使用 Jsoup 解析 html 如何保留 innerText 中的换行符回车符

原创
03/31 23:25
阅读数 227

写了个小工具用到了 Jsoup 使用中发现,在输出 html 的时候,innerText 里面的丢失了 \r\n 换行符回车符,解决这个问题只需关闭 Jsoup 输出格式化即可。

上代码,示例如下:

String html = "<!DOCTYPE HTML><html><head><title></title><style></style></head>"
		+ "<body> \r\n hello world! \r\n hello jeesite! \r\n </body></html> ";

Document document = Jsoup.parse(html);

// 默认解析后会进行 格式化 HTML,格式化后丢失了:回车、 换行、 空格
System.out.println(document.html());
System.out.println("==============");

// 输出设置格式化为关闭状态, 原样输出,保留:回车、 换行、 空格
document.outputSettings(new Document.OutputSettings().prettyPrint(false));
System.out.println(document.html());

执行结果:

<!doctype html>
<html>
 <head>
  <title></title>
  <style></style>
 </head>
 <body>
   hello world! hello jeesite! 
 </body>
</html>
==============
<!doctype html><html><head><title></title><style></style></head><body> 
 hello world! 
 hello jeesite! 
 </body></html> 
展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部