【Java】Jsoup格式化html问题(文本空格折叠等)解决方法

编程入门 行业动态 更新时间:2024-10-14 22:13:53

【Java】Jsoup格式化html问题(文本<a href=https://www.elefans.com/category/jswz/34/1768965.html style=空格折叠等)解决方法"/>

【Java】Jsoup格式化html问题(文本空格折叠等)解决方法

问题说明

Jsoup格式化html文本时,如:

Document document = Jsoup.parse(html);

这里在对html进行格式化的时候会将如下内容:

<p>      aaa   </p>

解析成如下格式:

<p> aaa </p>

即空格折叠问题(HTML的格式规范);

解决方式

在看Jsoup的源码中发现有outputSettings设置类,并且有个属性“prettyPrint",属性在Jsoup的构造函数中是默认设置为true的,也就是会按照html格式规范进行格式化,将此属性设置为false即可将html原样输出,即:

document.outputSettings(new Document.OutputSettings().prettyPrint(false));

即输出不必再按照html规范进行格式化,即可将处理后的html原样输出。
end。

更多推荐

【Java】Jsoup格式化html问题(文本空格折叠等)解决方法

本文发布于:2023-12-08 12:57:03,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1672860.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:空格   解决方法   文本   Java   Jsoup

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!