解析⼀个HTML字符串
存在问题
来⾃⽤户输⼊,⼀个⽂件或⼀个⽹站的HTML字符串,你可能需要对它进⾏解析并取其内容,或校验其格式是否完整,或想修改它。怎么办?jsonu能够帮你轻松解决这些问题
解决⽅法
使⽤静态⽅法或⽰例代码:
html获取input输入的数据String html = "<html><head><title>First parse</title></head>"
+ "<body><p>Parsed HTML into a doc.</p></body></html>";
Document doc = Jsoup.parse(html);
描述
这⽅法能够将输⼊的HTML解析为⼀个新的⽂档 (Document),参数 baseUri 是⽤来将相对 URL 转成绝对URL,并指定从哪个⽹站获取⽂档。如这个⽅法不适⽤,你可以使⽤⽅法来解析成HTML字符串如上⾯
的⽰例。.
只要解析的不是空字符串,就能返回⼀个结构合理的⽂档,其中包含(⾄少) ⼀个head和⼀个body元素。
⼀旦拥有了⼀个Document,你就可以使⽤Document中适当的⽅法或它⽗类和中的⽅法来取得相关数据。