Jsoup 使用CSS选择器选择元素
示例
String html = "<!DOCTYPE html>" + "<html>" + "<head>" + "<title>Hello world!</title>" + "</head>" + "<body>" + "<h1>Hello there!</h1>" + "<p>First paragraph</p>" + "<p class=\"not-first\">Second paragraph</p>" + "<p class=\"not-first third\">Third <a href=\"page.html\">paragraph</a></p>" + "</body>" + "</html>"; //解析文件 Document doc = Jsoup.parse(html); //获取文件标题 String title = doc.select("head > title").first().text(); System.out.println(title); //你好,世界! Element firstParagraph = doc.select("p").first(); //获取除第一段外的所有段落 Elements otherParagraphs = doc.select("p.not-first"); //和...一样 otherParagraphs = doc.select("p"); otherParagraphs.remove(0); //获取第三段(其他列表中的第二段) //不包括第一段) Element thirdParagraph = otherParagraphs.get(1); //选择: thirdParagraph = doc.select("p.third"); //您也可以在元素中进行选择,例如具有href属性的锚点 //在第三段中。 Element link = thirdParagraph.select("a[href]"); // or the first <h1> element in the document body Element headline = doc.select("body").first().select("h1").first();
您可以在此处找到支持的选择器的详细概述。