博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
查找网页元素并且输出到固定文件
阅读量:5084 次
发布时间:2019-06-13

本文共 1627 字,大约阅读时间需要 5 分钟。

import java.io.File;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.IOException;import java.io.PrintWriter;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;public class HrefTest {       /**    * 输出文件方法    * @param filePath    * @param sb    * @throws IOException    */    public static void outHref(String filePath,StringBuffer sb) throws IOException{                try {            File file = new File(filePath);            PrintWriter writer = new PrintWriter(new FileOutputStream(file));               writer.write(sb.toString());             writer.close();                     } catch (FileNotFoundException e) {            e.printStackTrace();        }    }    /**     * 定位元素     * @param args     */    public static void main(String[] args) {        String  filePath="/Users/liuqi/Desktop/result.log";        final String url="http://www.baidu.com/";        String str="";        StringBuffer sb=new StringBuffer();        try {            Document doc=Jsoup.connect(url).get();            Elements links=doc.getElementsByTag("a");            for(Element link:links){                if(link.attr("href").contains("baidu"))                     str=link.attr("href").toString();                     sb.append(str+"\n");                     System.out.println(link.attr("href"));                     outHref(filePath, sb);            }                    } catch (IOException e) {            e.printStackTrace();        }            }    }

需要加载jsoup-1.10.1.jar这个jar

转载于:https://www.cnblogs.com/liuqi/p/6795271.html

你可能感兴趣的文章
Java程序IP v6与IP v4的设置
查看>>
RUP(Rational Unified Process),统一软件开发过程
查看>>
数据库链路创建方法
查看>>
Enterprise Library - Data Access Application Block 6.0.1304
查看>>
重构代码 —— 函数即变量(Replace temp with Query)
查看>>
Bootstrap栅格学习
查看>>
程序员的数学
查看>>
聚合与组合
查看>>
jQuery如何获得select选中的值?input单选radio选中的值
查看>>
设计模式 之 享元模式
查看>>
如何理解汉诺塔
查看>>
洛谷 P2089 烤鸡【DFS递归/10重枚举】
查看>>
15 FFT及其框图实现
查看>>
Linux基本操作
查看>>
osg ifc ifccolumn
查看>>
C++ STL partial_sort
查看>>
3.0.35 platform 设备资源和数据
查看>>
centos redis 安装过程,解决办法
查看>>
IOS小技巧整理
查看>>
WebDriverExtensionsByC#
查看>>