Selenium不打开浏览器采爬取数据 Java

编程知识 更新时间:2023-04-22 10:18:56

Selenium

Selenium工具,是数据采集利器,尤其是对js的操作。相对于jsoup、httpclient工具,其最大的不同就是通过操作浏览器的方式获取数据,类似于用户点击,移动鼠标等。比如,说最近想开发采集Quora(https://www.quora/)的小软件,发现这个网页都是js操作,数据查看,使用的鼠标滚动的方式,类似的网站还有国内的网易新闻等(http://news.163/)。针对这些网站,其最好的方式是使用Selenium调用浏览器采集。
关于Selenium的安装,博主已在这篇博客中介绍了https://blog.csdn/qy20115549/article/details/77456473。

java使用Selenium

Selenium可以直接打开火狐浏览器、谷歌浏览器以及IE浏览器,进而获取页面的内容,同时也可以进行表单操作等,关于java使用Selenium调出浏览器的案例程序,读者可参考我之前的博客(https://blog.csdn/qy20115549/article/details/77915024)。

这里主要介绍在不打开浏览器 GUI的情况在浏览器中执行我们的Selenium脚本。在这里,以火狐为案例,我的版本为56.0(64位)。以下为案例程序:

        FirefoxBinary firefoxBinary = new FirefoxBinary();
        firefoxBinary.addCommandLineOptions("--headless");
        System.setProperty("webdriver.gecko.driver", "chrome\\geckodriver.exe");
        FirefoxOptions firefoxOptions = new FirefoxOptions();
        firefoxOptions.setBinary(firefoxBinary);
        FirefoxDriver driver = new FirefoxDriver(firefoxOptions);
        driver.get("http://www.baidu");
        String title = driver.getTitle();
        System.out.println(title);
        driver.quit();

程序的运行结果如下:



更多推荐

Selenium不打开浏览器采爬取数据 Java

本文发布于:2023-04-17 02:02:00,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/02561e42371a6caf276657a61cf71756.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:打开浏览器   数据   Selenium   Java   采爬取

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!

  • 82077文章数
  • 6581阅读数
  • 0评论数