你的浏览器怎样抓取网页内容?

文档创建者:自动控制
浏览次数:3323
最后更新:2023-05-08
本帖最后由 自动控制 于 2023-5-8 13:50 编辑

      在浏览网页的过程中,需要保存网页数据,把它复制下来保存到文件就好啦;但是,如果数据量大或者需要经常保存数据,简单重复的操作让人发狂。这时候就需要一个可以自动抓取数据的浏览器。
      1、先观察我们抓取数据的网页,以抓取城市名称和天气信息为例。首先打开【自动控制】菜单中的【项目管理器】窗口。
1抓取网页数据.png
      2、新建【打开网页】步骤,添加抓取页面的网址,其它选项使用默认值。

2、添加抓取网址

2、添加抓取网址

      3、再新建【抓取内容】步骤,添加抓取网页元素,点击【自动获取】按钮,浏览器自动进入元素获取模式。

3、新建抓取内容步骤

3、新建抓取内容步骤

      4、将鼠标指针移动需要抓取的元素位置,确定所需内容全部在红色方框内,点击鼠标右键,选择【获取元素并返回】,返回项目管理器窗口。

4、获取抓取数据元素

4、获取抓取数据元素

      5、选择通过【class】属性作为元素标识,抓取元素后获得【text】文本内容。元素别外命名为”天气“。

5、获取元素属性

5、获取元素属性

      6、新建【保存内容】步骤,选择保存为”Excel文档“格式,设定文件路径。点击【设置内容】按钮,勾选日期和天气两个字段。

6、保存抓取数据

6、保存抓取数据

      7、最后点击项目管理器工具栏上的保存,保存所有项目设置,下次使用时可直接打开执行项目。点击【开始】按钮执行项目,可以看到项目执行日志,最后打开保存的Excel文档,日期和抓取网页天气信息都保存到表格里了。

7、抓取网页数据结果文件

7、抓取网页数据结果文件

      按照这个方法,可以抓取任何显示在网页上的信息,并自动保存到文件。如果有多个网址,就增加自动循环抓取信息。








您需要登录后才可以回帖 登录 | 现在注册

本版积分规则

返回顶部 返回列表