网站更新实时监控自动采集文章内容

文档创建者:1583334209
浏览次数:7447
最后更新:2019-11-22

本次任务的目的是实时监控网站更新,发现文章更新后立即自动采集文章内容,并保存到数据库。
1、首先打开网站资讯监控工具,添加监控网页,并设置关键词监控,点击保存按钮。
1.png

2、添加监控目标网址,设定按关键词监控。


2.png

3、然后点击到监控警报的选择卡中,把发送链接到外部网络端口。这里的8888端口是木头浏览器设定的接收端口。
3.png

4、随后打开木头浏览器的自动控制中的外部接口,点击弹出来的对话框中的开始,里面中的端口号就是资讯监控工具中外部网络端口,两个端口要保持一致。随后点击资讯监控工具的开始监控
4.png

5.png

5、打开项目管理器,新建打开网页,点击添加按钮,再网址处右击选择外部变量中的@link,点击添加添加成功了
6.png

6、新建抓取元素,先随便打开以一篇百度新闻进行获取,首先获取标题,最后获取文章内容,点击确定就添加成功,给元素起一个标题,点击添加按钮,元素添加。同理添加文章内容
7.png

8.png

7、在项目管理中新建执行sql,用于把监控到的数据保存到数据库中,本案例使用本地数据库。1.选择本地使用的数据库,我这里使用的mysql 5.0版本的数据库,随后填写数据库的相应信息,填写完成后点击测试按钮,如果
9.png



8、随后点击左上角的项目中的保存,保存在一个目录下面,随后关闭重新打开外部接口,点击运行项目中的浏览,选中刚刚保存的项目,随后点击开始就可以对资讯监控工具监控到的数据进行保存到数据库。
10.png



9、随后把资讯监控工具中的信息列表数据清空,重新打开监控,当有监控到相关的文章就会发送数据到木头软件上进行处理。
12.png



13.png


10、最后的运行结果保存到数据库中
11.png



以上就是结合资讯监控工具和木头浏览器使用对网站实时监控自动采集文章内容的操作


您需要登录后才可以回帖 登录 | 现在注册

本版积分规则

返回顶部 返回列表