12、现在要采集内容页的标题和内容:

13、查看新闻页“源文件”,找title标签:

14、取得标题正则:

15、这里是要采集的内容区域:

16、取得新闻内容正则:

(注意:新闻内容正则里的 d_id='*' 用了通配符,因为每一篇新闻的d_id值是不同的,所以可以用*来代替它,“*”可以代替任意字符。)
17、点击提交按钮就完成了整个采集节点:
二、预览采集节点是否正确
1、提交按钮后返回管理节点:

2、点击“预览”采集,进入节点预览结果:

3、采集内容页列表

4、采集内容页页面:

三、采集
1、预览采集节点无误后,然后返回“管理节点”,点击“开始采集”链接就开始进行采集:

2、系统正在采集中:

3、采集完后显示本地临时入库的信息,这时可以对临时入库的信息进行修改或者删除:










