链接的重新定位:
如果新闻的链接特殊,可使用本功能对新闻网址重新定位,比如有些代码可能是这样:
<a href="Javascript:window.open('1')" target=_blank>新闻标题</a><br>
<a href="Javascript:window.open('5')" target=_blank>新闻标题</a><br>
....省略
<a href="Javascript:window.open('50')" target=_blank>新闻标题</a>
把开始/结束标记设置为红色部分,点击一条新闻看它的真实网页地址,比如第一条新闻的地址是这样,http://www.scuta.net/news.asp?id=1,那么绝对链接就设置为http://www.scuta.net/news.asp?id={$ID}就成了。
c 列 表 截 取 测 试
d 列 表 新 闻 链 接 测 试
e 正 文 设 置
f 采 样 测 试
g 属 性 设 置
设置一些采集的选项,注意
采集选项: 立即发布 保存图片 倒序采集 外部链接 中 保存图片不要勾选.
h 点"完成".采集设置完毕
[3] 数据采集
在这里可以看到自己刚设置好的项目,
采集模式:快速模式 稳定模式 筛选模式 采集测试 正文预览
这几种自己琢磨了,不多描述 .结果都差不多.
然后开始漫长的采集过程.服务器速度和网速有关系.
[4] 数据审核
数据审核中,有"全选" "部分选择" "全部" 这几种模式,点标题可以查看采集的文章(带图片) .也可以删除数据
[5] 数据导出
是把数据从采集库中导入到cms数据表中,默认的是审核完的文章才可以导出,如果导出过的话会显示"已导出"反之亦然.
数据导出时有几个选项需要注意:
有三种导出模式: 部分选择,全部选择,整个栏目导出.但是不管那种模式都要选择 ·请输出的[资源类别]方向 或者[资源特性],这些是与系统中你建立的资源分类相挂勾的,选择导出到哪个分类.