对于网站内容的填充,有时候需要大量的文章,利用工具采集网络上的文章进行编辑可以事半功倍。此教程是前篇文章(火车采集器采集文章链接图文教程)续写。上篇文章的第一步是:采集网址规则,这是第二步:采集内容规则。如下双击其中一条文章链接,进入内容规则编辑页面。
打开http://zhongyi.ifeng.com/jiakang/jkdyf/index_2.shtml其中的一篇文章,(如http://zhongyi.ifeng.com/jiakang/jkdcs/457719.shtml 查找“甲减的早期症状都有哪些呢”)查看源代码查找的它的开始标签与结束标签。如下图2:
咱们只要标题和内容,其它的作者、时间、出处标签可以删除掉。如下图
从图中,已找到的它的开始标签是<div id="i-article1">,结束标签是<div class="i-article3">。这两个标签在每篇文章是唯一的,可以多点击几篇不同的文章查找这两个标签,如果都有就对了。下图2是内容规则的截取:
内容规则编好,点击两个“确定”后,再点击测试,得到如下效果:
上图有些内容是不要或要替换掉的。点击内容修改,添加内容替换如下:
上图的<!--简介开始-->(*)“替换为”留空的就是去掉,当然也可以替换成比如“医院地址、联系方式等”内容。至此采集内容规则完成。进入第三步:发布内容设置。请阅读下篇文章:火车采集器采集文章图文教程2