登录

火车采集器采集文章图文教程

插件工具 maolai 789次浏览 0个评论

对于网站内容的填充,有时候需要大量的文章,利用工具采集网络上的文章进行编辑可以事半功倍。此教程是前篇文章(火车采集器采集文章链接图文教程)续写。上篇文章的第一步是:采集网址规则,这是第二步:采集内容规则。如下双击其中一条文章链接,进入内容规则编辑页面。

双击采集的链接

打开http://zhongyi.ifeng.com/jiakang/jkdyf/index_2.shtml其中的一篇文章,(如http://zhongyi.ifeng.com/jiakang/jkdcs/457719.shtml 查找“甲减的早期症状都有哪些呢”)查看源代码查找的它的开始标签与结束标签。如下图2:

文章内容段落

文章源代码查找

咱们只要标题和内容,其它的作者、时间、出处标签可以删除掉。如下图

删除不要的标签

从图中,已找到的它的开始标签是<div id="i-article1">,结束标签是<div class="i-article3">。这两个标签在每篇文章是唯一的,可以多点击几篇不同的文章查找这两个标签,如果都有就对了。下图2是内容规则的截取:

点击内容进行修改

采集内容规则

内容规则编好,点击两个“确定”后,再点击测试,得到如下效果:

内容采集测试

上图有些内容是不要或要替换掉的。点击内容修改,添加内容替换如下:

添加内容替换

上图的<!--简介开始-->(*)“替换为”留空的就是去掉,当然也可以替换成比如“医院地址、联系方式等”内容。至此采集内容规则完成。进入第三步:发布内容设置。请阅读下篇文章:火车采集器采集文章图文教程2


本文由maolai编辑整理发布,转载请注明火车采集器采集文章图文教程
喜欢 (0)
[maolai]
分享 (0)
maolai
关于作者:
无折腾,不生活。一个爱折腾,爱分享的90后,欢迎你认识我,我是MAOLAI。
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址