MENU

关闭

文档

采集教程

采集插件http://www.115cms.com/a_html/caiji.html

下载采集插件后 去您后台-应用中心-扩展插件-找到采集插件安装即可进入管理

第一步 进入管理页面 左上角点击添加一条记录


会得到一条杠添加的采集记录 然后选择配置进入配置页面


第二步 配置

配置主要有两个步骤 

一、是获取需要采集的页面  我们进行配置如下


1采集的域名可填写可不填写 要根据当前的采集网址进行配置 下面有讲到

2列表地址 是一个完整的url 例如:我们采集看看新闻http://www.kankanews.com/xinwen/

3a标签的容器怎么查看 需要按f12即可进行查看 得到   .infor>h1>a   如图 我们看到a标签的href就是我们需要采集的页面内容是一个完整的http开头的url我们1采集的域名就不用填写


4填写好点击获取采集地址 


二,填写标题的容器 点击上面采集地址任意一个url进入页面按f12查看标题的容器 得到 .nrHeader>h1


提取的类型选择纯文本 过滤和替换 需要学习下php的正则 替换自己想要的效果 一般普通采集 我们留空 即可 得到如下


第三步 获取内容容器 我们继续f12找到内容的 容器 得到.textBody


提取类型 选择源代码


然后下面的其他容器是自己增加的字段 自定义采集的 一般用不到留空即可

第三步 选择提交修改 一定要先点击提交修改

第四步 执行采集

整体如下


然后我们 就可以等待慢慢采集了