94采集器采集规则编写教程 可导出导入
时间:05-25
作者:
94采集器规则编写教程
1.打开采集器在规则管理得地方--规则列表-点击添加
1.打开采集器在规则管理得地方--规则列表-点击添加
94采集器规则编写教程
打开采集器在规则管理得地方--规则列表-点击添加
先基本信息
规则名字随便 地址就是你要采集得网站 编码查看网站 类型 一般选个启用
列表页内容替换 可为空 规则类型 可选CSS 正则 书号等
这里说下规则类型
CSS类型 比如 请看下面得举例
下图得代码我们就直接写 .l.bd ul li .s2 a|href
正则 方式就是截取 你要得内容区域 前后得代码 这里不再多说了。
下面是信息页得 一样可选CSS 正则方式
采集方式默认就行
比如下图的标题代码 我们可以写 meta[property="og:title"]|content
下面是目录页的 采集方式 都直接默认
注意 这里如果目标站章节栏目有分页 选分页
排序类型:针对个别网站章节倒序的
地址规则 .listmain dd a|href 对应下图 大家就明白了
目录页设置
这里也是如果目标站有分页要设置分页
内容页
最后 规则里所有替换方式 人家默认的提示信息都写了,需要替换什么按照说明来就行了。
替换主要就是章节内容里垃圾信息过滤用的多
我们测试下规则
94采集器 规则是可以导出的
点导入 就可以看到下面的代码
需要再其他地方使用
就在规则管理--规则列表--点上面的导入
给代码复制进去提交就可以了
打开采集器在规则管理得地方--规则列表-点击添加
先基本信息
规则名字随便 地址就是你要采集得网站 编码查看网站 类型 一般选个启用
列表页内容替换 可为空 规则类型 可选CSS 正则 书号等
这里说下规则类型
CSS类型 比如 请看下面得举例
下图得代码我们就直接写 .l.bd ul li .s2 a|href
正则 方式就是截取 你要得内容区域 前后得代码 这里不再多说了。
下面是信息页得 一样可选CSS 正则方式
采集方式默认就行
比如下图的标题代码 我们可以写 meta[property="og:title"]|content
下面是目录页的 采集方式 都直接默认
注意 这里如果目标站章节栏目有分页 选分页
排序类型:针对个别网站章节倒序的
地址规则 .listmain dd a|href 对应下图 大家就明白了
目录页设置
这里也是如果目标站有分页要设置分页
内容页
最后 规则里所有替换方式 人家默认的提示信息都写了,需要替换什么按照说明来就行了。
替换主要就是章节内容里垃圾信息过滤用的多
我们测试下规则
94采集器 规则是可以导出的
点导入 就可以看到下面的代码
需要再其他地方使用
就在规则管理--规则列表--点上面的导入
给代码复制进去提交就可以了