94采集器采集规则编写教程 可导出导入
时间:05-25
作者:
94采集器规则编写教程
1.打开采集器在规则管理得地方--规则列表-点击添加
1.打开采集器在规则管理得地方--规则列表-点击添加
94采集器规则编写教程
打开采集器在规则管理得地方--规则列表-点击添加

先基本信息
规则名字随便 地址就是你要采集得网站 编码查看网站 类型 一般选个启用

列表页内容替换 可为空 规则类型 可选CSS 正则 书号等

这里说下规则类型
CSS类型 比如 请看下面得举例
下图得代码我们就直接写 .l.bd ul li .s2 a|href

正则 方式就是截取 你要得内容区域 前后得代码 这里不再多说了。
下面是信息页得 一样可选CSS 正则方式
采集方式默认就行

比如下图的标题代码 我们可以写 meta[property="og:title"]|content

下面是目录页的 采集方式 都直接默认
注意 这里如果目标站章节栏目有分页 选分页
排序类型:针对个别网站章节倒序的

地址规则 .listmain dd a|href 对应下图 大家就明白了

目录页设置
这里也是如果目标站有分页要设置分页

内容页

最后 规则里所有替换方式 人家默认的提示信息都写了,需要替换什么按照说明来就行了。
替换主要就是章节内容里垃圾信息过滤用的多
我们测试下规则

94采集器 规则是可以导出的

点导入 就可以看到下面的代码

需要再其他地方使用
就在规则管理--规则列表--点上面的导入
给代码复制进去提交就可以了

打开采集器在规则管理得地方--规则列表-点击添加

先基本信息
规则名字随便 地址就是你要采集得网站 编码查看网站 类型 一般选个启用

列表页内容替换 可为空 规则类型 可选CSS 正则 书号等

这里说下规则类型
CSS类型 比如 请看下面得举例
下图得代码我们就直接写 .l.bd ul li .s2 a|href

正则 方式就是截取 你要得内容区域 前后得代码 这里不再多说了。
下面是信息页得 一样可选CSS 正则方式
采集方式默认就行

比如下图的标题代码 我们可以写 meta[property="og:title"]|content

下面是目录页的 采集方式 都直接默认
注意 这里如果目标站章节栏目有分页 选分页
排序类型:针对个别网站章节倒序的

地址规则 .listmain dd a|href 对应下图 大家就明白了

目录页设置
这里也是如果目标站有分页要设置分页

内容页

最后 规则里所有替换方式 人家默认的提示信息都写了,需要替换什么按照说明来就行了。
替换主要就是章节内容里垃圾信息过滤用的多
我们测试下规则

94采集器 规则是可以导出的

点导入 就可以看到下面的代码

需要再其他地方使用
就在规则管理--规则列表--点上面的导入
给代码复制进去提交就可以了
