技术宅

当前位置:首页 > 网站教程 > 其他教程

其他教程

94采集器采集规则编写教程 可导出导入

时间:05-25 作者:
94采集器规则编写教程
1.打开采集器在规则管理得地方--规则列表-点击添加





94采集器规则编写教程
打开采集器在规则管理得地方--规则列表-点击添加

先基本信息
规则名字随便  地址就是你要采集得网站  编码查看网站  类型 一般选个启用

列表页内容替换  可为空   规则类型 可选CSS  正则  书号等


这里说下规则类型
CSS类型  比如     请看下面得举例
下图得代码我们就直接写  .l.bd ul li .s2 a|href

正则 方式就是截取 你要得内容区域 前后得代码 这里不再多说了。

下面是信息页得  一样可选CSS  正则方式
采集方式默认就行


比如下图的标题代码 我们可以写  meta[property="og:title"]|content

下面是目录页的  采集方式 都直接默认
注意 这里如果目标站章节栏目有分页 选分页 
排序类型:针对个别网站章节倒序的  


地址规则 .listmain dd a|href   对应下图 大家就明白了

 目录页设置
这里也是如果目标站有分页要设置分页

内容页



最后  规则里所有替换方式 人家默认的提示信息都写了,需要替换什么按照说明来就行了。
替换主要就是章节内容里垃圾信息过滤用的多

我们测试下规则


94采集器 规则是可以导出的

点导入 就可以看到下面的代码

需要再其他地方使用
就在规则管理--规则列表--点上面的导入
给代码复制进去提交就可以了