技术宅

当前位置:首页 > 网站教程 > 其他教程

其他教程

关关采集器采集规则编写教程

时间:05-25 作者:
在关关采集器Rules文件夹下建立一个xml文件。为了方便区分,今天给大家演示编写云谣阁的采集规则,我就把这个xml文件命名为yunyaoge.xml


点击规则--规则管理器 出现如图所示

在关关采集器Rules文件夹下建立一个xml文件。为了方便区分,今天给大家演示编写云谣阁的采集规则,我就把这个xml文件命名为yunyaoge.xml


点击规则--规则管理器 出现如图所示。点载入开始编写采集规则


下面说下需要填写的内容
左边这里点击之后在右边都会出现相关的说明。很简单的。
只需要记住几个关键就行了 下面给大家举例说明一下记住一下几个正则


今天给大家演示采集的网站是www.yunyaoge.com,我们就打开这个网站首页,然后在网页随意空白处点击右键,然后点查看源文件(或者是查看网页源代码浏览器不同,显示的不同,但是意思是一样的),这里我看可以看到<meta charset="gbk" /> 表示这个网页是gbk编码的。这里在这里让填写编码我们就写gbk就行了


同样的道理,下面的novelname novelauthor这些我们都直接正则匹配就行了。就拿novelname来说 我们打开网页http://www.yunyaoge.com/xs/0/88/点击查看源文件,找到作者<meta property="og:novel:book_name" content="圣墟" />那么我们这里直接写<meta property="og:novel:book_name" content="(.+?)" />如图所示


一步一步的写完,那么接下来就是测试结果了。如果哪里有不对的地方,测试的时候会有提示。按照提示再修改就行了

【具体操作】

使用前请先设置好数据库和网站目录,而且设置好这两点之后只能把关关采集器关闭然后再打开才能生效!切记切记!


分类设置设置正确来保证你采集到的小说在你网站上显示的是正确的。
具体说明
1|玄幻魔法=,玄幻,魔法,玄幻魔法,异陆,穿越,奇幻,奇幻-异界幻想,奇幻-仙侠情缘,奇幻-妖精灵怪,奇幻-西方魔幻,奇幻-吸血家族,玄幻小说,重生文学,奇幻小说,玄幻异界,奇幻魔法,穿越架空,
=前面的是你网站的分类。 比如你采集http://www.yunyaoge.com/xs/0/88/这本小说。他的分类是玄幻小说,你只要写1|玄幻魔法=,玄幻小说, 就行了 一一对应,很简单


生成设置,如果你网站是伪静态的网站,生成目录页html 生成内容页html这些都不用选。只需要选个生成opf就行了。


采集动作这里,建议大家不要选检测重复章节。否则会有好多内容章节采集不到!有点相似的他就给你过滤了,真心很坑


高级设置这里的功能也是,说明也很详细,看自己需要勾选就行了


开始采集后可以看到采集进度