技术宅

当前位置:首页 > 网站教程 > 其他教程

其他教程

杰奇后台采集规则添加方法和采集

时间:07-16 作者:
这个采集规则是杰奇后台的采集规则 不是关关采集器的规则很多人用的linux服务器做小说网站异地采集不方便想从后台进行采集只是采集很慢,如果是用windows系统,直接用关关采集

这个采集规则是杰奇后台的采集规则 不是关关采集器的规则

很多人用的linux服务器做小说网站异地采集不方便想从后台进行采集只是采集很慢,如果是用windows系统,直接用关关采集器好多了,linux下用后台采集还行。
或许看我这个,应该可以学会自己配置后台采集吧。

杰奇后台采集规则添加方法和采集(教程)

系统默认变量:<{articleid}> – 文章序号,<{chapterid}> - 章节序号, <{subarticleid}> - 文章子序号, <{subchapterid}> - 章节子序号。
系统标签 * 可以替代任意字符串。
系统标签 ! 可以替代除了<和>以外的任意字符串。
系统标签 ~ 可以替代除了<>'”以外的任意字符串。
系统标签 ^ 可以替代除了数字和<>之外字符串。
系统标签 $ 可以替代数字字符串。
采集规则中,需要获取的内容部分用四个以上系统标签代替,如 !!!!

文章序列号运算方式:floor(<{articleid}>/1000)   // 这里单独说下 有的小说站的伪静态链接是www.ps288.com/22/2201/  就需要用这个运算方式转化下。

发送HTTP_REFERER标志,用于突破防采集设置:这里选择  是 

文章信息页面地址:http://www.ps288.com/<{subarticleid}>/<{articleid}>/                     // 这里说明下  如果是链接是www.ps288.com/22/2201/ 就写这个地址。

如果链接地址是:www.ps288.com/book/2201/ 就要改成 http://www.ps288.com/book/<{articleid}>/