找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 140|回复: 11

ygbook采集规则编写教程

[复制链接]

22

主题

290

回帖

720

积分

高级会员

积分
720
发表于 2018-2-13 16:40:43 | 显示全部楼层 |阅读模式
玩了几天了,分享些采集的经验。

首先ygbook分为单列表和多栏目匹配方式

单列表:http://www.biquge.com.tw/
多栏目:https://www.snwx8.com/

区别就是多栏目有分页,可显示全部小说。

先以单列表:http://www.biquge.com.tw/ 举例
前面的什么图片本地化  目标网站域名 编码都不用多说了,都看得懂。其中单列表监控页面为首页,[cate]对应情况取源站顶部分类 要中文的,比如玄幻小说  修真小说到最后恐怖小说依次对应本站 如果分类出入太大的 可自行在后台建分类再对应,最大页码为1.
规则列表页码这个很好理解 比如1|1|200的意思就是从第一页开始到200页,每次增加1页。
无缩略图标志一般为nocover,如果不是你看下源站是什么自行改即可。
列表页:链接CSS选择器和列表页:标题CSS选择器 这个怎么选 我们打开首页看到最近更新列表 先取大区域:#newscontent 再取一个区域 .l 区别于下方最新入库的的.r  最后我们再取我们真正要的区域.s2 a结束 组合就是#newscontent .l .s2 a,很多人喜欢这个样子写 就跟提示差不多 #newscontent li a 有些站是可以的,但是要分清楚。
文章页的各个选项,如果是有360结构化的站那么以下是通用的,标题CSS选择器 :meta[property=og:novel:book_name]|content  作者CSS选择器  meta[property=og:novel:author]|content  缩略图CSS选择器  meta[property=og:image]|content 内容CSS选择器一般为#intro 因为源站简介源码一般为,如果不是 自行修改intro即可,完结标志不用多说了。
章节目录页:区域CSS选择器一般为:#list  自行查看源码就知道了  章节目录页:采集规则也看源码如biquge.com.tw为[url=]第1章 工匠大师系统[/url],那么写成[url=][title][/url]即可。
如果有这样子的:第九章 第二次交手  你写成[url=][title][/url],把不要的用[string]代替掉即可。
最后章节内容页:内容CSS选择器一般为#content 为什么上面也提到过 自行查看源码就明白了。

通用替换  {filter replace='hostloc'}笔趣阁{/filter} 如果不替换只删除的话删除hostloc即可。

这就完了 然后测试修正即可。

多栏目以:https://www.snwx8.com/ 为例 这就不解释那么多了,累。。。
规则列表页面为:https://www.snwx8.com/[cate]/
回复

使用道具 举报

39

主题

528

回帖

1241

积分

金牌会员

积分
1241
发表于 2018-2-13 16:41:46 | 显示全部楼层
感谢楼主的教程




回复

使用道具 举报

12

主题

441

回帖

980

积分

高级会员

积分
980
发表于 2018-2-13 16:43:50 | 显示全部楼层
好多小说站,会不会有版权问题
回复

使用道具 举报

45

主题

724

回帖

1613

积分

金牌会员

积分
1613
发表于 2018-2-13 17:10:09 | 显示全部楼层
emmmm 看完了 还是不会写..
回复

使用道具 举报

303

主题

3626

回帖

8229

积分

论坛元老

积分
8229
发表于 2018-2-13 17:12:02 | 显示全部楼层
有没有能直接采集到自己站的,还要人点了才采集,太费事了
回复

使用道具 举报

35

主题

851

回帖

1867

积分

金牌会员

积分
1867
发表于 2018-2-13 17:13:19 | 显示全部楼层
谢谢分享!
回复

使用道具 举报

110

主题

525

回帖

1434

积分

金牌会员

积分
1434
发表于 2018-2-13 17:26:36 | 显示全部楼层
make,备份我的博客了。
回复

使用道具 举报

15

主题

152

回帖

385

积分

中级会员

积分
385
发表于 2018-2-15 07:34:34 | 显示全部楼层
mark!
回复

使用道具 举报

228

主题

947

回帖

2658

积分

金牌会员

积分
2658
发表于 2018-2-22 14:38:58 | 显示全部楼层
厉害,感谢
回复

使用道具 举报

22

主题

290

回帖

720

积分

高级会员

积分
720
 楼主| 发表于 2018-2-22 14:39:47 | 显示全部楼层
这个好给力!!按照教程采集一个单列表站,可是采集过来的分类和源站不一致,比如源站是『都市言情』而我这边却变成『玄幻小说』了,按照楼主的教程cate对应我源站写的是顶部中文分类
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Discuz! X

GMT+8, 2025-5-9 07:52 , Processed in 0.024517 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表