虚心学习
发表于 2019-2-4 15:44:27
机器有了,域名还没吧?xiuzhen.net要吗。哈哈
西崽猪猪
发表于 2019-2-4 15:30:00
西崽猪猪 发表于 2019-2-4 15:25
楼主你要跪,大盘鸡不适合开小说站。
现在小说站标配都是 4块SSD RAID10。
小文件太多了采集加访问非常影响 ...
之搞过一个,没那么高要求,hatch家搞个1.5t就可以,然后反代快点,重点是哪里可以采集到优质不缺章节广告插入少的资源
a3607
发表于 2019-2-4 15:30:30
biubiu 发表于 2019-2-6 08:40
之搞过一个,没那么高要求,hatch家搞个1.5t就可以,然后反代快点,重点是哪里可以采集到优质不缺章节广 ...
010.gif
你这么说那你肯定是没访问量
频繁读取 I/O的资源监测可以看见
HDD单盘基本130MB/s满载
biubiu
发表于 2019-2-4 16:33:40
西崽猪猪 发表于 2019-2-6 12:33
你这么说那你肯定是没访问量
频繁读取 I/O的资源监测可以看见
HDD单盘基本130MB/s满载 ...
强迫症受不了缺章节,内容被插入符号组合广告,后来折腾规则也未果,找某宝写的规则也不行,就不搞了
西崽猪猪
发表于 2019-2-4 15:44:00
有没用大佬发个程序啊,现在大盘鸡有好几个就差小说程序了 本帖最后由 timelo 于 2019-2-6 20:01 编辑
我用的wmcms但是代码写的贼**差 今年准备重写……自己写的Python 爬数据
biubiu
发表于 2019-2-4 16:54:57
wmcms但是源码很差
timelo
发表于 2019-2-4 18:55:30
西崽猪猪 发表于 2019-2-4 15:25
楼主你要跪,大盘鸡不适合开小说站。
现在小说站标配都是 4块SSD RAID10。
小文件太多了采集加访问非常影响 ...
访问量低的话,楼主大盘鸡没问题。
你这个配置,起码得千万pv往上了,才会硬盘IO瓶颈。
timelo
发表于 2019-2-5 10:56:57
"
我一般都是派森自己爬,什么登录验证,cf验证都突破了。就是麻烦一点,一个目标站点点对点的爬
wcn
发表于 2019-2-4 18:55:00
最近爬科技文章做流量垃圾站来着。。。
achen0207
发表于 2019-2-6 02:59:10
achen0207 发表于 2019-2-6 18:12
我一般都是派森自己爬,什么登录验证,cf验证都突破了。就是麻烦一点,一个目标站点点对点的爬 ...
lol.gif
对, 每个目标站点都要研究一下爬取的规则 ,但是自己写的 比较方便呀