这个书源可太牛了!

如果我自己收藏的有你喜欢的,可联系vx: kanyingvip

今天给大家推荐一下来自@不世玄奇大佬制作的书源,这个书源最厉害的地方是把搜索引擎(百度、夸克、谷歌)做成了书源,那么也就是说,阅读现在真的就成了浏览器,可以把所有通过搜索引擎搜索到的内容直接展示出来,具体的书源说明如下:


1、把搜索引擎做成书源,借助搜索引擎全网搜书。


2、支持多种搜索方式(书名#作者$网站、书名$网站、书名#作者、书名、#作者),具体用法见书源“源注释”和下面的用法展示视频:



其中夸克支持“#作者”指定作者搜索,这种方式得到的书籍与普通搜索最大的不同在于,借助了夸克官方的数据直接获取相关作者的书籍,然后从链接到的结果页中筛选出小说网站重定向过去直接观看。


3、夸克书源有完整的夸克官方分类排行榜,书籍链接指向夸克搜索结果页面,书源从中筛选出小说网站重定向过去直接观看,而且不满意的话,过段时间点详情页的刷新会重新定向到新的小说网站。


4、采用反向模式构造思想进行目录链接、章节链接识别,根据详情页链接构造出专门识别目录链接的正则表达式去识别目录链接,再根据目录链接构造成专门识别章节链接的正则表达式去识别章节链接,识别能力、识别速度、识别精确度远皆超一味堆砌规则的穷举法。


5、正文规则采用无用标签移除思想,将各种不可能存在内容的标签通往移除,再剔除链接及其环绕文字,网站插入的带有负数编号的宣传文本,再根据“章节名、书名”剔除首尾的包含章节名书名的冗余内容。


6、替换规则标记单词、数字、图片标签,再根据此三种标记的环绕文本特点判断是否是插入式网站宣传,或是正常文本,从而深入净化正文。首尾剔除重复内容,修正错误断行(且识别传统书籍中的插入式标题,不将其当做错误断行)


7、不仅可以搜书,还可以搜漫画,书中净化规则特意避开了img标签,净化的同时不会破坏图片显示。


8、单页文章自动构造目录:也就是说,当某个文章中不存在目录时,自动为将构造目录,从而可以浏览没有目录的单页网页,此点可用来看新闻,浏览网页


网络导入链接:

https://gitee.com/ch4nge/readbook/raw/master/booksource_qw

其实除此之外,我觉得这个书源最厉害的还有一点,就是整合了夸克的全网各类小说排行榜:

这个排行榜我让十一验证了一下,相当精准,非常好用,排行榜内收录的多数都是好书和热书,非常值得大家书荒时看看。


再次感谢一下@不世玄奇大佬的贡献!


最后鉴于昨天的大礼包百度云链接失效了,给大家补一下:

链接:https://pan.baidu.com/s/1ZC_URo1JxlS1igESI3qz5A  


提取码:4mg4

———阅友交流———



可以使用,不定时分享有价值的信息
天时网 » 这个书源可太牛了!

发表评论

提供最优质的资源集合

立即查看 了解详情