1
oska117 2018-06-20 11:16:54 +08:00 via Android
不错,谢谢分享,研究一下
|
3
isevenfox 2018-06-20 14:23:19 +08:00
star 一波~ 感谢
|
5
freemagico 2018-06-20 22:38:29 +08:00
已 star,请问爬虫是从哪里爬磁链的?
|
6
lueying OP @freemagico 这里是磁链到爬虫脚本 是加入 DHT 网络 获取到 hashinfo 附上 js 脚本地址 可以瞅瞅 跑跑试试
https://github.com/ssstk/manget2torrent/blob/master/src/spider/index.js |
7
hezhile 2018-06-21 10:03:05 +08:00 1
搜索结果的排序依据是什么呢?
可以按照收录日期排序码? |
8
lueying OP @hezhile 现在是 Elasticsearch 的自己查询的排序
现在正在添加最新收录排序 有问题欢迎建[issue]( https://github.com/ssstk/findcl/issues)交流。哇哈哈 |
9
lueying OP github issue 地址 https://github.com/ssstk/findcl/issues
|
11
wanwan 2018-06-22 15:50:51 +08:00
这类网站比较多啊。
|
13
artandlol 2018-06-23 08:27:13 +08:00 via iPhone
Docker 化的项目更受欢迎
|
15
artandlol 2018-06-23 11:35:35 +08:00
@sstzma #14 过奖了,小菜一枚。 配合 https://www.v2ex.com/t/383801 这个使用 味道更佳
|
16
Desiree 2018-06-23 14:54:02 +08:00
请问这些数据是从哪里来的?
|
17
lueying OP @Desiree 是加入 DHT 网络 获取到 hashinfo 再解析 hsahinfo 获取 BT 种子信息 可以了解下 BitTorrent 协议
这里是磁链到爬虫源码 https://github.com/ssstk/manget2torrent/blob/master/src/spider/index.js |
19
lueying OP @duola ES 团队不推荐完全采用 ES 作为主要存储,缺乏访问控制还有一些数据丢失和污染的问题。ES 没有事务,而且是近实时。成本也比数据库高。但是它的优势在于索引后,方便搜索,这是 mongodb 等数据库干不了的。
所以,搜索的时候使用 Elasticsearch,进入具体的资源页面,就直接从 mongodb 里取数据。 当然 小项目玩玩 用什么感觉都无所谓了~ |
22
jinzhe 2018-06-26 15:40:56 +08:00
搜索了下“藏”
|