看到有人专名写一个爬虫,于是用手上的东西,做了一个这个东西。
先直接上地址: https://f.binux.me/haixiuzu.html
pyspider DEMO版 + 多说 做数据库 + 前端渲染一个瀑布流
嘿,还真像那么回事有没有。
那么问题来了,还有哪些免费的 KV 数据库,有 HTTP API 的,能公开读取数据的。
多说老是转义导入的数据。。
|      1oojiayu      2014-10-26 21:44:01 +08:00 赞一个 | 
|  |      2ihacku      2014-10-26 22:03:00 +08:00 CouchDB? | 
|  |      3ChiangDi      2014-10-26 22:08:39 +08:00 豆瓣好奇怪,为什么那么多妹纸晒。。 | 
|  |      4can      2014-10-26 22:09:33 +08:00 不是说晚上管理员一下班,这组就……? | 
|  |      6Shared      2014-10-26 22:15:19 +08:00 为什么有css和js文件不能加载,主页裸奔了 | 
|  |      8shoumu      2014-10-26 22:38:30 +08:00 看不到图啊 | 
|  |      11shoumu      2014-10-26 22:43:30 +08:00  1 @binux  控制台信息 Failed to load resource: net::ERR_SSL_VERSION_OR_CIPHER_MISMATCH https://static.duoshuo.com/embed.unstable.js Uncaught ReferenceError: DUOSHUO is not defined haixiuzu.html:62 douban | 
|  |      13shakoon      2014-10-26 22:47:02 +08:00 不能翻页&说好的瀑布流呢?是因为采集数据还太少么 | 
|  |      14flyphy      2014-10-26 22:48:29 +08:00  1 试试撸女神 http://lunvshen.com | 
|  |      16kmvan      2014-10-26 23:21:36 +08:00 是啥语言采集的? | 
|  |      17binux OP | 
|  |      18gipsymoth      2014-10-27 09:18:42 +08:00 这个好 | 
|  |      19muziyue      2014-10-27 09:51:33 +08:00 有没有能判断性别的图像处理方案…… | 
|  |      20jacob      2014-10-27 17:24:55 +08:00 害羞组是啥玩意,这些图看得我都害羞了- - | 
|  |      21lubuwei      2014-10-27 18:21:22 +08:00 呃,下班再打开看看...... | 
|  |      22shakespark      2014-10-29 08:50:05 +08:00 为啥里面还有丁丁... | 
|  |      23shakespark      2014-10-29 08:54:14 +08:00 理解了...各种晒10分钟的图被lz抓取了啊哈哈哈 | 
|  |      24hydyy      2014-10-29 09:31:21 +08:00 。。。 | 
|  |      25chilaoqi      2014-10-29 10:42:58 +08:00 这么多丁丁 大丈夫? | 
|      27axe      2014-10-29 15:29:25 +08:00 害羞组是用来约约约的吗。。 | 
|  |      28yangkeao      2014-10-29 17:34:45 +08:00 我想知道多说做数据库是什么情况。。 | 
|  |      30gkuchan      2014-10-29 19:17:27 +08:00 …… 能不能把女人删掉  搞一个只有男人的版本…… | 
|  |      32alsotang      2014-11-01 20:52:13 +08:00 碉堡了 | 
|  |      332232588429      2014-11-02 00:49:20 +08:00 这个数据库是采到26号的?上限怎么定的? | 
|  |      34binux OP @2232588429 我只采集了第一页,我是从26号开始采集的。 | 
|  |      35wh1100717      2014-11-20 22:33:20 +08:00  1 其实你这个还可以加以下功能: 1. 定时check你抓下来的帖子是否删除,如果删除,则高亮显示(原因你懂的) 2. 想办法用算法把广告过滤掉... 3. 增加手动点击发豆油功能(原因你懂的) 4. 增加几个组一起check好了==! 我也写了个一个类似的东西...不过写完就觉得无趣懒得完善了,哈哈 | 
|  |      37mnhkahn      2015-02-25 08:50:41 +08:00 大哥,你这个有些图多说那边没给你处理么? | 
|  |      42lukew      2016-01-19 11:05:42 +08:00 @binux 如果要抓去 app 客户端,纯 http 的 api 接口,需要 https 的支持,登录这些操作 是否合适用 pyspider ? | 
|      44zkeeper      2018-12-04 07:18:38 +08:00 妈的来晚了, 啥都看不见 |