之前写过一个 scrapy-examples 项目( https://github.com/geekan/scrapy-examples )
里面自己造了模板化抽取的轮子。但用 scrapy 来实现还是不伦不类,有点想自己做个大轮子(爬虫)。
各位觉得大概多久可以读完代码?实现一个 scrapy 大概又要多久呢?
|  |      1yangxin0      2016-05-12 23:27:58 +08:00 20k 行算小型项目,正常情况 1 各月要看完吃透 | 
|      2zhtsuc      2016-05-13 00:45:09 +08:00 via Android 厉害 | 
|  |      3alexapollo OP @yangxin0 一天 1000 行? | 
|      4ayaseangle      2016-05-13 02:35:29 +08:00 想 python 这类动态语言表达力太强,代码量小并不代表好读,有时候有进坑。。。 | 
|      5kslr      2016-05-13 03:00:48 +08:00 via Android  1 @alexapollo 读的思想,而不是砖头怎么摆的 | 
|  |      6Dannytmp      2016-05-13 06:14:59 +08:00 via Android 没有必要把每一行都看懂吧 | 
|  |      7haogefeifei      2016-05-13 09:18:30 +08:00 从使用角度去读很快的。。 | 
|  |      8yangxin0      2016-05-13 10:08:20 +08:00 via iPhone @alexapollo 把握住要脉络,仔细看核心模块,其他的需要的时候再看 | 
|  |      9nivan      2016-05-13 10:27:31 +08:00 我看 LZ 头像的感觉,大概是读不完了!😄 | 
|  |      10Yc1992      2016-05-13 10:28:30 +08:00 难道单元测试的代码你也要读么。。。 话说只看 scrapy 肯定不行吧, twisted 不看一下也是不行的。 | 
|      11xiongxin8802      2016-05-13 10:35:47 +08:00 @Yc1992 不读单元测试,不知道有什么功能吧,我现在也在疑惑读别人的代码,是不是要先读单元测试 | 
|  |      12veezzz      2016-05-13 11:46:14 +08:00 最近自己也在造爬虫轮子,有兴趣可以交流下 | 
|  |      14andong777      2016-05-13 13:25:51 +08:00 可以考虑读一下早期的版本,比如 0.1 。早期版本比较精简,都是核心代码 | 
|      1528ms      2016-05-13 14:24:01 +08:00 scrapy 框架的核心是基于 Twisted 框架,其本身并没有什么复杂的东西, twisted 才是关键。 | 
|  |      16alexapollo OP | 
|  |      17alexapollo OP | 
|      18wsy2220      2016-05-13 23:31:45 +08:00 不是每一行都要看的... |