1
knightdf 2017-05-10 19:17:06 +08:00
pipeline 处理 item 应该是无序的,只是 pipeline 有权重高低顺序之分
|
2
dsg001 2017-05-10 19:38:05 +08:00
使用 orderdict 排序吧
|
3
zsz 2017-05-10 19:53:22 +08:00
pipelines 处理数据本身就是根据数据获取的顺序处理(流式),如果抓取的数据比较少,可以缓存到 cache 中,最后排序入库,不然还是直接入库,用 infoid 建立一个索引字段
|
4
freestyle 2017-05-11 09:59:46 +08:00
sorted(item.items(), key=lambda i:i["infoid"])
|
5
freestyle 2017-05-11 10:01:08 +08:00
4#回复错了
data = item.items() sorted(data, key=lambda i:i["infoid"]) |