V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  xiaozizayang  ›  全部回复第 16 页 / 共 23 页
回复总数  451
1 ... 8  9  10  11  12  13  14  15  16  17 ... 23  
2017-12-21 11:54:46 +08:00
回复了 xiaozizayang 创建的主题 Python Sanic 源码阅读 - 基于 0.1.2
你说得有道理 我也是说明和和注释相结合 我是这样写的 我把源码注释好了放在另外一个项目里 我在文章中列出框架的执行路线,每个路线的函数的作用,若想知道这个函数具体代码以及代码的具体解释,这里我就会把我注释好的代码地址放在旁边,读者可以一边看我写的注释,一边追踪框架的运行路线
2017-12-21 11:37:42 +08:00
回复了 xiaozizayang 创建的主题 Python Sanic 源码阅读 - 基于 0.1.2
@neoblackcap 这是导读 核心部分如 server.py 每个函数我都写注释了 难道把注释解释放在文档里?
2017-12-21 08:49:31 +08:00
回复了 xiaozizayang 创建的主题 Python Sanic 源码阅读 - 基于 0.1.2
@mimzy 非常感谢 已改
2017-12-20 08:30:42 +08:00
回复了 Ehco1996 创建的主题 Python 写了个爬虫用的小工具: LazySpider 发布啦!
支持楼主 谁不是新手来的
2017-12-18 20:58:14 +08:00
回复了 graetdk 创建的主题 程序员 违反一下政治正确,骂一下 Google
楼主有发邮件询问么?我和你一样情况,发邮件说情况,第二天就回访弄好了
2017-12-12 09:14:10 +08:00
回复了 quietjosen 创建的主题 程序员 我是如何把 iText 带到这个世界的(双 12 有活动)
block
2017-12-04 10:24:42 +08:00
回复了 prasanta 创建的主题 Python Toapi - 让任何一个网站提供 API 接口.
关于 xpath 的解决方式,我另一个项目和你这个项目的目标值提取方式很像,我当时的解决方式是让使用者自己定义一个函数在 Item 的继承类里面,比如
``` python
from talonspider import Item, TextField, AttrField
from pprint import pprint

try:
bool(type(unicode))
except NameError:
unicode = str


class DoubanItem(Item):
target_item = TextField(css_select='div.item')
title = TextField(css_select='span.title')
cover = AttrField(css_select='div.pic>a>img', attr='src')
abstract = TextField(css_select='span.inq')

def tal_title(self, title):
# 这里当返回是 list,让使用者在自己定义的这个函数里解决
if isinstance(title, unicode):
return title
else:
return ''.join([i.text.strip().replace(u'\xa0', '') for i in title])
```
项目地址 https://github.com/howie6879/talonspider

如果你觉得可以 我们可以改成这样子去解决
2017-12-04 10:20:40 +08:00
回复了 prasanta 创建的主题 Python Toapi - 让任何一个网站提供 API 接口.
@prasanta 抱歉 ,刚看到,我没用 xpath 不过我发现 cssselector 也有这个问题 我已经解决了并提交 pr,我还提交了一些参数的优化 比如 requests 的 get 支持 headers,flask 的一些 options 参数传递问题,新增加了一个用 css 提取写的豆瓣 demo
![]( http://oe7yjec8x.bkt.clouddn.com/howie/2017-12-04-00.png-blog.howie)
2017-12-04 07:59:17 +08:00
回复了 prasanta 创建的主题 Python Toapi - 让任何一个网站提供 API 接口.
我也有这个想法 但随后又想 这就是一个小爬虫框架啊 就没弄 支持楼主 想去贡献下😍😍
2017-11-23 16:25:48 +08:00
回复了 intohole 创建的主题 Python 来一起造作吧!有一个爬虫小框架等你来!
2017-11-02 18:58:54 +08:00
回复了 ssshooter 创建的主题 程序员 不知道大家还有没有认识的人是 11 点前睡觉的...
我啊
2017-10-26 09:15:30 +08:00
回复了 easthing 创建的主题 分享创造 instagram 图片批量下载
我也写了个 ig 下载网址 并开源了 https://github.com/howie6879/instdd
2017-10-24 15:11:59 +08:00
回复了 xiaozizayang 创建的主题 Python 有用 sanic 的么?菜鸟问个 sanic 的压测问题
@strahe 裸跑了 问题依旧 无法水平扩展 你几台机器?
2017-10-24 15:02:15 +08:00
回复了 xiaozizayang 创建的主题 Python 有用 sanic 的么?菜鸟问个 sanic 的压测问题
@raptor 我用 sanic 写个几个小应用 性能是可以的 我现在就是压测水平拓展发现有点问题 不知是我代码问题还是什么
不知有没有其他人遇到过
2017-10-24 14:09:33 +08:00
回复了 xiaozizayang 创建的主题 Python 有用 sanic 的么?菜鸟问个 sanic 的压测问题
@prasanta 谢谢回复 为什么裸跑比较好呢?我试了下裸跑 还是会在第三台的时候 rps 上不去 cpu 利用不起来~~~
2017-10-24 11:55:18 +08:00
回复了 xiaozizayang 创建的主题 Python 有用 sanic 的么?菜鸟问个 sanic 的压测问题
@keysona gunicorn 跑的 开了四个 有猜测是不是在 worker 切换消耗了时间
2017-10-10 20:01:43 +08:00
回复了 mathzhaoliang 创建的主题 Python 秀一个 Python 脚本生成的新作品
很早就看到大佬的项目 继续膜拜
2017-10-08 15:59:14 +08:00
回复了 Esen 创建的主题 MacBook Pro Macbook pro 屏幕进虫子了,买了 1 年零 10 个月,没买那个 care。
@Auster 很好 你买了多久 我刚预约了
2017-10-08 00:11:36 +08:00
回复了 Esen 创建的主题 MacBook Pro Macbook pro 屏幕进虫子了,买了 1 年零 10 个月,没买那个 care。
@Auster 能换的时候给我个 at
1 ... 8  9  10  11  12  13  14  15  16  17 ... 23  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2166 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms · UTC 05:28 · PVG 13:28 · LAX 22:28 · JFK 01:28
Developed with CodeLauncher
♥ Do have faith in what you're doing.