V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
sarahuyan
V2EX  ›  酷工作

静安期待 php+爬虫 薪资 open

  •  
  •   sarahuyan · 2016-08-05 13:52:35 +08:00 · 2584 次点击
    这是一个创建于 2827 天前的主题,其中的信息可能已经有所发展或是发生改变。
    畅圣科技,金融大数据平台;
    需要一位熟悉爬虫框架的 php 工程师,带领 3 人团队完成 1 条爬虫产品线
    合作伙伴为交大 ACM 世界冠军+交大博士,同济、南大,中科院等院校同学

    地点: 静安区江宁路 495 号博鸿大厦 27 楼(近康定路)。
    更多公司信息,详见 www.iuicity.com
    邮箱: [email protected]
    11 条回复    2016-08-28 14:51:00 +08:00
    gundanx10
        1
    gundanx10  
       2016-08-05 15:11:28 +08:00
    要外包吗?
    wh1012023498
        2
    wh1012023498  
       2016-08-05 20:21:37 +08:00
    PHP 有好的爬虫框架吗。。= =
    iamjs
        3
    iamjs  
       2016-08-06 06:52:59 +08:00
    @wh1012023498 同问
    sarahuyan
        4
    sarahuyan  
    OP
       2016-08-08 09:33:01 +08:00
    作为 hr ,我知道没有,但是作为程序员,有些人应该接触过 java 或 pthon 的爬虫框架
    sarahuyan
        5
    sarahuyan  
    OP
       2016-08-08 09:33:39 +08:00
    @gundanx10 抱歉,不需要外包
    dydhyh
        6
    dydhyh  
       2016-08-08 21:57:30 +08:00
    0.0 招实习么
    sarahuyan
        7
    sarahuyan  
    OP
       2016-08-09 12:07:15 +08:00
    @dydhyh 暂时 h 还没有实习生职位
    yepinf
        8
    yepinf  
       2016-08-09 12:18:18 +08:00
    yeless
        9
    yeless  
       2016-08-09 13:13:30 +08:00
    初级 python..
    wh1012023498
        10
    wh1012023498  
       2016-08-09 13:40:52 +08:00
    @yepinf 不怎么样
    gouchaoer
        11
    gouchaoer  
       2016-08-28 14:51:00 +08:00
    @wh1012023498 这么说吧,一般需要定制的爬虫很难去用 Scrapy 或者 java 的一堆框架,框架很难扩展(当然了框架适合改几句就跑起来玩的小白),简单的还是都开一个 httpclient 去拿数据然后找个 dom 抽取数据。。。一切还是看基础库好不好用,然后 web 库一直是 php 的强项。。。实际上爬虫的重心不在框架,代理、反爬虫技术栈、 js 、数据处理、监控等等细节用框架根本玩不动。。。我一直用 php 写所谓的“爬虫”,单纯写业务很 trivial 很 easy ,但是在反爬虫上面画的时间很多
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   903 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 19:13 · PVG 03:13 · LAX 12:13 · JFK 15:13
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.