V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 外包信息请发到 /go/outsourcing 节点。
• 不要把相同的信息发到不同的节点
xiaoxianyu
V2EX  ›  酷工作

[杭州 / 幻方量化] 高级数据采集工程师(AGI)

  •  
  •   xiaoxianyu · 2023-07-18 11:35:00 +08:00 · 1483 次点击
    这是一个创建于 523 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我们寻找会学,会玩,对世界充满好奇心,不走寻常路的人,去解决大的问题。

    岗位职责:

    1. 遵循 robots 协议,对互联网公开信息进行采集;

    2. 负责网页信息抽取技术算法的研究和开发,提升数据采集的效率和质量;

    3. 负责设计和开发分布式的网络数据采集技术,能独立解决实际开发过程碰到的各类问题(优化调度、并发、覆盖率等) ,提升数据采集的效果与性能;

    4. 负责数据采集解析入库、系统异常监控与警报等。

    任职要求:

    1. 具备扎实的编程能力、优秀的设计能力和代码品味,具有强烈的责任心

    2. 熟练掌握 HTML 、JavaScript 、Python 、Scrapy 等,能快速完成采集脚本的编写;

    3. 了解主流网络数据采集技术和框架工具,如 Selenium/Puppeteer/PhantomJS/Scrapy 等;

    4. 了解 NLP 基本技术,实际使用过如 Fasttext 、N-gram 、Bert 、GPT 等算法和模型者优先;

    5. 熟悉常见限制访问服务器资源和获取数据技术,具备相关的实战经验。

    公司介绍戳 👉 https://www.high-flyer.cn/

    简历邮递: yao.li@high-flyer.cn
    5 条回复    2023-08-01 11:17:21 +08:00
    ghyghoo8
        1
    ghyghoo8  
       2023-07-18 13:40:37 +08:00
    招前端吗
    alukongfu
        2
    alukongfu  
       2023-07-18 13:50:52 +08:00
    远程办公吗?
    garfieldlw
        3
    garfieldlw  
       2023-07-19 12:49:35 +08:00
    招后端吗?
    xiaoxianyu
        4
    xiaoxianyu  
    OP
       2023-08-01 11:15:53 +08:00
    @garfieldlw 简历可以先发我哈
    xiaoxianyu
        5
    xiaoxianyu  
    OP
       2023-08-01 11:17:21 +08:00
    @ghyghoo8 目前急缺全栈工程师,简历可以先发我一下哈
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1453 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 16:45 · PVG 00:45 · LAX 08:45 · JFK 11:45
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.