首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 外包信息请发到 /go/outsourcing 节点。

• 不要把相同的信息发到不同的节点

这是一个创建于 1738 天前的主题，其中的信息可能已经有所发展或是发生改变。

公司 logo

关于我们

公司 logo

我们是一个小而美的数据科学团队，通过运用技术改变商业世界，实现数据驱动的精细化研究、运营与决策。
我们的产品正在服务国内外一流企业，包括世界最大的对冲基金、国际一线汽车品牌、快消品龙头厂商，以及时尚鞋服大牌。
我们的团队里有许多顶尖的工程师和数据科学家，来自腾讯、百度、快播、华为、BCG 和国际投资银行，毕业于海内外著名高校。

我们用到的一些技术

Python：爬虫、数据清洗、Web 服务等都用了 Python
Go：爬虫、基础服务、高性能 API 等用了 Go 语言
MySQL/TiDB （官网）：存储爬虫获取的数据，OLTP
Cassandra：存储爬虫获取的数据
Hive: 数据仓库，存储和 ETL
Impala：Hadoop 上的交互式 SQL 查询引擎，OLAP
AWS Redshift: OLAP 数据仓库

其他的还有 MongoDB、Redis、Vue、Docker、ElasticSearch、Kibana、Apache Airflow 等。

大数据工程师 15-25K 全职

职位描述：

负责大数据平台的设计开发，包括平台组件选型及搭建、平台服务开发；
参与设计数据仓库模型、构建分层体系、元数据管理及核心应用开发；
参与数据清洗、转换和加工（ ETL ）；
负责新技术的调研、选型、推广和应用。

任职要求：

本科及以上学历，计算机相关专业，3 年以上大数据工作经验；
熟悉 Hadoop 生态，对 HDFS, Hive, MapReduce, Spark, HBase, Impala 中至少一个有深入理解和使用经验；
熟练使用 SQL，至少熟悉一种关系型数据库；
深入理解维度模型，有数据仓库设计和开发经验；
熟练使用 Python，有良好的编码习惯；
熟悉 Kafka, Spark Streaming, Flink，有实际使用经验者优先；
熟悉 ElasticSearch, Solr, ClickHouse, Redshift 等技术优先；
提供技术博客 / GitHub 账号，有开源贡献和优质技术文章优先。

ETL 工程师 10-20K 全职 /实习

职位描述：

负责数据模型设计和 ETL 设计、开发和文档编写；
负责离线 /实时数据同步和清洗；
根据业务需求，输出报表，给分析师提供数据提取服务。

任职要求：

本科及以上学历，计算机相关专业，1 年以上相关工作经验；
熟练使用 Python，有良好的编码习惯。熟悉 Pandas, 正则表达式、文件处理、并行编程；
掌握数据仓库基础理论知识和 ETL 设计技术；
熟练使用 SQL，至少熟悉一种常用数据库，包括但不限于 MySQL、Postgres、SQL Server、Oracle ；
了解 HDFS, Hive, Impala, Presto 等 Hadoop 大数据技术，有 Spark 经验尤佳；
熟练使用 Linux 系统；
良好的沟通、理解能力，工作细致、耐心、负责；
提供技术博客 / GitHub 账号，有开源贡献和优质技术文章优先。

Python 爬虫工程师 10-30K 全职

职位描述：

负责抓取电商、社交、新闻媒体、论坛类的数据；
监控抓取数据的完整性；
参与爬虫框架的开发。

任职要求：

本科及以上学历；
熟悉 Linux 下的 Python 开发；
熟悉常用数据库，包括 MySQL、Redis、MongoDB 等；
熟悉 Web 开发技术、尤其是前端技术，有实际 Web 开发经验者优先；
熟悉爬虫开发，了解常用爬虫框架如 Scrapy、Requests、XPath 等, 了解常见的反爬手段及其应对措施；
计算机相关专业优先；
熟悉 Node.js 或者 Java 等其它语言者优先。

我们可以为你提供

有竞争力的薪酬：工资、一年两次调薪机会、五险一金、年终奖、节假日福利、生日礼物等。既有情怀，又有“钱”途；
合理的工作时间：我们有弹性工作时间制度，并追求使用技术去高效解决问题，不提倡加班；
团队活动：YiMBA 系列课程、每周的篮球和羽毛球运动，每周分享会，每月聚餐、生日会等。我们是一个有凝聚力的团队；
年度体检：豪华体检，健康强壮的身体是工作的基础；
零食饮料：不间断的供应丰富优质的零食饮料；
年度旅游：前脚去泰国后脚去巴厘岛，随着团队的壮大，以后能去得更远；
舒适的工作环境：我们有一个漂亮的办公室，开放式的设计和十分开阔壮观的窗景

想了解我们日常更多？请猛戳链接： https://www.yimian.com.cn/blog/

> 长期接受全职和实习申请,期待你的加入

> 欢迎发送简历至： [email protected]

>公司地址：深圳市南山区深南大道 9966 号威盛科技大厦 1408

团队活动

目前尚无回复

Python 数据 etl 熟悉

关于 · 帮助文档 · 博客 · API · FAQ · 实用小工具 · 1031 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 22ms · UTC 19:49 · PVG 03:49 · LAX 11:49 · JFK 14:49
Developed with CodeLauncher
♥ Do have faith in what you're doing.