我们是一个小而美的数据科学团队,通过运用技术改变商业世界,实现数据驱动的精细化研究、运营与决策。
我们的产品正在服务国内外一流企业,包括世界最大的对冲基金、国际一线汽车品牌、快消品龙头厂商,以及时尚鞋服大牌。
我们的团队里有许多顶尖的工程师和数据科学家,来自腾讯、百度、快播、华为、BCG 和国际投资银行,毕业于海内外著名高校。
其他的还有 MongoDB、Redis、Vue、Docker、ElasticSearch、Kibana、Apache Airflow 等。
负责大数据平台的设计开发,包括平台组件选型及搭建、平台服务开发;
参与设计数据仓库模型、构建分层体系、元数据管理及核心应用开发;
参与数据清洗、转换和加工( ETL );
负责新技术的调研、选型、推广和应用。
本科及以上学历,计算机相关专业,3 年以上大数据工作经验;
熟悉 Hadoop 生态,对 HDFS, Hive, MapReduce, Spark, HBase, Impala 中至少一个有深入理解和使用经验;
熟练使用 SQL,至少熟悉一种关系型数据库;
深入理解维度模型,有数据仓库设计和开发经验;
熟练使用 Python,有良好的编码习惯;
熟悉 Kafka, Spark Streaming, Flink,有实际使用经验者优先;
熟悉 ElasticSearch, Solr, ClickHouse, Redshift 等技术优先;
提供技术博客 / GitHub 账号,有开源贡献和优质技术文章优先。
负责数据模型设计和 ETL 设计、开发和文档编写;
负责离线 /实时数据同步和清洗;
根据业务需求,输出报表,给分析师提供数据提取服务。
本科及以上学历,计算机相关专业,1 年以上相关工作经验;
熟练使用 Python,有良好的编码习惯。熟悉 Pandas, 正则表达式、文件处理、并行编程;
掌握数据仓库基础理论知识和 ETL 设计技术;
熟练使用 SQL,至少熟悉一种常用数据库,包括但不限于 MySQL、Postgres、SQL Server、Oracle ;
了解 HDFS, Hive, Impala, Presto 等 Hadoop 大数据技术,有 Spark 经验尤佳;
熟练使用 Linux 系统;
良好的沟通、理解能力,工作细致、耐心、负责;
提供技术博客 / GitHub 账号,有开源贡献和优质技术文章优先。
负责抓取电商、社交、新闻媒体、论坛类的数据;
监控抓取数据的完整性;
参与爬虫框架的开发。
本科及以上学历;
熟悉 Linux 下的 Python 开发;
熟悉常用数据库,包括 MySQL、Redis、MongoDB 等;
熟悉 Web 开发技术、尤其是前端技术,有实际 Web 开发经验者优先;
熟悉爬虫开发,了解常用爬虫框架如 Scrapy、Requests、XPath 等, 了解常见的反爬手段及其应对措施;
计算机相关专业优先;
熟悉 Node.js 或者 Java 等其它语言者优先。
有竞争力的薪酬:工资、一年两次调薪机会、五险一金、年终奖、节假日福利、生日礼物等。既有情怀,又有“钱”途;
合理的工作时间:我们有弹性工作时间制度,并追求使用技术去高效解决问题,不提倡加班;
团队活动:YiMBA 系列课程、每周的篮球和羽毛球运动,每周分享会,每月聚餐、生日会等。我们是一个有凝聚力的团队;
年度体检:豪华体检,健康强壮的身体是工作的基础;
零食饮料:不间断的供应丰富优质的零食饮料;
年度旅游:前脚去泰国后脚去巴厘岛,随着团队的壮大,以后能去得更远;
舒适的工作环境:我们有一个漂亮的办公室,开放式的设计和十分开阔壮观的窗景