V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
NascentCoreAI
V2EX  ›  远程工作

NVIDIA GPU 智算集群运维工程师

  •  
  •   NascentCoreAI · 2023-10-30 14:45:35 +08:00 · 1088 次点击
    这是一个创建于 393 天前的主题,其中的信息可能已经有所发展或是发生改变。

    公司介绍: 算想未来是一家大模型算力云服务技术服务商;正在研发一款云原生、基于 K8s 的大模型训练平台软件产品;目前已有稳定营收、收支平衡、正在进行天使轮或 A 轮融资;算想未来的目标产品是开放的大模型算力云市场,一个匹配中小企业大模型算力需求与多样化的 GPU 算力供应源的开放式的、分布式的算力市场;该产品一方面解决算力供需匹配问题、另一方面基于算想未来大模型算力平台软件,提高算力使用效率、降低大模式算力用户使用成本。 算想未来团队来自 Google 等世界领先的大模型计算平台基础设施研发团队;创始团队合计超过 30 年的人工智能基础设施软件的研发经验。团队有丰富的创业经验,创始人是连续创业者,曾于 2019 年 4 月加入 Pixie ( https://px.dev ),作为创始团队成员和技术负责人,带领团队完成产品研发、并于 2020 年 12 月被纽约证券交易所上市公司 New Relic 收购,前后历时不到 2 年。 算想未来获得奇绩创坛天使轮融资;从全球超过 5000 家申请者中脱颖而出入选奇绩创坛 2022 年秋季创业营(录取率不到 1%)。团队帮助中国大模型团队迅速突破模型训练的算力墙,让大模型训练规模赶超 OpenAI 、Google ,打开大模型算法和 AI 应用迭代飞轮,让大模型发生在中国,让中国成为 AI 经济世代的领导者! 面试流程: 2 轮线上 1 轮线下

    薪资待遇

    • 20k-40k 12 月 工作亮点
    • 业界最热门的大模型及 AGI 赛道初创团队
    • Google 等世界顶级大模型 AI 算力平台技术专家带队;
    • 解决中国算力卡脖子难题,为中国大模型团队提供低成本、高性价比算力;
    • 与全球业界顶尖工程团队、高校教授、研究机构定时交流前沿技术;
    • 混合办公(北京、或远程)、平等沟通、极致扁平化团队;
    • 内部信息完全公开,为工程师打开产品、商业的大门;
    • 丰厚期权; 关键词 DevOps 、Kubernetes 、Docker 、Python 、运维开发经验 能力要求
    • 计算机及计算机相关专业本科或以上学历,熟悉计算机科学基本知识:分布式系统原理、计算机网络、数据结构和算法
    • 独立解决生产环境中的技术问题,阅读英文技术文档
    • 精通 Linux 环境下 GPU 、IB 网络的运维管理、Kubernetes 运维管理
    • 熟悉 Kubeflow 、Ansible 、Ceph 、Harbor 等云原生工具
    • 熟悉 Golang 、Python 、Shell 等编程语言
    • 熟悉服务端基础技术(存储系统、数据库、消息队列、微服务、安全等)、熟悉分布式系统可扩展性机制和功能、熟悉 IaC ( Infrastructure as Code )最佳实践、熟悉公有云产品服务和系统架构
    • 坚持高质量 DevOps 工程实践(测试、集成、架构)、抱有 AI 信仰:坚信 AI 改变世界
    • 乐于并且善于与团队进行远程合作,在各种场合下卓越的沟通能力(代码、文档、即时通信工具、音视频会议、线下会议等等) 岗位职责
    • 对 NVIDIA GPU 智算集群服务器及 IB 网络进行配置、优化,适配 Kubernetes ;
    • 编写私有化部署的交付部署方案,编写部署和运维软件工具和脚本;
    • 指导私有化部署客户现场交付,根据用户需求、IT 资产具体情况,制定可靠、高效的交付部署方案;
    • 参与设计、开发 K8s 上的大模型训推平台;
    • 参与制定公司整体软件工程规范,持续迭代优化公司软件工程质量、提升工程团队研发效能、提升产品服务质量; 联系方式
    • 巩女士,Email: [email protected] ,手机:15910555162 (微信同手机号)
    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1055 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 20:19 · PVG 04:19 · LAX 12:19 · JFK 15:19
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.