Grok-1 开源了

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 763 天前的主题，其中的信息可能已经有所发展或是发生改变。

3 月 18 日消息马斯克旗下 AI 初创企业 xAI 今天发布新闻稿，宣布正在开源 3140 亿参数的混合专家模型 Grok-1 ，该模型遵循 Apache 2.0 协议开放模型权重和架构，号称是“迄今为止全球参数量最大的开源大语言模型”可能需要一台拥有 628 GB GPU 内存的机器（每个参数 2 字节）。这么算下来，8xH100 （每个 80GB ）就可以了。https://github.com/xai-org/grok-1

Grok-1

开源

模型

23 条回复 • 2024-03-20 20:53:37 +08:00

lilei2023

2024 年 3 月 18 日

没几个牛逼的 GPU ，估计跑不起来吧

muzihuaner

2024 年 3 月 18 日

@lilei2023 确实

Bluecoda

2024 年 3 月 18 日

自主创新又可以了

huihuiHK

2024 年 3 月 18 日

国内一大批自主创新正在路上

cPO3Im7cn3lD39cU

2024 年 3 月 18 日

@Bluecoda 又乱说了
明明是一大批自主研发的，不可能用别人的技术来创新的

Beginner1

2024 年 3 月 18 日

314B 个参数，得什么水准的设备才能跑

okakuyang

2024 年 3 月 18 日 via iPhone

老马还是说到做到的

Beginner1

2024 年 3 月 18 日

话说 Meta 的 13B 的 chat 如何，有没有人搭建过，准备搞一个，如果效果不好就算了

e1d4py0KiD6KgqkQ

2024 年 3 月 18 日 via Android

我看有人把它下载了，几百 G

DIMOJANG

2024 年 3 月 18 日

这下那些说苹果统一内存适合搞大模型的人说不出话了

huluhulu

2024 年 3 月 18 日

Grok-1 之前测试成绩好像不太行，属于量大，但是不行的那种

Chihaya0824

PRO

2024 年 3 月 18 日

这个是一个 MoE 模型，然后也是 8 个 expert 然后同时激活两个的架构
所以大概率并不是 OP 算的那样要整个丢进去，大概硬要求只是需要类似 90B 模型的大小的空间就行了
苹果的统一内存还是很可能能用的，特别是这还是没有 Quantization 之前的大小
所以老黄能不能下一代 90 系列变成 48G 显存秋梨膏