为什么 deepseek 的源代码只有几个文件？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

For Existing Member Sign In

This topic created in 36 days ago, the information mentioned may be changed or developed.

convert.py fp8_cast_bf16.py generate.py kernel.py model.py 就这几个文件？就这一个文件就可以实现一个大模型？

DeepSeek

源代码

大模型

18 replies • 2026-04-24 14:57:26 +08:00

106npo

Mar 28 via Android

大模型的开源指的是权重

opengps

Mar 28

大模型里的大，指的是训练集大

cpalead

Mar 28

@106npo 权重是什么意思

lifei6671

Mar 28

当然不是呀。DeepSeek 所谓的开源是指开源里大模型的权重。你可以理解为一个公式，DeepSeek 给出的最优解集合。开源的当然不是解的过程。
一般情况下，会有三个文件，配置文件、权重文件和 Tokenizer 文件。

levn

Mar 28

完全开源 (Open Source / Open Source AI - OSI): 遵循 Open Source Initiative 的定义。指不仅开放模型权重，还开放训练代码、数据预处理流程、甚至训练数据集的完整生态，OLMo 就是一个例子。
开放权重 (Open Weights): 大多数所谓的“开源”大模型均属于此。这类模型会公开模型参数（ Weight ），使您可以运行、微调模型，但通常不公开训练数据来源、预训练时的配比策略或完整代码。例如，早期的 Llama 系列通常被认为是开放权重。

Inn0Vat10n

Mar 28

其他的代码你没集群,没数据,也跑不起来啊

cpalead

Mar 28

@Inn0Vat10n 其他的代码在哪

CEBBCAT

Mar 28

楼主是退休的高校计算机系老教授吗？这些问题可以问问 chatgpt.com 看看

frayesshi1

PRO

Mar 28

这几个 python 文件不是权重吧，权重是类似 CV 里面的 bin 文件或者 yolo 的 onnx 文件，是训练得到的数据

hefish

Mar 28

数据有好多 G 的吧。
源码里面调用的模块，也不小啊。。
你跑了跑就知道了。。
我光装个 vllm 就装了几百个 M 。

strobber16

Mar 28 via Android

微内核

cpalead

Mar 28

@CEBBCAT 是什么让你判断是高校计算机老教授的

CEBBCAT

Mar 28

@cpalead #12 说出来会打击人，总的来说还是尝试在思维敏捷和思辨上加强一些锻炼吧

xyooyx

Mar 28

非 AI 时代，企业花了大量成本找来最优秀的工程师编写出优质代码，有价值的是代码逻辑，所以我们得出逻辑 [开放代码=共享价值] 。
模型时代，企业花了大量算力计算出模型权重，那么开发代码并不能实现价值共享，转而变成 [开放权重=共享价值]

zizon

Mar 29

1. generate.py 描述了数据/权重文件怎么加载的.
2. model.py,尤其 Transformer 类描述了模型结构/层等怎么构成的信息.
3. kernel.py 描述了 2 里用到的一些核心自定义算子.

给你 2+1 类似与给了头文件声明和.so 文件.

开源的是这个.h.

4. 更接近一些你理解的开源的是有些会提供 finetune.py,做微调的.
这个会告诉你一部分真实完整训练场景下,input/训练数据大概长什么样.
理论上,你有可能根据这个数据格式,去完整重新训练一个等价模型,前提是有对应的硬件资源.

但,通常来说 fintune.py 暴露的信息是不够的.
之所以叫微调,也就是因为它只是一部分 input 长这样.

你可以看看 olmo 的 train.py,比较符合你的对开源的想法.
属于一个端到端,理论上你有硬件条件就可以从 repo 完整复刻的开源形态.
https://github.com/allenai/OLMo/blob/main/scripts/train.py

你说 1/2/4 够不够.
也不能说不够吧.

但 pretrain 的 datasource 直觉上还是很影响跟模型交互的语言/prompt 风格的.

doomty

Mar 30

问了 chatgpt ，回答中提到了这个 https://huggingface.co/deepseek-ai/DeepSeek-V3.2/tree/main 里面有你期待的大文件

cpalead

Mar 31

@doomty 这些是代码吗？不是参数吗

nieyuanhong

Apr 24

要不你找一个 ai 问问吧, 你这种提问态度只有 ai 能受得了.