小米发布了新的开源模型 MiMo-V2-Flash

37 replies • 2025-12-19 16:33:04 +08:00

1

usVexMownCzar

Dec 17, 2025 via iPhone

除了快其他就是垃圾。

快 tm 2026 年了，出一个 2023 年的模型

2

mailfarmer

Dec 17, 2025

小米就没什么大模型方面的人才吧

3

xiaofeilongyy555

Dec 17, 2025

@mailfarmer 罗福莉

4

xiaofeilongyy555

Dec 17, 2025

@usVexMownCzar 小米的模型主要还是服务于自家的业务吧，并不像 gpt 和 claude 这些专注推理与编码

5

dacapoday

Dec 17, 2025

@xiaofeilongyy555 不知道这位是原团队里的扛把子，还是离了团队就什么都不是的角色。

6

MIUIOS

Dec 17, 2025

@usVexMownCzar 在哪里看到是 2023 的

7

Astralume

Dec 17, 2025

但是小爱同学还是那么垃圾，如果能应用到小爱同学（本地部署也行）那才有用啊。

8

xiaofeilongyy555

Dec 17, 2025

@dacapoday ACL 8 篇论文，2 篇一作，不知这个含金量够不够

9

rogerer

Dec 17, 2025

@xiaofeilongyy555 一般，现在很多本科生也能做到两篇顶会。

10

xiaofeilongyy555

Dec 17, 2025

@rogerer 请问全球每年计算机毕业生中，有多少人手握 2 篇 ACL 一作？有 1% 吗？

11

xiaofeilongyy555

Dec 17, 2025

@Astralume 小爱现在用的是 deepseek 吧。相比模型，我感觉小爱对于工具的使用、接入不行，

12

rogerer

Dec 17, 2025

@xiaofeilongyy555 本来能参与 LLM 的预训练这个工作，就不到 1%。

13

Shanky

Dec 17, 2025

https://huggingface.co/XiaomiMiMo/MiMo-V2-Flash
看 hugging face 上的 benchmark 成绩挺好，如果能结合米家实现本地小模型/联网大模型，在 IoT 领域的应用挺有想象力的

14

xiaofeilongyy555

Dec 17, 2025

@rogerer 这什么春秋笔法啊。既然都知道只有 1% 的人能碰预训练，那能占住这 1% 的坑位还能连出一作，不正好说明他就是那 1% 的精英吗？承认别人优秀很难吗，非要说是显卡自己成精写的论文？

15

xiaofeilongyy555

Dec 17, 2025

@Shanky 本地小模型不太可能，硬件需求对个人来讲太高，调用网络接口反而是更划算的事情

16

IlIl

Dec 17, 2025

和盘古对比呢有没数据

17

xiaofeilongyy555

Dec 17, 2025

@IlIl 和千问对比就行了(*^o^*)

18

rogerer

Dec 17, 2025

@xiaofeilongyy555 你先别急，我的意思是，在能做预训练的人里，两篇 ACL 不算什么。我们组来的本科实习生都是两篇 nips 打底。

19

xiaofeilongyy555

Dec 17, 2025

@rogerer 别拿那套批量产出的套路来显摆。现在谁不知道有些大组靠着算力堆实验，实习生只要进去跑个数、填个表就能混个 NIPS 挂名？ ACL 一作看的是对 NLP 问题的深度洞察，不是看你在哪家大厂当熟练调参工。这种流水线上的‘两篇打底’，除了装点门面，真到了解决实际业务问题时有多少含金量，大家心里都有数