V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
PtAu
V2EX  ›  分享发现

小米发布了新的开源模型 MiMo-V2-Flash

  •  
  •   PtAu · 1 天前 · 2076 次点击

    试了一下推理速度好快啊,但是感觉理解能力和生成效果离我想的有些差距。 MiMo-V2-Flash

    33 条回复    2025-12-17 18:28:22 +08:00
    usVexMownCzar
        1
    usVexMownCzar  
       21 小时 54 分钟前 via iPhone
    除了快其他就是垃圾。

    快 tm 2026 年了,出一个 2023 年的模型
    mailfarmer
        2
    mailfarmer  
       21 小时 28 分钟前
    小米就没什么大模型方面的人才吧
    xiaofeilongyy555
        3
    xiaofeilongyy555  
       20 小时 59 分钟前
    @mailfarmer 罗福莉
    xiaofeilongyy555
        4
    xiaofeilongyy555  
       20 小时 56 分钟前
    @usVexMownCzar 小米的模型主要还是服务于自家的业务吧,并不像 gpt 和 claude 这些专注推理与编码
    dacapoday
        5
    dacapoday  
       20 小时 13 分钟前
    @xiaofeilongyy555 不知道这位是原团队里的扛把子,还是离了团队就什么都不是的角色。
    MIUIOS
        6
    MIUIOS  
       20 小时 13 分钟前
    @usVexMownCzar 在哪里看到是 2023 的
    Astralume
        7
    Astralume  
       19 小时 40 分钟前
    但是小爱同学还是那么垃圾,如果能应用到小爱同学(本地部署也行)那才有用啊。
    xiaofeilongyy555
        8
    xiaofeilongyy555  
       19 小时 40 分钟前
    @dacapoday ACL 8 篇论文,2 篇一作,不知这个含金量够不够
    rogerer
        9
    rogerer  
       19 小时 35 分钟前
    @xiaofeilongyy555 一般,现在很多本科生也能做到两篇顶会。
    xiaofeilongyy555
        10
    xiaofeilongyy555  
       19 小时 30 分钟前
    @rogerer 请问全球每年计算机毕业生中,有多少人手握 2 篇 ACL 一作?有 1% 吗?
    xiaofeilongyy555
        11
    xiaofeilongyy555  
       19 小时 29 分钟前
    @Astralume 小爱现在用的是 deepseek 吧。相比模型,我感觉小爱对于工具的使用、接入不行,
    rogerer
        12
    rogerer  
       19 小时 21 分钟前
    @xiaofeilongyy555 本来能参与 LLM 的预训练这个工作,就不到 1%。
    Shanky
        13
    Shanky  
       19 小时 21 分钟前
    https://huggingface.co/XiaomiMiMo/MiMo-V2-Flash
    看 hugging face 上的 benchmark 成绩挺好,如果能结合米家实现本地小模型/联网大模型,在 IoT 领域的应用挺有想象力的
    xiaofeilongyy555
        14
    xiaofeilongyy555  
       19 小时 17 分钟前
    @rogerer 这什么春秋笔法啊。既然都知道只有 1% 的人能碰预训练,那能占住这 1% 的坑位还能连出一作,不正好说明他就是那 1% 的精英吗?承认别人优秀很难吗,非要说是显卡自己成精写的论文?
    xiaofeilongyy555
        15
    xiaofeilongyy555  
       19 小时 16 分钟前
    @Shanky 本地小模型不太可能,硬件需求对个人来讲太高,调用网络接口反而是更划算的事情
    IlIl
        16
    IlIl  
       19 小时 14 分钟前
    和盘古对比呢 有没数据
    xiaofeilongyy555
        17
    xiaofeilongyy555  
       19 小时 10 分钟前
    @IlIl 和千问对比就行了(*^o^*)
    rogerer
        18
    rogerer  
       19 小时 9 分钟前
    @xiaofeilongyy555 你先别急,我的意思是,在能做预训练的人里,两篇 ACL 不算什么。我们组来的本科实习生都是两篇 nips 打底。
    xiaofeilongyy555
        19
    xiaofeilongyy555  
       19 小时 5 分钟前
    @rogerer 别拿那套批量产出的套路来显摆。现在谁不知道有些大组靠着算力堆实验,实习生只要进去跑个数、填个表就能混个 NIPS 挂名? ACL 一作看的是对 NLP 问题的深度洞察,不是看你在哪家大厂当熟练调参工。 这种流水线上的‘两篇打底’,除了装点门面,真到了解决实际业务问题时有多少含金量,大家心里都有数
    urlk
        20
    urlk  
       19 小时 0 分钟前
    Plutooo
        21
    Plutooo  
       18 小时 45 分钟前   ❤️ 4
    好奇帖子里的某位 v 友是米粉还是员工
    kimiler
        22
    kimiler  
       17 小时 13 分钟前
    @xiaofeilongyy555 当你和小米比参数的时候就表示你已经输了😄
    liaohongxing
        23
    liaohongxing  
       17 小时 6 分钟前
    某人说过,一个人的命运啊,当然要靠自我奋斗,但是也要考虑到历史的行程。对罗福莉持保留态度,一伙人凑到一起能刚好能干事,但是个人渺小有时候什么都不是,当前对她神话的太厉害,能不能带起飞,围观看后续吧。
    voidmnwzp
        24
    voidmnwzp  
       17 小时 2 分钟前 via iPhone
    蒸馏 dicksuck 的吧
    xiaofeilongyy555
        25
    xiaofeilongyy555  
       16 小时 51 分钟前
    @liaohongxing 确实是这样。个人能力和大环境分不开。
    但是,miui 垃圾大家都骂金凡(^▽^)小米汽车 os 做的好大家说是洪峰带队做的。
    其实我最开始只是想说小米并不是没有大模型方面的人才,结果话题慢慢被带歪了,开始讨论起个人渺小,人才被神话太厉害╮(╯_╰)╭
    liaohongxing
        26
    liaohongxing  
       16 小时 48 分钟前
    找了一下网址: https://aistudio.xiaomimimo.com/ ,试了一下,效果还可以,没那么不堪。
    liaohongxing
        27
    liaohongxing  
       16 小时 45 分钟前
    如果联通 小爱同学+本地 mcp 再迭代几次,小爱同学估计智力+本地应用操作 会上升不少,当前的小爱同学智力有点太差了。
    even77
        28
    even77  
       16 小时 39 分钟前
    看后面小爱同学的更新了,目前感觉小爱同学和豆包差得太多了,很希望把小爱换成豆包
    ynxh
        29
    ynxh  
       16 小时 35 分钟前
    预测一下,未来小米可能会推出一个本地化的个人算力盒子。有可能结合 nas 一起。人车家战略,在我看来,还需要这个东西实现闭环。允许你在任何地方,调用家里的算力进行敏感信息处理和运算。
    refsdiary
        30
    refsdiary  
       16 小时 15 分钟前
    @ynxh 不用预测肯定的呀。已经有开源的方案了呀。米家那个
    losetear
        31
    losetear  
       15 小时 56 分钟前
    试了下,感觉不咋行,有点差
    ynxh
        32
    ynxh  
       15 小时 27 分钟前
    @refsdiary 在哪有 ai 算力盒的方案,全套的系统在哪,硬件在哪,起码还得加上内网穿透,多端流转,你确定开源的是模型还是什么?咱们说的是一回事吗?
    zhuhaohenry
        33
    zhuhaohenry  
       12 小时 13 分钟前
    集成到 claude code 里感觉还行啊。。。 现在免费 15 天,不用白不用
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   968 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 22:41 · PVG 06:41 · LAX 14:41 · JFK 17:41
    ♥ Do have faith in what you're doing.