V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  hbdh5  ›  全部回复第 1 页 / 共 3 页
回复总数  42
1  2  3  
7 小时 53 分钟前
回复了 houshuu 创建的主题 Local LLM DeepSeek V3
@neteroster 是的,论文主要的亮点就是训练部分,不得不说还得是 MoE ,要是 dense 模型参数太大的话一张卡放不下数据交换的妈都不认识,根本没地应用这么多优化。只能送钱给老黄。
16 小时 40 分钟前
回复了 mqb666 创建的主题 硬件 想用笔记本跑 AI 模型,有什么推荐的吗
@mumbler 可题主问的是笔记本跑,那我就默认是个人用了。医疗数据应该是有业务用途的怎么也得买个 8 卡集群吧?
16 小时 43 分钟前
回复了 houshuu 创建的主题 Local LLM DeepSeek V3
没人关注训练部分吗?看看原始论文,推理部分的优化似乎来自蒸馏自家的推理模型,auxilary loss 动态调度负载 + DualPipe 优化 pipeline bubbles + 根据通信做混合精度优化, 计算与通信的瓶颈的优化做到极致了。以至于训练成本只有 500 多万刀,和 o 家和 g 家比算是用乞丐的成本达成了至少也是不相上下的结果。要我说,closedai 不做人干脆把 gpu 匀给 deepseek ,可惜匀不得。
21 小时 41 分钟前
回复了 mqb666 创建的主题 硬件 想用笔记本跑 AI 模型,有什么推荐的吗
推荐就是老老实实的调 api ,别想本地跑啥模型,新发布的 deepseek v3 看了吧,这玩意主流的笔记本就是量化到 1bit 都加载不进内存。
技术没啥门槛,RAG+AI Agent+Promt ,国内主要是底模不行,要有个 sonnet 那样强大的底模才行。国内那些大公司还是少弄些开源刷榜的模型把,弄个强大闭源的底模比天天刷那些 ai 榜单强一万倍。
16 天前
回复了 kongkongye 创建的主题 程序员 大家用 windsurf/cursor 开发真实体验如何?
我用 cursor 写 rust ,感觉像个智障,天天编译器报错过不去,要不就是写的一坨,最后受不了还得我自己写。然后换个 js 项目,那叫一个流畅。看来配合 ai 写代码还得选个用的多的语言,这样他的数据集足够才不会太智障。
2023-12-14 13:12:14 +08:00
回复了 YHKM 创建的主题 路由器 搞来搞去,还是发现硬路由稳定
别整啥 ALL IN ONE, 别装啥虚拟化系统有啥不稳定的。路由这么重要的组件值得单独部署一个硬件。
image classification ,烂大街了已经。随便找个主流的模型训练下差不多行了。相比之下数据集反而比模型更有门槛
2023-11-14 11:24:20 +08:00
回复了 ThinkStu 创建的主题 LeetCode 为什么要刷算法?
除了面试没有任何意义
2023-04-16 10:46:14 +08:00
回复了 zhengzhongzhao 创建的主题 程序员 functional programming 应该翻译成泛函编程
泛函是分析学中的概念,而编程语言中的函数是 ml 和 pl 的概念,只分 first-order 和 higher-order 。且不说两者研究的内容牛头不对马嘴了,泛函是实值函数,而 pl 的对象大多是 most coutable 你要硬是把它套用到 pl 里那你确定 pl 的对象满足实数的要求吗?
2023-04-04 13:32:13 +08:00
回复了 Salud 创建的主题 职场话题 看到这篇文章关于学历问题有些感想。
尽管我也不认同学历卡门槛,但是学历问题不是歧视。对学历的要求来自于社会分工,来自于资本主义与工业化大生产对个人的筛选与规训。假如有一天在统计学意义上学历与资本回报率(而不是能力)负相关那么资本就会毫不犹豫的雇佣低学历的人。
2022-11-11 00:42:28 +08:00
回复了 Pinwheel 创建的主题 程序员 VSCode 顶部出现常驻搜索栏
"window.commandCenter"
2022-11-09 09:30:08 +08:00
回复了 amlee 创建的主题 Python 本来以为生成器了解的差不多了,结果这段代码把我看懵了
或者 apply_many f = iterate (. f) f
2022-11-09 09:21:33 +08:00
回复了 amlee 创建的主题 Python 本来以为生成器了解的差不多了,结果这段代码把我看懵了
haskell 可以更简洁

apply_many f = iterate nxt f
where nxt f = f . f
2022-11-05 15:34:29 +08:00
回复了 haolongsun 创建的主题 硬件 amd 大降价!,历史第一次。
@gzlock 不是 4090, 是 cuda
2022-11-05 03:10:23 +08:00
回复了 haolongsun 创建的主题 硬件 amd 大降价!,历史第一次。
cpu yes, gpu 依然 yes 不起来
@gstqc 那之后要升级就是全价买,算下来 2000 多,哈人。
2022-08-28 07:35:19 +08:00
回复了 skywind3000 创建的主题 Vim 分享篇文章:为什么我会使用 Vim ?
一路看下来的感觉就是编辑器圣战这个话题的活力还真是生生不息。我觉得可定制性,扩展性这个东西见仁见智吧,可定制好是好,但你为了这个先得付出学习成本,比如 vimscript 什么的。如果不考虑成本的话那所有开源的代码都是同等可定制性的。而论其学习成本以传统 gui 逻辑为界面基础的各个编辑器是有绝对的优势的。
1  2  3  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2782 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 13:20 · PVG 21:20 · LAX 05:20 · JFK 08:20
Developed with CodeLauncher
♥ Do have faith in what you're doing.