yjhatfdu2's recent timeline updates
yjhatfdu2

yjhatfdu2

V2EX member #457268, joined on 2019-12-04 10:30:20 +08:00
Today's activity rank 4934
yjhatfdu2's recent replies
6 days ago
Replied to a topic by webfamer 职场话题 这工作能干不
老板这是想招一个 Agent
不是 windows 的问题,是 vllm 的问题,我在 Linux 上一样遇到,似乎是不限制图片数量和大小,会被 multimodel 模块初始化的时候 profile 占用大量内存,我 128G 照样被爆,算是 vllm 的问题吧
@sentinelK 我也遇到了,需要设置--limit-mm-per-prompt 把图片数量和视频数量和大小减少,--mm-processor-cache-gb 设的比较小比如 0.5
May 25
Replied to a topic by archxm 奇思妙想 关于零碎数据存放问题
cloudflare R2 ?
不如 RTX PRO 6000
Apr 8
Replied to a topic by ahdw Local LLM 闲置 16GB M1 Pro MBP 跑大模型
这个问题我在 omlx 上遇到过,似乎是你设置的上下文大小,不是比较整数的值,比如你填个 32768 或者 65536 试试
我都用的 opencode 连接官方的收费 API ,试下来 K2.5 是不如 M2.1 的。K2.5 慢、轴、蠢,反复错误修复不正确,而且关于任务的理解就很不到位。M2.1 虽然也不算出色(和 GPT5.2 、opus 比),但是快、基本可以正确
确实垃圾,看了下我在 moonshot 居然还有余额,用的官方的 API 接 opencode ,又慢又蠢而且反复出错,根本不如 M2.1 ,当然都远不如 gpt-5.2-codex 和 claude
当然是考虑一下新一代的 next.js ,新一代的 php😅
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3087 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 18ms · UTC 12:45 · PVG 20:45 · LAX 05:45 · JFK 08:45
♥ Do have faith in what you're doing.