yjhatfdu2's recent timeline updates

yjhatfdu2

V2EX member #457268, joined on 2019-12-04 10:30:20 +08:00

Today's activity rank 4934

Apple • yjhatfdu2 • Nov 14, 2024 • Lastly replied by allinschroe

Apple • yjhatfdu2 • Nov 19, 2024 • Lastly replied by willyeon99

Apple • yjhatfdu2 • Nov 7, 2024 • Lastly replied by lqcc

数据库 • yjhatfdu2 • May 23, 2024 • Lastly replied by baidu2022

程序员 • yjhatfdu2 • Jun 16, 2024 • Lastly replied by UchihaJay

yjhatfdu2's recent replies

6 days ago

老板这是想招一个 Agent

12 days ago

不是 windows 的问题，是 vllm 的问题，我在 Linux 上一样遇到，似乎是不限制图片数量和大小，会被 multimodel 模块初始化的时候 profile 占用大量内存，我 128G 照样被爆，算是 vllm 的问题吧

12 days ago

@sentinelK 我也遇到了，需要设置--limit-mm-per-prompt 把图片数量和视频数量和大小减少，--mm-processor-cache-gb 设的比较小比如 0.5

May 25

cloudflare R2 ？

May 20

不如 RTX PRO 6000

Apr 8

这个问题我在 omlx 上遇到过，似乎是你设置的上下文大小，不是比较整数的值，比如你填个 32768 或者 65536 试试

Feb 5

我都用的 opencode 连接官方的收费 API ，试下来 K2.5 是不如 M2.1 的。K2.5 慢、轴、蠢，反复错误修复不正确，而且关于任务的理解就很不到位。M2.1 虽然也不算出色（和 GPT5.2 、opus 比），但是快、基本可以正确

Feb 2

确实垃圾，看了下我在 moonshot 居然还有余额，用的官方的 API 接 opencode ，又慢又蠢而且反复出错，根本不如 M2.1 ，当然都远不如 gpt-5.2-codex 和 claude

Jan 27

当然是考虑一下新一代的 next.js ，新一代的 php😅