A 卡炼丹开始好起来了？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

已注册用户请登录

这是一个创建于 281 天前的主题，其中的信息可能已经有所发展或是发生改变。

MLC-LLM 包可以利用 AMD 的 ROCm 进行大语言模型的编译及推理。性能方面，在 Llama2-7B/13B 上，7900 XTX 做推理可以达到 80% 4090 的水平

4 条回复

qq565425677

281 天前

从防垄断角度考虑非常不错，不过具体到个人使用还是先让别人把坑都踩一遍吧

chhtdd

281 天前

CUDA 的坑踩得够多了，不想再踩一遍 opencl 的了

czfy

281 天前

@chhtdd 我以为 CUDA 这么多年已经很成熟了，没想到还是有坑？

chhtdd

281 天前

@czfy 都有坑，不同平台，不同版本，坑多了去了