现在用的火山引擎的 codig plan ,对 glm5.2 非常满意,但是么美中不足,现在没办法处理视觉理解。我看之前 glm5.1 也是文本模型,是怎么做到可以处理视觉理解的,现在 5.1 下架了。
现在用的火山引擎的 codig plan ,对 glm5.2 非常满意,但是么美中不足,现在没办法处理视觉理解。我看之前 glm5.1 也是文本模型,是怎么做到可以处理视觉理解的,现在 5.1 下架了。
1
jotsai 3h 23m ago
用的 GLM Coding Plan ,模型服务端已内置 image_analysis 工具,具备图片理解能力 😊
https://docs.bigmodel.cn/cn/coding-plan/mcp/vision-mcp-server#%E6%94%AF%E6%8C%81%E7%9A%84%E5%AE%A2%E6%88%B7%E7%AB%AF |
2
QingmuSanren OP @jotsai glm 的 coding plan 根本抢不到啊,痛,现在只能退而用火山。看大佬发的视觉理解 mcp ,文中说的大概意思就是,再买点搭配的视觉模型 token 一起用?
|
3
jotsai 25 mins ago
@QingmuSanren 这个 MCP 应该只是给 GLM Coding Plan 补视觉短板的,非 GLM Coding Plan 的我感觉直接接 1 个原生多模态的大模型比较好吧
|
4
yvyvyv 2 mins ago
让 claude 用文字描述出来
|