🙏🏻🙏🏻🙏🏻我是个小公司桌面运维，老板让我给他开发个 AI 大模型……

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 206 天前的主题，其中的信息可能已经有所发展或是发生改变。

如题
我在一家非 IT 行业的公司干桌面运维，说是运维其实啥都干，简单的服务器运维、直播推流、摄影摄像等等。老板基本上是个技术盲，在他眼里，技术相关的问题我全知道。

他想要有一个 AI ，把一位哲学家（比较小众）的文集通读一遍（大概 40 万字）。然后扮演这位哲学家，充当聊天机器人。这个聊天机器人的用户量估计不会太高（小众圈子里面流传一下），最多也就 1000 人左右（并发可能就 30 人以内）。

我说我干不来，他表示让我至少给个方案，适当招两个人，或者找人外包都行。

从头搞个 AI 模型我猜是不可能的，我大概想法是租个云服务器，给 Llama 3 或类似的开源模型喂点数据，然后套个前端。

希望懂行的朋友告诉我一下我的想法是否可行？以及这个事情工作量大不大。如果可行的话，我就去着手研究一下怎样微调 Llama 3 ，然后给老板一个方案。

模型

方案

119 条回复 • 2024-08-23 17:03:07 +08:00

1 2

❮

❯

101

luoyuan2018

205 天前

阿里云的百炼就可以满足需求了。

102

jesse10

205 天前

最简单的，建一个 gpts ，把文集上传上去，写好 prompt 就行了。

103

karnaugh

205 天前

coze dify gpts 类似的功能随便搞一个就行咯

104

flmn

205 天前

这是简单啊，你去找个懂行的外包出去，还能吃回扣。

105

TArysiyehua

205 天前

外包给我呗，我接，私聊我

106

proxyai

205 天前

楼主留给联系方式, 和你沟通方案

107

oColtono

205 天前

@iloveayu #60 hhh ，老板原话确实是让我找两个人跟我一起开发。我自己翻译了一下他的话，他的需求应该是一个套壳就能满足了

108

cexll

205 天前

@nyw17 #34 数据量太大了 RAG 响应会很慢

109

cexll

205 天前

给楼主几个可行方案
闭源大模型 or 开源大模型
1.如果你选择闭源大模型，基本上只能使用 RAG 相关的技术，就是提前将数据给量化放在量化数据库，使用一些 python 库例如(langchain or llama_index)，在 API 请求之后将用户内容放量化数据库去 search 然后再给到 LLM(大模型) 去推理，中间的延迟如果能过接受的话，这个方案是最简单的。
2.选择开源大模型，你会有两个方案本地部署 or 使用 API ，本地部署你要考虑的东西就非常多，其实不是特别推荐，可以选择一些能过使用自己提交 LLM 的平台进行部署在平台上，这样就可以微调大模型，将你的数据 write 进入大模型中，这样就不会有 RAG 方案那么高的延迟，但是这个方案就需要你去了解大模型微调，相对技术难度更高。
上面很多人推荐的我都看过了 GraphRAG 太费钱了现目前根本无法商用的
买两块 4090 的也不太科学首先是性能并不好其次是价格另外买不买得到的问题，我推荐直接用各种平台的显卡，用多久扣多少钱