按照我个人理解,AI Agent 干的事情就是把一个复杂的任务拆分成多个步骤,然后串起来,只是这些步骤里某一些步骤需要调用大模型来做输出。
然而,其实我们任何一个程序都是在干这个事情,比如你打开淘宝,淘宝后台的入口服务(或者叫 Agent 吧)在获取到你的请求信息之后,可能去数据库里查询你的注册信息,然后调用商品推荐服务拉取到商品 ID 列表,接着根据这些 ID 列表调用商品详情服务获取的商品的各种数据,最后给客户端回包。
所以 这个 AI Agent 是不是就一个概念?
当然还有另外一种理解,上面举例的 Agent 是死板固定的 Agent 、没有任何智能;理想态的 Agent 是真正有思考规划能力的,只需要给它一个一句话的任务,它能真正地分解任务、而不是靠预先设置好的逻辑( if else 等)分解任务。但是这种 Agent 目前真的出现了么?哪怕有一个真正初具智能的呢?
1
Rickkkkkkk 1 天前
你感觉 LLM 是 if-else 吗?
|
2
Eins 1 天前
看来没理解 LLM 最基本的逻辑和能力,用硬编码的逻辑看 agent ,似乎是成立的,但这只是 agent 的一种表象的执行逻辑,背后的运行逻辑已经不是硬编码了,而是一种决策能力。我猜提这个问题没有问过 ai 吧
|
3
bwnjnOEI 1 天前 via iPhone
上面那个不叫事件驱动吗?现在的 agent 固定的 workflow 模式比较成熟了没什么难度。你说的后者属于 orchestrator 模式本质也算 workflow 但是 rl 训练可以规划推理检索,比较成熟的应用的是 deepresearch 。以上都是需要你主动提问,目前自主的 agent ,比如实时运行的个人助力,应该还不存在。
|
4
liyafe1997 1 天前
你理解得基本没错,所谓 Agent/MCP 就是一套提供给 LLM 调用的 API ,它生成请求来调用,调用的结果说白了就是生成一堆 prompt 喂回给它。
说白了抽象理解大概就是 AI 生成一堆函数调用的代码,然后执行,然后把执行结果在下一次 prompt 中喂回去,如此循环。 |
5
lscho 1 天前
“理想态的 Agent 是真正有思考规划能力的,只需要给它一个一句话的任务,它能真正地分解任务”
现在各大 ai 编辑器的 plan 模式不就是这样吗?比如 cursor 的 plan 模式,trae 的 solo 模式,都可以分解任务了 |
6
maolon 1 天前 你这个理解是 workflow 而不是 agent ,建议看看 anthrophic 的 agent 定义 https://www.anthropic.com/engineering/building-effective-agents
|
7
crocoBaby 1 天前 via iPhone
我个人理解是对比传统写的请求信息,多了根据向量数据判断权重,比如根据当前客户的画像调整请求返回的数据
|
8
archxm 23 小时 9 分钟前 via Android
一切都是为了麻痹你,让你有辛福感
|
9
vikim 21 小时 31 分钟前
废话不多说, 是
用了这久, 相当于就是给 AI 一个 api 接口而已, 其余的功能上有多牛掰 纯属胡扯 当然胡扯出新高度了 也是牛 |
10
yh7gdiaYW 20 小时 41 分钟前
不算旧瓶装新酒,是真有新东西的,解决了"允许用户用任何喜欢的描述方式提问"的实现。在 Agent 之前,这种功能只能按某种解析规则 if else 匹配到预设的工作流上
|
11
w0017 19 小时 46 分钟前
整个世界都是分类任务
|
12
xyooyx 19 小时 39 分钟前
这里面有一个核心是把“下一步做什么”交由给 AI ,这一步如果没有做,那就是“新瓶装旧酒”
|
13
visper 19 小时 27 分钟前
agent 不就是把大模型和调用工具的能力合起来当成一个概念吗? 最开始技术上叫 function calling 好像。
|
14
tamshy 19 小时 26 分钟前
一个是让你直接给妙瓦底转 30 万。另一个是编排一堆自动化脚本+剧本 最后你心甘情愿转了 30 万
|
15
goodboy95 18 小时 5 分钟前 via Android
真做 agent 的肯定都是做你那个“理想态”,比如 roo code 的 orchestrator 模式,或者 manus 、openai agent 那些。
|
16
qm OP @liyafe1997 LLM 和 Agent 的调用关系:是 LLM 调用 Agent 还是 Agent 调用 LLM 呢?
|
17
liyafe1997 13 小时 2 分钟前
@qm 更多是 LLM 调用 Agent ,但理解成互相调用也没错,Agent 生成 prompt ,这不也是调用 LLM 吗
|
18
qm OP @liyafe1997 如果把 LLM 理解成纯粹的模型,这个模型 infer 过程中,本身其实没有办法去做外部网络的调用事情,那如果要做这个事情,得是 LLM 周边的系统,那么这个周边的系统其实就是 Agent 的一部分了
|