# Agent到底是什么？和普通大模型问答有什么区别？

前段时间有个录友面试大模型应用岗，项目里写了一个"智能客服 Agent"。

面试官问他："你这个 Agent 和普通客服机器人有什么区别？"

他回答："我们用了更强的大模型，能理解用户问题，还能多轮对话。"

面试官继续追问："那它有没有自己决定下一步做什么？有没有调用工具？有没有根据工具结果继续调整动作？如果只是用户问一句，它答一句，为什么叫 Agent？"

这下就卡住了。

这类问题现在很常见。很多简历上写了 Agent，但讲出来还是一个 ChatBot；很多产品宣传说自己是 Agent，但本质只是 Prompt 包了一层页面。

所以这篇先把最基础的问题讲清楚：Agent 到底是什么？它和普通大模型问答到底差在哪？

普通问答 vs Agent：差别不在会不会说，而在会不会做

# 一、普通大模型问答，本质是"你问我答"

先别急着定义 Agent，我们从最熟的普通问答说起。

普通大模型问答是什么？

就是用户输入一句话，模型根据上下文生成一段回复。

比如你问：

帮我解释一下 Redis 为什么快？

模型会回答：

Redis 快，主要因为它基于内存、单线程避免锁竞争、使用 IO 多路复用、数据结构高效……

这就是典型的大模型问答。

它可以很聪明，可以讲得很细，也可以帮你写代码、改简历、总结文章。

但它有一个核心特点：它主要是在生成文本。

你让它讲 Redis，它讲给你听。

你让它写 SQL，它把 SQL 写出来。

你让它分析日志，它只能基于你贴给它的日志分析。

这类系统的交互方式很简单：

用户给问题 -> 模型生成答案 -> 用户继续追问。

整个过程中，模型大多数时候没有真正"动手"。

它不知道你的数据库现在有什么数据，不会自己去查监控，不会自己打开系统后台，不会自己执行脚本，也不会在发现第一步失败后自动换方案。

所以普通问答更像一个知识很强的顾问。

它能给建议，但行动还得你来做。

# 二、Agent 的关键，不是"回答更聪明"

很多人理解 Agent，第一反应是：Agent 是不是更聪明的大模型？

不是。

Agent 的关键不是更会说，而是更会做。

这句话很重要。

普通问答的核心产物是"答案"。

Agent 的核心产物是"完成任务的过程和结果"。

举个例子。

你对普通大模型说：

帮我分析一下这个网站为什么最近转化率下降。

如果是普通问答，它可能会给你一套分析思路：

看流量来源有没有变化
看页面加载速度有没有变慢
看按钮点击率有没有下降
看最近有没有改版
看用户反馈里有没有负面信号

这些建议可能都对，但你还是要自己去查数据。

如果是一个真正的 Agent，它应该能做更多事：

先拆解问题：转化率下降可能来自流量、页面、价格、性能、用户路径。
调用数据工具：查最近 30 天 PV、UV、点击率、跳出率、支付转化。
调用日志工具：看接口延迟、错误率、页面加载耗时。
对比历史数据：找出异常时间点。
生成初步结论：比如"移动端支付页加载时间从 1.2 秒涨到 4.8 秒"。
继续验证：查看是否和某次发布有关。
最后输出结论和建议：哪个环节出问题，证据是什么，下一步怎么修。

你看，这里已经不是"回答问题"了。

它是在围绕一个目标，自己决定下一步做什么，并不断根据结果调整。

这才是 Agent 的味道。

从回答到行动：Agent 不是更会说，而是更会做

# 三、Agent 至少要有四个能力

讲 Agent，不要一上来就堆一堆高大上的词。

先记住这四个能力：规划、工具、执行、反馈。

没有这四个东西，很多所谓 Agent 其实只是披了个名字。

# 1. 规划：知道任务要怎么拆

用户给 Agent 的往往不是一个简单问题，而是一个目标。

比如：

帮我整理一下这个仓库的技术债，并给出优先级。

这不是一句话能答完的。

Agent 需要先拆任务：

先看项目目录
再看核心模块
再看最近提交
再找重复代码、复杂函数、缺测试的地方
再判断哪些问题影响最大
最后整理成报告

这一步就是规划。

没有规划，Agent 就会变成想到哪做到哪。

很多 Agent 翻车，就是因为计划不稳定：一开始说要检查测试，跑着跑着忘了；一开始说要分析全仓库，最后只看了两个文件就开始总结。

# 2. 工具：能连接外部世界

没有工具，Agent 很多时候只能"会说不会做"。

工具可以是：

搜索工具
数据库查询工具
文件读写工具
代码执行工具
浏览器工具
业务 API
发邮件、发消息、创建工单的接口

工具的意义，是让模型从"文本生成器"变成"能操作环境的执行者"。

比如用户问：

帮我查一下昨天订单失败最多的原因。

普通问答只能说："你可以从支付失败、库存不足、风控拦截几个方向排查。"

Agent 应该能调用订单数据库，查失败码分布，再调用日志系统看异常接口，最后给出真实结论。

这就是 Function Calling / Tool Use 为什么重要。

它不是 Agent 的附属能力，而是 Agent 行动能力的入口。

# 3. 执行：一步一步把任务跑完

会规划不等于会执行。

很多模型特别擅长列计划：

第一步，收集数据；第二步，分析问题；第三步，输出报告。

听起来很完整，但真正执行时就散了。

因为执行不是写计划，而是把每一步真的做完。

比如查数据库失败怎么办？

工具返回为空怎么办？

某个接口超时怎么办？

发现数据不够，要不要换一个工具继续查？

这些都属于执行过程。

真正的 Agent，需要能在执行中处理分支，而不是只按一张固定清单往下走。

# 4. 反馈：看结果，再决定下一步

Agent 和普通程序最大的区别之一，是它会根据中间结果调整动作。

比如它先查订单失败原因，发现失败最多的是"支付超时"。

那下一步就不应该继续查库存，而应该去查支付接口延迟、第三方支付回调、网关错误日志。

这就是反馈。

它的基本循环是：

思考 -> 行动 -> 观察结果 -> 再思考 -> 再行动。

很多人听过 ReAct，其实就是这个思路。

Reasoning 是思考，Acting 是行动，中间靠 Observation 把工具结果带回来。

Agent 的四个核心能力：规划、工具、执行、反馈

# 四、一个简单判断：它有没有"自己决定下一步"

怎么判断一个系统是不是 Agent？

我给一个很实用的判断标准：

看它有没有在任务过程中，自己决定下一步做什么。

如果它只是固定流程：

用户输入问题
系统检索知识库
模型总结答案
返回给用户

这更像 RAG 问答，不一定是 Agent。

如果它是：

用户给一个目标
模型判断需要先查知识库
查完发现信息不够，又决定查数据库
数据库结果异常，又决定调用日志工具
根据日志继续定位问题
最后生成结论

这就更像 Agent。

因为它不是在机械执行固定流程，而是在根据任务状态做动态决策。

这里要注意，不是用了大模型就叫 Agent。

也不是用了 Function Calling 就一定叫 Agent。

如果工具调用路径完全固定，没有开放决策，那它可能只是一个带工具的 Workflow。

Agent 的核心是：目标驱动 + 动态决策 + 外部行动 + 反馈迭代。

这四个词，面试时可以直接说。

# 五、Agent 和 Workflow 到底差在哪？

Agent 和 Workflow 很容易混。

Workflow 是工作流。

它适合流程明确、步骤稳定、规则清楚的任务。

比如发票审核：

OCR 识别发票
提取金额、税号、日期
校验字段
调用财务系统入账
返回审核结果

这个流程很固定，用 Workflow 就很好。

你不需要让模型每次自由发挥："我想想接下来要不要入账。"

那太危险了。

Agent 适合什么？

适合任务开放、路径不固定、需要中途判断的场景。

比如：

帮我定位线上接口变慢的原因。

这个任务没有固定路径。

可能是数据库慢，可能是缓存击穿，可能是某个服务发布导致，可能是第三方 API 超时。

你没法提前写死每一步。

这时候 Agent 的价值就出来了：它可以根据查到的现象，决定下一步查哪里。

所以别神化 Agent。

能用 Workflow 稳定解决的问题，就不要硬上 Agent。

Agent 的自由度更高，但不代表更可靠。

自由度越高，越需要约束、评估、权限控制和失败恢复。

什么时候用 Workflow，什么时候才需要 Agent

# 六、Agent 不是一个模型，而是一套系统

这点很容易被忽略。

很多人说"我用了 GPT-5，所以我做了 Agent"。

不对。

模型只是 Agent 的一部分。

一个完整 Agent 系统，通常至少包括：

模型：负责理解、推理、生成
Prompt：定义角色、目标、边界
工具：连接外部系统
执行器：真正调用工具、处理返回结果
状态管理：记录当前任务进度
记忆系统：保存跨轮信息
评估机制：判断做得对不对
权限控制：限制能做什么、不能做什么
失败恢复：出错后能不能重试、回滚、停止

所以 Agent 不是"一个更强模型"。

它更像一个围绕模型搭起来的工程系统。

模型负责思考，但系统负责让它安全地行动。

这也是为什么同样用一个模型，不同团队做出来的 Agent 效果差很多。

差距往往不在模型本身，而在工具设计、上下文管理、执行编排、评估观测这些工程细节。

Agent 不是一个模型，而是一套工程系统

# 七、面试时怎么回答"Agent 是什么"

如果面试官问：

你怎么理解 Agent？

不要只回答：

Agent 是智能体，可以自主完成任务。

这句话太虚了。

你可以这样回答：

我理解的 Agent，不是单纯的大模型问答，而是一个围绕目标持续行动的系统。它会根据用户目标进行任务规划，选择合适的工具调用外部环境，执行中观察工具返回结果，再决定下一步动作。普通 ChatBot 主要是生成回答，而 Agent 更强调行动、反馈和迭代。它的核心不是模型更聪明，而是系统具备规划、工具调用、执行编排和状态反馈能力。

这个回答就比较稳。

如果面试官继续问：

那 Agent 和 Workflow 有什么区别？

你可以补一句：

Workflow 更适合步骤固定、规则明确的任务；Agent 更适合路径不确定、需要动态决策的任务。工程上不是所有场景都应该上 Agent，如果流程能写死，用 Workflow 往往更稳定、更可控。

这句话很加分。

因为它说明你不是看到 Agent 热就硬套，而是知道取舍。

# 八、总结

Agent 不是"会聊天的大模型"，也不是"套了几个工具的大模型"。

它真正的特点，是能围绕一个目标持续行动。

普通问答解决的是：怎么回答。

Workflow 解决的是：按固定步骤怎么执行。

Agent 解决的是：目标不变，但路径不确定时，怎么边做边判断。

所以理解 Agent，抓住四个关键词就够了：

规划、工具、执行、反馈。

会讲这四个词，才能把 Agent 从一个热词，讲成一个真正能落地的工程系统。

← AI Agent学习路线（专攻Agent先看） ReAct、Reflection、规划执行怎么选 →

验证登录状态...