Agent 能力分级
🎯 学习目标
- 用交互模式与自主性两个维度区分三类产品形态
- 为典型业务场景选择合适的架构
- 理解 Copilot 中「人确认」为何是安全与体验的关键
- 避免把 everything 都做成 Agent
引言
「我们要做一个 AI Agent」——这句话在会议里出现频率极高,但很多时候真正需要的是 ChatBot 或 Copilot。本节用三个真实场景帮你建立选型直觉,而不是背定义表。
章节正文
第 1 步:三种形态各是什么体验
ChatBot:用户问一句,模型答一句(可多轮,但通常不主动调用工具链)。例如 FAQ 客服、闲聊陪伴。
Copilot:模型给建议或草稿,人点击确认后才执行。例如 IDE 补全、邮件草稿、PR 建议——你始终是驾驶员。
Agent:围绕目标自主循环:规划 → 调工具 → 观察 → 再规划,直到完成或终止。例如「调研竞品并写报告」「根据 issue 自动提 PR」——你设定目标与边界,过程可能无人值守。
自主性:ChatBot 低,Copilot 中,Agent 高。自主性越高,Harness 与安全成本越高。
第 2 步:对比表与典型失败
| 类型 | 工具调用 | 人类确认 | 失败时 |
|---|---|---|---|
| ChatBot | 通常无或单次 | 无 | 答错话 |
| Copilot | 有,但执行前确认 | 必须 | 建议不靠谱,人可不采纳 |
| Agent | 多步自动 | 高风险步骤应插入 | 连环误操作 |
把 ChatBot 硬加多步 Auto Agent,常见问题:用户不知道 AI 在后台干了什么;一次错误工具调用造成不可撤销后果。
第 3 步:选型决策树(口语版)
- 答案是否在固定流程里可枚举?→ Workflow(5.6),不必 Agent
- 是否需要实时查数据/改草稿,但人必须拍板?→ Copilot
- 是否只需对话,无外部副作用?→ ChatBot
- 是否多步、路径不确定、可接受 Harness 成本?→ Agent
很多「编码助手」本质是 Copilot:补全、重构建议、解释代码——不是 nightly 自动改生产。
第 4 步:产品表述与用户预期
UI 文案应诚实:
- ChatBot:「回答仅供参考」
- Copilot:「点击 Apply 才会写入文件」
- Agent:「将自动执行以下步骤… [展开] [暂停]」
预期管理错了,比模型笨更伤信任。Agent 界面务必有进度、暂停、回滚入口。
动手练习
- 为你熟悉的 5 个 AI 功能标注 ChatBot / Copilot / Agent,并写一句理由。
- 设计 Copilot「Apply 前 diff 预览」交互草图(文字描述即可)。
- 举一个「不该做 Agent」的场景,说明若强行 Agent 化会发生什么风险。
- 写 Agent 产品首页 disclaimer 三句话,平衡能力宣传与安全预期。
常见问题
Q:Copilot 和 Agent 可以共存吗?
常见混合:Agent 规划多步,其中 write 类步骤降级为 Copilot 确认。或 Agent 只做到 draft,最后一步必须人发布。
Q:ChatGPT 算哪种?
默认对话是 ChatBot;开启 Code Interpreter / 插件 / Deep Research 时接近 Agent 或 Copilot,取决于是否自动执行与确认机制。
Q:B 端为什么更偏 Copilot?
合规与问责:关键决策需人签字。全自动 Agent 适合内部工具或低风险批处理,对外服务多数要 Human-in-the-loop。
本节小结
ChatBot 答、Copilot 建议人确认、Agent 自主循环。选型看流程是否固定、副作用大小与 Harness 能力,勿默认 Agent 最高级。