Skip to content

Agent 能力分级

🎯 学习目标

  • 用交互模式与自主性两个维度区分三类产品形态
  • 为典型业务场景选择合适的架构
  • 理解 Copilot 中「人确认」为何是安全与体验的关键
  • 避免把 everything 都做成 Agent

引言

「我们要做一个 AI Agent」——这句话在会议里出现频率极高,但很多时候真正需要的是 ChatBot 或 Copilot。本节用三个真实场景帮你建立选型直觉,而不是背定义表。

章节正文

第 1 步:三种形态各是什么体验

ChatBot:用户问一句,模型答一句(可多轮,但通常不主动调用工具链)。例如 FAQ 客服、闲聊陪伴。

Copilot:模型给建议或草稿,人点击确认后才执行。例如 IDE 补全、邮件草稿、PR 建议——你始终是驾驶员。

Agent:围绕目标自主循环:规划 → 调工具 → 观察 → 再规划,直到完成或终止。例如「调研竞品并写报告」「根据 issue 自动提 PR」——你设定目标与边界,过程可能无人值守。

自主性:ChatBot 低,Copilot 中,Agent 高。自主性越高,Harness 与安全成本越高。

第 2 步:对比表与典型失败

类型工具调用人类确认失败时
ChatBot通常无或单次答错话
Copilot有,但执行前确认必须建议不靠谱,人可不采纳
Agent多步自动高风险步骤应插入连环误操作

把 ChatBot 硬加多步 Auto Agent,常见问题:用户不知道 AI 在后台干了什么;一次错误工具调用造成不可撤销后果。

第 3 步:选型决策树(口语版)

  1. 答案是否在固定流程里可枚举?→ Workflow(5.6),不必 Agent
  2. 是否需要实时查数据/改草稿,但人必须拍板?→ Copilot
  3. 是否只需对话,无外部副作用?→ ChatBot
  4. 是否多步、路径不确定、可接受 Harness 成本?→ Agent

很多「编码助手」本质是 Copilot:补全、重构建议、解释代码——不是 nightly 自动改生产。

第 4 步:产品表述与用户预期

UI 文案应诚实:

  • ChatBot:「回答仅供参考」
  • Copilot:「点击 Apply 才会写入文件」
  • Agent:「将自动执行以下步骤… [展开] [暂停]」

预期管理错了,比模型笨更伤信任。Agent 界面务必有进度、暂停、回滚入口。

动手练习

  1. 为你熟悉的 5 个 AI 功能标注 ChatBot / Copilot / Agent,并写一句理由。
  2. 设计 Copilot「Apply 前 diff 预览」交互草图(文字描述即可)。
  3. 举一个「不该做 Agent」的场景,说明若强行 Agent 化会发生什么风险。
  4. 写 Agent 产品首页 disclaimer 三句话,平衡能力宣传与安全预期。

常见问题

Q:Copilot 和 Agent 可以共存吗?

常见混合:Agent 规划多步,其中 write 类步骤降级为 Copilot 确认。或 Agent 只做到 draft,最后一步必须人发布。

Q:ChatGPT 算哪种?

默认对话是 ChatBot;开启 Code Interpreter / 插件 / Deep Research 时接近 Agent 或 Copilot,取决于是否自动执行与确认机制。

Q:B 端为什么更偏 Copilot?

合规与问责:关键决策需人签字。全自动 Agent 适合内部工具或低风险批处理,对外服务多数要 Human-in-the-loop。

本节小结

ChatBot 答、Copilot 建议人确认、Agent 自主循环。选型看流程是否固定、副作用大小与 Harness 能力,勿默认 Agent 最高级。