Agent 能力分级

🎯 学习目标
用交互模式与自主性两个维度区分三类产品形态
为典型业务场景选择合适的架构
理解 Copilot 中「人确认」为何是安全与体验的关键
避免把 everything 都做成 Agent

引言

「我们要做一个 AI Agent」——这句话在会议里出现频率极高，但很多时候真正需要的是 ChatBot 或 Copilot。本节用三个真实场景帮你建立选型直觉，而不是背定义表。

章节正文

第 1 步：三种形态各是什么体验

ChatBot：用户问一句，模型答一句（可多轮，但通常不主动调用工具链）。例如 FAQ 客服、闲聊陪伴。

Copilot：模型给建议或草稿，人点击确认后才执行。例如 IDE 补全、邮件草稿、PR 建议——你始终是驾驶员。

Agent：围绕目标自主循环：规划 → 调工具 → 观察 → 再规划，直到完成或终止。例如「调研竞品并写报告」「根据 issue 自动提 PR」——你设定目标与边界，过程可能无人值守。

自主性：ChatBot 低，Copilot 中，Agent 高。自主性越高，Harness 与安全成本越高。

第 2 步：对比表与典型失败

类型	工具调用	人类确认	失败时
ChatBot	通常无或单次	无	答错话
Copilot	有，但执行前确认	必须	建议不靠谱，人可不采纳
Agent	多步自动	高风险步骤应插入	连环误操作

把 ChatBot 硬加多步 Auto Agent，常见问题：用户不知道 AI 在后台干了什么；一次错误工具调用造成不可撤销后果。

第 3 步：选型决策树（口语版）

答案是否在固定流程里可枚举？→ Workflow（5.6），不必 Agent
是否需要实时查数据/改草稿，但人必须拍板？→ Copilot
是否只需对话，无外部副作用？→ ChatBot
是否多步、路径不确定、可接受 Harness 成本？→ Agent

很多「编码助手」本质是 Copilot：补全、重构建议、解释代码——不是 nightly 自动改生产。

第 4 步：产品表述与用户预期

UI 文案应诚实：

ChatBot：「回答仅供参考」
Copilot：「点击 Apply 才会写入文件」
Agent：「将自动执行以下步骤… [展开] [暂停]」

预期管理错了，比模型笨更伤信任。Agent 界面务必有进度、暂停、回滚入口。

动手练习

为你熟悉的 5 个 AI 功能标注 ChatBot / Copilot / Agent，并写一句理由。
设计 Copilot「Apply 前 diff 预览」交互草图（文字描述即可）。
举一个「不该做 Agent」的场景，说明若强行 Agent 化会发生什么风险。
写 Agent 产品首页 disclaimer 三句话，平衡能力宣传与安全预期。

常见问题

Q：Copilot 和 Agent 可以共存吗？

常见混合：Agent 规划多步，其中 write 类步骤降级为 Copilot 确认。或 Agent 只做到 draft，最后一步必须人发布。

Q：ChatGPT 算哪种？

默认对话是 ChatBot；开启 Code Interpreter / 插件 / Deep Research 时接近 Agent 或 Copilot，取决于是否自动执行与确认机制。

Q：B 端为什么更偏 Copilot？

合规与问责：关键决策需人签字。全自动 Agent 适合内部工具或低风险批处理，对外服务多数要 Human-in-the-loop。

本节小结

ChatBot 答、Copilot 建议人确认、Agent 自主循环。选型看流程是否固定、副作用大小与 Harness 能力，勿默认 Agent 最高级。

Agent 能力分级 ​

引言 ​

章节正文 ​

第 1 步：三种形态各是什么体验 ​

第 2 步：对比表与典型失败 ​

第 3 步：选型决策树（口语版） ​

第 4 步：产品表述与用户预期 ​

动手练习 ​

常见问题 ​

本节小结 ​