AI · ML · LLM
🎯 学习目标
- 能准确区分 AI、ML、DL、生成式 AI 与大语言模型(LLM)的层级关系
- 理解 LLM 作为「语言与推理引擎」的能力边界,而非企业知识库本身
- 能在产品设计与技术沟通中使用一致、不误导的术语
- 为后续 API 调用、RAG 与 Agent 学习建立概念基础
引言
当你第一次打开 ChatGPT 或 DeepSeek,很容易把屏幕上那个「会说话的系统」等同于「人工智能」的全部。实际上,大语言模型只是人工智能(AI,Artificial Intelligence)漫长演进树上的一个分支——而且是近几年才变得足够好用、足够便宜的那一支。
本节课的目标不是背定义,而是帮你在团队讨论、架构设计、对外宣传时说对话、想对路。我们会从最广义的 AI 出发,一层层收窄到机器学习(ML,Machine Learning)、深度学习(DL,Deep Learning),再到生成式 AI 与大语言模型(LLM,Large Language Model)。你会发现:每一层都在解决「如何让机器从数据或经验中获得能力」这一核心问题,只是方法与规模不同。
作为应用工程师,你不需要训练模型,但必须清楚 LLM 能做什么、不能做什么。把 LLM 当成「已经读过整个互联网的公司大脑」是常见误区;正确做法是把它看作在给定上下文下做语言预测与推理的引擎,企业知识、实时数据与业务规则需要由你通过 RAG、数据库和工具调用来注入。
章节正文
第 1 步:从 AI 到 ML:从「写规则」到「学规律」
人工智能的最早形态是专家系统:工程师把「如果……那么……」的规则一条条写进程序。这在下棋、质检等封闭场景有效,但面对开放的自然语言时,规则数量会爆炸,且难以维护。
机器学习(ML) 换了一条路:不直接写规则,而是给机器大量样本,让它自己总结规律。例如垃圾邮件分类,你提供成千上万封已标注的邮件,模型学习「哪些词组合更常出现在垃圾邮件里」。ML 还包括决策树、支持向量机、随机森林等经典算法,它们仍在表格数据、风控等场景广泛使用。
深度学习(DL) 是 ML 的一个子集,使用多层神经网络(Neural Network)。2012 年 ImageNet 竞赛中卷积神经网络(CNN)的突破性表现,让 DL 在图像、语音领域迅速成为主流。关键洞察是:层数足够深时,网络可以自动学习从低级特征(边缘、音素)到高级语义(物体、词语)的层次表示,而不需要人工设计全部特征。
对 LLM 学习者而言,记住这条链即可:AI ⊃ ML ⊃ DL ⊃ 现代 LLM。LLM 用的是深度学习里的 Transformer 架构,训练方式是「预测下一个词(Token)」,但本质上仍是「从数据中学习」。
第 2 步:生成式 AI 与基座模型:从「分类」到「创造」
传统 ML 任务多是判别式(Discriminative)的:给定输入,输出一个标签——这是猫还是狗、这封邮件是不是垃圾邮件。而 生成式 AI(Generative AI) 关心的是创造新内容:写一段文章、画一张图、生成一段代码、合成一段语音。
基座模型(Foundation Model) 是在海量数据上预训练、可适配多种下游任务的大规模模型。OpenAI 的 GPT 系列、Meta 的 Llama、阿里的 Qwen、DeepSeek 的 V3 等都属于基座模型。它们先学会「语言与世界的一般规律」,再通过微调或 Prompt 适配具体产品。
大语言模型(LLM) 是基座模型中以自然语言为主要模态的一类,通常基于 Transformer 架构,参数量从数十亿到数千亿不等。你日常调用的 Chat Completions API,背后就是 LLM 在根据上下文逐 Token 生成回复。
一个容易混淆的点:生成式 AI ≠ 只有 LLM。Stable Diffusion 生成图像、Whisper 转写语音、Sora 类模型生成视频,都属于生成式 AI,但不叫 LLM。本课程聚焦文本 LLM 及其工程化应用,多模态会在 1.6 节单独介绍。
第 3 步:LLM 的能力边界:引擎 vs 知识库
LLM 的核心机制是 next-token prediction(下一词预测):给定前面的文本,模型输出下一个 Token 的概率分布,采样或贪心选取后再继续生成。这一简单目标,在海量文本上训练后,涌现出问答、推理、翻译、写代码等复杂能力——但涌现不等于可靠。
LLM 擅长的事包括:在上下文内的语言理解、格式转换、摘要、代码草稿、多轮对话、按指令变换风格等。只要任务可以被表述为「在给定文字条件下,继续写出合理的文字」,LLM 往往表现不错。
LLM 不擅长、或不能单独承担的事包括:保证事实正确(会幻觉,即编造看似合理但不真实的内容)、访问训练 cutoff 之后的实时信息、精确记住某次对话之外的企业私有数据、可审计的数值计算(应交给计算器或数据库)。因此:
- 不要把 LLM 描述成「公司所有文档都已装进模型里」
- 架构上把 LLM 放在推理层,知识放在向量库、SQL、API 等数据层
- 需要准确事实时,用 RAG(检索增强生成) 或工具调用,而不是加长 Prompt 碰运气
这一边界认知会贯穿本课程后续所有章节。
第 4 步:术语对照与沟通实践
在跨职能沟通中,建议使用下表统一语言,避免「AI 做了某某」这种模糊表述:
| 概念 | 英文 | 一句话 |
|---|---|---|
| 人工智能 | AI | 让机器表现智能行为的总称 |
| 机器学习 | ML | 从数据中学习,而非硬编码规则 |
| 深度学习 | DL | 用深层神经网络的 ML |
| 生成式 AI | Generative AI | 生成文本、图像、代码等 |
| 基座模型 | Foundation Model | 大规模预训练、可下游适配 |
| 大语言模型 | LLM | 以语言为主的大规模 Transformer 模型 |
实践中的表述示例:
- ❌ 「我们的 AI 知道所有合同条款」→ ✅ 「我们用 RAG 检索合同片段,再由 LLM 根据片段回答」
- ❌ 「换更强的 AI 就能解决幻觉」→ ✅ 「需要检索、引用来源与拒答策略组合治理幻觉」
- ❌ 「Deep Learning 就是 ChatGPT」→ ✅ 「ChatGPT 基于深度学习中的 Transformer LLM」
建议在项目文档中固定一份术语表,并在 PRD、架构图里标注「LLM 推理服务」「Embedding 服务」「向量库」等具体组件,而不是笼统写「AI 模块」。
第 5 步:为工程实践划清学习路线
理解概念层次后,应用工程师的典型路径是:
- 调用 API(第 2 章):学会 messages、参数、流式输出
- Prompt 与结构化输出(2.5–2.6):可控、可解析的模型行为
- RAG(第 4 章):把企业知识接入 LLM
- Agent 与工具(第 5 章):让 LLM 调用搜索、数据库、API
你不需要从零训练 GPT,也不必先学完反向传播再写业务代码。但你需要知道:当产品要求「100% 准确的政策问答」时,答案在 RAG + 评估体系,而不是「换一个更大的模型」这么简单。
本节建立的概念框架,会在后续每一章反复出现。遇到新名词时,先问:它属于 AI 的哪一层?是模型能力、训练方法,还是工程组件?
动手练习
- 用一段话向非技术同事解释:ChatGPT 是 LLM,LLM 是生成式 AI 的一种,生成式 AI 属于深度学习,深度学习属于机器学习——各用一句生活化比喻。
- 列出你当前项目中三处文档或口头表述,检查是否把 LLM 说成「全知知识库」;改写为「推理引擎 + 外部知识源」的准确说法。
- 画一张简单的架构草图:用户 → 应用后端 → LLM API,并标注知识应来自哪里(数据库 / 向量检索 / 第三方 API)。
- 选一款你用过的产品(如 Copilot、通义、DeepSeek),写 5 条「它擅长 / 不擅长」的能力边界清单。
常见问题
Q:没有 GPU 也能学 LLM 应用开发吗?
可以。本课程面向应用层:通过远程 API 或 Ollama 本地推理即可,训练才需要大规模 GPU 集群。第 2.1 节会对比远程与本地部署。
Q:LLM 和「人工智能」可以混用吗?
日常口语可以,但技术文档中建议区分:AI 是总称,LLM 是具体技术路线。对外宣传说「AI 驱动」没问题,对内架构应写清是 LLM、Embedding 还是传统 ML 模型。
Q:为什么说 LLM 是预测下一个 Token,却能「理解」问题?
「理解」是行为层面的描述。模型在海量文本上学会了统计与语义规律,使得预测下一个 Token 在多数场景下等价于合理回答。但它没有人类意义上的「知道」,这也是幻觉与知识 cutoff 存在的根本原因。
本节小结
AI、ML、DL 是层层嵌套的关系;LLM 属于生成式 AI 中的语言基座模型,基于 Transformer 做 next-token prediction。应用开发的核心认知是:LLM 是推理引擎,不是企业知识库;准确性与时效性要靠 RAG、工具与治理体系补足。掌握这一边界,是后续 API、Prompt、RAG 学习的地基。