AI · ML · LLM

🎯 学习目标
能准确区分 AI、ML、DL、生成式 AI 与大语言模型（LLM）的层级关系
理解 LLM 作为「语言与推理引擎」的能力边界，而非企业知识库本身
能在产品设计与技术沟通中使用一致、不误导的术语
为后续 API 调用、RAG 与 Agent 学习建立概念基础

引言

当你第一次打开 ChatGPT 或 DeepSeek，很容易把屏幕上那个「会说话的系统」等同于「人工智能」的全部。实际上，大语言模型只是人工智能（AI，Artificial Intelligence）漫长演进树上的一个分支——而且是近几年才变得足够好用、足够便宜的那一支。

本节课的目标不是背定义，而是帮你在团队讨论、架构设计、对外宣传时说对话、想对路。我们会从最广义的 AI 出发，一层层收窄到机器学习（ML，Machine Learning）、深度学习（DL，Deep Learning），再到生成式 AI 与大语言模型（LLM，Large Language Model）。你会发现：每一层都在解决「如何让机器从数据或经验中获得能力」这一核心问题，只是方法与规模不同。

作为应用工程师，你不需要训练模型，但必须清楚 LLM 能做什么、不能做什么。把 LLM 当成「已经读过整个互联网的公司大脑」是常见误区；正确做法是把它看作在给定上下文下做语言预测与推理的引擎，企业知识、实时数据与业务规则需要由你通过 RAG、数据库和工具调用来注入。

章节正文

第 1 步：从 AI 到 ML：从「写规则」到「学规律」

人工智能的最早形态是专家系统：工程师把「如果……那么……」的规则一条条写进程序。这在下棋、质检等封闭场景有效，但面对开放的自然语言时，规则数量会爆炸，且难以维护。

机器学习（ML） 换了一条路：不直接写规则，而是给机器大量样本，让它自己总结规律。例如垃圾邮件分类，你提供成千上万封已标注的邮件，模型学习「哪些词组合更常出现在垃圾邮件里」。ML 还包括决策树、支持向量机、随机森林等经典算法，它们仍在表格数据、风控等场景广泛使用。

深度学习（DL） 是 ML 的一个子集，使用多层神经网络（Neural Network）。2012 年 ImageNet 竞赛中卷积神经网络（CNN）的突破性表现，让 DL 在图像、语音领域迅速成为主流。关键洞察是：层数足够深时，网络可以自动学习从低级特征（边缘、音素）到高级语义（物体、词语）的层次表示，而不需要人工设计全部特征。

对 LLM 学习者而言，记住这条链即可：AI ⊃ ML ⊃ DL ⊃ 现代 LLM。LLM 用的是深度学习里的 Transformer 架构，训练方式是「预测下一个词（Token）」，但本质上仍是「从数据中学习」。

第 2 步：生成式 AI 与基座模型：从「分类」到「创造」

传统 ML 任务多是判别式（Discriminative）的：给定输入，输出一个标签——这是猫还是狗、这封邮件是不是垃圾邮件。而 生成式 AI（Generative AI） 关心的是创造新内容：写一段文章、画一张图、生成一段代码、合成一段语音。

基座模型（Foundation Model） 是在海量数据上预训练、可适配多种下游任务的大规模模型。OpenAI 的 GPT 系列、Meta 的 Llama、阿里的 Qwen、DeepSeek 的 V3 等都属于基座模型。它们先学会「语言与世界的一般规律」，再通过微调或 Prompt 适配具体产品。

大语言模型（LLM） 是基座模型中以自然语言为主要模态的一类，通常基于 Transformer 架构，参数量从数十亿到数千亿不等。你日常调用的 Chat Completions API，背后就是 LLM 在根据上下文逐 Token 生成回复。

一个容易混淆的点：生成式 AI ≠ 只有 LLM。Stable Diffusion 生成图像、Whisper 转写语音、Sora 类模型生成视频，都属于生成式 AI，但不叫 LLM。本课程聚焦文本 LLM 及其工程化应用，多模态会在 1.6 节单独介绍。

第 3 步：LLM 的能力边界：引擎 vs 知识库

LLM 的核心机制是 next-token prediction（下一词预测）：给定前面的文本，模型输出下一个 Token 的概率分布，采样或贪心选取后再继续生成。这一简单目标，在海量文本上训练后，涌现出问答、推理、翻译、写代码等复杂能力——但涌现不等于可靠。

LLM 擅长的事包括：在上下文内的语言理解、格式转换、摘要、代码草稿、多轮对话、按指令变换风格等。只要任务可以被表述为「在给定文字条件下，继续写出合理的文字」，LLM 往往表现不错。

LLM 不擅长、或不能单独承担的事包括：保证事实正确（会幻觉，即编造看似合理但不真实的内容）、访问训练 cutoff 之后的实时信息、精确记住某次对话之外的企业私有数据、可审计的数值计算（应交给计算器或数据库）。因此：

不要把 LLM 描述成「公司所有文档都已装进模型里」
架构上把 LLM 放在推理层，知识放在向量库、SQL、API 等数据层
需要准确事实时，用 RAG（检索增强生成） 或工具调用，而不是加长 Prompt 碰运气

这一边界认知会贯穿本课程后续所有章节。

第 4 步：术语对照与沟通实践

在跨职能沟通中，建议使用下表统一语言，避免「AI 做了某某」这种模糊表述：

概念	英文	一句话
人工智能	AI	让机器表现智能行为的总称
机器学习	ML	从数据中学习，而非硬编码规则
深度学习	DL	用深层神经网络的 ML
生成式 AI	Generative AI	生成文本、图像、代码等
基座模型	Foundation Model	大规模预训练、可下游适配
大语言模型	LLM	以语言为主的大规模 Transformer 模型

实践中的表述示例：

❌ 「我们的 AI 知道所有合同条款」→ ✅ 「我们用 RAG 检索合同片段，再由 LLM 根据片段回答」
❌ 「换更强的 AI 就能解决幻觉」→ ✅ 「需要检索、引用来源与拒答策略组合治理幻觉」
❌ 「Deep Learning 就是 ChatGPT」→ ✅ 「ChatGPT 基于深度学习中的 Transformer LLM」

建议在项目文档中固定一份术语表，并在 PRD、架构图里标注「LLM 推理服务」「Embedding 服务」「向量库」等具体组件，而不是笼统写「AI 模块」。

第 5 步：为工程实践划清学习路线

理解概念层次后，应用工程师的典型路径是：

调用 API（第 2 章）：学会 messages、参数、流式输出
Prompt 与结构化输出（2.5–2.6）：可控、可解析的模型行为
RAG（第 4 章）：把企业知识接入 LLM
Agent 与工具（第 5 章）：让 LLM 调用搜索、数据库、API

你不需要从零训练 GPT，也不必先学完反向传播再写业务代码。但你需要知道：当产品要求「100% 准确的政策问答」时，答案在 RAG + 评估体系，而不是「换一个更大的模型」这么简单。

本节建立的概念框架，会在后续每一章反复出现。遇到新名词时，先问：它属于 AI 的哪一层？是模型能力、训练方法，还是工程组件？

动手练习

用一段话向非技术同事解释：ChatGPT 是 LLM，LLM 是生成式 AI 的一种，生成式 AI 属于深度学习，深度学习属于机器学习——各用一句生活化比喻。
列出你当前项目中三处文档或口头表述，检查是否把 LLM 说成「全知知识库」；改写为「推理引擎 + 外部知识源」的准确说法。
画一张简单的架构草图：用户 → 应用后端 → LLM API，并标注知识应来自哪里（数据库 / 向量检索 / 第三方 API）。
选一款你用过的产品（如 Copilot、通义、DeepSeek），写 5 条「它擅长 / 不擅长」的能力边界清单。

常见问题

Q：没有 GPU 也能学 LLM 应用开发吗？

可以。本课程面向应用层：通过远程 API 或 Ollama 本地推理即可，训练才需要大规模 GPU 集群。第 2.1 节会对比远程与本地部署。

Q：LLM 和「人工智能」可以混用吗？

日常口语可以，但技术文档中建议区分：AI 是总称，LLM 是具体技术路线。对外宣传说「AI 驱动」没问题，对内架构应写清是 LLM、Embedding 还是传统 ML 模型。

Q：为什么说 LLM 是预测下一个 Token，却能「理解」问题？

「理解」是行为层面的描述。模型在海量文本上学会了统计与语义规律，使得预测下一个 Token 在多数场景下等价于合理回答。但它没有人类意义上的「知道」，这也是幻觉与知识 cutoff 存在的根本原因。

本节小结

AI、ML、DL 是层层嵌套的关系；LLM 属于生成式 AI 中的语言基座模型，基于 Transformer 做 next-token prediction。应用开发的核心认知是：LLM 是推理引擎，不是企业知识库；准确性与时效性要靠 RAG、工具与治理体系补足。掌握这一边界，是后续 API、Prompt、RAG 学习的地基。

AI · ML · LLM ​

引言 ​

章节正文 ​

第 1 步：从 AI 到 ML：从「写规则」到「学规律」 ​

第 2 步：生成式 AI 与基座模型：从「分类」到「创造」 ​

第 3 步：LLM 的能力边界：引擎 vs 知识库 ​

第 4 步：术语对照与沟通实践 ​

第 5 步：为工程实践划清学习路线 ​

动手练习 ​

常见问题 ​

本节小结 ​