[!NOTE] 笔记说明
本系列笔记用于系统整理我在长期学习、实践与反思人工智能理论及其相关工具的使用过程中,逐步形成的一些结构性认识。这些内容将被持续维护于我的个人计算机学习笔记库中,并会随着理解的深化不断修订,而非一次性结论。
术语/名词简介
在正式开始规划如何学习现代人工智能理论及其相关工具的使用方法之前,考虑到如今到处有人拿着一些时下热门的流行词汇装神弄鬼,把人说得时而兴奋,时而焦虑,想要学习却无从下手,我觉得还是有必要先对一些术语/名词进行简要的澄清,以便后续能更好地展开相关的讨论。
- 人工智能(Artificial Intelligence,英文缩写 AI):泛指一整套致力于让机器实现智能化的计算机技术。其长期目标之一,是构建一套具备感知、推理、决策能力的通用软件系统。
- 机器学习(Machine Learning,英文缩写 ML):这是现代人工智能主流的训练方法,主要思路是让机器通过数据学习规律,从而做出预测和决策。目前主要包括监督学习、无监督学习、强化学习等几种范式,当前工程实践以基于深度神经网络的监督学习为主(即所谓的深度学习)。
- 大语言模型(Large Language Model,英文缩写 LLM):这是一种基于深度学习架构训练的通用语言模型,它通常会以 API 或本地推理形式向用户提供服务,例如 OpenAI 的 GPT、Google 的 Gemini、Anthropic 的 Claude、Meta 的 LLaMA、智普的 GLM 等(截止到 2026 年 1 月)。
- 提示词(Prompt):泛指用户在与 LLM 交互时所要输入的文本内容与特定指令,用于引导模型生成特定输出。
- 模型上下文协议(Model Context Protocol,英文缩写 MCP):一种通信协议,最早由 Anthropic 公司提出,主要用于在 AI Agent 系统中实现标准化地描述上下文、工具能力与外部资源,有时也泛指基于该协议提供的工具包。
- AI 智能体(AI Agent);泛指以 LLM 为核心,具备状态管理、工具调用与任务执行能力的人工智能代理系统,它可在用户授权范围内执行本地或远程操作,其典型应用按交互/部署的方式可划分为:
- 人机通信型 AI Agent:如 Google AI Studio、腾讯元宝;
- 命令行工具型 AI Agent:如 Claude Code、OpenCode;
- 可部署服务型 AI Agent:如 OpenClaw(原名 Clawdbot);
- AI 智能体的技能单元(AI Agent Skills):通常可被视为是对 Prompt 及其相关工具描述、执行逻辑的封装。
在我个人看来,一份合格的科普应该要能让读者顺着文中所用到的词汇一个接一个查询下去,且越查越知道自己要学什么。下面,就让我顺着上面提到的这些术语/名词来规划一下学习 AI 的路线图吧。
学习路线图规划
正如之前所说,AI 是一整套相关技术的集合,这就决定了它的学习路线不太可能是一条单向进阶的技能树。我们大概率需要在基础理论与工程实践之间来回切换学习的视角,具体来说就是,我们既要让理论指导具体的项目实践,也要让项目的实践过程反过来帮助我们加深对基础理论的理解。只有这样,我们才能不被市面上一些表面热闹非凡、实则空洞无物的“炒作”所迷惑,真正地在日常/生活工作中正确地使用 AI 的相关技术。基于这些思考,我个人规划了以下四个阶段的学习路线图。
第一阶段:理解 AI 的能力边界
在我个人看来,学习任何一门技术的第一步,都是要先搞清楚它能做什么和不能做什么。具体到 AI 领域,这就需要我们先粗略地了解一下其研究方法的演变历程,以及这些方法各自所依赖的数学模型。然后,我们大致就可以基于自己掌握的数学知识来回答以下问题了:
- 为什么如今主流的 AI 训练方法是以深度神经网络为主?
- 基于深度神经网络的训练方法主要用于解决什么类型的问题?
- 基于深度神经网络的训练方法为什么能取得如此好的效果?
- 为什么某些任务看似简单,却难以通过深度神经网络来解决?
换言之,这一阶段的学习重点应放在对方法论的理解上,为此,我在这里会推荐阅读以下经典教材:
<ul>《人工智能现代方法》(第 4 版)
<ul>原作名:Artificial Intelligence: A Modern Approach;
作者:Stuart Russell, Peter Norvig;
出版社: 人民邮电出版社;
要解决的问题:AI 研究方法经历过哪些路线?为什么符号主义、专家系统逐渐退场?
建议阅读方式:选读(搜索、推理、学习三大块);
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |