模型上下文协议(Model Context Protocol,英文缩写 MCP):一种通信协议,最早由 Anthropic 公司提出,主要用于在 AI Agent 系统中实现标准化地描述上下文、工具能力与外部资源,有时也泛指基于该协议提供的工具包。
AI 智能体(AI Agent);泛指以 LLM 为核心,具备状态管理、工具调用与任务执行能力的人工智能代理系统,它可在用户授权范围内执行本地或远程操作,其典型应用按交互/部署的方式可划分为:
人机通信型 AI Agent:如 Google AI Studio、腾讯元宝;
命令行工具型 AI Agent:如 Claude Code、OpenCode;
可部署服务型 AI Agent:如 OpenClaw(原名 Clawdbot);
AI 智能体的技能单元(AI Agent Skills):通常可被视为是对 Prompt 及其相关工具描述、执行逻辑的封装。
在我个人看来,一份合格的科普应该要能让读者顺着文中所用到的词汇一个接一个查询下去,且越查越知道自己要学什么。下面,就让我顺着上面提到的这些术语/名词来规划一下学习 AI 的路线图吧。
学习路线图规划
正如之前所说,AI 是一整套相关技术的集合,这就决定了它的学习路线不太可能是一条单向进阶的技能树。我们大概率需要在基础理论与工程实践之间来回切换学习的视角,具体来说就是,我们既要让理论指导具体的项目实践,也要让项目的实践过程反过来帮助我们加深对基础理论的理解。只有这样,我们才能不被市面上一些表面热闹非凡、实则空洞无物的“炒作”所迷惑,真正地在日常/生活工作中正确地使用 AI 的相关技术。基于这些思考,我个人规划了以下四个阶段的学习路线图。
第一阶段:理解 AI 的能力边界
在我个人看来,学习任何一门技术的第一步,都是要先搞清楚它能做什么和不能做什么。具体到 AI 领域,这就需要我们先粗略地了解一下其研究方法的演变历程,以及这些方法各自所依赖的数学模型。然后,我们大致就可以基于自己掌握的数学知识来回答以下问题了:
为什么如今主流的 AI 训练方法是以深度神经网络为主?
基于深度神经网络的训练方法主要用于解决什么类型的问题?
基于深度神经网络的训练方法为什么能取得如此好的效果?
为什么某些任务看似简单,却难以通过深度神经网络来解决?
换言之,这一阶段的学习重点应放在对方法论的理解上,为此,我在这里会推荐阅读以下经典教材:
<ul>《人工智能现代方法》(第 4 版)
<ul>原作名:Artificial Intelligence: A Modern Approach;
作者:Stuart Russell, Peter Norvig;
出版社: 人民邮电出版社;
要解决的问题:AI 研究方法经历过哪些路线?为什么符号主义、专家系统逐渐退场?
建议阅读方式:选读(搜索、推理、学习三大块);