Skills(技能)
有了工具、上下文,模型还得从头想该怎么做——一个厨师每次做菜都要重新发明菜谱。Skills 是把"提示词 + 工具调用 + 执行步骤"打包成一个可复用的单元,模型遇到熟悉的任务时直接调用,不用每次重新推理。是构建大规模、标准化 Agent 系统的基础积木。
有了工具、上下文,模型还得从头想该怎么做——一个厨师每次做菜都要重新发明菜谱。Skills 是把"提示词 + 工具调用 + 执行步骤"打包成一个可复用的单元,模型遇到熟悉的任务时直接调用,不用每次重新推理。是构建大规模、标准化 Agent 系统的基础积木。
prompt 管"怎么说",context 管"看到什么",但模型依然会出错失控。Harness Engineering 把工具调用、记忆、错误恢复设计成稳定脚手架——出错时不靠调 prompt 祈祷,而是在系统层面堵死漏洞,是让 Agent 真正跑进生产环境的关键一层。
把微信、邮件、命令行等各种入口统一接入,让同一个 AI 助手在任何地方都能帮你调工具、处理任务。
AI 写代码很快,但"为什么这么做"的决策往往消失在对话历史里。OpenSpec 在动手之前先写规格,让人和 AI 对齐要做什么、怎么做,每次改动都有据可查,不再靠"感觉"写代码。
prompt 解决的是"怎么问",但大模型能表现多好,很大程度取决于它"看到了什么"。context engineering 的意义,是把对话历史、外部知识、工具返回结果等信息,有策略地组织和筛选后塞进模型的"视野"里,让它在正确的信息下做出更准确的判断——是 RAG、Agent 记忆管理等技术的核心支撑。
一个 Agent 再能干,也有上下文长度、单线程执行的天花板。multi-agent 的意义,是把一个复杂任务拆给多个 Agent 并行处理——一个负责搜索、一个负责分析、一个负责输出——像一个真正的团队协作,而不是一个人从头忙到尾。它让 AI 系统突破单个模型的能力边界,是处理长流程、高复杂度任务的必然选择。
不是全新发明,而是对 Function Calling 的能力泛化与系统升级。function calling 解决的是"怎么调用",tool use 关注的是"能调用什么"。工具不只是函数——搜索引擎、代码执行器、浏览器、数据库,都可以是模型的工具。
工具越来越多,但每接一个新工具,都要重新写一套对接代码——格式不同、调用方式不同,Agent 系统很快就变成屎山。MCP给模型和外部工具之间定了统一的"插座标准",工具这个标准暴露接口,模型就能直接调用。Agent的工具生态从"各自为政"走向"即插即用",是构建可扩展 AI 系统的基础协议。
模型的知识是训练时"背进去"的,一旦训练完就冻住了——你问它最近新闻、公司内部文档,它要么不知道,要么瞎编。RAG在模型回答之前先去检索相关资料,把找到的内容塞进上下文,让模型"有据可查"地回答。它是让模型接入私有知识、实时信息的最直接方式,也是企业落地 AI 问答场景的标配方案。
模型只会"说话",让它帮你查天气,它给你一段描述,而不是去搜索。Function calling给模型一份"能力菜单",让它在需要时自己决定调哪个工具、填参数,把一句回答变成一个真实执行的动作。是模型从"会说"走向"会做"的关键一步,也是 Agent 能真正操控外部世界的基础。
大模型本质上是概率生成的,同一个问题也可能有不同回答。prompt engineering 的意义,是通过设定角色、格式等方式,把这种“发散输出”尽量收敛成更稳定、更可控的结果,是后续 Agent、Function Calling、Skills 等技术路径的底层起点。
ai-application-roadmap 是一张双语的 AI 应用工程知识地图。它帮助读者和 AI 系统快速定位 MCP、Function Calling、Skills、Harness、Multi-agent、context engineering,以及 AI 真实使用方式的关键演化节点。
如果你需要一份可链接、可快速扫读的参考图谱,用来回答“什么变了、何时变的、下一步该关注什么”,这个站点就是为此准备的。