译文信息

Skills 将领域专长封装进智能体可以访问并应用的文件里——把通用智能体变成懂行的专家,足以应对真实工作。

过去一年变化很大。MCP 成了智能体连接能力的行业标准,业界与开发者社区快速跟进。Claude Code 发布,成为通用编程智能体。我们还推出了 Claude Agent SDK,现已提供开箱即用的生产级智能体。

但在构建与部署这些智能体的过程中,我们反复遇到同一道鸿沟:智能体有智识与能力,却不总有有效完成真实工作所需的专长。这促使我们创建 Agent Skills。Skills 是由文件组织起来的集合,把工作流、最佳实践、脚本等领域专长打包成智能体可以访问并应用的格式。它们把「能干的通才」变成「有谱的专家」。

本文将说明我们为何不再堆叠大量领域专用智能体、转而押注 Skills,以及这一转变如何改变我们扩展智能体能力的方式。

新范式:有代码就够了

我们曾以为不同领域的智能体会长得截然不同——编程智能体、研究智能体、金融、营销,各自似乎都需要专属工具与脚手架。行业一度拥抱「按领域造智能体」的模型。但随着模型智力提升、智能体能力成熟,我们收敛到了另一种做法。

我们逐渐把代码不仅看作一种用例,更看作智能体完成几乎所有数字工作的接口。Claude Code 是编程智能体,也是恰好通过代码工作的通用智能体。

设想用 Claude Code 生成一份财务报告:它可以调用 API 做研究、在文件系统里存数据、用 Python 分析并综合洞见。这一切都经由代码完成;脚手架可以简单到 bash 加文件系统。

通用能力不等于领域专长。当我们把 Claude Code 用于真实工作时,这道缺口就暴露出来。

缺失的一环:领域专长

你会希望谁替你报税:一位从零推导的数学天才,还是一位报过成千上万份申报的经验丰富的税务师?多数人会选择后者——不是因为更聪明,而是因为具备对的专长

今天的智能体有点像那位数学天才:擅长在陌生情境里推理,却常常缺少资深从业者的积累型专长。在恰当引导下它们能做出惊人成果;但往往缺少关键上下文、难以吸收你所在组织的专长,也不会自动从重复任务中学习。

Skills 以智能体可以渐进访问并应用的格式封装领域专长,弥合这道鸿沟。

什么是 Agent Skills?

Skills 为智能体打包领域专长程序性知识

anthropic_brand/
├── SKILL.md
├── docs.md
├── slide-decks.md
└── apply_template.py

这种刻意保持的简单,是因为文件是与你现有工具链天然兼容的原语:可以用 Git 版本管理、放在 Google Drive、与团队共享。这也意味着创建 Skill 不必局限于工程师——产品经理、分析师与领域专家已经在把各自工作流固化成 Skills。

渐进式披露

Skills 可以承载大量信息。为保护上下文窗口并让 Skills 可组合,我们采用渐进式披露:运行时最初只向模型展示元数据(YAML front matter 中的 namedescription)。

---
name: Anthropic Brand Style Guidelines
description: Anthropic's official brand colors and typography…
---

若 Claude 判断需要某个 Skill,它会读取完整 SKILL.md。若还需更多细节,Skill 可包含 references/ 目录,仅在需要时加载补充文档。

这种三层设计让你能为智能体配备成百上千个 Skills 而不撑爆上下文——元数据约 50 tokens,完整 SKILL.md500 tokens,参考文件 2000+ tokens 且仅在确需时载入。

Skills 可把脚本当作工具

传统工具有时会遇到:说明写得差、模型难以修改或扩展、还容易挤占上下文。代码则不同:自文档化、可修改,且不必一直待在上下文里。

一个真实例子:我们反复看到 Claude 写同一段脚本,用来把 Anthropic 的幻灯片样式套到演示稿上。于是我们让 Claude 把它存成给自己用的工具:

# anthropic/brand_styling/apply_template.py
import sys
from pptx import Presentation

if len(sys.argv) != 2:
    print("USAGE: apply_template.py <pptx>")
    sys.exit(1)

prs = Presentation(sys.argv[1])
for slide in prs.slides:
    ...

slide-decks.md 中的对应说明只需引用该脚本:

## Anthropic Slide Decks
- Intro/outro slides
  - background color: `#141413`
  - foreground color: oat
- Section slides:
  - background color: `#da7857`
  - foreground color: `#141413`

Use the `./apply_template.py` script to update a pptx file in-place.

Skills 生态

Skills 生态成形很快,目前我们观察到三类主要建设方向:

基础型 Skills(Foundational)

提供人人需要的基础能力:处理文档、电子表格、演示稿等。它们编码文档生成与操作的最佳实践。可在公开仓库中查看基础 Skills的具体形态。

合作伙伴 Skills(Partner)

随着 Skills 成为智能体对接专业化能力的标准方式,企业正在构建 Skills,让自己的服务可被智能体直接调用。K-DenseBrowserbaseNotion许多其他方正在创建与自身服务直接集成的 Skills,在保持 Skills 格式简单的前提下扩展 Claude 在特定领域的能力。

企业 Skills(Enterprise)

组织构建专有 Skills,固化内部流程与领域专长。Skills 有助于捕获让智能体在企业场景里真正好用的具体工作流、合规要求与机构知识。

我们看到的趋势

随着采用面扩大,几种模式正在浮现,也暗示这一范式可能走向何方。它们影响我们如何看待 Skill 设计以及为 Skill 开发者建设的工具。

复杂度在上升

早期 Skills 多为简单文档引用;现在出现更复杂的多步工作流,需要协调数据拉取、复杂计算以及跨多种工具的格式化输出。

  • 简单:「状态报告撰写」(约 100 行)——模板与版式
  • 中等:「财务模型构建」(约 800 行)——数据拉取、用 Python 做 Excel 建模
  • 复杂:「RNA 测序流程」(2500+ 行)——协调 HISAT2、StringTie、DESeq2 等分析

Skills 与 MCP

Skills 与 MCP 服务器天然互补。例如「竞品分析」Skill 可能协调网页搜索、经 MCP 访问的内部数据库、Slack 消息记录与 Notion 页面,综合成一份完整报告。

非开发者参与创建

Skill 的创建正从工程师扩展到产品经理、分析师与各学科的领域专家。借助 skill-creator 等工具的交互式引导,他们可以在约 30 分钟内创建并测试第一个 Skill。我们也在改进工具与模板,让任何人都能更轻松地沉淀与分享专长。

完整架构

综合起来,正在成形的智能体架构大致包含四层:

  1. Agent loop(智能体循环):决定下一步做什么的核心推理系统
  2. Agent runtime(智能体运行时):执行环境(代码、文件系统)
  3. MCP servers:连接外部工具与数据源
  4. Skills library:领域专长与程序性知识

每一层职责清晰:循环负责推理,运行时负责执行,MCP 负责连接,Skills 负责引导。这种拆分让系统可理解,也让各部分能独立演进。

设想在这一架构上只增加一个 Skill:frontend design skill 会立刻改变 Claude 的前端能力——在排版、色彩理论与动效上给出专门指导,且仅在构建 Web 界面时激活。渐进式披露意味着只在相关时加载。扩展新能力的路径是直接的。

向新垂直领域部署 Skills

「通用智能体 + MCP + Skills」这一模式,已经在帮助我们把 Claude 推向新的垂直场景。

金融服务

在推出 Skills 后不久,我们通过面向金融服务的 Claude为金融专业人士增强了 Skills,例如:

  • DCF 模型构建:搭建现金流折现模型,含恰当的 WACC 计算与敏感性分析
  • 可比公司分析:生成带相关倍数与对标的可比公司表
  • 财报分析:处理季度业绩并撰写投资更新报告
  • 首次覆盖:构建含财务模型的完整研究报告
  • 尽职调查:用标准化框架组织并购分析
  • 推介材料:按行业惯例制作客户演示

医疗与生命科学

我们也通过 Skills 强化了医疗与生命科学方向的能力,使 Claude 对研究人员、临床人员与医疗开发者更有用,例如:

  • 生物信息学套件:面向 scVI-tools、Nextflow 部署等的 Skills,用于管理基因组流程与单细胞 RNA 测序
  • 临床试验方案生成:加速临床研究中的方案撰写
  • 科学问题遴选:帮助研究者识别并框定有影响力的研究问题
  • FHIR 开发:帮助开发者编写更准确的健康数据互操作代码,更快连接医疗系统并减少错误
  • 事先授权审核:对照承保要求、临床指南与患者记录,减轻行政负担、加快患者获得所需照护

标准化 Agent Skills

为实现这一愿景,我们正在将 Agent Skills 作为开放标准发布。与 MCP 一样,我们认为 Skills 应在工具与平台间可移植——无论你使用 Claude 还是其他 AI 平台,同一个 Skill 都应能工作。我们已与生态中的成员协作推进该标准,并乐见早期采用。

当有人第一次使用 AI 智能体时,它理应已经知道你和团队在意什么——因为 Skills 捕获并传递了这些专长。随着生态壮大,社区中他人构建的 Skill 也能让你的智能体更有用、更可靠、能力更强——无论他们使用哪一家 AI 平台。

入门与延伸阅读

我们正在收敛通用智能体的整体架构,而 Skills 提供了交付与分享新能力的范式。真正的价值来自我们共同构建的集体知识库:沉淀专长、在团队间传递,让每一个智能体都比上一个更强。

资源:

致谢

Barry Zhang, Mahesh Murag, Keith Lazuka, Ryan Whitehead