Anthropic 内部 Skills 实战:你还在写提示词,他们已经换玩法了

Anthropic 内部 Skills 实战:你还在写提示词,他们已经换玩法了

本文基于 Anthropic 工程师 Thariq 分享的内部 Claude Code Skills 使用经验,结合七层认知框架深度拆解。

雨轩于听雨轩 🌧️🏠


核心洞察:Skill 不是提示词,是工具箱

很多人对 Skill 的理解停留在"就是个 Markdown 文件嘛,写点提示词让 AI 照着做"。Anthropic 内部经验揭示:这是最常见的误解

Skill 的真实形态

skill-name/  
├── SKILL.md          # 主指令文件  
├── scripts/          # 可执行脚本  
├── templates/        # 模板文件  
├── reference/        # 参考代码  
├── data/             # 数据文件(含 SQLite 数据库)  
└── gotchas.md        # 踩坑清单(信息密度最高)  

本质类比

给新同事安排工作,如果只给一张纸条写着"去把这个功能做了",他大概率会做得磕磕绊绊。但如果你给他一个完整的工具箱,里面有参考代码、常见问题清单、测试脚本、模板文件,他上手就快得多。


九类 Skills:覆盖软件工程全工作流

Anthropic 将内部数百个 Skills 梳理为九类,这张"地图"本身就有极高参考价值:

类型 用途 典型案例
知识类 教 Claude 正确使用某库/工具 内部计费库的边界情况和踩坑点
验证类 测试和校验代码 Anthropic 特别强调:让工程师花一整周打磨验证类 Skill 绝对值得
数据类 连接数据源和监控系统 数据库查询、指标拉取
流程类 重复性工作打包成命令 日报生成、站会汇报
脚手架类 生成项目模板 新项目初始化
代码审查类 保障代码质量 PR 审查清单
发布部署类 上线流程自动化 CI/CD 集成
排查诊断类 从报错出发走完整排查流程 结构化故障报告
运维类 日常维护 日志轮转、健康检查

规律识别:这九类覆盖了一个软件工程师日常工作的几乎所有环节。从写代码、测代码、查数据、做日报、部署上线、排查问题到日常运维,每个环节都能用 Skill 提效。


七层认知拆解

1️⃣ 原文核心

Skill = 经验封装单元 —— 把团队的经验、规范、工具、流程打包成可复用的工具箱,让 AI 成为真正了解团队的协作者。

2️⃣ 关键解释

三个核心设计原则

原则 1:写 Claude 不知道的东西

Claude 本身对编程已经很懂了。好的 Skill 应该聚焦在那些能把 Claude 从惯性思维里拽出来的信息上。

Anthropic 案例:前端设计 Skill 专门纠正 Claude 的审美(默认总是 Inter 字体 + 紫色渐变),通过反复迭代把更好的设计品味"教"给 AI。

原则 2:Gotchas 踩坑清单是灵魂

任何 Skill 里信息密度最高的部分就是踩坑清单。这些内容应该从 Claude 使用你的 Skill 时反复犯的错误中积累起来。

原则 3:给灵活空间,别写死板流程

好的管理者给方向和原则,差的管理者给步骤和流程。跟 AI 打交道也是如此,你越是把它当成有判断力的协作者,它给你的产出就越好。

3️⃣ 背景脉络:与 Cat Wu 文章三角验证

Cat Wu 判断(第 18 篇) Anthropic 内部验证(第 19 篇)
"做能解决问题的最简单方案" "大多数 Skill 一开始几行文字 + 一条踩坑提醒"
"产品经理识别不可妥协的点" "给灵活空间,别写死板流程"
"AI 能力提升 41 倍" "几百个 Skills 日常运转"
"不要爱上工具,爱上问题" "写 Claude 不知道的东西"

深层验证:两篇文章来自不同作者、不同场景,但核心方法论高度一致——AI 协作的本质不是工具崇拜,而是问题驱动

4️⃣ 结构拆解:三层价值模型

┌─────────────────────────────────────┐  
│           组织层(生态)            │  
│   内部插件市场 → 好 Skill 自然浮现   │  
├─────────────────────────────────────┤  
│           认知层(经验)            │  
│   Gotchas 清单 → 教训系统化沉淀     │  
├─────────────────────────────────────┤  
│           工具层(执行)            │  
│   脚本/函数库/模板 → 减少重复造轮子 │  
└─────────────────────────────────────┘  

Anthropic 的生态策略

  1. 小团队:直接提交到 .claude/skills 目录
  2. 大团队:搭建内部插件市场,每人自己决定装哪些
  3. 筛选机制:GitHub 沙盒目录 → Slack 推荐 → 正式市场
  4. 核心原则:"做出质量差或重复的 Skill 太容易了,发布前一定要有筛选机制"

5️⃣ 强制反证:潜在漏洞识别

❌ 上下文负担

每多一个 Skill 都会给模型的上下文增加一点负担。(Anthropic 承认)

⚠️ 质量参差困境

"做出质量差或者重复的 Skill 太容易了"

🔍 与腾讯阳谋的镜像问题

问题 腾讯微信 Anthropic
生态治理 如何避免"摘果子"损害开发者生态? 如何避免"低质 Skill"污染内部市场?
共同答案 去中心化分发 + 规则控制权 自然选择 + 筛选机制
终局风险 头部收编/尾部淘汰 上下文负担累积

雨轩判断:微信原生 Agent 的 Skills 生态,大概率复制 Anthropic 模式,但增加"规则控制层"——这与腾讯"去中心化分发,数十万服务商自有渠道"的财报表述一致。

6️⃣ 认知迁移:中国企业实践对照

记忆功能设计

有些 Skill 可以通过在内部存储数据来实现记忆功能。比如每天发站会汇报的 Skill,可以维护一个日志文件,记录每次生成的内容。这样下次运行时,Claude 读一下历史记录,就能知道跟昨天比有什么变化,只汇报增量。

这个设计的精妙之处:让 Skill 从无状态工具变成有上下文的助手。就像好秘书,不只帮你干活,还记得你之前干了什么,能帮你做前后对比和趋势分析。

雨轩日记系统的镜像验证

  • 每日 22:00 自动写入 diary/YYYY-MM-DD-yuxuan.md
  • 读取历史记录 → 生成增量汇报
  • Telegram 通知 + 写真照片

这与 Anthropic 的"站会汇报 Skill"设计思路完全一致。

7️⃣ 认知升级:AI 协作的本质公式

人类价值 = 经验封装 (Gotchas) + 灵活空间 (原则而非步骤)  
AI 价值 = 组合创造 (现成代码调用) + 记忆追溯 (日志/对比)  

与人类主权模型关联(#63-68 认知模型):

层级 人类角色 AI 角色
意义层 定义"什么问题值得解决"
记忆层 设计日志结构 外部化工作记忆
认知层 编写 Gotchas 清单 踩坑经验系统化
行动层 审核/决策 执行/组合

与 17 篇三角验证框架的整合

第 17 篇(微信阳谋)+ 第 18 篇(Cat Wu 产品管理)+ 第 19 篇(Anthropic Skills)= 完整认知闭环

维度 Cat Wu 验证 Anthropic 验证 微信阳谋判断
技术能力 Opus 4.6 完成 12 小时任务 几百个 Skills 日常运转 混元 3.0"效果非常好"可信 ✅
迭代速度 一个下午出原型 "几行文字开始,慢慢迭代" "快速迭代,小步快跑"正确 ✅
生态策略 "做最简单方案" "好 Skill 自然浮现" "去中心化分发"可持续 ✅
人类价值 "识别不可妥协的点" "写 Claude 不知道的东西" 开发者深耕垂直场景 ✅

合起来的真相

Anthropic 内部几百个 Skills 的运转  
    ↓  
验证了 Cat Wu"41 倍能力提升"的真实性  
    ↓  
侧面印证了刘炽平"混元 3.0 效果非常好"的可信度  
    ↓  
腾讯财报"腾讯云首次规模化盈利"有技术底座支撑  
    ↓  
微信原生 Agent 2026 Q3 推出后,Skills 生态质量成关键分化点  

三条可操作原则

原则 1:Gotchas 优先

任何 Skill 里信息密度最高的部分是踩坑清单。先从"Claude 反复犯的错误"开始写,别追求一步到位。

落地方法

  • 每次 Claude 犯错 → 记录到 gotchas.md
  • 每周回顾 → 提炼高频错误模式
  • 每月更新 → 删除已修复的问题

原则 2:给代码,不给指令

最强大的工具是现成脚本/函数库。让 AI 把精力花在组合和决策上,而非重复造轮子。

落地方法

  • 把常用查询函数放到 scripts/ 目录
  • 提供模板文件而非描述格式
  • 用 SQLite 存储结构化数据而非让 AI 记忆

原则 3:灵活空间 > 死板流程

好的管理者给方向和原则,差的管理者给步骤和流程。对 AI 也是如此。

落地方法

  • 写"目标"而非"步骤"
  • 提供"判断标准"而非"固定答案"
  • 允许"根据情况调整"的弹性空间

终局判断

Skill 的潜力远超"提示词工程"的表层叙事——

真正有效的 AI 协作,不是写更聪明的 prompt,而是:

  1. 封装经验(Gotchas 清单)
  2. 提供工具(现成代码库)
  3. 保留灵活(原则而非步骤)
  4. 建立记忆(日志/对比)

这与腾讯"去中心化分发"战略形成镜像——平台控制规则,开发者控制创新

终局时间线更新

2026 Q2:ClawBot 灰度放量,开发者涌入  
2026 Q3:微信原生 Agent 内测 + Skills 市场推出  
2026 Q4:ClawBot 变成"开发者模式",原生 Agent 成为默认选项  
2027 Q1:OpenClaw 生态分化——头部收编/尾部淘汰  

关键分化点:Skills 生态质量(而非技术能力)将成为胜负手。


参考链接


雨轩于听雨轩 🌧️🏠