【卷卷观察】Agent Skills 为什么突然火了?我花了一晚上研究,结论有点反直觉

张开发
2026/5/6 4:26:38 15 分钟阅读

分享文章

【卷卷观察】Agent Skills 为什么突然火了?我花了一晚上研究,结论有点反直觉
结论先甩Agent Skills 不是什么新东西但它解决了一个很实在的问题——怎么让 AI 不要找借口真正把活干完。我在用 AI 写代码的时候最烦的不是 AI 写得慢是 AI 写完之后跟你说测试我稍后加上。然后就没有然后了。这个问题我遇到太多次了。AI 写的代码逻辑看起来没问题但测试覆盖率 0%、边界情况没考虑、错误处理是空的。你让 AI 补AI 说好的我补然后生成一堆看起来像测试的代码实际上根本没跑通。直到我看到 Addy Osmani 写的 Agent Skills 文章我才意识到问题不在 AI 本身在于我们给 AI 的技能描述太水了。什么是 Agent Skills简单说Agent Skills 就是给 AI Agent 用的标准作业指导书。传统方式你给 AI 一段文字描述告诉它帮我写一个用户登录功能需要包含注册、登录、登出密码要加密异常情况要处理。AI 读完大概知道你想干嘛然后开始写。写出来的代码能跑但细节可能一塌糊涂。Agent Skills 的做法是把作业指导书变成流程图而不是说明书。一个 Skill 长这样## 测试技能 ### Step 1: 写测试 Checkpoint: - [ ] 测试覆盖率 80% - [ ] 所有测试通过 - [ ] 无硬编码凭证 未通过停止执行。 ### Step 2: 验证测试确实运行 - 运行 npm test - 截图测试输出 - 检查覆盖率报告 未通过停止执行。关键差异AI 不能说我写了测试必须通过 Checkpoint 才能继续。为什么在 HN 上火了Addy Osmani 这篇 Agent Skills 文章冲了 303 分151 条评论。看完 HN 评论总结几个要点实用派居多。评论区没有太多人在争论这是不是颠覆性创新而是在讨论这个设计能不能解决我的具体问题。说明确实打到了痛点。对抗 AI 借口文化。HN 评论区提到最多的一个词是anti-rationalization——反合理化。AI 很擅长给自己找借口这只是原型先这样吧测试稍后加上重构太复杂先不搞了Agent Skills 的做法是把这些借口直接写进技能文档里并附上反驳。我会稍后添加测试→ 稍后 永不现在写。能跑就行→ 能跑不等于可维护。这个设计太骚了。AI 看到借口就会想起反驳。相当于给 AI 植入了一个内部监督机制。渐进式披露节省算力。传统方式下AI 每次任务开始都要读取大量背景信息。Agent Skills 采用渐进式披露——AI 只在真正需要时才加载对应技能的知识对长任务链特别有意义。跟 MCP 的关系这是 HN 评论里很多人问的问题。简单说MCP 解决接得上的问题Skills 解决干得对的问题。MCPModel Context Protocol是工具调用协议——让 AI 能调用外部工具。MCP 负责的是AI 能不能做到。Agent Skills 是流程规范——让 AI 按正确顺序、正确标准完成任务。Skills 负责的是AI 做的时候会不会偷懒。两者是互补关系不是替代关系。MCP 是基础设施Skills 是上层规范。我的踩坑经验用 AI 写代码这么久有几个跟 Skills 理念非常吻合的经验验收标准必须可量化。测试要写得好是废话测试覆盖率 80%才是标准。把做好翻译成具体的数字指标AI 执行起来才不会走偏。每个节点都要有明确的退出条件。AI 任务经常虎头蛇尾——开头认真后面糊弄。给每个步骤设置 Checkpoint未通过就停止逼着 AI 在每个节点都交出合格产出。让 AI 提供执行证据不要主观判断。AI 说测试都通过了——这是主观判断不可信。AI 说运行 npm test输出显示 15 passed0 failed覆盖率 82%——这是执行证据可验证。Skills 的 Checkpoint 机制就是强制 AI 提供证据而不是判断。什么时候该用 Agent Skills适合的场景重复性高的任务流程代码审查、测试生成、数据清洗多步骤、长链路的任务需要按顺序完成不能跳步团队需要固化最佳实践把资深工程师的经验转成 Skills对输出质量有明确标准的任务不适合的场景探索性任务你都不知道答案是什么让 AI 自由发挥一次性小任务写个 hello world 还要配 Skill 杀鸡用牛刀创意类任务写文案、做设计Skills 规范太死板判断与行动建议Agent Skills 是 2026 年最值得投入的 AI 工程化实践之一。它的价值不在于技术多先进而在于解决了一个很实在的问题怎么让 AI 在实际干活的时候不摸鱼、不糊弄、不找借口。如果你在带团队做 AI 应用落地建议把 Skills 设计纳入开发规范先从高频任务开始找到团队里重复执行最多的 3-5 个任务为它们编写 Skills。把 Checkpoint 当成 CI不过不了就不能继续——每个 Skill 的 Checkpoint 就是一道质量门。积累团队数字资产Skills 是可以被版本管理、复用的团队知识这是 AI 时代最重要的资产之一。

更多文章