今天的 skills,已经解决了”经验复用”的问题,但还没有解决”经验生长”的问题。
它们大多仍是人工整理出来的静态方法包:能被调用,能被复制,能提升效率,但不会在真实任务中自己分化、修正和迭代。
这也是我最近越来越明确的一个判断:Skills 的下一阶段,不是继续堆更多模板,而是长出”演化树”。
换句话说,未来真正有价值的,不是一个写得很全的 skill 文档,而是一套能在实战里不断分支、筛选、保留和淘汰的 skill 系统。主干来自人的经验沉淀,分支来自真实世界的持续反馈。谁先做出这种能力,谁的 Agent 才更有可能形成真正的经验复利。
现在的 skills,像”标本”,还不像”物种”
今天的 skills 并不难理解。
本质上,它是在把一段可复用的方法、流程、约束整理出来,交给 Agent 在相似任务中反复使用。这当然有价值,而且已经证明有效。
但问题也很直接:大多数 skill 的源头,仍然是人的总结,而不是系统自己的持续实战。
所以现在很多 skill 更像”标本”——它记录了一套曾经有效的方法,却不会随着环境变化自己更新。工具变了,接口变了,依赖变了,错误模式变了,skill 本身却往往还是原来的样子。
它能复用经验,但不会自己长出新经验。
真正重要的,不是复用,而是演化
如果借用生物学的视角,这个问题会更容易看清。
生物最有价值的能力,不是被定义出来,而是能够在环境变化里持续演化:环境变化,个体分化,适者保留,低效淘汰,最后形成演化树。
我觉得,未来的 skills 也会走到这一步。因为真实任务从来都不是一条固定流程。
同样一个 skill,在不同上下文下,往往就应该走不同路径:
- 环境不同
- 权限不同
- 工具链不同
- 错误类型不同
- 用户目标不同
如果一个 skill 只有主干,没有分支,那么它一旦离开理想条件,就会迅速退化成临场发挥。
所以问题不是”skill 还要不要更多”,而是:skill 能不能在执行中长出分支。 这才是下一阶段真正的分水岭。
一旦能演化,skill 的价值会变一层
当 skill 从”静态模板”变成”演化树”,它的价值会发生质变。
首先是成功率更高。 系统不再每次都走同一条路,而是能根据上下文,选择更合适的分支。
其次是稳定性更强。 那些在高频实战中反复验证过的路径,会逐渐沉淀下来,不再过度依赖模型的临场发挥。
再往后,是经验真正开始产生复利。 静态 skill 很容易老化;可演化的 skill 则可能越用越成熟。每一次执行,不只是完成一次任务,也是在给整棵树增加新的养分。
还有一点很重要:长尾问题会被逐步产品化。 今天很多异常之所以麻烦,是因为每次都要重新处理。可一旦某类异常反复出现,它就有机会从”偶发情况”变成”正式分支”。这意味着系统不是在一次次重复犯错,而是在不断把例外变成经验。
怎么把 skill 做成”演化树”
真正难的不是提出这个概念,而是把它落到系统设计上。
1. skill 不能只是文档,要变成结构化对象
如果 skill 只是 prompt、Markdown 或 checklist,它适合人阅读,但不适合机器演化。
系统很难知道到底是哪一步经常失败、哪个判断点最容易分叉、哪条回退路径更有效。所以未来的 skill,更像一个图,而不是一段说明:
- 有步骤节点
- 有条件判断
- 有前置条件
- 有异常入口
- 有回退路径
- 有终止条件
只有这样,系统才有可能真正”分析一个 skill”,而不是只会”调用一个 skill”。
2. 要建立 execution trace 到 skill update 的闭环
今天很多 Agent 系统已经有 trace,但大多是为了调试。下一阶段更关键的是:这些执行轨迹能不能反过来成为 skill 迭代的原料。
系统需要知道:
- 当前任务用了哪个 skill 版本
- 实际走了哪条路径
- 在哪里失败
- 切换过哪些备选方案
- 最终是否成功
- 成本、耗时、稳定性如何
当这些轨迹积累到足够多时,模式就会开始浮现:某类上下文总是触发同样的异常,某条备用路径在特定环境里长期更稳,某一步其实在大量场景里都是多余的。
这时,skill 才真正有机会从”被动使用”进入”主动修正”。
3. 不要急着覆盖旧 skill,而要允许它派生分支
我觉得这点尤其关键。
更合理的方式,不是系统自动把旧 skill 直接改掉,而是先让它派生变体。例如从一个主干 skill 上,逐渐长出:
- 快速分支
- 稳妥分支
- 低权限分支
- 特定环境分支
- 特定异常分支
然后让这些分支在真实任务里竞争。谁成功率更高,谁成本更低,谁在某类上下文里表现更稳定,谁就获得更多机会被路由到。
这其实非常像生物演化里的”变异 + 选择”。它不是修文档,而是在培养一个会分化的系统。
4. 分支多了之后,router 会变得很重要
一旦 skill 长出很多分支,新的问题马上就来了:当前任务该走哪一支?
所以未来 skill 系统里,除了 skill 本身,一个非常关键的层会是 router。它负责根据上下文,把任务送到最合适的 skill 分支。
这个 router 不一定非得极其复杂。它可以是规则系统,也可以是分类器、向量检索、案例匹配,甚至是几种方法的混合。关键不是”多聪明”,而是能否稳定判断:当前问题更接近哪一类环境、哪一类目标、哪一类异常。
skills 决定能力边界,router 决定命中效率。
5. 演化必须和治理一起出现
只要系统开始修改自己的执行方法,就不能只谈效率,不谈边界。
所以这类 skill 演化系统,必须同时具备:
- 版本管理
- 差异审计
- 回滚机制
- 灰度发布
- 高风险场景下的人工审批
否则所谓”进化”,很容易变成”污染”:一次局部成功,被错误推广成通用规则,最后把整个 skill 主干带偏。
真正成熟的系统,不会只有演化能力,也一定会有治理能力。
下一阶段的差距,可能不只在模型,而在经验系统
我越来越觉得,未来 Agent 的竞争力,不会只来自模型本身,也不会只来自工具数量。
更大的差距,很可能来自:谁先拥有一棵真正能持续生长的 skill 演化树。
- 主干来自人的经验沉淀
- 分支来自真实世界的反馈
- router 负责选择
- 治理负责约束
到了那时,skills 就不再只是写给 Agent 的说明书,而会变成 Agent 的后天能力系统。
这可能才是 Skills 真正的下一阶段。