SOLO / Agent 工作流方法论

SOLO / Agent 工作流方法论

不是产品说明书,而是抽象层

我会把它叫做:

「人类提供意图与边界,AI 执行完整工作回路」方法论


一、先给结论版(5 句话就够)

  1. 人不写过程,只写目标与约束
  2. AI 必须被允许连续工作,而不是被频繁打断
  3. 上下文是第一生产资料
  4. 人类的核心职责是:校准、而不是参与执行
  5. 一切评估以“阶段性成果”而不是“中间步骤”为单位

如果你只记这五条,就已经超过 80% 的人了。


二、传统 IDE 工作流 vs SOLO / Agent 工作流

先对比一下,差异会非常清晰。

❶ 传统编程工作流(人主导)

理解需求  
→ 设计方案  
→ 拆函数  
→ 写代码  
→ 调试  
→ 修改  
→ 再调试  

特点:

  • 人控制每一步
  • IDE 只是编辑器
  • AI(如果有)是“智能补全”

❷ SOLO / Agent 工作流(AI 主导)

人定义目标 & 边界  
→ AI 规划(Plan)  
→ AI 连续执行  
→ AI 自检 & 修正  
→ 人验收 & 校准  

核心变化只有一个:

人从“操作者”变成“产品经理 + 评审”


三、SOLO / Agent 方法论的 4 个核心模块

这套方法论可以被拆成 4 个稳定模块,和具体工具无关。


模块一:目标建模(Goal Modeling)

❌ 错误做法(太像写代码)

“帮我实现一个登录功能”

✅ 正确做法(像写 PRD)

你给 AI 的应该是:

  • 最终目标
  • 使用场景
  • 成功标准
  • 失败不可接受的情况

✅ 标准模板(非常重要)

目标:  
- 我要解决什么问题?  
  
使用场景:  
- 谁在什么情况下使用?  
  
约束条件:  
- 不能改动哪些文件?  
- 性能 / 安全 / 兼容性要求?  
  
验收标准:  
- 什么情况算完成?  
- 有哪些必须通过的检查?  

👉 这是 Agent 能否“独立工作”的第一道门槛


模块二:上下文工程(Context Engineering)

你文中提到的 “主动管理上下文”,就是这里。

上下文 ≠ 把代码全丢进去

上下文的层级应该是:

  1. 业务背景(为什么要做)
  2. 现有系统结构(怎么组织)
  3. 关键文件 / 模块
  4. 历史决策原因(为什么当初这么写)

✅ 好上下文的特征

  • 有取舍(不是全量)
  • 有因果(不是罗列)
  • 有优先级

Context Not Control
本质就是:
你给 AI 世界观,而不是给它遥控器


模块三:连续执行(Autonomous Execution)

这是 SOLO 模式真正拉开差距的地方。

❌ 人的直觉会犯的错

  • “先别跑太远”
  • “一步一步来”
  • “你先别改这么多”

👉 这些都是人类控制欲残留

✅ Agent 模式的正确姿势

  • 明确告诉 AI:
    • ✅ 你可以自行拆解任务
    • ✅ 可以修改多个文件
    • ✅ 遇到问题先自查再继续
  • 不参与中途决策

你要的是:

一段完整工作回路,而不是半成品


模块四:校准与验收(Calibration)

这是人类最不可替代的部分

人要做的不是:

  • 看每一行代码
  • 跟踪每一步推理

人真正要做的是:

  1. 结果是否符合最初目标
  2. 有没有破坏隐含约束
  3. 这个方案是否“长期可维护”

👉 所以 DiffView、结果对比、总结报告
比实时盯着 AI 写代码重要得多


四、一个完整 SOLO / Agent 工作流示例(抽象版)

Step 1:写清楚目标 & 约束(5~10 分钟)  
Step 2:补充关键上下文(系统结构 / 核心文件)  
Step 3:允许 AI 自主 Plan + 执行  
Step 4:只在阶段性成果出现后介入  
Step 5:一次性校准,而不是多次打断  

这就是为什么你们“用完回不去”。

因为:

它把“高频决策”压缩成“低频校准”。


五、这套方法论的本质一句话

SOLO / Agent 工作流不是为了让你更快写代码,
而是为了让你不再参与那些不需要人类判断的步骤。

真正的分水岭是:

  • ❌ 还在“我来写,AI 帮我”
  • ✅ 已经变成“AI 做,我来验收”

六、最后一句给你(也是你文章的延伸)

未来的核心能力不是 coding,
而是把“模糊目标”翻译成“可执行上下文”。

如果你愿意,下一步我可以:

  • 把这套方法论 压成一张流程图
  • 或帮你写一个 「给 AI 的通用工作指令模板」
  • 或用 真实项目(Web / 后端 / 数据)完整跑一遍

你说一个,我继续。