人类主导的半自动 Vibe-coding 工作流

人类主导的半自动 Vibe-coding 工作流

使用的工具

OpenCode Desktop / OMO / RTK

OpenCode Desktop

OpenCode 官网 | OpenCode 文档 | OpenCode 仓库 | OpenCode Desktop Windows 下载直链

OpenCode 是一个开源的 AI 编码代理,在半自动 Vibe-coding 工作流中充当我的主用工作台,功能优势:

  • 基于项目目录的图形化工作台 / 会话管理,支持 worktree 模式开发。
  • 原生支持多服务器、MCP、LSP以及专用插件。
  • 基于 Git changes 的图形化审查系统。
  • 在同一个项目中并行启动多个代理并行操作。

OMO(oh-my-openagent)

OMO 官网 | OMO 仓库

oh-my-openagent(简称 OMO) 是一个开源的多 Agent 编排框架,自动规划、分解并分配任务。
简单来说就是不太需要什么操作就能增强 LLM Agent 的能力和 Vibe-coding 开发效率。

如何安装?

直接把下面的提示词发送给你的 LLM Agent:

1
2
Install and configure oh-my-opencode by following the instructions here:
https://raw.githubusercontent.com/code-yeongyu/oh-my-openagent/refs/heads/dev/docs/guide/installation.md

你要使用什么 LLM 来编码就要选 Yes,否则 OMO 无法为每个角色分配 LLM 型号 / 推理强度来达到最佳使用效果
比如你要用 Anthropic 的 Opus 4.6 你就要在 Do you have a Claude Pro/Max subscription? 时选择 Yes (standard)Yes (max20 mode)
或者你要用 OpenAI 的 gpt-5.4 你就要在 Do you have an OpenAI/ChatGPT Plus subscription? 时选择 Yes

我没有任何 LLM Agent:

  1. 先打开 powershell 并执行:
1
powershell -c "irm bun.sh/install.ps1 | iex"
  1. 装完后重开终端,先检查一下:
1
bun --version
  1. 然后执行 OMO 的手动安装:
1
bunx oh-my-opencode install
  1. 按需填写配置,如上所说,用什么模型就要选 yes

如何更新?

1
bunx oh-my-opencode doctor

如果有新版本会有类似下面的命令提示,执行即可:

1
cd "$env:UserProfile\.config\opencode"; bun install

RTK(Rust Token Killer)

RTK 是一个用于节省 Token 开销的命令行工具。(平均能降低 60-90%)

RTK 官网 | RTK 仓库

如何安装:

  1. Windows 下载 预编译二进制文件(一般为 “rtk-x86_64-pc-windows-msvc.zip”)
  2. 解压后将该目录添加进系统 PATH 环境变量,在 CMD 中运行 rtk --version,若显示版本号则成功。
  3. 使用该命令为 OpenCode 安装插件 rtk init -g --opencode
  4. 后续更新:按照安装方法重新下载最新的 预编译二进制文件,覆盖之前的可执行文件,自此更新完成。

我现在更倾向于把半自动 Vibe-coding 理解成一种开发状态:
想法出现的时候,能很快开始做;做的过程中,AI 能持续接住上下文;但项目的方向、边界和节奏,还是由人来控制。


工作流

1. 触发任务:用一句自然语言开启 Ultra Work 模式

在第一个指令的最前面添加 “ulw” 来触发 Ultra Work。

示例指令:

1
ulw 在用户设置页增加一个“深色模式切换开关”,状态存 localStorage,并同步更新全局主题。

发送指令后,可以在界面里能看到类似这样的输出:

1
2
3
4
5
6
分解为 4 个子任务:
1. 调研现有主题管理逻辑(Context7 + 代码库搜索)
2. 创建设置页 UI 组件(React + Tailwind)
3. 编写 localStorage 持久化 Hook
4. 更新全局主题切换逻辑并自测
启动并行 Agent:Researcher、Frontend、TestRunner ...

整个过程完全自主,不需要告诉它“先读哪个文件”或者“写单元测试”,它会自己判断。

2. 人类检查点:只在 Git Changes 面板里做决策

OMO 在完成任务的过程中,会不断产生代码变更。工作台右侧的 Git Changes 是我们需要注意的。

  • 每完成一个子任务,OMO 会暂停并把改动文件列表推送到面板。
  • 我们的工作不是逐行 Review(太累了),而是:
    • 扫一眼文件列表,看有没有改到不该动的地方。
    • 快速浏览核心文件,看 AI 写的逻辑是否符合预期。
    • 如果某个改动不对,直接在该文件的 Diff 视图里点 “Revert this hunk”,或者直接在对话里提示:“localStorage 的 key 不要用 theme-mode,用 app-theme”。

工作流全景图(时序版)

1
2
3
4
5
6
7
8
9
10
11
12
[你] 打开 OpenCode Desktop
[你] 输入: ulw 实现某某功能

[OMO] 自动拆解任务,调用 MCP 研究文档 / 搜索代码
[RTK] 拦截所有命令输出,压缩后喂给 LLM
[OMO] 并行启动多个 Agent,开始写代码

[你] 间歇性查看 Git Changes 面板,纠正方向
[OMO] 收到反馈后调整,继续执行

[OMO] 自我纠错、跑测试、生成 Commit Message
[你] 最终确认,一键提交

总结

为什么说这是半自动工作流而不是全自动 Vibe-coding?
这套体系下还是以人为主导的智能编码流程,能够实现小的目标,如果要一次性完成项目级应用,这套工作流还不能很省心(会遇到卡切片、偏离开发路线),这套工作流没有长期约束和任务自驱。

AI 主导的全自动持续开发工作流可以看这篇文章:待补