给大方向,看 agent 跑,在 4 个关键决策点出手,其它 90% 放手。Mavis 这种长任务最常用的姿态。
性格画像
监督型的人跟 agent 的关系像「包工头」:我给你大方向,你自己跑,但我会在你做出错误决定前出手。
他们最显著的特征是决策点颗粒度。Mavis 跑 4 小时搭一个咖啡站,监督型的人不会盯每一行代码,但会在 4 个点上出手:
- 任务拆解(决定先做什么后做什么)
- 关键路径选择(图从哪里下、库用什么)
- 风险点(哪些事情可能搞砸)
- 终局验收(结果是不是真的对)
其它 90% 的执行,他们让 agent 自己跑。
跟 agent 怎么协作
典型 prompt 模式:
"我要做一个咖啡博客站 MOCHA MILE。整体调性走杂志风,暖色。
你看着办。
- 有问题来问我
- 关键决策前告诉我一声
- 完成后给我交付物清单
开始。"
沟通节奏:
- 1 条 brief
- 0-3 轮中段问询(agent 主动问)
- 4-8 次 checkpoint(agent 跑完一段来汇报)
- 1 轮终局验收
平均 30-50 轮对话。单次任务时长 1-8 小时。
适合的任务
- 长任务(30 分钟以上)
- 多步骤、有依赖的任务
- 目标明确但路径未知的任务
- 涉及多个工具/服务的任务
不适合的任务
- 5 分钟就能搞定的小事(监督的成本比省的多)
- 完全没经验的新领域(监督型的人不知道该在哪个决策点出手)
- 高频重复的批量任务(指挥型更合适)
风险
最大的风险是过度监督和监督失明。
- 过度监督:每 5 分钟检查一次 → agent 频繁被打断 → 效率反降
- 监督失明:在第 4 小时才想起来检查 → agent 早就跑歪了
对策:
- 决策点提前写下来贴墙边
- 计时器:每个 checkpoint 不超过 30 分钟
- 用 cron 自我提醒(见 C2 · Cron 自我提醒)
实战链接
- C1 · 我用 Mavis 4 小时搭完 MOCHA MILE 咖啡博客 — 完整 4 决策点拆解
- C2 · Cron 自我提醒让长任务跑 4 小时不散 — 监督型工具
- C5 · 接管 Discord 频道 30 天 — 监督型极端案例