M 个人工作台
返回首页

Harness Agent Lab

Agent 专题工作区

这页只记录这个专题怎么推进:现在学到哪、这一阶段在做什么、下一步往哪走。知识条目本身不在这里铺开,统一放到独立知识库和专题资料页里。

Progress

当前开发学习进度

这不是一次性写完的框架,而是一轮一轮把 Agent 外层能力搭出来。每一步都对应一组代码、一段实验动作和一条可复盘的阶段记录。

01

入口与 CLI

从 Node CLI 的 bin 机制开始,切到 Commander,明确命令如何进入 Runtime。

02

配置与装配

把默认配置、用户配置、命令行覆盖和工厂注入收进 config / runtime。

03

Runtime 生命周期

补齐 start / stop / dispose、启动失败回滚和 hook 生命周期。

04

V2 Planning

把用户目标拆成 TaskPlan / TaskItem,让任务从聊天变成结构化计划。

05

V3 Orchestration

加入 TaskSnapshot、TaskStore、TaskOrchestrator,让计划可以被推进和恢复。

06

Replanner 第一版

blocked 后生成新 revision,插入解除阻塞任务,保留已完成成果。

07

TeamCoordinator 主链

把角色执行、review、batch、followUp 和 escalation 收进统一协调链路。

08

Zod 运行时校验

把配置、任务快照、协作协议和模型输出这些外部输入纳入 schema 校验。

09

Vitest 测试体系

补齐 setupFiles、matcher、fixture、coverage、CI 报告和质量门禁。

10

LoggerPort 可观察性

接入结构化日志、trace、脱敏、文件日志、轮转和执行日志存储。

11

Hono Gateway 入口层

把 HTTP 入口收成 GatewayPort 和 RuntimeGatewayPort,明确 Web 只做入口适配。

12

MCP SDK 接入预研

完成 transport、connection、tool adapter 第一版验证,但暂不把 MCP 变成主体功能主线。

Architecture Evolution

AgentLoop 外层是怎么长出来的

当前共识是:AgentLoop 只是单轮执行内核。计划、调度、快照、重新规划、多 Agent、长期在线,都应该长在外层。

  1. V0

    AgentLoop 内核

    负责构建上下文、模型决策、工具循环、写回 session 和学习记录。

    状态:已完成
  2. V1

    Runtime 装配层

    把模型、工具、记忆、插件、MCP、Gateway、Hook 统一装成 RuntimeBundle。

    状态:已完成
  3. V2

    Planning 计划层

    把用户目标拆成 TaskPlan,并提供 normalize / validate,保证任务结构稳定。

    状态:已完成
  4. V3

    Orchestration + Snapshot

    让任务能 startNext、complete、block、fail、retry、resume、archive、restore、replan。

    状态:已完成
  5. V4

    多 Agent 协作

    把 suggestedOwner 升级成真实 worker / explorer / verifier / coordinator 分工,并让角色拥有独立 SessionState。

    状态:第一版完成
  6. V5

    TeamCoordinator 协调层

    把 review plan、runnable batch、followUp 和 escalation 统一收口到团队协调主链。

    状态:主链完成,继续强化可观察性和协作协议
  7. V6

    显式协作协议

    让角色之间通过 assignment、review、followUp、escalation 等结构化消息协作。

    状态:已进入设计与第一版实现
  8. V7

    持续在线平台

    接入 heartbeat、standing orders、detached task ledger 和跨入口 session routing。

    状态:后续平台化

Code Reading Path

接下来按这条代码链路学习

知识点不要孤立背。每次学习都拿一条真实命令,从 CLI 一路追到 Runtime、Orchestrator、AgentLoop 和 TaskStore。

推荐主线命令 harness-agent execute-plan "完成一个小任务"
  1. src/entry/cli.ts

    看 Commander 如何分发到 runExecutePlan / runResume / runReplan。

  2. src/runtime/runtime-bundle.ts

    看 Runtime 如何装配 planner、taskStore、taskOrchestrator、agentLoop。

  3. src/planning/planning-types.ts

    看 TaskPlan / TaskItem 如何描述静态计划。

  4. src/task-state/task-snapshot.ts

    看 TaskSnapshot / PlanSnapshot 如何记录执行进度。

  5. src/orchestration/task-orchestrator.ts

    看 startNext / completeTask / blockTask / failTask 如何推进状态机。

  6. src/orchestration/task-execution-evaluator.ts

    看自然语言回复如何转成 completed / blocked / failed。

  7. src/planning/default-replanner.ts

    看 blocked 后如何生成新 revision 并插入解除阻塞任务。

  8. src/team/default-team-coordinator.ts

    看 assignment、review、followUp、batch 和 escalation 如何统一收口。

  9. src/team/default-task-executors.ts

    看 worker / explorer / verifier 如何映射到独立角色执行器。

  10. src/team/default-task-review-policy.ts

    看 review plan 如何决定审查角色、顺序与并行策略。

Stage Logs

从开始到现在的学习记录

这里现在只放阶段入口,点进去看完整学习记录;知识点拆解继续放在知识库。