AI Tools / Harness Wave

Harness 架构爆火之后,AI 工具地图已经换了一套看法

最近的变化不只是模型更强,而是越来越多产品开始围绕 agent harness / runtime 构建:让 agent 真正进入终端、仓库、消息通道、审批流和长任务执行链。OpenClaw、Hermes、QClaw 这一类,已经不能再和普通聊天助手混成一个层级来写。

最近最热变化Harness
要分开的层5 类
真正分水岭能否持续做事
一句话说:模型是脑子,harness 是身体、工具带、任务账本、审批系统和恢复机制。

Layers

先把 5 类东西分开

现在最常见的问题,是把不同层的产品混成一个“AI 工具榜单”。看起来热闹,实际上没法指导判断。

原生通用助手

ChatGPT、Claude、Gemini、Kimi、通义、DeepSeek。重点是默认入口、综合能力和用户心智。

编码 IDE

Cursor、GitHub Copilot、Windsurf。重点是代码编辑、项目理解和开发工作流。

Agent Harness / CLI

Codex CLI、Claude Code、Gemini CLI 等。重点是把 agent 拉进终端和仓库里做事。

Agent Runtime / 平台

OpenClaw、Hermes 这类更进一步,强调会话、工具、记忆、消息、子任务、长期运行与监督机制。

国内跟进与封装产品

像 QClaw 这类,把 runtime/harness 进一步产品化、渠道化、本地化,降低普通用户使用门槛。

聚合入口 / 工作台

价值在多模型切换和工作台组织,不等于背后自己拥有最强原生能力。

Harness Map

最近必须补进来的 Harness / Runtime 代表

这一层看的是:agent 能不能真的工作,而不是只能回答。

OpenClaw

Agent Runtime

不只是一个 CLI,而是把会话、消息通道、工具路由、子任务、记忆、审批、跨设备和长期任务组织成完整运行层。

  • 强项:跨渠道消息、工具系统、会话管理、子 agent、ACP 外部 harness 接入
  • 看点:更像完整 agent 操作系统,而不是单点工具
  • 适合:想把 agent 变成持续运行生产工具的人

Hermes

Agent Runtime

这一波里被高频讨论的新代表,核心卖点是更强化的 agent runtime、持续学习/自优化叙事,以及对 OpenClaw 路线的对照讨论。

  • 强项:社区热度高,工程架构讨论度高
  • 看点:被视为新一轮 harness/runtime 热潮中的代表项目
  • 适合:关注 agent runtime 演进与架构差异的人

Codex CLI

Harness / CLI

代表一类“让 agent 真正在终端里工作”的形态。重点不是聊天,而是命令执行、文件改动、审批和任务推进。

  • 强项:终端任务链、代码修改、命令执行
  • 看点:把 agent 从对话框拉进实际执行环境
  • 适合:开发者、CLI 工作流用户

Claude Code

Harness / CLI

让 Claude 深入仓库、终端和代码任务链,面向“完整做事”的场景,而不仅是对话问答。

  • 强项:仓库理解、代码任务、长流程执行
  • 看点:工程化 agent 形态很典型
  • 适合:中高强度开发与代码重构工作流

Gemini CLI

Harness / CLI

属于同一波 CLI harness 趋势:把模型能力接进开发终端与工具调用,让 agent 能沿工作流前进,而不是停在回答层。

  • 强项:CLI 入口、开发链路、自动化潜力
  • 看点:说明 harness 正在成为独立赛道
  • 适合:已有 Google / Gemini 技术栈的人

QClaw

国内封装 / 跟进产品

更偏“把这类 agent runtime 产品化并接进微信等日常入口”的路线,说明国内市场已经开始快速跟进和渠道化封装。

  • 强项:本地化入口、微信远程办公叙事、降低使用门槛
  • 看点:证明这波不是只在极客圈内火,而是在走向大众化产品包装
  • 适合:想通过更熟悉入口使用 agent 的普通用户

Compare

原创、跟进、仿制,要怎么写才不乱

第一类:原生架构创新者

这类产品重点在于重新定义 agent 的执行层,包括会话、工具、记忆、任务恢复、审批和长期运行。OpenClaw、Hermes 更接近这一层。

Runtime Session Tooling Long-running

第二类:CLI Harness 代表

这类产品强调终端、仓库和代码任务链,让 agent 真正干活。Codex CLI、Claude Code、Gemini CLI 是最典型的观察对象。

CLI Repo Command Approval

第三类:国内快速跟进产品

这类产品往往把已有 harness/runtime 思路做得更易安装、更适合微信/办公渠道、更方便普通用户理解。QClaw 是代表之一,后续这类产品只会更多。

本地化 渠道化 产品封装

写法建议:别一上来就下“原创/抄袭”死结论

更稳妥的写法是区分:架构原创模式跟进产品封装渠道复制。因为这波赛道演进本来就会快速借鉴、互相吸收。

避免情绪化定性 先讲结构差异 再讲定位差异
对外表达上,建议把 QClaw 等写成“国内跟进/封装代表”,而不是上来就只写“仿制品”。这样更稳,也更像在做行业判断,不像发情绪帖。顺着这条线继续看,可配合 Agent Harness 深度解析 一起读。

Takeaway

这一页现在真正要告诉读者什么

以前在比模型,现在在比执行层

未来一段时间,真正拉开差距的不会只是“哪个模型更强”,而是:谁能把模型能力稳定装进工作流,谁能把 agent 变成可持续执行的生产工具。

Harness 正在从极客工具走向产品层

OpenClaw、Hermes 是架构层代表,Codex CLI/Claude Code/Gemini CLI 是 CLI 层代表,QClaw 等则说明这波已经开始向更大众、更本地化的产品层扩散。

继续延伸阅读:可以从这里直接去看 AI VendorsAINEWSOpenClaw 总览,把“工具、厂商、新闻、架构”四条线连起来看。