原生通用助手
ChatGPT、Claude、Gemini、Kimi、通义、DeepSeek。重点是默认入口、综合能力和用户心智。

最近的变化不只是模型更强,而是越来越多产品开始围绕 agent harness / runtime 构建:让 agent 真正进入终端、仓库、消息通道、审批流和长任务执行链。OpenClaw、Hermes、QClaw 这一类,已经不能再和普通聊天助手混成一个层级来写。
Layers
现在最常见的问题,是把不同层的产品混成一个“AI 工具榜单”。看起来热闹,实际上没法指导判断。
ChatGPT、Claude、Gemini、Kimi、通义、DeepSeek。重点是默认入口、综合能力和用户心智。
Cursor、GitHub Copilot、Windsurf。重点是代码编辑、项目理解和开发工作流。
Codex CLI、Claude Code、Gemini CLI 等。重点是把 agent 拉进终端和仓库里做事。
OpenClaw、Hermes 这类更进一步,强调会话、工具、记忆、消息、子任务、长期运行与监督机制。
像 QClaw 这类,把 runtime/harness 进一步产品化、渠道化、本地化,降低普通用户使用门槛。
价值在多模型切换和工作台组织,不等于背后自己拥有最强原生能力。
Harness Map
这一层看的是:agent 能不能真的工作,而不是只能回答。
不只是一个 CLI,而是把会话、消息通道、工具路由、子任务、记忆、审批、跨设备和长期任务组织成完整运行层。
这一波里被高频讨论的新代表,核心卖点是更强化的 agent runtime、持续学习/自优化叙事,以及对 OpenClaw 路线的对照讨论。
代表一类“让 agent 真正在终端里工作”的形态。重点不是聊天,而是命令执行、文件改动、审批和任务推进。
让 Claude 深入仓库、终端和代码任务链,面向“完整做事”的场景,而不仅是对话问答。
属于同一波 CLI harness 趋势:把模型能力接进开发终端与工具调用,让 agent 能沿工作流前进,而不是停在回答层。
更偏“把这类 agent runtime 产品化并接进微信等日常入口”的路线,说明国内市场已经开始快速跟进和渠道化封装。
Compare
这类产品重点在于重新定义 agent 的执行层,包括会话、工具、记忆、任务恢复、审批和长期运行。OpenClaw、Hermes 更接近这一层。
这类产品强调终端、仓库和代码任务链,让 agent 真正干活。Codex CLI、Claude Code、Gemini CLI 是最典型的观察对象。
这类产品往往把已有 harness/runtime 思路做得更易安装、更适合微信/办公渠道、更方便普通用户理解。QClaw 是代表之一,后续这类产品只会更多。
更稳妥的写法是区分:架构原创、模式跟进、产品封装、渠道复制。因为这波赛道演进本来就会快速借鉴、互相吸收。
Takeaway
未来一段时间,真正拉开差距的不会只是“哪个模型更强”,而是:谁能把模型能力稳定装进工作流,谁能把 agent 变成可持续执行的生产工具。
OpenClaw、Hermes 是架构层代表,Codex CLI/Claude Code/Gemini CLI 是 CLI 层代表,QClaw 等则说明这波已经开始向更大众、更本地化的产品层扩散。