CLI Agents 比较指南¶
📌 这份是 reference doc(深度比较、选择逻辑、坑、推荐搭配)。 第一次接触 CLI agent、想要 step-by-step 上手 → 看
tracks/cli/A1-cli-intro.zh-Hans.md(Track A 第一站)。 想先理解“为什么有的 agent 在 terminal、有的在 Telegram、有的在 Jetson”这层 mental model → 看resources/agent-paradigms.zh-Hans.md(5 种 agent 型态)。 已经在用、想决定 / 比较 / 升级 → 留在这份。
跨 5 个 branch + Track A 共用的参考——Claude Code / Codex / OpenCode / Gemini CLI / goose / Aider / Hermes Agent 之间怎么挑? Track A(A1-A3)的 CLI workflow 设计、5 条 branch 内的 CLI 引用都连到这份;每个 branch 都会用到 CLI agent,但没有一个 branch 真的“拥有”这份比较,所以放在 resources/。
📋 7 个主流 CLI agent¶
只列在 terminal 跑的(IDE-based 如 Cursor / Cline / Continue 不在这份;那些放在 for-developer)。前 6 个数字 gh api 验证于 2026-05-06;Hermes Agent 验证于 2026-05-10。
| 工具 | 提供者 | License | 主推 LLM | 认证 / 计费 | Stars |
|---|---|---|---|---|---|
| Claude Code | Anthropic(官方) | NOASSERTION | Claude | Claude 订阅 或 Anthropic Console API key | ★ 120k+ |
| Codex | OpenAI(官方) | Apache-2.0 | GPT 系列 | ChatGPT 账号登录 或 OpenAI API key | ★ 80k+ |
| OpenCode | 社群(repo 已迁至 anomalyco/opencode) |
MIT | 任意(多 provider) | BYO API key 或 OpenCode Zen 内建 hosted | ★ 155k+ |
| Gemini CLI | Google(官方) | Apache-2.0 | Gemini | 免费额度宽,超出收费 | ★ 103k+ |
| goose | Agentic AI Foundation(repo 已迁至 aaif-goose/goose) |
Apache-2.0 | 15+ provider(含 Ollama) | BYO API key 或既有 Claude / ChatGPT / Gemini 订阅(ACP) | ★ 43k+ |
| Aider | Aider-AI(社群) | Apache-2.0 | BYO API key | ★ 44k+ | |
| Hermes Agent | Nous Research | MIT | 200+ via OpenRouter / NVIDIA NIM / 智谱 GLM / Kimi / 小米 MiMo / MiniMax / HF / OpenAI | BYO API key(多 provider) | ★ 156k+ |
🎯 该选哪个?依 use case 决定¶
写 paper / 文献 / 研究¶
首推:Claude Code(长 context、reasoning 强、挡幻觉扎实)。Gemini CLI 是备选——它的百万 token 适合丢整本 PDF / dataset 进去问。
写 code / 改 codebase¶
首推:Aider(git-native——每次改完自动 commit,方便 revert)或 Claude Code。OpenCode 适合需要在多 LLM 间切的场景。
隐私 / offline / 不送云端¶
首推:goose 或 OpenCode + 本地 Ollama。两个都支持 BYO LLM,可以接 http://localhost:11434/v1(Ollama 默认)。
已订 ChatGPT Plus / Pro¶
首推:Codex——同一个账号就能用,不另外付费。
用 Google 生态 + 想要 1M token 长 context¶
首推:Gemini CLI。免费额度宽、长 context 是强项。注意:Google 服务(Gmail / Drive / Docs)的集成靠 MCP 扩展,不是内建——跟其他 CLI 一样需要安装 MCP server。
不想被 vendor lock-in¶
首推:OpenCode > goose > Aider。三个都不绑特定 provider,模型可换。
第一次装 CLI agent,先试手感¶
首推:Claude Code。生态广泛、CLAUDE.md 机制让 prompt 可以版本控制、出问题时社群资源多。
想跑在 cloud VM、用 Telegram / Slack 等多平台跟它聊 + 用中国大陆 LLM¶
首推:Hermes Agent。差异化在三件事: - 不绑 laptop——agent 跑在 $5 VPS / Modal serverless,你从 Telegram / Discord / Slack / WhatsApp / Signal 任一个介面对话 - 多 LLM 中性——支持 GLM / Kimi / 小米 MiMo / MiniMax,刚好对应 11 中文圈生态 - 内建 self-improving skill loop + cron 排程——agent 跟你互动久了会自动生成 skill,跨 session 持续优化 - ⚠️ skill 自动演化是 frontier feature,目前缺独立审计;对 production 任务建议先在低风险场景试
📝 跨 CLI 都通用的 prompt 写法¶
如果想让 prompt 在不同 CLI 之间 portable(或想随时换工具不重写),照这几条原则:
- 明确指定文件路径——“修改
src/auth.py”比“修改那个 auth 档”好 - 要求多步骤拆解——
先列 plan、确认后再动手,所有 CLI 都吃这个结构 - 避免依赖特定 CLI 的 magic 指令——
/init/compact是 Claude Code 专属,OpenCode 没有 - 用
.cursorrules/CLAUDE.md/AGENTS.md记持续性偏好——Claude Code 用CLAUDE.md,Codex 用AGENTS.md,OpenCode 用OPENCODE.md,内容可以一样 - 明确要 review 的 scope——“只 review 我这次的 diff”vs “review 整个 repo”
跨 CLI 写的 prompt 通常会比 CLI-specific prompt 麻烦 5-10%,但好处是切换工具时不用重写。
⚠️ 常见坑¶
File path 处理¶
- Windows 路径用反斜线(
C:\Users\...),多数 CLI 内部会转,但有时会搞混 - 建议:在 git-bash / WSL 下用 forward slash,避免奇怪 quoting
git 集成差异¶
- Aider 自动 commit 每次改动(这是它的设计,不是 bug)
- Claude Code / Codex / OpenCode / goose 默认不自动 commit,需要手动或 prompt 要求
Sandbox 默认值(每个 CLI 文件略有差异,使用前请对照官方文件)¶
- Claude Code:bash 写入默认限定 cwd,读取范围较广(被 deny rule 排除的除外)
- Codex:版本控制目录建议
Auto(workspace-write + on-request 提权);非 git 目录建议read-only - goose / OpenCode:相对宽松——建议自己加 sandbox / approval 设置,不要靠默认
Token cost 累积¶
- 在大 codebase 上跑
grep一次可能消耗 10 万+ token - 在大 PDF 上摘要可能 50 万 token(Gemini 适合,其他要 cost-aware)
- 建议:每次操作前估 cost;订 monthly cap
多 CLI session 互相干扰¶
- 同一个 repo 开两个 CLI(譬如 Claude Code + Aider),改档可能 race condition
- 建议:一个 repo 一个 CLI(除非真的有并行需求)
🔧 实用搭配(real-world setup)¶
下面 3 个常见搭配,挑一个合的场景:
Setup A:Claude Code 主推 + OpenCode 备援¶
- Claude Code 处理日常 90%(写 code、写 doc、debug)
- OpenCode 接 Ollama,处理隐私数据(医疗记录、财务分析)
- 一个 prompt 写一次,两边都能跑
Setup B:Codex(GPT)+ Aider(Claude)混用¶
- Codex 处理 ChatGPT Plus 额度内的小事
- Aider 接 Claude API key 处理大重构(git-native commit 方便)
- 两个账单分开算、互不影响
Setup C:Gemini CLI 主推(给长 context 场景)¶
- 整本 PDF / 整个 codebase 一次喂进去
- 加 Aider 处理需要精确 git diff 的场景
- 适合学者、知识工作者
Setup D:Hermes Agent + 本地 Ollama(多平台 + 中国大陆 LLM + offline)¶
- Hermes Agent 跑在 $5 VPS 或自己的机器上,当作多平台 agent gateway
- LLM endpoint 用 Ollama(
http://localhost:11434/v1),也可以改接 z.ai GLM / Kimi 等 provider - 聊天入口 用 Telegram / Slack / Discord;Hermes 负责把平台消息转进 agent workflow
- 完全不想接 Anthropic / OpenAI 时,这条路线适合做离线、隐私资料、低成本重复实验
- Step-by-step 做法看
resources/cookbook.mdRecipe 6
从这份指南连回各 branch¶
不同 audience 对 CLI 的需求不一样:
- for-developer:除了 CLI,也看 IDE-based agents(Cursor、Cline、Continue)
- for-everyday-users Tier 2:CLI 是进阶选项,先试 Tier 0 / 1 的 Web / Desktop App
- for-researcher:除了 CLI,也看 paper-specific 工具(paper-qa、gpt-researcher、ChatPaper)
- for-knowledge-worker:除了 CLI,也看 workflow 自动化(n8n、Make)
- for-teacher:CLI 对教师偏进阶;建议先看 prompt 素材库
维护备注¶
- 7 个 CLI 的 stars / license / pushed_at 每季用
bash scripts/refresh-stars.py更新一次 - CLI 工具市场变化快——新工具出现要评估是否加入这份比较(门槛:> 30k stars + 维护中 + 真的 CLI 不是 IDE)
- 比较表格的“强项 / 弱项”栏位刻意没填——避免产生主观 bias,让 use case section 跟读者自己的判断做这件事