`examples/` — 动手练习可跑范例¶

← 回主路线 README

学习地图每个 stage 都有“动手练习”section、讲“该做什么”。这个资料夹补上真的可以跑的范例 code——复制 → 装依赖 → python starter.py 看到预期输出。

目录结构¶

examples/
├── stage-3/                     # Tool Use & Agent 入门
│   ├── 03-react-from-scratch/   # 练习 3：从零实现 ReAct
│   │   ├── starter.py           # 主程式（~70 行可跑）
│   │   ├── test.py              # 自我验证（pure assert、无 pytest）
│   │   ├── README.md            # 200-400 字走查（+.zh-Hans.md +.en.md）
│   │   └── requirements.txt     # 依赖钉版本
│   └── ...
├── stage-1/
└── ...

短的练习（≤30 LOC）直接以 <details> 收摺塞在 stage 档内、不开资料夹。长的（>30 LOC）才开资料夹——避免 stage 档被 code block 撑爆。

怎么跑任一个范例¶

cd examples/stage-3/03-react-from-scratch
pip install -r requirements.txt
export ANTHROPIC_API_KEY=sk-ant-...   # 各范例顶端会说它要哪个 key
python starter.py                     # 跑真的 API 看输出（会花一点点钱、约 $0.001）
python test.py                        # 跑验证（用 mock、不花钱）

设计原则¶

维度	规则
程序长度	starter ≤80 LOC、超过拆档
依赖	stdlib + 最多 2 个 pip 套件、钉版本
测试	纯 `assert`、不用 pytest、reader 跑 `python test.py` 看 ✅
注解	中文（zh-Hans 为主）、变数 / 函数名英文
自我验证	每个 starter.py 结尾必有 `# === 自我验证 ===` 区块
环境变数	顶端注解写清楚需要哪些 key
Free-tier 友善	用最便宜 model（claude-haiku / Ollama）、注解写怎么换 Sonnet
Windows 编码	每个 .py 顶端必须有 UTF-8 reconfigure（见下）

Windows cp950 编码 fix（每个 starter.py / test.py 必加）¶

Windows 预设 console 是 cp950（Big5）、印不出 emoji 跟非 Big5 中文。每个 .py 档顶端 import 区后立刻加：

import sys
if hasattr(sys.stdout, "reconfigure"):
    sys.stdout.reconfigure(encoding="utf-8", errors="replace")

否则 Windows reader 在 PowerShell / cmd 跑会炸 UnicodeEncodeError: 'cp950' codec can't encode character '✅'。

三条路径 — 默认用 Ollama（成本考量）¶

💰 为什么默认 Ollama？ 练习场景跑 1000 次跑满 Sonnet ~$4、跑 haiku ~$0.25、跑本机 Ollama $0。学习阶段不该被 API 成本卡住。Cloud LLM 留给“想看高质量答案 / production deployment”时用。

每个练习都同时提供 3 条路径：

Path A（默认、推荐）— Ollama 本机¶

预设 starter.py / 第一个 inline <details> 用本机 LLM
需 Ollama、按 stage pull 对应 model：
Stage 1 + 2（纯 chat / prompt eng）：ollama pull gemma4:e4b（~7.5 GB、多模態、CPU 跑得動）
Stage 3+（tool use / agent）：ollama pull qwen2.5:3b（1.9 GB、tool-use 支持稳定）
全程 $0、offline、隐私敏感资料 OK
SDK 用 openai package（OpenAI 兼容 API）、base_url="http://localhost:11434/v1"
适合：所有读者（默认推这条）

Path B（选择性）— Anthropic API（想看 cloud 高质量时）¶

对照 starter_anthropic.py（folder）或第二个 inline <details> 区块
需 ANTHROPIC_API_KEY、跑一轮约 $0.001（haiku）/ $0.004（sonnet）
答案质量 / latency 都比本机 Ollama 强
适合：production 要求高质量、需要 long-context、Stage 7 production tier

Path C（验逻辑、不打 API）¶

所有 test.py 都用 unittest.mock、python test.py 看程序逻辑有没有写对
跟 Path A / B 互补：先 mock 验逻辑、再 real call 确认

三条路的 Trade-off¶

维度	A Ollama（默认）	B Anthropic	C Mock
Cost / call	$0	~$0.001-0.004	$0
需要	Ollama install	API key	无
答案质量	中（3-4B model）	高	预设、看不出真实质量
速度	5-30s/call（无 GPU）	~1-3s/call	<0.1s
Offline	✅	❌	✅
隐私敏感资料	✅	❌	✅
Stage 3+ tool use	✅（qwen2.5 / llama3.2）	✅	✅
适合	默认、无预算压力	production 升级	程序逻辑验证

→ 建议流程：先 C 验逻辑（不花钱）、再 A 本机跑看实际 model 行为、production 阶段（Stage 7）再升 B 看 cloud 质量。

推荐 LLM 清单¶

本机 + cloud、user 视角。
💡 不是要你全装、是让你看到“练习用哪个”“production 升级到哪个”。Claude 是 canonical / production 主轴；Ollama 是练习默认。

本机 LLM（练习默认、用 Ollama）¶

Model	下载大小	建议 RAM	对应 Stage	Tool-use	速度（CPU/GPU）	主用途
`gemma4:e4b` ⭐	7.5 GB	8 GB	1+2	基本	慢 / 中	Stage 1-2 纯 chat / prompt eng（默认）
`qwen2.5:3b` ⭐	1.9 GB	4 GB	3+	稳定	中 / 快	Stage 3+ tool use / agent（默认）
`llama3.2:3b`	2.0 GB	4 GB	3+	稳定	中 / 快	qwen2.5:3b 的替代
`mistral-nemo:12b`	7.1 GB	16 GB	3+	强	慢 / 中	想看更接近 cloud 质量
`qwen2.5:14b`	9.0 GB	16 GB	进阶	强	慢 / 中	大 model 对照（需 GPU 偏好）
`gemma4:e2b`	4.0 GB	4 GB	1+2	基本	中 / 快	4GB RAM 机器替代

安装：ollama pull <model> + ollama serve。详细硬件配置看 resources/cli-agents-guide.zh-Hans.md。

Cloud LLM（canonical / production 主轴、用 Anthropic）¶

Model	每 1M input	每 1M output	Context	主用途
`claude-fable-5`	$10	$50	—	Mythos 级；2026-06-09 GA。⚠️ 2026-06-12 起暂停访问（美国出口管制指令）；目前无法使用、请改用 Opus 4.8
`claude-haiku-4-5` ⭐	$1	$5	200k	最便宜、Stage 1-7 练习 cloud 对照都 OK
`claude-sonnet-5` ⭐	$3	$15	1M	production 默认、Stage 5+ agent 开发
`claude-opus-4-8`	$5	$25	1M	Opus 级旗舰、复杂推理 / 长 context refactor、目前可用的最高层级

订阅替代：Claude Pro $20/月含 Sonnet 用量、Claude Max $100/月含 Opus。详细看 resources/cli-agents-guide.zh-Hans.md。

Cloud LLM 中国 / 开源 alternatives（地区限制 / 预算敏感 / 中文场景）¶

不能 / 不想用 Anthropic？这些 API 都 OpenAI-compatible、改 base_url 跟 model name 就能跑本 repo 同一份练习。

Provider	主 model	每 1M input	每 1M output	OpenAI-compat?	主卖点
DeepSeek ⭐	`deepseek-chat` (V3)	$0.27	$1.10	✅	最便宜 cloud（比 haiku $1/$5 还便宜 4 倍）、中英文俱佳、含免费 web `chat.deepseek.com`
DeepSeek R1	`deepseek-reasoner`	$0.55	$2.19	✅	推理模型（o1 级）、价格仍只是 OpenAI o1 的 1/30
Moonshot Kimi	`kimi-k2-turbo-preview`	$5-10	$15-30	✅	1M token context（卖点）、适合大文件 / 长对话。web 版 `kimi.com` 免费
通义千问 Qwen	`qwen-max` / `qwen-turbo`	$0.50-1.50	$1.50-6	✅（DashScope）	中文 native、同 model 也能 Ollama 本机跑（cloud + local 两条路径都通）
智谱 GLM	`glm-4.5` / `glm-4-plus`	$0.30-2	$1.50-9	✅	中国 native、有 free tier。web `chatglm.cn` 免费
NVIDIA NIM	Llama / Mistral / DeepSeek / Qwen 等 hosted	free tier 1000 credits	(同)	✅	托管 10+ open model、新账号送 credits、不必本机 GPU。`build.nvidia.com`

API endpoints（OpenAI SDK 接法）：

# DeepSeek
client = OpenAI(api_key=os.environ["DEEPSEEK_API_KEY"], base_url="https://api.deepseek.com/v1")
r = client.chat.completions.create(model="deepseek-chat", messages=[...])

# Moonshot Kimi（中国 endpoint；海外用 .ai 结尾）
client = OpenAI(api_key=os.environ["MOONSHOT_API_KEY"], base_url="https://api.moonshot.cn/v1")
r = client.chat.completions.create(model="kimi-k2-turbo-preview", messages=[...])

# 通义千问 Qwen（Alibaba DashScope）
client = OpenAI(api_key=os.environ["DASHSCOPE_API_KEY"],
                base_url="https://dashscope.aliyuncs.com/compatible-mode/v1")
r = client.chat.completions.create(model="qwen-turbo", messages=[...])

# 智谱 GLM
client = OpenAI(api_key=os.environ["ZHIPUAI_API_KEY"], base_url="https://open.bigmodel.cn/api/paas/v4")
r = client.chat.completions.create(model="glm-4.5-flash", messages=[...])

# NVIDIA NIM（hosted open-source）
client = OpenAI(api_key=os.environ["NVIDIA_API_KEY"], base_url="https://integrate.api.nvidia.com/v1")
r = client.chat.completions.create(model="meta/llama-3.3-70b-instruct", messages=[...])

怎么挑：

情境	选	理由
中国大陆、无 cloud 访问	Ollama 本机 / DeepSeek API	本机免费；DeepSeek 在中国有 endpoint
预算极敏感（< $1/月）	DeepSeek API	比 haiku 便宜 4 倍、质量接近
大文件 / 长文档 RAG	Moonshot Kimi	1M token context 卖点
中文 native task（古文、中文搜索）	Qwen / GLM	训练语料中文占比高
想试 10+ open model 没 GPU	NVIDIA NIM	一个 key 玩 Llama / Mixtral / Qwen / DeepSeek
Production agent（agent / tool use）	Anthropic Claude（canonical）	本 repo Path B 默认、tool calling 最稳

预算估算（跑完 Stage 1-7 全 54 练习）¶

学习路径	总时间	总成本	适合谁
全本机 Ollama	~30 hr (CPU) / ~10 hr (GPU)	$0	预算敏感、隐私需求、中国大陆无 cloud 访问
混合：本机练 + haiku 终验 ⭐	~30 hr	$2-5	推荐默认：练习 local 跑、最后 1-2 次用 haiku 看 cloud 质量
全 haiku	~10 hr	$5-15	想快、预算允许、想看完整 cloud 体验
全 sonnet	~8 hr	$20-50	深度练习、追求高质量答案
混合：sonnet 为主 + opus 难题	~8 hr	$30-80	已是 production agent 开发者

🎯 新手默认：先全本机跑、预算上限 $5。Stage 7 production tier 才考虑 sonnet 升级。

对应 stage 索引¶

Stage	练习	范例位置
1 LLM 基础	6 个	inline 4 + folder 2（`examples/stage-1/`）
2 Prompt eng	4 个	全 inline
3 Tool use	6 个	inline 1 + folder 5（`examples/stage-3/`）
4 Frameworks	5 个	全 folder（`examples/stage-4/`）
5 Claude Code 生态	11 个	inline 6 + folder 5（`examples/stage-5/`）
6 Memory/RAG	5 个	全 folder（`examples/stage-6/`）
7 Multi-agent	5 个	inline 1 + folder 4（`examples/stage-7/`）
Track A1-A3	12 个	全 inline、外加 2 个小 folder（CLI-9 / CLI-10）

→ T1 完成范围：只有 Stage 3 全部 6 个（剩余 stage 按 plan 分批推进）。

贡献 / 报错¶

跑不过、结果跟预期输出对不上、或想补一个新练习： - 开 issue 标 examples label - 或直接 PR、follow 本资料夹“设计原则”表格的规则

为什么这样分（不直接全塞 stage 档）¶

Stage 档保持 readable：学习地图读者不一定要看 code、只想理解 concept；长 code block 干扰阅读流
范例可独立演进：API SDK 升版、model name 改、范例需要单独 commit、不污染学习地图 git log
Reader 可以 clone 单一 example：svn export 或 git clone --filter=tree:0 只抓一个资料夹
未来 CI：example 失败不应 block mdbook deploy；分开可让 CI 有条件性检查

examples/ — 动手练习可跑范例¶