学习计划
围绕 PPT 中的素材,我把学习顺序拆成三个阶段:先补齐认知与阅读,再熟悉模型与评测方法,最后搭建工具链与自动化体系。下面的列表按这个节奏组织,你可以按章节逐步推进。
1. 注意事项
- Anthropic 是怎么使用 Claude Code:讲清楚“写代码 ≠ 交付好软件”的现实,也提醒收益很高、门槛很低,应保持开放心态。
2. 理论与案例阅读
2.1 必读 / 入门(建议一口气读完)
- 结构化提示词:从提示词工程切入的入门教程。
- AI 代理的上下文工程:Manus 的一线经验。
- Manus AI Agent PPT:配套幻灯,可结合文章食用。
- Context Rot:More Input, More Stupid,解释长上下文的退化现象。
- 评估 LLM 的上下文能力:指出“1M 上下文”更多是宣传。
2.2 Anthropic 官方文章(作为一组工作手册)
- How we built our multi-agent research system
- Effective context engineering for AI agents
- Building agents with the Claude Agent SDK
- Writing effective tools for agents — with agents
- Building effective agents
2.3 进阶延伸(补完认知边界)
- Cognition|Don’t Build Multi-Agents
- Letta|Anatomy of a Context Window
- Letta|Agent Memory
- Letta|RAG is not Agent Memory
- LangChain|The rise of “context engineering”
- LangChain|Context Engineering for Agents
- Github|12 Factor Agents
3. 模型与评测
3.1 基本性能指标
- Token 计算器:估算一段代码需要的上下文预算。
- SWE-Bench:衡量“智力水平”的公共基准,目标是 70%+(配合推理策略)。
- Claude API 成本页:结合 Prompt Cache、Reasoning、ToolUse 规划预算。
3.2 国际主流模型
- gpt-5.2-codex:适合修复 BUG,精准但稍慢。
- Gemini 3.0 Pro:对话体验最佳,适合作为常驻副驾。
- Gemini 3.0 Flash:强调推理速度,可做快速遍历。
- Opus:当前最强的 coding 模型,可以作为主力 agent。
- Sonnet 4.5:“全能模型”,进一步搭配 Haiku 形成梯队。
3.3 中国模型
- Qwen3 Max:定位“中国特色 Gemini”。
- Qwen3 Coder Plus:备用 coder,当占坑模型使用。
- GLM 4.6:能力不错,但近期表现趋弱,关注版本更新。
- Minimax-M2:推理速度与成本折中,可跑本土合规方案。
- Kimi K2:主打长上下文场景,可配合知识库。
4. 工具链与平台
4.1 Web / Remote Agent
- v0.dev、lovable、Google AI Studio、bolt.new:免环境、可在线预览,适合快速验证 DEMO。
4.2 VSCode-Fork 工具(商业 + 开源)
- 商业产品:
- 开源项目:
- Void(已停止维护)。
- Cline、Roo Code、Kilo Code、continue.dev:可自行托管,便于深度定制。
4.3 CLI 工具
- Claude Code:特性最丰富、适用场景最广。
- Codex CLI:功能简洁,主要靠模型力。
- OpenCode:插件设计成熟,适合复杂工作区。
- iflow:国产 Claude Code。
- gemini cli:简单但更新迅速,可抢鲜体验。
4.4 个人常用 AI 工具
- Cherry Studio:跨平台桌面副驾。
- Gemini Pro 会员:追求高可用的聊天体验。
- AIHubMix:托管多模型/多代理,做统一入口。
- notebooklm:知识库管理。
- Dify:快速把简单功能上线。
- zread / deepwiki:分析开源仓库、提炼资料。
5. MCP 生态与插件
5.1 快速找 MCP
- 官方收录列表:第一站,确认官方兼容。
- Awesome MCP:社区维护的精选合集。
- smithery.ai、mcp.so、魔塔 MCP 广场:快速检索第三方服务。
5.2 常用 MCP(安装优先级)
- chrome-devtools-mcp:读取控制台 / 网络日志。
- Figma MCP:图形交互。
- K8S MCP:集群运维,记得 readonly 模式。
- github MCP:操作仓库(如可替换成
ghCLI)。 - context7 / ref.tools:上下文与文档管理,后者更精准。