模型与计费

了解各模型特点与计费方式。

常用模型推荐

模型	特点	推荐用途
Claude Sonnet 4.5	性价比高，速度快	日常编程任务
Claude Opus 4.5	智能强，适合深度思考	复杂问题、架构设计
GPT-5.2	输出细致、稳定	代码生成、文档编写
Gemini 3 Pro	前端能力强	前端开发、UI 设计
Gemini 3 Flash	速度快、价格低	简单任务、文件读取

分组说明

Claude Max 号池：由 Claude Max 账号组成，稳定性较高
Codex 分组：支持 OpenAI 系模型
Gemini 分组：支持 Google 系模型
AWS Bedrock 分组：使用 AWS 官方服务，响应较快

什么是缓存

缓存是一种优化机制：

首次请求会创建缓存，通常会有额外费用
后续相似请求命中缓存时，价格更低
5 分钟缓存适合频繁切换，1 小时缓存适合持续处理同一项目

什么是上下文

上下文是模型一次能处理的内容长度：

默认上下文通常为 200K-256K tokens
特价分组的上下文可能更短
1M 上下文适合处理超长内容