模型与计费
了解各模型特点与计费方式。
常用模型推荐
| 模型 | 特点 | 推荐用途 |
|---|---|---|
| Claude Sonnet 4.5 | 性价比高,速度快 | 日常编程任务 |
| Claude Opus 4.5 | 智能强,适合深度思考 | 复杂问题、架构设计 |
| GPT-5.2 | 输出细致、稳定 | 代码生成、文档编写 |
| Gemini 3 Pro | 前端能力强 | 前端开发、UI 设计 |
| Gemini 3 Flash | 速度快、价格低 | 简单任务、文件读取 |
分组说明
- Claude Max 号池:由 Claude Max 账号组成,稳定性较高
- Codex 分组:支持 OpenAI 系模型
- Gemini 分组:支持 Google 系模型
- AWS Bedrock 分组:使用 AWS 官方服务,响应较快
什么是缓存
缓存是一种优化机制:
- 首次请求会创建缓存,通常会有额外费用
- 后续相似请求命中缓存时,价格更低
- 5 分钟缓存适合频繁切换,1 小时缓存适合持续处理同一项目
什么是上下文
上下文是模型一次能处理的内容长度:
- 默认上下文通常为
200K-256K tokens - 特价分组的上下文可能更短
1M上下文适合处理超长内容