Skip to content

模型与计费

了解各模型特点与计费方式。

常用模型推荐

模型特点推荐用途
Claude Sonnet 4.5性价比高,速度快日常编程任务
Claude Opus 4.5智能强,适合深度思考复杂问题、架构设计
GPT-5.2输出细致、稳定代码生成、文档编写
Gemini 3 Pro前端能力强前端开发、UI 设计
Gemini 3 Flash速度快、价格低简单任务、文件读取

分组说明

  • Claude Max 号池:由 Claude Max 账号组成,稳定性较高
  • Codex 分组:支持 OpenAI 系模型
  • Gemini 分组:支持 Google 系模型
  • AWS Bedrock 分组:使用 AWS 官方服务,响应较快

什么是缓存

缓存是一种优化机制:

  • 首次请求会创建缓存,通常会有额外费用
  • 后续相似请求命中缓存时,价格更低
  • 5 分钟缓存适合频繁切换,1 小时缓存适合持续处理同一项目

什么是上下文

上下文是模型一次能处理的内容长度:

  • 默认上下文通常为 200K-256K tokens
  • 特价分组的上下文可能更短
  • 1M 上下文适合处理超长内容