1_AI Token计费与代理服务

本文旨在解析大型语言模型(LLM)的核心概念、命名规范及 Google 模型生态,并汇总实用的代理与免费资源,为开发者提供高效的选型与使用指南。

1. AI 核心概念

理解 Token 机制与计费模型是进行成本控制和架构设计的基础。

1.1 Token 计量机制

Token 是 LLM 处理文本的最小原子单位。

  • 英文场景:1 Token ≈ 0.75 个单词(例如 “Hello world” 约占 2 Token)。
  • 中文场景:1 Token ≈ 0.5 ~ 0.8 个汉字。Gemini 的分词器对多语言支持较优,建议按 1 个汉字 ≈ 1.3 Token 进行保守估算。
  • 换算单位:
    • 1K = 1,000 Token
    • 1M = 1,000,000 Token
    • B (Billion) = 10 亿参数(如 32B 模型)

1.2 计费模型

主流 API 计费通常以 M (Million) 为单位。以 google/gemini-3-pro-preview 为例:

  • Input (输入): $2/M Tokens ≈ ¥14.4/百万 Token
  • Output (输出): $12/M Tokens ≈ ¥86.4/百万 Token

成本控制策略:
输出 Token 的单价通常远高于输入 Token。在架构设计中,应利用 “Input 廉价 “ 的特性,通过提供丰富的上下文(Context)来引导模型生成精准简练的 “Output”。

  • 以 google/gemini-3-pro-preview 为例
    • 输入一万 token:0.02×7.25 ≈ 0.145 元
    • 输出一万 token:0.12×7.25 ≈ 0.87 元

2. 模型命名规范

理解厂商的命名规则有助于快速定位模型定位与能力。

2.1 规模与能力分级

后缀定位特点适用场景典型代表
Mini / Lite / Nano / Micro轻量版端侧运行,极低延迟,低成本简单分类、文本提取、移动端应用GPT-4o-mini, Gemini Nano
Flash / Fast/ Turbo竞速版优化响应速度与长文档处理高吞吐量任务,实时交互Gemini 1.5 Flash
Pro / Plus / Base专业版能力与成本的平衡点,主力模型复杂通用任务,逻辑推理Gemini 1.5 Pro, Claude 3.5 Sonnet
Ultra / Max / Opus旗舰版最高智力水平,擅长深度推理数学证明、创意写作、科研辅助Gemini 1.5 Ultra, Claude 3 Opus

2.2 版本生命周期

  • Preview: 预览版。功能尚未完全锁定,可能存在不稳定性,通常用于早期测试。
  • Exp (Experimental): 实验版。往往包含前沿技术(如超长上下文、增强数学能力),在性能上可能优于同期正式版。
  • Date Tag (如 1106, 0125): 日期快照。建议优先选择较新的日期版本,以获取最新的知识库和 Bug 修复。

3. Google 模型生态与调用

Google 的 AI 能力主要通过两个渠道交付:面向开发者的 AI Studio 和面向企业的 Vertex AI。

3.1 接入渠道决策

flowchart TD
    Start[开始选型] --> Scenario{使用场景决策}

    Scenario -->|个人开发/原型验证| AIStudio[Google AI Studio]
    Scenario -->|企业应用/生产环境| VertexAI[Google Cloud Vertex AI]

    AIStudio --> KeyAuth[鉴权: API Key]
    AIStudio --> Feature1[特点: 免费额度高,接入快]

    VertexAI --> IAMAuth[鉴权: IAM / Service Account]
    VertexAI --> Feature2[特点: 数据合规,SLA保障]
  • Google AI Studio:(BackendGeminiAPI)
    • 适合个人开发者。通过 API Key (AIza 开头) 快速接入,提供慷慨的免费额度,适合 Hobbyist 项目和快速原型验证。
  • Vertex AI: (BackendVertexAI)
    • Google Cloud Platform (GCP) 的企业级服务。支持 IAM 权限管理、VPC 网络隔离,承诺数据不用于模型训练,适合对合规性和 SLA 有要求的生产环境。

3.2 Nano 图像模型(2025-12 最强)

Nano 是 Google 针对端侧设备优化的轻量化模型系列,2025 年 12 月基准下的最强版本包括:

  • gemini-2.5-flash-image-preview (Nano Banana)
  • gemini-3-pro-image-preview (Nano Banana Pro)

4. 模型代理服务

本节汇总常用的模型代理服务与免费资源。

4.1 代理网站

当直接访问官方 API 受限或需要统一管理多模型渠道时,可使用代理服务。

  • OpenRouter: 业界知名的模型聚合平台,支持几乎所有主流开源和闭源模型,价格透明。
  • TurboAI: 提供一定的免费试用额度。
  • AIHubMix: 稳定运营中,支持小额充值验证。
  • 302.AI: 专注于按量计费的 AI 代理平台。

4.2 免费资源