AI Token 的江湖：大模型时代的“新石油”为何值得你关注

作者： CBINEWS

责任编辑：邹大斌

来源：电脑商情在线

时间： 2026-05-27 17:51

你可能从未想过“千万亿”这个数字会出现在日常对话中。但在上周的 Google I/O 大会上，谷歌 CEO Sundar Pichai 就用这个量级来描述公司每月处理的 AI 数据：3.2 千万亿个 Token。“我从来没想过自己会说‘千万亿’这个词，”Pichai 说，“但我们确实到了这一步。”

Token，这个听起来颇为技术化的概念，正在成为 AI 行业的新货币——有人称之为驱动 AI 革命的“新石油”。它不仅是衡量大语言模型计算能力的基本单位，更是一套全新的商业定价体系。而这套体系，正在深刻改变企业使用 AI 的成本结构、商业模式乃至人才策略。

Token 到底是什么？

Token 是大语言模型处理数据的最小单元。与人类的思维方式类似，LLM 通过将句子拆分为 Token 来理解语义。Pichai 将其描述为“模型处理数据的基本单位，每个 Token 往往代表一个正在被解决的问题”。

一个 Token 可以是一个单词、一个子词、一串字母，也可以是一个符号或短语。复合词通常会被拆分——比如“running”可能被分解为“run”和“ing”两个 Token，因为后者改变了句子的时态含义。

Gartner 高级总监分析师 Deepak Seth 给出了一个直观的换算公式：平均一个 Token 约等于四分之三个英文单词，100 个单词大约产生 135 个 Token。这个换算倍数直接影响着 AI 服务的实际开销。

Token 定价的隐藏逻辑：上传便宜，下载贵

并非所有 Token 的价格都相同。一套典型的 Token 定价体系中，输入 Token（上传）比输出 Token（下载）便宜得多。

ManpowerGroup 数据科学与 AI 解决方案负责人 Max Leaming 以简历润色为例说明：用户付费上传简历，然后支付更贵的费用下载经 LLM 润色后的版本。“上传成本低于下载成本，因为 AI 已经为你做了工作，”Leaming 解释道。

目前，Token 计费主要面向企业用户和开发者等重度用户。Anthropic 的 Claude Code、OpenAI 的 Codex 均采用 Token 定价，而微软的 GitHub 也于 6 月 1 日起开始实施类似计费模式。最终账单不仅包括 Token 消耗，还叠加了 GPU 算力时间成本——用 Leaming 的话说，这两项费用“是并行开票的”。

Token 效率：拉开企业 AI 成本的真正差距

在实际生产中，Token 的使用效率差异惊人。Gartner 的 Seth 指出，同样是完成一项编码任务，有的开发者可能消耗 1 万个 Token，而另一位可能只用 1 千个。“问题在于，目前还没有衡量 Token 效率的成熟工具。”

当企业真正意识到 Token 成本时，“基于结果的定价”模式可能成为趋势。ManpowerGroup 为此开发了一套内部仪表板，帮助客户减少查询步骤。数据显示，新用户在初次使用其劳动力市场数据工具时需要平均 10 轮追问才能获取目标信息，一年后这个数字降到了 4 轮。

“他们使用的 Token 更少了，效率更高了，”Leaming 说，“而这很大程度上取决于你的提示词能力。”

不过，效率考量的另一面也在浮现。以 Anthropic 颇具争议的 Mythos 大模型为例，虽然该模型尚未公开发布，预计单 Token 价格可能极高，但其更强的推理能力可能反而降低总体成本。“即使单 Token 成本上升，整体成本也可能下降，”Leaming 表示。

谷歌也在朝这个方向努力。Pichai 在会上透露，Gemini 3.5 Flash 以不到同类前沿模型一半的价格提供了同等能力。“我们已经听说很多公司年度 Token 预算已经提前耗尽……如果企业混合使用 Flash 和其他前沿模型，可以省下大量费用。”

“毒品贩子策略”：AI 厂商的免费 Token 陷阱

在 Gartner 的 Seth 看来，顶级 AI 厂商花费数万亿美元建设 AI 基础设施，却未在 Token 上收取足够的费用。“我觉得 OpenAI、Google 和 Anthropic 们正在执行一种‘毒品贩子策略’：先让人对 AI 上瘾，然后再提高 Token 价格。”

免费 Token 的另一个潜在目标是——锁定客户。当企业围绕某个专有 LLM 和智能体构建了完整的工作流程，迁移成本就会变得极其高昂。

而为了巩固这种锁定，各大 AI 厂商正在派出一类新角色进入客户现场：前向部署工程师。这些工程师帮助客户制定 AI 策略、构建智能体框架、与客户自己的领域专家和工程师协同部署 AI——本质上是在替客户搭建一整套 AI 基础设施。

Leaming 观察到了一个关键转变：“过去 LLM 本身是产品，现在 OpenAI、Google 和微软想进入你的公司内部，为你搭建整个基础设施。”

Token 福利：打工人的“话费补贴”新时代

更令人意想不到的是，Token 正开始成为一种员工福利。Nvidia CEO 黄仁勋曾提到，一些公司开始向工程师赠送免费 Token，就像企业为员工报销手机话费一样。

Leaming 对这个趋势持谨慎态度。如果雇主提供的是 OpenAI 或微软的免费 Token，“那么我被激励了——我对这个产品越熟悉，使用它的频率就越高。”这本质上是一种间接的供应商锁定。

免费 Token 也是推动前沿 AI 技术在“非安全区”落地的催化剂。ARM 高级副总裁 Alex Spinelli 透露，他自掏腰包尝试 OpenClaw 这款被视为突破性但尚未达到企业安全标准的 AI 技术，结果一个周末烧掉了 500 美元。“我把配置搞错了，周末收到 500 美元的账单，我当时想——这他妈的怎么回事？天下没有免费的午餐，Token 真的很贵。”

Seth 将这种策略比作印度某烟草公司曾将香烟随工资一起发放的做法：“除了工资，他们还能拿到几盒香烟。目的就是让他们分发出去，让产品更流行。如果免费给你，你就会用它——因为这相当于不要钱。”

结语

从技术层面看，Token 不过是一个计量单位；但从商业层面看，它正在重塑整个 AI 产业的价值分配逻辑。当谷歌每月吞吐 3.2 千万亿 Token，当开发者一个不小心就烧掉 500 美元，当免费赠品背后暗藏锁定意图——Token 早已不只是 Token。

对于正在拥抱 AI 的企业而言，理解 Token 的定价机制、管理 Token 的消耗效率、警悉免费 Token 背后的商业动机，可能比选择哪个大模型本身更为重要。