AI Token 的江湖:大模型时代的“新石油”为何值得你关注
作者: CBINEWS
责任编辑: 邹大斌
来源: 电脑商情在线
时间: 2026-05-27 17:51
你可能从未想过“千万亿”这个数字会出现在日常对话中。但在上周的 Google I/O 大会上,谷歌 CEO Sundar Pichai 就用这个量级来描述公司每月处理的 AI 数据:3.2 千万亿个 Token。“我从来没想过自己会说‘千万亿’这个词,”Pichai 说,“但我们确实到了这一步。”
Token,这个听起来颇为技术化的概念,正在成为 AI 行业的新货币——有人称之为驱动 AI 革命的“新石油”。它不仅是衡量大语言模型计算能力的基本单位,更是一套全新的商业定价体系。而这套体系,正在深刻改变企业使用 AI 的成本结构、商业模式乃至人才策略。
Token 到底是什么?
Token 是大语言模型处理数据的最小单元。与人类的思维方式类似,LLM 通过将句子拆分为 Token 来理解语义。Pichai 将其描述为“模型处理数据的基本单位,每个 Token 往往代表一个正在被解决的问题”。
一个 Token 可以是一个单词、一个子词、一串字母,也可以是一个符号或短语。复合词通常会被拆分——比如“running”可能被分解为“run”和“ing”两个 Token,因为后者改变了句子的时态含义。
Gartner 高级总监分析师 Deepak Seth 给出了一个直观的换算公式:平均一个 Token 约等于四分之三个英文单词,100 个单词大约产生 135 个 Token。这个换算倍数直接影响着 AI 服务的实际开销。
Token 定价的隐藏逻辑:上传便宜,下载贵
并非所有 Token 的价格都相同。一套典型的 Token 定价体系中,输入 Token(上传)比输出 Token(下载)便宜得多。
ManpowerGroup 数据科学与 AI 解决方案负责人 Max Leaming 以简历润色为例说明:用户付费上传简历,然后支付更贵的费用下载经 LLM 润色后的版本。“上传成本低于下载成本,因为 AI 已经为你做了工作,”Leaming 解释道。
目前,Token 计费主要面向企业用户和开发者等重度用户。Anthropic 的 Claude Code、OpenAI 的 Codex 均采用 Token 定价,而微软的 GitHub 也于 6 月 1 日起开始实施类似计费模式。最终账单不仅包括 Token 消耗,还叠加了 GPU 算力时间成本——用 Leaming 的话说,这两项费用“是并行开票的”。
Token 效率:拉开企业 AI 成本的真正差距
在实际生产中,Token 的使用效率差异惊人。Gartner 的 Seth 指出,同样是完成一项编码任务,有的开发者可能消耗 1 万个 Token,而另一位可能只用 1 千个。“问题在于,目前还没有衡量 Token 效率的成熟工具。”
当企业真正意识到 Token 成本时,“基于结果的定价”模式可能成为趋势。ManpowerGroup 为此开发了一套内部仪表板,帮助客户减少查询步骤。数据显示,新用户在初次使用其劳动力市场数据工具时需要平均 10 轮追问才能获取目标信息,一年后这个数字降到了 4 轮。
“他们使用的 Token 更少了,效率更高了,”Leaming 说,“而这很大程度上取决于你的提示词能力。”
不过,效率考量的另一面也在浮现。以 Anthropic 颇具争议的 Mythos 大模型为例,虽然该模型尚未公开发布,预计单 Token 价格可能极高,但其更强的推理能力可能反而降低总体成本。“即使单 Token 成本上升,整体成本也可能下降,”Leaming 表示。
谷歌也在朝这个方向努力。Pichai 在会上透露,Gemini 3.5 Flash 以不到同类前沿模型一半的价格提供了同等能力。“我们已经听说很多公司年度 Token 预算已经提前耗尽……如果企业混合使用 Flash 和其他前沿模型,可以省下大量费用。”
“毒品贩子策略”:AI 厂商的免费 Token 陷阱
在 Gartner 的 Seth 看来,顶级 AI 厂商花费数万亿美元建设 AI 基础设施,却未在 Token 上收取足够的费用。“我觉得 OpenAI、Google 和 Anthropic 们正在执行一种‘毒品贩子策略’:先让人对 AI 上瘾,然后再提高 Token 价格。”
免费 Token 的另一个潜在目标是——锁定客户。当企业围绕某个专有 LLM 和智能体构建了完整的工作流程,迁移成本就会变得极其高昂。
而为了巩固这种锁定,各大 AI 厂商正在派出一类新角色进入客户现场:前向部署工程师。这些工程师帮助客户制定 AI 策略、构建智能体框架、与客户自己的领域专家和工程师协同部署 AI——本质上是在替客户搭建一整套 AI 基础设施。
Leaming 观察到了一个关键转变:“过去 LLM 本身是产品,现在 OpenAI、Google 和微软想进入你的公司内部,为你搭建整个基础设施。”
Token 福利:打工人的“话费补贴”新时代
更令人意想不到的是,Token 正开始成为一种员工福利。Nvidia CEO 黄仁勋曾提到,一些公司开始向工程师赠送免费 Token,就像企业为员工报销手机话费一样。
Leaming 对这个趋势持谨慎态度。如果雇主提供的是 OpenAI 或微软的免费 Token,“那么我被激励了——我对这个产品越熟悉,使用它的频率就越高。”这本质上是一种间接的供应商锁定。
免费 Token 也是推动前沿 AI 技术在“非安全区”落地的催化剂。ARM 高级副总裁 Alex Spinelli 透露,他自掏腰包尝试 OpenClaw 这款被视为突破性但尚未达到企业安全标准的 AI 技术,结果一个周末烧掉了 500 美元。“我把配置搞错了,周末收到 500 美元的账单,我当时想——这他妈的怎么回事?天下没有免费的午餐,Token 真的很贵。”
Seth 将这种策略比作印度某烟草公司曾将香烟随工资一起发放的做法:“除了工资,他们还能拿到几盒香烟。目的就是让他们分发出去,让产品更流行。如果免费给你,你就会用它——因为这相当于不要钱。”
结语
从技术层面看,Token 不过是一个计量单位;但从商业层面看,它正在重塑整个 AI 产业的价值分配逻辑。当谷歌每月吞吐 3.2 千万亿 Token,当开发者一个不小心就烧掉 500 美元,当免费赠品背后暗藏锁定意图——Token 早已不只是 Token。
对于正在拥抱 AI 的企业而言,理解 Token 的定价机制、管理 Token 的消耗效率、警悉免费 Token 背后的商业动机,可能比选择哪个大模型本身更为重要。
