Token再这么烧下去,AI迟早要反噬自己
2026-07-01 21:49:14
  • 0
  • 0
  • 0

““没有什么比一张六位数的Token账单,更能帮你升职”

今年春天,一位在Meta工作的软件工程师朋友突然给我发来一条消息。

"看到我们裁员的新闻了吧?"

本以为他要吐槽扎克伯格管理水平不行,结果却话锋一转:"现在大家都疯了一样在烧Token。"

我愣了一下。

"为什么?"

“尽管公司从来没有公开地告诉我们Token使用量会不会影响绩效,但大家都猜这个指标会成为裁员的依据。”他说到。

这种担心并非毫无来由。

2026年初,Meta内部曾出现一个由员工自建的AI使用排行榜——Claudeonomics。它统计了超过8.5万名员工的AI使用情况,并列出了Token消耗最高的Top 250员工。排行榜后来被撤下,但Meta随后证实,公司确实存在官方的AI Insights Dashboard,用于追踪员工AI工具的使用情况,只是不再按照Token简单排名。

在北美华人科技论坛一亩三分地上,也有匿名用户提到,一些Meta员工会通过编写循环任务,持续调用模型,以提高自己的Token使用量。

几天后,我又联系了一位在Intuit工作的软件工程师。

今年以来,Intuit股价持续低迷,再叠加SaaS行业裁员消息不断,公司内部也开始弥漫着一种不安的情绪。

"大家都觉得,裁员只是时间问题。"他说到。在聊到AI时,他突然说了相似的话,"我们现在也在想办法多用一点Token。"

我问他为什么。

"Manager每周都会看团队的AI使用情况。如果有人几乎不用,就会被提醒:'你应该多用一点。'"

同样的,Intuit从来没公开表明Token使用量会影响绩效。"但既然公司开始统计,那这个数据肯定有用。"他说到。

"前两天,一个同事给我发了个GitHub项目。"

我问,什么项目?

"他说,如果只是想把Token刷高,用这个最快。"他笑了一下,"我当时觉得挺离谱的。但我周围很多人也在比较每个月谁在Claude上花的钱更多。"

聊天结束后,我点开了他发来的那个链接。

项目名字叫Burn Baby Burn。打开README,也是满满的讽刺意味。

第一页写着一句黑色幽默:

Nothing gets you promoted faster than a six-figure token bill. (没有什么比一张六位数的Token账单,更能帮你升职)

下面还有一句:

Investors love AI usage. (投资人喜欢看AI使用量)

仔细看了一遍,整个项目没有教开发者怎么写更好的Prompt,也没有提高Agent效率。只有一个简单粗暴的目标:更快地浪费公司给的Token预算。

这个项目很快被转发到Hacker News。有用户评论说:

"This is one of the funniest things I've seen on HN. This is actually becoming useful where I work." (这是我最近在Hacker News上看到最好笑的东西。可笑的是,它在我们公司居然真的开始有用了。)

教你如何用一行代码
烧掉50000个Token

我接着翻看Burn Baby Burn这个项目,发现它的运行方式并不复杂。

用户安装后,只需要在命令行里输入类似burn 50000,它就会调用Claude Code或Codex,目标是消耗5万个Token。项目说明里甚至直接给了几个例子:burn 50000--model haiku、burn 100000--model sonnet、burn 50000--backend codex。

脚本会生成一段没有实际意义的填充文本,然后把这段文本塞进Prompt里,并要求模型只回复一个单词:burned。换句话说,它不是让模型解决问题,而是让模型读取一堆无意义内容,再给出一个极短回答。Token就是在这个过程中被消耗掉的。

为了让这个过程看起来更像一场表演,脚本还会在终端里显示进度条、动画和累计成本。每调用一次模型,它会解析Claude或Codex返回的Token使用量,把已经烧掉的Token累加起来,直到达到用户设定的目标。

项目作者显然是在搞笑。如果用户一次试图烧掉超过100万个Token,程序会直接退出,并提醒:"这个仓库是个玩笑,README里的企业版也不是真的。"

但评论区的开发者似乎比作者还会玩。

有人提Issue,希望增加多线程支持,理由是:"我已经靠这个工具升职了,现在需要烧更多Token。"

还有人建议把整个项目用Rust重写,因为"Bash烧Token还是太慢了。"

我继续搜索"token burn",发现Burn Baby Burn并不是唯一一个这样的项目。

有人做了token-burn。作者说Claude Code、Codex这类工具每周都会重置额度,不用也是浪费,不如趁额度清零之前,让AI去跑代码审查、补测试、重构,把剩下的Token全部花掉。

再往下翻,还有不少类似的小工具。

有的自动生成超长Prompt,有的让多个Agent互相讨论,还有的专门循环调用模型,把额度一直跑到清零。它们大多没有多少Star,也未必真的会有人长期使用。但如果放在两年前,很难想象GitHub上会出现这样一类项目。

毕竟那时工程师们讨论的还是怎么减少服务器开销、压缩云计算成本、优化代码效率。

今天,他们开始讨论另一件事:怎么在AI上花更多的钱。

AI行业正在重复苏联工厂的错误

英国经济学家Charles Goodhart曾提出一个观点:“当一个指标成为目标,它就不再是一个好的指标。”

这就是后来广为流传的Goodhart's Law(古德哈特定律)。

历史上,苏联计划经济就犯过这样的错误。为了提高工业产量,政府用钉子的重量考核工厂,结果工厂生产出又粗又大的钉子;后来改成按数量考核,工厂又开始生产细如针尖的小钉子。

无论是哪一种,工厂都完成了KPI,但真正有用的钉子却越来越少。

今天的AI行业,越来越像当年的苏联工厂。

Token原本只是衡量模型计算资源的一项技术指标,但过去一年,它逐渐变成了衡量AI应用程度、产品增长速度,甚至企业价值的重要指标。企业开始鼓励员工多用AI,创业公司开始展示Token增长,越来越多VC也把Token消耗、Token增速当成产品活跃度和增长潜力的重要信号。

所以“Tokenmaxxing”一度成为硅谷开发者讨论的热门话题,这才衍生出了专门帮助"烧Token"的GitHub项目。

然而,每一个Token背后都是真金白银的投入。

GPU要扩,HBM要买,数据中心要建,电费要交,网络、散热、运维一样都少不了。AI Agent越普及,推理次数越多,整个AI基础设施的成本也跟着水涨船高。今天涨价的不只是HBM,而是整个AI行业的底层成本。

更尴尬的是,成本一路飙升,价值却没有同步增长。

Token消耗越来越多,AI调用越来越频繁,但企业的生产力、收入和利润,并没有按同样的速度增长。于是,企业开始限预算,模型公司开始取消补贴、改成按量收费,整个行业突然开始重新计算ROI。

过去,企业鼓励员工多烧Token,VC鼓励创业公司讲Token增长,模型公司补贴Token抢市场。所有人都在追逐同一个数字,却越来越少有人问一句:

这些Token,到底创造了多少价值?

长长的账单把老板打醒了

过去几个月,因为AI Token成本增长得远远超出了预期,美国已经有不少大型公司开始限制员工使用AI。

据《金融时报》报道,由于一些员工开始为了提升排名而故意消耗Token,Amazon已经关闭了统计员工AI使用情况的内部排行榜 KiroRank。

在与员工沟通时,Amazon高级副总裁Dave Treadwell明确表示:“不要为了使用AI而使用AI。请使用AI去帮助解决客户问题、业务问题,并推动创新。”

Uber更着急。据报道,公司原本一整年的AI工程预算,仅用了四个月就全部花完,不得不为每位工程师使用Claude Code、Cursor等AI编程工具设置每月1500美元的预算上限。

即便消耗了如此多的Token,Uber首席运营官Andrew Macdonald在今年5月接受采访时仍坦言,截至目前,他还没有看到AI支出的增加,与生产力提升之间存在明确的对应关系。

除此之外,更多科技公司加入到这场AI成本控制大战之中:微软缩减了内部Claude Code授权;协作软件公司Atlassian开始为员工设置Token配额;在线旅游平台Priceline在AI编程工具涨价后加强使用审核;而加密货币交易所Coinbase则选择另一条路——不直接限制Token,而是通过模型路由和缓存优化,降低每一次AI调用的成本。

出于ROI的考虑,越来越多企业开始重新审视AI的投入方式。

McKinsey最新《State of AI》报告显示,88%的企业已经至少在一个业务部门部署了AI,较上一年进一步提升,说明AI采用率已经非常高。然而,真正看到财务回报的企业却远没有那么多。只有39%的受访企业认为AI已经对经营利润(EBIT)产生影响,而且其中绝大多数企业表示,这种影响占利润的比例仍不足5%。

这种变化也反映在其他研究中。根据KPMG今年5月对全球2145名企业高管的一项调查,近一半受访企业表示,由于AI Agent的成本已经超过带来的收益,因此减少了AI Agent的使用。

企业正在进入Gartner所说的"幻灭低谷(Trough of Disillusionment)"——最初对AI的兴奋,正逐渐让位于对成本、规模化和ROI的现实考量。过去讨论的是AI Adoption(采用率),如今讨论的则是AI ROI。

连OpenAI CEO Sam Altman都承认,这种变化发生得非常快。他表示,今年年初,几乎没有企业会主动讨论AI成本;但短短几个月后,这已经成为客户最关心的问题。过去几个月,他听到最多的一句话就是:

"我们第一季度就花光了全年AI预算。

模型公司也补贴不起了
该有人买单了

当企业开始重新计算AI的经济账,模型公司也不得不改变自己的商业模式。

过去两年,为了抢占市场,OpenAI、Anthropic等公司普遍采用固定订阅(Flat Fee)模式,企业无论消耗多少Token,费用几乎保持不变,而不断上涨的推理成本则由模型公司自己承担。

这套模式在AI还是聊天机器人时代尚且能够维持,但AI Agent改变了游戏规则。

相比一次普通问答,一个AI Agent往往需要连续调用模型、反复推理、修改代码、验证结果,一个任务消耗的Token可能是传统聊天机器人的几十倍甚至上百倍。用户看到的只是"完成了一个任务",模型公司承担的却是GPU被占用、电力被消耗、服务器持续运转和数据中心持续扩容的成本。

财务压力也开始迅速累积。根据《金融时报》披露的数据,OpenAI去年营收约130亿美元,运营亏损却高达209亿美元;即使剔除一次性会计因素,经营层面的现金消耗仍达到约80亿美元。

Anthropic虽然收入高速增长,却仍持续融资数百亿美元,用于采购GPU、建设数据中心,以及支撑Claude不断增长的推理需求。

这也解释了为什么这两家巨头计划在今年上市——对于这些仍处于高投入阶段的模型公司而言,持续获得资本市场支持,已经成为支撑算力扩张和模型迭代的重要前提。

不过,OpenAI最近又倾向于将IPO推迟到明年。据多家媒体报道,主要原因并非放缓扩张,而是顾问团队担心近期大型科技IPO上市后的市场表现不佳,希望等待更有利的市场环境,并争取实现更高的上市估值。

在计划上市之前,模型公司的商业模式已经开始发生变化。OpenAI、Anthropic以及GitHub Copilot等产品陆续放弃固定订阅,转向按实际使用量收费(Usage-based Pricing)。GitHub更是在博客中坦言,公司过去一直在承担不断上涨的AI推理成本,固定价格模式已经“无法持续(no longer sustainable)”。

正如投资机构Sure Valley Ventures管理合伙人Barry Downes所说:“过去一年,很多AI产品实际上都在补贴用户使用量,以争夺市场份额。现在,是时候有人来买单了。”

但这个账单,并不会只落到某一家公司头上。

企业会以更高的AI订阅费、更严格的Token配额和更复杂的成本管理来买单;模型公司会以更高的推理成本、更低的毛利率和更难讲的盈利故事来买单;创业公司会以更贵的API成本和更难成立的商业模型来买单;投资人则会以更长的回本周期和更低的估值容忍度来买单。

Tokenmaxxing看起来像一个玩笑,最后却戳中了整个行业最真实的问题:当一个行业把资源消耗包装成增长,它迟早要为这套增长叙事付费。

AI真正应该比拼的,不是谁烧掉更多Token,而是谁能用更少的Token,把事情做得更好。

否则,今天烧的是Token,明天反噬的,就是AI自己讲出来的增长故事。

文:王茜茜 / 数据猿

责编:凝视深空 / 数据猿

 
最新文章
相关阅读