Token再这么烧下去，AI迟早要反噬自己-数据猿的专栏

Token再这么烧下去，AI迟早要反噬自己

2026-07-01 21:49:14栏目：默认栏目 IP属地：IP未知

““没有什么比一张六位数的Token账单，更能帮你升职”

今年春天，一位在Meta工作的软件工程师朋友突然给我发来一条消息。

"看到我们裁员的新闻了吧？"

本以为他要吐槽扎克伯格管理水平不行，结果却话锋一转："现在大家都疯了一样在烧Token。"

我愣了一下。

"为什么？"

“尽管公司从来没有公开地告诉我们Token使用量会不会影响绩效，但大家都猜这个指标会成为裁员的依据。”他说到。

这种担心并非毫无来由。

2026年初，Meta内部曾出现一个由员工自建的AI使用排行榜——Claudeonomics。它统计了超过8.5万名员工的AI使用情况，并列出了Token消耗最高的Top 250员工。排行榜后来被撤下，但Meta随后证实，公司确实存在官方的AI Insights Dashboard，用于追踪员工AI工具的使用情况，只是不再按照Token简单排名。

在北美华人科技论坛一亩三分地上，也有匿名用户提到，一些Meta员工会通过编写循环任务，持续调用模型，以提高自己的Token使用量。

几天后，我又联系了一位在Intuit工作的软件工程师。

今年以来，Intuit股价持续低迷，再叠加SaaS行业裁员消息不断，公司内部也开始弥漫着一种不安的情绪。

"大家都觉得，裁员只是时间问题。"他说到。在聊到AI时，他突然说了相似的话，"我们现在也在想办法多用一点Token。"

我问他为什么。

"Manager每周都会看团队的AI使用情况。如果有人几乎不用，就会被提醒：'你应该多用一点。'"

同样的，Intuit从来没公开表明Token使用量会影响绩效。"但既然公司开始统计，那这个数据肯定有用。"他说到。

"前两天，一个同事给我发了个GitHub项目。"

我问，什么项目？

"他说，如果只是想把Token刷高，用这个最快。"他笑了一下，"我当时觉得挺离谱的。但我周围很多人也在比较每个月谁在Claude上花的钱更多。"

聊天结束后，我点开了他发来的那个链接。

项目名字叫Burn Baby Burn。打开README，也是满满的讽刺意味。

第一页写着一句黑色幽默：

Nothing gets you promoted faster than a six-figure token bill. （没有什么比一张六位数的Token账单，更能帮你升职）

下面还有一句：

Investors love AI usage. （投资人喜欢看AI使用量）

仔细看了一遍，整个项目没有教开发者怎么写更好的Prompt，也没有提高Agent效率。只有一个简单粗暴的目标：更快地浪费公司给的Token预算。

这个项目很快被转发到Hacker News。有用户评论说：

"This is one of the funniest things I've seen on HN. This is actually becoming useful where I work." （这是我最近在Hacker News上看到最好笑的东西。可笑的是，它在我们公司居然真的开始有用了。）

教你如何用一行代码
烧掉50000个Token

我接着翻看Burn Baby Burn这个项目，发现它的运行方式并不复杂。

用户安装后，只需要在命令行里输入类似burn 50000，它就会调用Claude Code或Codex，目标是消耗5万个Token。项目说明里甚至直接给了几个例子：burn 50000--model haiku、burn 100000--model sonnet、burn 50000--backend codex。

脚本会生成一段没有实际意义的填充文本，然后把这段文本塞进Prompt里，并要求模型只回复一个单词：burned。换句话说，它不是让模型解决问题，而是让模型读取一堆无意义内容，再给出一个极短回答。Token就是在这个过程中被消耗掉的。

为了让这个过程看起来更像一场表演，脚本还会在终端里显示进度条、动画和累计成本。每调用一次模型，它会解析Claude或Codex返回的Token使用量，把已经烧掉的Token累加起来，直到达到用户设定的目标。

项目作者显然是在搞笑。如果用户一次试图烧掉超过100万个Token，程序会直接退出，并提醒："这个仓库是个玩笑，README里的企业版也不是真的。"

但评论区的开发者似乎比作者还会玩。

有人提Issue，希望增加多线程支持，理由是："我已经靠这个工具升职了，现在需要烧更多Token。"

还有人建议把整个项目用Rust重写，因为"Bash烧Token还是太慢了。"

我继续搜索"token burn"，发现Burn Baby Burn并不是唯一一个这样的项目。

有人做了token-burn。作者说Claude Code、Codex这类工具每周都会重置额度，不用也是浪费，不如趁额度清零之前，让AI去跑代码审查、补测试、重构，把剩下的Token全部花掉。

再往下翻，还有不少类似的小工具。

有的自动生成超长Prompt，有的让多个Agent互相讨论，还有的专门循环调用模型，把额度一直跑到清零。它们大多没有多少Star，也未必真的会有人长期使用。但如果放在两年前，很难想象GitHub上会出现这样一类项目。

毕竟那时工程师们讨论的还是怎么减少服务器开销、压缩云计算成本、优化代码效率。

今天，他们开始讨论另一件事：怎么在AI上花更多的钱。

AI行业正在重复苏联工厂的错误

英国经济学家Charles Goodhart曾提出一个观点：“当一个指标成为目标，它就不再是一个好的指标。”

这就是后来广为流传的Goodhart's Law（古德哈特定律）。

历史上，苏联计划经济就犯过这样的错误。为了提高工业产量，政府用钉子的重量考核工厂，结果工厂生产出又粗又大的钉子；后来改成按数量考核，工厂又开始生产细如针尖的小钉子。

无论是哪一种，工厂都完成了KPI，但真正有用的钉子却越来越少。

今天的AI行业，越来越像当年的苏联工厂。

Token原本只是衡量模型计算资源的一项技术指标，但过去一年，它逐渐变成了衡量AI应用程度、产品增长速度，甚至企业价值的重要指标。企业开始鼓励员工多用AI，创业公司开始展示Token增长，越来越多VC也把Token消耗、Token增速当成产品活跃度和增长潜力的重要信号。

所以“Tokenmaxxing”一度成为硅谷开发者讨论的热门话题，这才衍生出了专门帮助"烧Token"的GitHub项目。

然而，每一个Token背后都是真金白银的投入。

GPU要扩，HBM要买，数据中心要建，电费要交，网络、散热、运维一样都少不了。AI Agent越普及，推理次数越多，整个AI基础设施的成本也跟着水涨船高。今天涨价的不只是HBM，而是整个AI行业的底层成本。

更尴尬的是，成本一路飙升，价值却没有同步增长。

Token消耗越来越多，AI调用越来越频繁，但企业的生产力、收入和利润，并没有按同样的速度增长。于是，企业开始限预算，模型公司开始取消补贴、改成按量收费，整个行业突然开始重新计算ROI。

过去，企业鼓励员工多烧Token，VC鼓励创业公司讲Token增长，模型公司补贴Token抢市场。所有人都在追逐同一个数字，却越来越少有人问一句：

这些Token，到底创造了多少价值？

长长的账单把老板打醒了

过去几个月，因为AI Token成本增长得远远超出了预期，美国已经有不少大型公司开始限制员工使用AI。

据《金融时报》报道，由于一些员工开始为了提升排名而故意消耗Token，Amazon已经关闭了统计员工AI使用情况的内部排行榜 KiroRank。

在与员工沟通时，Amazon高级副总裁Dave Treadwell明确表示：“不要为了使用AI而使用AI。请使用AI去帮助解决客户问题、业务问题，并推动创新。”

Uber更着急。据报道，公司原本一整年的AI工程预算，仅用了四个月就全部花完，不得不为每位工程师使用Claude Code、Cursor等AI编程工具设置每月1500美元的预算上限。

即便消耗了如此多的Token，Uber首席运营官Andrew Macdonald在今年5月接受采访时仍坦言，截至目前，他还没有看到AI支出的增加，与生产力提升之间存在明确的对应关系。

除此之外，更多科技公司加入到这场AI成本控制大战之中：微软缩减了内部Claude Code授权；协作软件公司Atlassian开始为员工设置Token配额；在线旅游平台Priceline在AI编程工具涨价后加强使用审核；而加密货币交易所Coinbase则选择另一条路——不直接限制Token，而是通过模型路由和缓存优化，降低每一次AI调用的成本。

出于ROI的考虑，越来越多企业开始重新审视AI的投入方式。

McKinsey最新《State of AI》报告显示，88%的企业已经至少在一个业务部门部署了AI，较上一年进一步提升，说明AI采用率已经非常高。然而，真正看到财务回报的企业却远没有那么多。只有39%的受访企业认为AI已经对经营利润（EBIT）产生影响，而且其中绝大多数企业表示，这种影响占利润的比例仍不足5%。

这种变化也反映在其他研究中。根据KPMG今年5月对全球2145名企业高管的一项调查，近一半受访企业表示，由于AI Agent的成本已经超过带来的收益，因此减少了AI Agent的使用。

企业正在进入Gartner所说的"幻灭低谷（Trough of Disillusionment）"——最初对AI的兴奋，正逐渐让位于对成本、规模化和ROI的现实考量。过去讨论的是AI Adoption（采用率），如今讨论的则是AI ROI。

连OpenAI CEO Sam Altman都承认，这种变化发生得非常快。他表示，今年年初，几乎没有企业会主动讨论AI成本；但短短几个月后，这已经成为客户最关心的问题。过去几个月，他听到最多的一句话就是：

"我们第一季度就花光了全年AI预算。

模型公司也补贴不起了
该有人买单了

当企业开始重新计算AI的经济账，模型公司也不得不改变自己的商业模式。

过去两年，为了抢占市场，OpenAI、Anthropic等公司普遍采用固定订阅（Flat Fee）模式，企业无论消耗多少Token，费用几乎保持不变，而不断上涨的推理成本则由模型公司自己承担。

这套模式在AI还是聊天机器人时代尚且能够维持，但AI Agent改变了游戏规则。

相比一次普通问答，一个AI Agent往往需要连续调用模型、反复推理、修改代码、验证结果，一个任务消耗的Token可能是传统聊天机器人的几十倍甚至上百倍。用户看到的只是"完成了一个任务"，模型公司承担的却是GPU被占用、电力被消耗、服务器持续运转和数据中心持续扩容的成本。

财务压力也开始迅速累积。根据《金融时报》披露的数据，OpenAI去年营收约130亿美元，运营亏损却高达209亿美元；即使剔除一次性会计因素，经营层面的现金消耗仍达到约80亿美元。

Anthropic虽然收入高速增长，却仍持续融资数百亿美元，用于采购GPU、建设数据中心，以及支撑Claude不断增长的推理需求。

这也解释了为什么这两家巨头计划在今年上市——对于这些仍处于高投入阶段的模型公司而言，持续获得资本市场支持，已经成为支撑算力扩张和模型迭代的重要前提。

不过，OpenAI最近又倾向于将IPO推迟到明年。据多家媒体报道，主要原因并非放缓扩张，而是顾问团队担心近期大型科技IPO上市后的市场表现不佳，希望等待更有利的市场环境，并争取实现更高的上市估值。

在计划上市之前，模型公司的商业模式已经开始发生变化。OpenAI、Anthropic以及GitHub Copilot等产品陆续放弃固定订阅，转向按实际使用量收费（Usage-based Pricing）。GitHub更是在博客中坦言，公司过去一直在承担不断上涨的AI推理成本，固定价格模式已经“无法持续（no longer sustainable）”。

正如投资机构Sure Valley Ventures管理合伙人Barry Downes所说：“过去一年，很多AI产品实际上都在补贴用户使用量，以争夺市场份额。现在，是时候有人来买单了。”

但这个账单，并不会只落到某一家公司头上。

企业会以更高的AI订阅费、更严格的Token配额和更复杂的成本管理来买单；模型公司会以更高的推理成本、更低的毛利率和更难讲的盈利故事来买单；创业公司会以更贵的API成本和更难成立的商业模型来买单；投资人则会以更长的回本周期和更低的估值容忍度来买单。

Tokenmaxxing看起来像一个玩笑，最后却戳中了整个行业最真实的问题：当一个行业把资源消耗包装成增长，它迟早要为这套增长叙事付费。

AI真正应该比拼的，不是谁烧掉更多Token，而是谁能用更少的Token，把事情做得更好。

否则，今天烧的是Token，明天反噬的，就是AI自己讲出来的增长故事。

文：王茜茜 / 数据猿

责编：凝视深空 / 数据猿

教你如何用一行代码烧掉50000个Token

AI行业正在重复苏联工厂的错误

长长的账单把老板打醒了

模型公司也补贴不起了该有人买单了

教你如何用一行代码
烧掉50000个Token

模型公司也补贴不起了
该有人买单了