大模型厂商，是时候告别Token狂欢了,dacum模型

文 | 伯虎财经（bohuFN），作者 | 楷楷

“低价卖Token并对第三方开放，看起来很友好，但那是一个陷阱。”

近日，小米集团MiMo负责人罗福莉在X平台发文，将Token价格战比喻为“陷阱”，提醒大模型公司不应该盲目参与价格战。

几天之前，Anthropic突然宣布切断第三方工具对Claude订阅的访问权限，这也是罗福莉发文讨论Token定价逻辑的契机。

在这场全民“养龙虾”的Token狂欢中，罗福莉的公开信和Anthropic的“封杀令”，成为行业中罕见的“不同声音”，给这股热潮泼下了冷水。

但问题是，大模型厂商当真算不清这笔成本账？还是说，这只是行业一场心照不宣的博弈，用狂烧的Token换取一张通往未来的入场券，赌的是AGI的未来。

如果是这样的话，谁还能叫醒一个正在装睡的人。

01 Anthropic撑不住了

几天前，Anthropic向所有用户发送邮件，宣布自当地时间4月4日下午3点起，Claude Pro和Max订阅将不再覆盖OpenClaw等第三方工具的使用。

事出突然，Anthropic给用户送了一笔一次性补贴，金额刚好等于一个月订阅费。但相较于从前花200美元月费就能无限量调用Claude的好日子，这笔补贴显然只是杯水车薪。

消息一出，社交媒体瞬间炸锅，用户们破口大骂，铺天盖地都是“过河拆桥”的论调，因为OpenClaw创始人彼得·斯坦伯格跟Anthropic的恩怨早已有之。

OpenClaw最初上线时命名为Clawdbot，由于名字跟Anthropic旗下的Claude高度相似，被Anthropic一份律师函要求改名，梁子算是结下了。

更重要的是，在OpenClaw验证了市场对开源智能体的需求后，Anthropic随即推出了Claude Cowork，除了安全考量之外，这也被认为是想用自家产品取代OpenClaw。

但这些都不足以解释“封杀令”的全部，真正让Anthropic下决心动刀的，是成本问题。

Anthropic在用户信中提到，“第三方工具对系统造成了过大的压力，我们必须优先保障使用我们核心产品的用户体验。”

外媒称明星独角兽Cursor曾在去年进行估算，发现每月200美元的Claude Code订阅可能消耗高达2000美元的计算资源，说明Anthropic一直在进行巨额补贴；也有其他分析师指出，Anthropic订阅制实际消耗的算力成本或高达5000美元。

这意味着，大模型曾经的订阅收费模式，在Agent时代恐怕难以跑通。

一方面，在Agent模式下，Token使用量正以几何级增长速度膨胀。

当大模型还停留在对话层面时，单轮对话大约消耗1000-3000个Token，平台只要统计出一个代表大部分用户的用量均值，就可以跑通订阅制。

但在Agent场景中，一个用户背后可能同时跑着10个甚至100个Agent，每个Agent都在

7×24小时地执行任务，每次任务都会触发多次模型推理，随着交互次数不断增多，就形成了“滚雪球式”的Token消耗，靠“少用”补贴“多用”的订阅制也就失去了平衡。

作为参考，一个普通ChatGPT用户即使天天聊天，月消耗也不过百万级；而一个重度“养虾”用户，日均消耗Token则在3000万-1亿之间。

但另一方面，大模型企业的成本并没有随着用量暴增而自然下降，反而越走越高。

斯坦福大学的《2025年人工智能指数报告》指出，在高效小模型的驱动下，GPT-3.5 级别的模型推理成本已在过去两年间下降到了原来的1/280，硬件成本每年下降 30%。

只是，推理成本虽然下降了，但训练成本却依然惊人。更重要的是，全球算力依然处于紧缺阶段，越多用户扎堆使用Agent，越推高了企业的运营成本。

以OpenAI为例，其对投资者表示，预计到2028年算力支出将达到1210亿美元，届时亏损可能会达到850亿美元，或将超越已有上市公司的亏损记录。

虽然Anthropic的训练成本没那么高，约为OpenAI的40%左右，但当下也依然处于烧钱状态，其自然不想再被第三方工具白薅羊毛。

（图：OpenAI与Anthropic训练成本对比）

02 卷Token价格是陷阱

Anthropic撑不住了，国产大模型企业又如何呢？

罗福莉可能是最能共鸣Anthropic的同行，她在社交平台发文，称 Claude Code大概率不赚钱，甚至可能在亏损，因为Claude Code的定价逻辑要成立，前提是用户必须用 Anthropic 自己的框架，否则就会出问题。

她以OpenClaw作为案例，指出接入第三方框架可能带来的问题：

“我观察过OpenClaw的上下文管理，很糟糕。在单次用户查询里，它会触发多轮低价值工具调用，每次都是携带长上下文的独立API请求，往往超过10万Token。”

简单来说，同一件事，OpenClaw会比Claude Code原生框架多跑几遍，实际成本会达到订阅价格的数十倍。在成本结构上，即便是使用OpenClaw的轻度用户，也等同于重度用户。

因此，低价售卖Token并对第三方开放看似对用户友好，实则是陷阱。企业为了控制成本，只能降低算力或用更便宜的低智模型；用户在低智模型上反复碰壁，使用体验也并不好。

可是，罗福莉这番发言却是国内大模型行业中“少数的声音”。至少在当下，大部分大厂及大模型企业还是将Token吞吐量视为衡量实力的重要指标。

全球大模型聚合路由平台OpenRouter数据显示，中国大模型的单周调用量已连续一个月超过海外模型，调用量位于前列的都是国产模型，比如小米、阶跃星辰、Minimax等。

全球科技大厂也在推波助澜，比如鼓励员工多使用AI工具，Meta甚至列出了Token 消耗量排行榜，这已成为科技大厂的隐性KPI。

因此，Token之所以贵，不仅仅在于居高不下的成本，更因为这是一场暂时还看不到尽头的消耗战，当所有人都在拼命消耗更多Token，算力便永远追不上被制造出来的需求。

况且，比起Token消耗到底是不是虚假繁荣这个问题，大模型企业，更难抵御的是真金白银的诱惑——在短短3个月里，Anthropic的年化收入便从90亿美元飙升至300 亿美元。

卷Token价格或许是“陷阱”，但在全球大模型厂商“你追我赶”之际，谁都不愿意先踩下“刹车”。

对于阿里、字节、腾讯等一线科技公司而言，大家围绕AI超级入口争夺已久，但还是无法摆脱“烧钱换流量”的互联网打法，发红包、增投流能激活DAU，可一旦没有了“钞能力”，用户也会快速流失。

“龙虾”则成为了新的契机。用户完成部署后，就相当于将自己的“智能体助手”嵌入了某个云平台，不仅会产生源源不断的Token消耗，个人数据也会沉淀在生态体系内，迁移成本将变得越来越高，大厂自然不会放过这个新的“生态入口”。

对于Kimi、智谱等二线厂商而言，“龙虾”的出现带动了算力需求，让它们的模型能够被调用起来，API增长也有故事可讲，这足以驱动它们更卖力地销售API。

从逻辑上来讲，罗福莉对于Token的评价是对的，“价格内卷”不可能一直持续。但对于因为“龙虾”而跑通增长叙事的大模型厂商而言，大家或许还想再“装睡”一会儿。

03 效率比价格更重要

谁也无法叫醒一个装睡的人，但现实或许可以——越来越高的Token消耗量并没有带来相应的利润增长，这也是大模型企业无法回避的问题。

以全面对标Anthropic的智谱为例，其在2025年交出了一份“高增长、高亏损”的成绩单：全年总收入7.24亿元，同比大增131.9%；全年亏损47.18亿元，同比扩大59.5%。

智谱创始人张鹏曾表示，智谱要成为Anthropic的平替，甚至开玩笑称Anthropic卖200美元，我们就卖200元人民币。今年3月，智谱发布了一键安装的AutoClaw，个人版39元/月/3500万Tokens，99元/月/1亿Tokens，门槛确实不高。

但背后的账单也非常沉重。2025年，智谱的研发开支为31.8亿元，同比增长44.9%；没有基础设施的智谱，还需要给第三方算力供应商支付高额的采购费，从2022 年的1463万元飙升至2025 年上半年的 11.45亿元。

面对无法绕开两大刚性支出——研发投入与算力成本，进入2026年以来，国内外云厂商陆续对AI算力、存储等相关产品进行调价，但国内模型相较于海外模型而言，依然便宜。

根据民银证券2025年12月发布的研报，国内大模型API平均价格约为 3.88 元/百万 Tokens，而海外模型约为20.46 元/百万 Tokens，是国内模型 API 价格的5倍以上。

价格优势带来了规模需求，在这一背景下，国内大模型厂商恐怕暂时还不会摆脱价格战。但在Token消耗大于供给的当下，逐渐收紧免费额度和补贴也是大势所趋。

罗福莉提到，大模型行业的出路不是更便宜的Token，而是“更高token效率的Agent框架”叠加“更强大高效的模型”，Agent时代不属于烧算力最多的人，而是用算力最聪明的人。

这将推动大模型厂商往两个方向发展：

一方面，从“算力规模”转向“工程效率”的竞争，单纯卖API的企业将面临越来越近的天花板，要将模型层跟智能硬件、应用产品等深度结合起来，才能为商业模式注入更多可能性。

另一方面，推动Token收费的分层定价。当下，主流大模型的计费方式基本上涵盖了订阅制、按量计费以及Token Plan套餐，即超额后再按量付费。

长远来看，Token定价除了简单地“按量分层”，还可以按推理能力、任务数量等维度推出更精细化的付费体系，既能让平台缓解算力峰值的压力，也能进一步增加收入。

比如DeepSeek悄悄上线了“快速模式”和“专家模式”两个入口，被认为是分成模式的一种全新探索；火山引擎谭待表示，未来可能会孵化出垂直领域的智能体，按回答问题的数量收费。

当下，Token狂欢或许还会持续一段时间，但对整个大模型来说，Token成本已经成为每一个企业和用户都无法忽视的成本因素。

说到底，大模型从来不是一门纯粹的技术生意，而是一场关于效率与价值的博弈。大模型企业想做长久的生意，自然也要学会算账，只有脚踏实地，才能更好仰望星空。