文 | 伯虎财经(bohuFN),作者 | 楷楷
“低价卖Token并对第三方开放,看起来很友好,但那是一个陷阱。”
近日,小米集团MiMo负责人罗福莉在X平台发文,将Token价格战比喻为“陷阱”,提醒大模型公司不应该盲目参与价格战。
几天之前,Anthropic突然宣布切断第三方工具对Claude订阅的访问权限,这也是罗福莉发文讨论Token定价逻辑的契机。
在这场全民“养龙虾”的Token狂欢中,罗福莉的公开信和Anthropic的“封杀令”,成为行业中罕见的“不同声音”,给这股热潮泼下了冷水。
但问题是,大模型厂商当真算不清这笔成本账?还是说,这只是行业一场心照不宣的博弈,用狂烧的Token换取一张通往未来的入场券,赌的是AGI的未来。
如果是这样的话,谁还能叫醒一个正在装睡的人。
01 Anthropic撑不住了
几天前,Anthropic向所有用户发送邮件,宣布自当地时间4月4日下午3点起,Claude Pro和Max订阅将不再覆盖OpenClaw等第三方工具的使用。
事出突然,Anthropic给用户送了一笔一次性补贴,金额刚好等于一个月订阅费。但相较于从前花200美元月费就能无限量调用Claude的好日子,这笔补贴显然只是杯水车薪。
消息一出,社交媒体瞬间炸锅,用户们破口大骂,铺天盖地都是“过河拆桥”的论调,因为OpenClaw创始人彼得·斯坦伯格跟Anthropic的恩怨早已有之。
OpenClaw最初上线时命名为Clawdbot,由于名字跟Anthropic旗下的Claude高度相似,被Anthropic一份律师函要求改名,梁子算是结下了。
更重要的是,在OpenClaw验证了市场对开源智能体的需求后,Anthropic随即推出了Claude Cowork,除了安全考量之外,这也被认为是想用自家产品取代OpenClaw。
但这些都不足以解释“封杀令”的全部,真正让Anthropic下决心动刀的,是成本问题。
Anthropic在用户信中提到,“第三方工具对系统造成了过大的压力,我们必须优先保障使用我们核心产品的用户体验。”
外媒称明星独角兽Cursor曾在去年进行估算,发现每月200美元的Claude Code订阅可能消耗高达2000美元的计算资源,说明Anthropic一直在进行巨额补贴;也有其他分析师指出,Anthropic订阅制实际消耗的算力成本或高达5000美元。
这意味着,大模型曾经的订阅收费模式,在Agent时代恐怕难以跑通。
一方面,在Agent模式下,Token使用量正以几何级增长速度膨胀。
当大模型还停留在对话层面时,单轮对话大约消耗1000-3000个Token,平台只要统计出一个代表大部分用户的用量均值,就可以跑通订阅制。
但在Agent场景中,一个用户背后可能同时跑着10个甚至100个Agent,每个Agent都在
7×24小时地执行任务,每次任务都会触发多次模型推理,随着交互次数不断增多,就形成了“滚雪球式”的Token消耗,靠“少用”补贴“多用”的订阅制也就失去了平衡。
作为参考,一个普通ChatGPT用户即使天天聊天,月消耗也不过百万级;而一个重度“养虾”用户,日均消耗Token则在3000万-1亿之间。
但另一方面,大模型企业的成本并没有随着用量暴增而自然下降,反而越走越高。
斯坦福大学的《2025年人工智能指数报告》指出,在高效小模型的驱动下,GPT-3.5 级别的模型推理成本已在过去两年间下降到了原来的1/280,硬件成本每年下降 30%。
只是,推理成本虽然下降了,但训练成本却依然惊人。更重要的是,全球算力依然处于紧缺阶段,越多用户扎堆使用Agent,越推高了企业的运营成本。
以OpenAI为例,其对投资者表示,预计到2028年算力支出将达到1210亿美元,届时亏损可能会达到850亿美元,或将超越已有上市公司的亏损记录。
虽然Anthropic的训练成本没那么高,约为OpenAI的40%左右,但当下也依然处于烧钱状态,其自然不想再被第三方工具白薅羊毛。
(图:OpenAI与Anthropic训练成本对比)
02 卷Token价格是陷阱
Anthropic撑不住了,国产大模型企业又如何呢?
罗福莉可能是最能共鸣Anthropic的同行,她在社交平台发文,称 Claude Code大概率不赚钱,甚至可能在亏损,因为Claude Code的定价逻辑要成立,前提是用户必须用 Anthropic 自己的框架,否则就会出问题。
她以OpenClaw作为案例,指出接入第三方框架可能带来的问题:
“我观察过OpenClaw的上下文管理,很糟糕。在单次用户查询里,它会触发多轮低价值工具调用,每次都是携带长上下文的独立API请求,往往超过10万Token。”
简单来说,同一件事,OpenClaw会比Claude Code原生框架多跑几遍,实际成本会达到订阅价格的数十倍。在成本结构上,即便是使用OpenClaw的轻度用户,也等同于重度用户。
因此,低价售卖Token并对第三方开放看似对用户友好,实则是陷阱。企业为了控制成本,只能降低算力或用更便宜的低智模型;用户在低智模型上反复碰壁,使用体验也并不好。
可是,罗福莉这番发言却是国内大模型行业中“少数的声音”。至少在当下,大部分大厂及大模型企业还是将Token吞吐量视为衡量实力的重要指标。
全球大模型聚合路由平台OpenRouter数据显示,中国大模型的单周调用量已连续一个月超过海外模型,调用量位于前列的都是国产模型,比如小米、阶跃星辰、Minimax等。
全球科技大厂也在推波助澜,比如鼓励员工多使用AI工具,Meta甚至列出了Token 消耗量排行榜,这已成为科技大厂的隐性KPI。
因此,Token之所以贵,不仅仅在于居高不下的成本,更因为这是一场暂时还看不到尽头的消耗战,当所有人都在拼命消耗更多Token,算力便永远追不上被制造出来的需求。
况且,比起Token消耗到底是不是虚假繁荣这个问题,大模型企业,更难抵御的是真金白银的诱惑——在短短3个月里,Anthropic的年化收入便从90亿美元飙升至300 亿美元。
卷Token价格或许是“陷阱”,但在全球大模型厂商“你追我赶”之际,谁都不愿意先踩下“刹车”。
对于阿里、字节、腾讯等一线科技公司而言,大家围绕AI超级入口争夺已久,但还是无法摆脱“烧钱换流量”的互联网打法,发红包、增投流能激活DAU,可一旦没有了“钞能力”,用户也会快速流失。
“龙虾”则成为了新的契机。用户完成部署后,就相当于将自己的“智能体助手”嵌入了某个云平台,不仅会产生源源不断的Token消耗,个人数据也会沉淀在生态体系内,迁移成本将变得越来越高,大厂自然不会放过这个新的“生态入口”。
对于Kimi、智谱等二线厂商而言,“龙虾”的出现带动了算力需求,让它们的模型能够被调用起来,API增长也有故事可讲,这足以驱动它们更卖力地销售API。
从逻辑上来讲,罗福莉对于Token的评价是对的,“价格内卷”不可能一直持续。但对于因为“龙虾”而跑通增长叙事的大模型厂商而言,大家或许还想再“装睡”一会儿。
03 效率比价格更重要
谁也无法叫醒一个装睡的人,但现实或许可以——越来越高的Token消耗量并没有带来相应的利润增长,这也是大模型企业无法回避的问题。
以全面对标Anthropic的智谱为例,其在2025年交出了一份“高增长、高亏损”的成绩单:全年总收入7.24亿元,同比大增131.9%;全年亏损47.18亿元,同比扩大59.5%。
智谱创始人张鹏曾表示,智谱要成为Anthropic的平替,甚至开玩笑称Anthropic卖200美元,我们就卖200元人民币。今年3月,智谱发布了一键安装的AutoClaw,个人版39元/月/3500万Tokens,99元/月/1亿Tokens,门槛确实不高。
但背后的账单也非常沉重。2025年,智谱的研发开支为31.8亿元,同比增长44.9%;没有基础设施的智谱,还需要给第三方算力供应商支付高额的采购费,从2022 年的1463万元飙升至2025 年上半年的 11.45亿元。
面对无法绕开两大刚性支出——研发投入与算力成本,进入2026年以来,国内外云厂商陆续对AI算力、存储等相关产品进行调价,但国内模型相较于海外模型而言,依然便宜。
根据民银证券2025年12月发布的研报,国内大模型API平均价格约为 3.88 元/百万 Tokens,而海外模型约为20.46 元/百万 Tokens,是国内模型 API 价格的5倍以上。
价格优势带来了规模需求,在这一背景下,国内大模型厂商恐怕暂时还不会摆脱价格战。但在Token消耗大于供给的当下,逐渐收紧免费额度和补贴也是大势所趋。
罗福莉提到,大模型行业的出路不是更便宜的Token,而是“更高token效率的Agent框架”叠加“更强大高效的模型”,Agent时代不属于烧算力最多的人,而是用算力最聪明的人。
这将推动大模型厂商往两个方向发展:
一方面,从“算力规模”转向“工程效率”的竞争,单纯卖API的企业将面临越来越近的天花板,要将模型层跟智能硬件、应用产品等深度结合起来,才能为商业模式注入更多可能性。
另一方面,推动Token收费的分层定价。当下,主流大模型的计费方式基本上涵盖了订阅制、按量计费以及Token Plan套餐,即超额后再按量付费。
长远来看,Token定价除了简单地“按量分层”,还可以按推理能力、任务数量等维度推出更精细化的付费体系,既能让平台缓解算力峰值的压力,也能进一步增加收入。
比如DeepSeek悄悄上线了“快速模式”和“专家模式”两个入口,被认为是分成模式的一种全新探索;火山引擎谭待表示,未来可能会孵化出垂直领域的智能体,按回答问题的数量收费。
当下,Token狂欢或许还会持续一段时间,但对整个大模型来说,Token成本已经成为每一个企业和用户都无法忽视的成本因素。
说到底,大模型从来不是一门纯粹的技术生意,而是一场关于效率与价值的博弈。大模型企业想做长久的生意,自然也要学会算账,只有脚踏实地,才能更好仰望星空。