AI交易的核心变量正在从“技术是否可行”转向“成本是否可承受”。随着Token价格快速下行,市场开始重新审视AI推理需求、企业支出回报与相关资产估值之间的关系。

高盛One-Delta部门负责人Rich Privorotsky在最新交易观点中指出,DeepSeek据称将Token定价下调75%,小米MiMo降价幅度接近99%,AI生态中的成本压缩问题已难以忽视。他认为,这种变化可能触发类似补贴竞争后的“价格战”逻辑。

这一变化正在重塑市场对AI基础设施的判断。他指出,基础设施瓶颈终会缓解,市场不应为“即将被解决的问题”支付过高溢价。Token支出持续走高,开源模型关注度明显升温,而编码助手安装量已进入平台期。

对投资者而言,问题已不再是AI需求是否增长,而是低成本Token会否先于新应用场景的全面爆发,替代高成本推理,从而形成一段收入压力期。短期来看,月底流动性、散户资金与机构观望情绪仍可能支撑半导体和动量交易,但估值溢价与集中度风险正在累积。

成本压缩成为AI叙事的新变量

过去半年,AI投资叙事的焦点主要是技术能力。现在,市场开始转向单位经济模型。

AI技术对部分工作负载、部分用户、部分场景已经证明有效。但新的问题是,企业级规模下的单位经济是否成立,以及这种改善能否在实验室和云服务提供商所需的收入轨迹内实现。

乐观情形依赖两个条件:编排能力成熟,以及单位成本在12至18个月内明显改善。悲观情形则是,更多企业高管开始公开表示AI支出无法证明其价值,并削减使用量。

这使“Token经济学”成为AI估值中的承重变量。换言之,市场不仅要看AI使用量,还要看每单位使用量能否产生足够收入与利润。

低价Token可能先冲击高成本推理

Rich Privorotsky提出的关键问题是,Token成本快速下降是否会暂时打破Jevons paradox需求扩张逻辑。

Jevons paradox指的是,资源使用效率提高后,总体消费反而增加的现象。应用到AI上,成本越低,长期需求可能越大。但争议在于,需求扩张是否会立即发生。

如果更便宜的Token首先替代原本价格更高的推理服务,而不是立刻创造全新使用场景,那么AI收入增长可能出现时间差。市场需要评估,这段滞后期会对云服务商、模型公司以及AI基础设施需求造成多大压力。

成本逻辑重塑采购

开源模型热度上升,正在改变企业AI采购逻辑。

当“以10%的成本获得90%的输出”变得越来越可行时,企业可能更认真地审视Token支出。Token支出的理性化可能会在第二、第三季度成为董事会层面的重要议题,其重要性可能不低于AI增长叙事本身。

这意味着,AI行业面临的不是需求消失,而是需求结构改变。企业可能继续使用AI,但会更倾向于压低推理成本,减少对昂贵前沿模型的依赖,并在不同任务中选择更低成本的替代方案。

对市场而言,这种变化可能影响AI价值链内部的收益分配。高成本推理、数据中心扩张和高估值基础设施资产,都会面临更严格的投资回报审查。

半导体动量仍强,但脆弱性上升

尽管Token价格战带来新的估值问题,Rich Privorotsky认为,短期市场仍可能继续上涨。

他指出,月底流动性因素可能继续机械性支撑动量交易和半导体板块。散户资金仍然强劲,机构投资者可能仍比应有水平更怀疑,这种怀疑反而继续支撑行情上行。

同时,AI相关半导体交易已经经历强烈挤仓,每一次回调都被积极买入。上行波动率仍受到追捧,下行恐慌持续回落,但部分结构已经显得拉伸。

这也解释了当前市场的矛盾:短期资金面和仓位因素仍支持上涨,但Token经济学的变化正在削弱部分长期估值假设。对投资者而言,风险不是AI叙事终结,而是叙事内部的利润池重新定价。

瓶颈会缓解,溢价未必安全

Rich Privorotsky并未否定AI长期前景。他认为,AI建设最终可能被证明是正确的,并可能像互联网一样改变世界。

但他同时提醒,市场不应结构性做空人类创造力。历史上,瓶颈往往会被解决:内存短缺会缓解,电力短缺会吸引投资,约束条件会逐步放松。

这对市场构成双重含义。一方面,AI基础设施瓶颈不一定能长期支撑高价格和高利润率。另一方面,成本下降和效率提升也可能在更长周期内释放更大需求。

当前真正的问题,是市场是否已经为这一过程支付了过高溢价。随着“Token战争”开启,投资者需要更精细地区分AI需求增长与AI成本压缩之间的影响,而不是简单将二者都简单视为利好。