昊梵体育网

小米降价折射大模型行业三大本质转轨 小米这一波降价,砍向的不是友商,而是算力成本

小米降价折射大模型行业三大本质转轨
小米这一波降价,砍向的不是友商,而是算力成本那堵旧墙。99%的最高降幅听起来像是噱头,拆解其底层逻辑,能看到大模型行业正在经历三个本质性的转轨。
第一个,从“按量收费”丝滑切换到“技术变现”。直接看数字:MiMo-V2.5-Pro的输入缓存命中价压到了每百万tokens仅0.025元,输出降至6元。这种定价力度,说明小米团队在推理引擎上啃下了硬骨头。负责人罗福莉的说法很实在——基于SGLang HiCache对SWA的分层KV缓存优化,缓存成本直降80%。这种架构级的优化,意味着降价不是烧钱抢市场,而是真正把工程红利折现给开发者。
第二个,定价权正从单纯拼规模转向拼架构。很多人看到降价就喊“价格战”,忽略了雷军宣布降价的前一晚,MiMo-V2.5-Pro刚在国际权威的Artificial Analysis评测中拿了综合智能和Agent指数双料开源第一。性能能打、推理架构又有高稀疏比压低计算量,这种结构性成本优势才是小米敢喊“永久降价”的底气。
第三个,生态构建的优先级高于短期利润。同步优化的Token Plan“加量不加价”,同等价格用量提升5到8倍,配合不再区分上下文窗口长度的简化计费。这套组合拳瞄准的是降低上手门槛,吸引更多实体场景的开发者和企业接入。毕竟,再好的模型跑不满推理负载也是空转,用低价高质的API驱动真实需求、带动上游算力链条滚动,才是通往AGI的正循环。