小米MiMo降价背后:算力平权与技术信号释放
雷军这次对 MiMo-V2.5 系列动刀,最高 99% 的永久降价,根本不是简单的“价格战”,而是一场蓄谋已久的“算力平权”运动。这等于直接扔掉了大模型付费时代的车票,把 API 价格打到了地板价。这背后至少释放了三个强烈的技术信号。
第一个信号,技术降本不再是空话,而是工程化的铁证。 能打到 0.025 元/百万 tokens 这种近乎免费的水平,靠的是推理系统底层的重构。小米技术团队基于 SGLang HiCache 搞定了 Sliding Window Attention,把显存和内存间的数据搬运量砍到了原来的 1/7,缓存命中率飙升。这不是简单的烧钱补贴,是实打实通过算法优化把单位服务成本压下去了,这是技术成熟后才能干的事。
第二个信号,计费逻辑在向开发者彻底倾斜。 取消上下文窗口计费,优化 Token Plan 让同等价格用量提升 5 到 8 倍,这让开发者在做复杂 Agent 或代码生成时,再也不用像算账一样抠抠搜搜地计算窗口长度。MiMo-V2.5-Pro 刚拿了全球开源模型综合智能指数和 Agent 指数的并列第一,反手就把价格打成白菜价,这是想通过极致的性价比,把开发者牢牢锁在小米的生态里,降低 AI 应用的创新门槛。
第三个信号,这是小米“人车家全生态”的算力底座在发牌。 雷军头天晚间刚公布一季度研发投入 90 亿、未来三年要在 AI 砸 600 亿,第二天一早就宣布大降价。这不是巧合。随着 AIoT 平台连接设备超 11 亿,小米的野心是要让 MiMo 无处不在。降价是为即将到来的端侧 AI 和智能座舱场景铺路,让算力像水电一样流到车机、手机和全屋智能里。
这一轮降价,小米不是在卖模型,而是在发通往下一个 AI 时代的入场券。

