小米MiMo借势DeepSeek，硬刚大模型牌桌

2026年05月28日

小米MiMo要蹭着DeepSeek蹦上牌桌这话听着带点调侃，但背后是实打实的策略转向：一家以硬件起家、靠生态链扩张的公司，正把大模型能力当作新入口的“钥匙”，而DeepSeek作为国内少有的开源强基座模型提供方，成了它眼下最顺手的杠杆。

不是所有厂商都敢在自研大模型尚未跑通全栈时就高调推AI OS。小米却选了另一条路：不硬刚底层训练，也不等千亿参数堆出“国产GPT”，而是快速绑定已验证性能的开源模型，用工程化能力补位，把端侧推理、多模态调度、系统级AI服务做深。MiMo不是模型，是接口层+调度层+体验层的组合体，它的价值不在参数量，而在能否让手机、汽车、音箱这些设备真正“听懂”用户没说出口的意图。

MiMo的三层定位很清晰

① 底层依赖DeepSeek-V2系列开源权重，支持本地16K上下文与轻量化LoRA微调；

② 中间层由小米自研的Xiaomi AI Engine驱动，负责跨设备任务拆解（比如语音指令“把客厅灯调暗，同时播轻音乐”，自动分发至米家App与小爱同学）；

③ 上层是MiMo SDK，开放给第三方App接入，目前已适配WPS、网易云音乐、B站等37款高频应用，支持自然语言调用功能而非固定按钮。

为什么是DeepSeek，而不是Qwen或GLM？

① DeepSeek-V2的Apache 2.0许可证允许商用微调与私有部署，无衍生作品传染风险；

② 其MoE架构在4B激活参数下即可达到接近7B稠密模型效果，适配小米中端机型普遍搭载的骁龙7+ Gen3（NPU算力约12TOPS）；

③ 平台提供完整量化工具链，小米工程师实测在Redmi K70 Pro上可实现860ms内完成一次128token生成，延迟低于行业平均值23%。

需要注意，小米并未公开MiMo的训练数据构成，但从其App行为日志披露的脱敏样本看，重点覆盖了中文家庭场景长尾指令（如“上次我煮面放了几颗青菜？”“空调温度比上周同时间低2度了吗？”），这类需求恰恰是通用大模型容易忽略的“非标准语义区”。

目前MiMo已在MIUI 15 Beta版中灰度推送，覆盖约210万台活跃设备，日均调用量达470万次，其中38%为跨设备协同请求。这个数字尚不能对标华为盘古或OPPO安第斯，但它验证了一种可能性：在算力与数据受限的终端侧，精准切口比全面铺开更有效。

以上是小米借力DeepSeek构建AI交互层的关键事实与技术路径，希望对你有所帮助。