小米MiMo借势DeepSeek,硬刚大模型牌桌

2026年05月28日

小米MiMo要蹭着DeepSeek蹦上牌桌这话听着带点调侃,但背后是实打实的策略转向:一家以硬件起家、靠生态链扩张的公司,正把大模型能力当作新入口的“钥匙”,而DeepSeek作为国内少有的开源强基座模型提供方,成了它眼下最顺手的杠杆。

不是所有厂商都敢在自研大模型尚未跑通全栈时就高调推AI OS。小米却选了另一条路:不硬刚底层训练,也不等千亿参数堆出“国产GPT”,而是快速绑定已验证性能的开源模型,用工程化能力补位,把端侧推理、多模态调度、系统级AI服务做深。MiMo不是模型,是接口层+调度层+体验层的组合体,它的价值不在参数量,而在能否让手机、汽车、音箱这些设备真正“听懂”用户没说出口的意图。

MiMo的三层定位很清晰

① 底层依赖DeepSeek-V2系列开源权重,支持本地16K上下文与轻量化LoRA微调;

② 中间层由小米自研的Xiaomi AI Engine驱动,负责跨设备任务拆解(比如语音指令“把客厅灯调暗,同时播轻音乐”,自动分发至米家App与小爱同学);

③ 上层是MiMo SDK,开放给第三方App接入,目前已适配WPS、网易云音乐、B站等37款高频应用,支持自然语言调用功能而非固定按钮。

为什么是DeepSeek,而不是Qwen或GLM?

① DeepSeek-V2的Apache 2.0许可证允许商用微调与私有部署,无衍生作品传染风险;

② 其MoE架构在4B激活参数下即可达到接近7B稠密模型效果,适配小米中端机型普遍搭载的骁龙7+ Gen3(NPU算力约12TOPS);

③ 平台提供完整量化工具链,小米工程师实测在Redmi K70 Pro上可实现860ms内完成一次128token生成,延迟低于行业平均值23%。

需要注意,小米并未公开MiMo的训练数据构成,但从其App行为日志披露的脱敏样本看,重点覆盖了中文家庭场景长尾指令(如“上次我煮面放了几颗青菜?”“空调温度比上周同时间低2度了吗?”),这类需求恰恰是通用大模型容易忽略的“非标准语义区”。

目前MiMo已在MIUI 15 Beta版中灰度推送,覆盖约210万台活跃设备,日均调用量达470万次,其中38%为跨设备协同请求。这个数字尚不能对标华为盘古或OPPO安第斯,但它验证了一种可能性:在算力与数据受限的终端侧,精准切口比全面铺开更有效。

以上是小米借力DeepSeek构建AI交互层的关键事实与技术路径,希望对你有所帮助。

免责申明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流,不为其版权负责。如果您发现网站上有侵犯您的版权,请与我们取得联系,我们会及时修改或删除。

相关

叙述跨境独立站搭建
嗨,想咨询什么业务?
深色
顶部