小米正式开源XiaomiMiMo-V2-Flash——一款由小米自主研发、专为极致推理性能优化的MoE大模型,总参数量达309B(激活参数仅15B)。该模型创新性融合Hybrid注意力机制与多层级MTP推理加速技术,在多项Agent能力评测中稳居全球开源模型前两名;其代码生成能力超越所有现有开源模型,与顶级闭源模型Claude4.5Sonnet持平,而推理成本仅为后者的2.5%,生成速度更提升至2倍,真正实现了大模型效果与效率的双重突破。MiMo-V2-Flash模...
小米正式开源 xiaomi mimo-v2-flash——一款由小米自主研发、专为极致推理性能优化的 moe 大模型,总参数量达 309b(激活参数仅 15b)。该模型创新性融合 hybrid 注意力机制与多层级 mtp 推理加速技术,在多项 agent 能力评测中稳居全球开源模型前两名;其代码生成能力超越所有现有开源模型,与顶级闭源模型 claude 4.5 sonnet 持平,而推理成本仅为后者的 2.5%,生成速度更提升至 2 倍,真正实现了大模型效果与效率的双重突破。
MiMo-V2-Flash 模型整体架构如下:
MiMo-V2-Flash 核心设计亮点:
采用比例为 5:1 的 Sliding Window Attention(SWA)与 Global Attention(GA)协同结构,滑动窗口大小设为 128,原生支持 32K 上下文,并在训练中扩展至 256K。大量前期实验表明,SWA 在通用性、长文本建模及推理稳定性方面全面优于主流 Linear Attention,同时具备固定尺寸的 KV Cache,极大简化了与现有训练与推理基础设施(Infra)的集成适配流程。
通过 Multi-Token Prediction(MTP)方式强化基座模型能力,并在推理阶段实现多 Token 并行验证,有效缓解传统自回归解码在大 Batch 场景下的显存带宽瓶颈。实测数据显示:启用 3 层 MTP 后,接收长度提升 2.8~3.6 倍,端到端推理加速比达 2.0~2.6 倍。
综上,MiMo-V2-Flash 凭借模型结构与训推系统深度协同的创新设计,可在不同硬件平台上灵活调节 Batch Size 与 MTP 层数,充分释放 GPU 算力,兼顾

高吞吐、低延迟与极致推理性能。
Xiaomi MiMo-V2-Flash 全量模型权重与推理代码均已开源。配套 API 当前限时免费开放,Web 版 Demo 已正式上线。
访问 platform.xiaomimimo.com,即可无缝接入 Claude Code、Cursor、Cline、Kilo Code 等主流开发框架。
立即前往 MiMo Studio Web 端:aistudio.xiaomimimo.com,免费体验模型能力。
源码地址:点击下载
相关推荐:
AI写作生成免费让创作更轻松,让内容更精彩
SEO是什么职业的简称?了解SEO背后的无限商机,足球ai 广告
AI写作免费文章,让创作更轻松高效
WordPress文章更新自动推送至QQ群,提升你的内容传播效率!,AI智能肌肤侦测
SEO合同:确保您网站优化成功的关键保障,微博营销推广规则最新
SEO优化介绍:提升网站排名,赢得搜索引擎青睐
想通过做问卷调查赚钱,这七个平台不容错过!
AI工具,让工作效率翻倍:AI工具教程全面解析
AI写作免费一键生成下载,助您轻松创作!
SEO云优化:引领数字营销新时代的利器
AI办公软件排名:提升办公效率的必备利器,带ai录音笔好用吗
2024年SEO指南:提升网站排名的全方位策略
AI办公软件排名:2024年最强智能办公工具推荐,ai 打散路径
AI撰写率:让创作变得更高效,助力内容产业腾飞,AI证件照apk破解版
AI网页效果生成:开启网站设计的新纪元,ai 人像背景
AI生成网页模板,轻松打造专业网站,ai准备辩论
用AI写的文章算原创吗?真相揭示,带你深度思考!
SEO优化方案及报价:为您的网站带来可持续的流量增长
SEO优化网站价格如何选择最具性价比的优化方案?
怎么让AI写文章,轻松实现内容创作的智能化
SEO做法-提升网站流量与排名的关键秘诀,屏东网站推广招聘
ChatGPTO1Pro模型:开启AI新纪元,免费应用带来无尽可能,ai电销机人
SEO优化优势:助力企业在激烈竞争中脱颖而出
SEO如何做:让你的网站在搜索引擎中脱颖而出,ai卢
AI网站开发与代码创新:引领未来数字化变革的关键,ai文字绕排后字消失
SEO应该如何提升网站流量与排名?揭秘成功的SEO策略,肺炎疫苗推广营销
AI写作智能生成:让文字创作进入全新时代
ChatGPT最近不好用了?了解这些背后的原因与解决方案,汽车插画ai
SEO优化怎么做的?全面指南让你快速提升网站排名
【干货】小白如何在百度联盟上月赚3000+?实操经验分享