1. 模型发布与开源信息

MiMo V2.5 Pro 是近期发布的最新开源模型,其完整权重已在 HuggingFace 平台以 MIT 许可证 正式公开,允许用户自行部署。相比标准版 V2.5,Pro 版本体积更大,且为原生 Omni-to 模型。基于初步表现,该模型有望成为当前性能最强的开源模型之一。

2. 核心参数与性能基准

模型总参数量超 1 万亿,采用 混合专家(MoE)架构,激活参数为 420 亿。架构上融合了 混合注意力机制MTP(多令牌预测) 技术,可显著提升 Token 生成速度。上下文窗口达 100 万,最大输出长度支持 128K。定价策略为输入 $2/百万 Token,输出 $6/百万 Token。基准测试显示其综合表现优于同期闭源模型(如 Opus 4.6 与 GPT-54),且基础模型同步开源,为社区二次开发(如微调小型模型)提供了便利。

3. 测试环境与任务设定

测试通过 OpenRouter 接入,优先使用 Web 聊天界面以快速评估模型在多样化任务中的泛化能力。本次采用经典的 Browser OS Test v2.5 框架,核心要求为:在 5 个预设应用中实现 2 个功能完整的 3D 游戏(其中必须包含 1 个 GTA 克隆版),实现更换壁纸功能,并自主设计一项特色功能。

4. 实际测试表现与结果分析

模型经过超 11 分钟 的深度思考后生成脚本。生成的 OS 界面视觉呈现极具创意,但存在明显的画面闪烁问题。基础交互功能正常:右键菜单响应灵敏,右下角时钟显示准确,开始菜单布局整洁。壁纸更换功能可通过右键菜单成功调用。GTA 应用因连续报错未能运行,但计算器功能完全正常。终端(Neoetch)运行流畅,系统状态显示内存占用约 9.5MB,推测为资源受限环境导致部分 3D 应用无法加载。作者对终端界面的黄绿色主题设计表示认可。