微软Build 2026开发者大会 | Agent优先 | 七款自研AI模型 | 前沿微调 | Scout | ACS控制规范 | ASSERT | MXC执行容器 | Rayfin

大家好，这里是最佳拍档，我是大飞 6月2日微软在旧金山梅森堡举办了一年一度的Build开发者大会在这次大会上微软正式宣告了“Agent优先”时代的全面到来一口气发布了七款从零训练的自研AI模型还有从系统级安全沙箱到1P FLOPS算力的开发者工作站从能别在胸前的AI可穿戴设备

到量子计算的重大突破总共20多项更新覆盖了从芯片到云、从软件到硬件的全栈布局这标志着微软在AI领域的战略已经发生了根本性的转变从过去深度依赖OpenAI 到现在全面转向自研今天这期视频我就为大家详细拆解一下这次Build大会的所有内容看看微软为我们描绘的AI未来到底是什么样子的

在正式开始之前我们先回顾一下去年的Build大会 2025年微软在Build上第一次明确提出了“AI Agent时代”的方向发布了Copilot Studio多Agent编排工具、Windows AI

Foundry平台并且宣布全面支持模型上下文协议MCP 当时GitHub Copilot还推出了Coding Agent 如果说2025年微软解决的是Agent的标准和框架问题那么2026年的这次大会微软要解决的就是Agent真正落地的问题整场大会以微软CEO萨提亚·纳德拉（Satya

Nadella）的愿景陈述为主线展开在抛出Agent优先的战略框架后各业务线高管依次登台用一众具体产品把这套框架落地首先我们来看模型层面的更新这也是这次大会最核心的内容之一微软AI部门负责人穆斯塔法·苏莱曼（Mustafa Suleyman）在大会上宣布

推出七款由微软AI内部开发的全新模型统一归入MAI家族 MAI也就是Microsoft AI 苏莱曼将MAI的使命描述为构建一台爬山机器通过持续投入计算量、更优数据和更精准的评估实现循环往复的自我改进让用户始终保持在技术前沿

他还提到了一个数据用来训练前沿模型的计算量已经增长了一万亿倍预计未来三年内还将再增长一千倍而微软所有的MAI模型都坚持从零开始进行爬山零蒸馏的原则不依赖任何第三方模型的输出进行训练因为蒸馏技术虽然能快速提升小模型的性能但是也会带来数据来源不清晰、商业授权风险和能力天花板受限等问题

微软坚持从零训练就是为了从根源上保证模型的安全性、可控性和商业可用性在这七款模型中最受关注的无疑是旗舰推理模型MAI-Thinking-1 这是一个中型模型采用MoE混合专家架构拥有350亿激活参数总参数约1万亿，上下文窗口达到256K 微软表示它在关键的软件工程测试中

性能可以跟市面上最好的模型打平在盲测对比中人类评判员对它的偏好程度跟Anthropic的Sonnet 4.6不相上下特别值得一提的是这个模型没有针对特定基准做过优化完全是自然训练的结果

然后是编程模型MAI-Code-1-Flash 这是一个高效推理的编码模型只有50亿参数专为GitHub Copilot、VS Code和微软技术栈量身定制并且深度集成微软表示它的性能可以和Anthropic的Haiku媲美但是成本更低在SWE-bench Pro测试中

MAI-Code-1-Flash取得了51%的成绩对于一个50亿参数的小模型来说这个表现已经算是相当不错了文生图方面微软推出了MAI-Image-2.5以及Flash版支持文生图和图像编辑功能微软称 MAI-Image-2.5在Arena评分上超越了谷歌的Nano Banana Pro

在大模型竞技场图像编辑排行榜上排名第二目前这两款模型已经集成到了PowerPoint中用户可以直接在PowerPoint里生成和编辑图片未来还会推广到OneDrive等更多微软产品中

转录模型MAI-Transcribe-1.5具备SOTA级别的准确性速度比竞品模型快五倍内置支持43种语言的领域特定术语识别适合用于需要处理多语言音频内容的场景语音生成模型MAI-Voice-2则提供了高质量、自然听感的语音生成支持15种语言能够根据短样本适配声音

并且具备完善的防滥用保护措施它的Flash版也即将推出以更低的成本实现同样的功能特别适合实时语音交互的智能体场景所有这些MAI模型都共享相同的数据规范、基础设施和评估框架除了在Azure Foundry上分发以外这些模型还将在Open

Router、Fireworks和Baseten等第三方平台上向开发者提供更重要的是开发者能够自行调整模型的权重这对于企业定制化来说是一个巨大的利好意味着企业可以根据自己的业务需求对模型进行深度的个性化改造说到企业定制微软在大会上还介绍了一项非常重要的技术

叫做Microsoft Frontier Tuning 这是一种让企业用自身工作数据定制模型的方法萨提亚·纳德拉（Satya Nadella）解释说最有价值的数据不是通用语料而是Agent在企业里执行任务的真实轨迹、步骤和决策 Frontier

Tuning的逻辑就是把MAI模型接入实际的业务流程让模型在真实环境中边做边学这样一来企业就相当于构建了自己的模型在自己的环境中，用自己的数据训练由自己来控制模型机构的知识会成为模型的一部分并且只属于企业自己微软内部测试显示为Excel调整的MAI模型性能与GPT-5.4水平相当

但是效率提高了10倍全球知名咨询公司麦肯锡采用Frontier Tuning后 MAI在所有测试模型中实现了最高胜率同时成本降低了大约10倍在医疗健康领域微软还宣布与梅奥诊所合作共同打造一个用于医疗保健的前沿AI模型

这个模型将梅奥诊所的临床专业知识、去标识化的临床数据和纵向洞察与微软的基础AI能力结合有望在医疗诊断、患者管理、医学研究等方面发挥重要作用除了模型本身微软还在软硬件协同方面取得了重要进展 MAI模型正在与微软自研的Maia 200芯片进行协同设计通过软硬件联合优化

每瓦性能可以达到英伟达GB200的1.4倍目前Maia 200已经在美国爱荷华州投入运行计划今年晚些时候扩展到更多的区域讲完了模型我们再来看这次大会的另一个核心 Agent生态的全面落地微软在这次大会上正式宣告了向“Agent优先”的宏大转型目标是自动化知识工作者使用软件的方式

将AI助手植入到日常办公的每一个交互中这次发布的核心Agent产品叫做Scout 它被称为“永远在线”的AI Agent 构建在OpenClaw开源框架之上可以在微软Teams中像人类同事一样与你交互简单来说

Scout能浏览你的工作消息、日历和电子邮件收件箱自动完成各种任务重新安排有冲突的会议还能起草听起来非常专业的回复你可以在Teams中直接向它发送指令甚至可以为它取一个你喜欢的名字微软新任命的企业副总裁奥马尔·沙欣（Omar Shahin）解释了Scout的设计理念

它不是一个你需要主动去调用的工具而是一个24小时在线的虚拟同事帮你处理那些繁琐和重复的工作让你能专注于更有价值的事情 Scout会通过微软Frontier计划提供需要GitHub Copilot订阅微软目前还正在测试一款Scout桌面应用

将向选择了“Frontier”功能访问权限的订阅用户推出在微软内部销售部门目前是使用Scout最大、增长最快的群体除了Scout以外另一项重要的Agent产品是GitHub Copilot桌面应用 GitHub首席产品官马里奥·罗德里格斯（Mario

Rodriguez）介绍说这是一款构建在GitHub之上的、Agent原生的桌面体验通过统一的“My Work”视图开发者可以看到跨所有连接仓库的动态工作包括活动会话、议题、PR和后台自动化任务每个会话都在其自己的Git worktree中运行这样多个并行的Agent就不会互相干扰

开发者可以同时处理多个不同的项目这款应用还具备Agent Merge功能可以带领PR完成审查、检查和合并的整个流程最有意思的是Canvas界面它用于人机之间的双向交互让开发者可以检查、引导和验证Agent代表自己执行的工作全程掌控工作的进展和质量避免智能体出现错误或者不符合预期的行为

GitHub Copilot应用面向Windows 11、Windows 11 on Arm、Mac和Linux提供技术预览版同样需要GitHub Copilot订阅未来还会向Copilot

Free用户开放应用支持云端和本地沙箱两者都附带策略支持方便企业进行统一的管理和治理随着Agent变得越来越强大和自主一个不可回避的问题就是安全和治理 Agent越自主越有用但让它不受护栏约束地在企业网络上运行也就越危险微软将这个问题描述为一个“多层系统问题”

Agent与人类、工具、应用、模型以及其他Agent之间的每一次交互都会暴露新的攻击面同时引入不同的故障模式为了解决这个问题微软推出了一系列Agent安全治理工具首先是Agent控制规范，简称ACS 这是一个新的开源标准目的是为开发者提供更一致、更细粒度的方法来控制AI Agent的行为

ACS让开发、合规和安全团队能够为Agent定义策略文件明确规定Agent可以做什么、绝对不能做什么、何时需要人类批准以及应该记录哪些证据供后续审查 ACS会作为一个SDK发布附带了LangChain、OpenAI

Agents SDK、Anthropic Agents SDK、AutoGen、CrewAI、Semantic Kernel、Microsoft ExtensionsAI、MCP工具等插件由于策略可以写成单个文件它可以与Agent捆绑在一起跟随Agent穿越不同的框架和环境

这对于跨平台、跨系统的Agent部署来说是一个非常重要的特性它确保了智能体无论在什么环境下运行都能遵守相同的安全策略另一项重要的测试工具是ASSERT 全称是自适应规范驱动的评估与回归测试评分（Adaptive Spec-driven Scoring for Evaluation and

Regression Testing）这是一个开源框架通过AI将对目标、策略或预期行为的高级自然语言描述转化为结构化的评分测试具体来说 ASSERT会接收关于AI模型预期行为的简明语言描述

然后生成可接受与不可接受行为的集合、问题场景和测试用例然后针对目标系统运行这些测试并给出评分它还能记录AI系统所采取的路径包括中间操作和工具调用以便开发者检查失败的位置这大大降低了Agent测试的门槛让非专业测试人员也能轻松地对Agent的行为进行评估和验证

如果说ACS和ASSERT是在应用层为Agent设置护栏那么微软接下来推出的MXC 就是在操作系统层面为Agent划下了一道不可逾越的红线 MXC全称是微软执行容器（Microsoft Execution Containers）这是一个内置在Windows操作系统本身的、由策略驱动的执行层

微软Windows和设备执行副总裁帕万·达武鲁里（Pavan Davuluri）强调 MXC对于AI Agent的商业落地至关重要它围绕安全性、容器、隔离和用户控制让Agent对普通消费者和企业部署来说都足够安全

MXC本质上是一个SDK和策略模型嵌入在Windows和适用于Linux的Windows子系统（WSL）中提供微软所称的“可组合的沙箱频谱” 这个频谱的范围非常广从轻量级的进程隔离到轻量级虚拟机、Linux容器再到在Windows 365上运行的完整云实例

开发者可以根据Agent的风险等级和功能需求选择合适的隔离级别比如，对于简单的Coding Agent 使用轻量级进程隔离就足够了而对于需要访问敏感数据的企业级Agent 则可以使用虚拟机甚至云实例来进行隔离 MXC的另一个核心特性是身份绑定每个Agent都被绑定到一个身份要么是本地ID

要么是由Microsoft Entra支持的云预配身份这确保了Agent的每一个动作都可被归因、审计和治理也就是说如果一个Agent执行了违规操作企业可以准确地追溯到是哪个Agent、在什么时间、执行了什么操作

从而进行相应的处理目前MXC已经提供早期预览版与微软企业安全栈集成的Agent 365将于2026年7月推出预览版它将把Entra身份服务、Intune设备管理、Defender威胁防护和Purview数据治理能力层叠到MXC之上让IT部门能够集中管理所有智能体的隔离和安全策略

在合作伙伴方面 OpenAI、英伟达、Manus、Nous Research 也就是Hermes Agent背后的公司以及OpenClaw 都已经宣布将在MXC上构建他们的产品特别值得一提的是OpenClaw的合作这是创建者彼得·斯坦伯格（Peter

Steinberger）主动联系微软表达合作兴趣最终发展成了全面的平台级伙伴关系在大会的现场演示中 OpenClaw拿到了删除桌面文件的命令但是因为MXC被设置为只读模式所有的操作都被成功阻止了直观展示了MXC的强大安全能力

除了系统级的安全更新微软Edge浏览器也获得了重要的本地AI能力升级微软表示自Build 2025引入Phi-4-mini模型后团队根据开发者的反馈进一步扩展了端侧AI的能力这次主要带来了三项更新第一项是Aion-1.0-Instruct

这是一个比Phi-4-mini更小、更快、更高效的本地小语言模型它可以在GPU和CPU能力较弱的PC上运行目前以开发者预览版提供将于7月登陆Hugging Face 第二项是语言检测和翻译API 随Edge 148版本提供这两个API由Edge内置的端侧AI模型驱动

允许网站和浏览器扩展识别文本语言并且在不同语言对之间进行翻译微软称这个翻译服务提供快速、高质量的翻译支持超过145种语言并且针对网络上的翻译工作负载进行了优化最重要的是，这个服务是完全免费的第三项是通过Web Speech API实现语音识别

目前在Edge Canary和Dev频道中以实验形式提供这个API帮助开发者将语音或音频输入整合到网站和浏览器扩展中所有的处理都在设备本地运行当然也可以选择基于云端的语音转文本和文本转语音服务作为后盾本地运行意味着不需要联网速度更快延迟更低其次，所有的数据都在设备本地处理

不会上传到云端大大提高了隐私性和安全性作为一场开发者大会微软自然也带来了大量面向开发者的工具和云服务更新首先是在数据智能层面微软发布了Microsoft IQ 它把此前各自独立的四个上下文源合并成了Agent的共享基础微软Fabric首席技术官阿米尔·内茨（Amir

Netz）打了一个非常形象的比方他说《黑客帝国》里那些绿色代码瀑布不是装饰而是构建那个世界的地基而微软想在数据世界做的事就是给Agent造一个基于数据的现实 Microsoft IQ的四个上下文源分别是Work

IQ、Foundry IQ、Fabric IQ和Web IQ Work IQ负责捕获组织日常运作的方式利用电子邮件、文档、会议和日程安排等数据了解公司的人员结构、工作流程和沟通方式 Foundry IQ负责管理机构知识策划和索引企业的知识库让Agent能够快速找到所需的信息 Fabric

IQ则通过数据对业务的实时运营状态进行建模定义基于Fabric实时信号所锚定的实体、关系和业务规则这个功能预计在未来几个月正式发布最后是Web IQ 它可以添加来自网络的实时全球上下文让Agent能够获取最新的外部信息有了这套完整的上下文体系 Agent就不再是一个只会机械执行命令的工具

而是一个真正了解公司运转情况的虚拟员工光有共享的上下文地基还不够当Agent开始生成应用时每个应用都需要一个后端如果放任不管这些应用就会在上下文层之外形成新的数据孤岛为了解决这个问题

微软发布了Rayfin 这是一个开源SDK和CLI 它能把Agent构建的应用直接部署到Fabric平台作为受治理的生产后端应用产生的数据默认会进入统一的OneLake数据湖然后再反馈回Microsoft IQ 微软把Rayfin定位为Supabase和Neon的竞争对手核心区别就在于治理

所有通过Rayfin部署的应用都走同一套数据和合规通道阿米尔·内茨（Amir Netz）解释说这是一个双向过程 Agent构建应用的时候从企业的数据规则里获取信息而应用运行起来产生的数据又反过来更新这套规则这样下一个Agent就能用上最新的东西除了Microsoft

IQ和Rayfin 微软还推出了WSL容器功能让开发者能在Windows上直接创建和管理Linux容器微软还给它配了命令行界面和API 允许在本机Windows应用里运行Linux容器

这个功能将在未来几个月提供公开预览为了不让开发者在环境配置上浪费时间微软还发布了Windows Developer Configurations 可以快速设置一台新机器并且套用开发者优化配置自动安装WSL、PowerShell 7和Visual Studio Code

同时在文件资源管理器里启用Git版本控制并显示隐藏文件这些工具虽然看起来不起眼却能大大提高开发者的工作效率让他们能把更多的时间花在真正有价值的事情上这次Build大会更新的硬件部分也同样很丰富当AI计算越来越吃算力 Agent工作流又需要持续不断地运行时

微软索性把目光投向了开发者手边的设备与其每次都去租昂贵的云GPU 不如让这些AI重活直接在本地机器上完成为此，微软发布了两款新硬件首先是Surface RTX Spark Dev Box Surface产品公司副总裁安德鲁·希尔（Andrew

Hill）宣布了这款紧凑型的开发者PC 它搭载了英伟达RTX Spark超级芯片结合了NVIDIA Blackwell RTX GPU和NVIDIA Grace CPU 提供高达1 Petaflop的AI算力配备128 GB统一内存可以在本地运行1200亿参数、100万上下文的大模型

还能对模型进行微调设备采用铝制机箱兼作散热器专为长时间运行的训练任务、大模型推理和复杂的Agent流程设计更贴心的是这款设备预装了Windows 11 Pro 并且在镜像层面为开发者做了全面的预配置包括深色主题、为开发简化的任务栏、开启开发者模式、以及默认使用PowerShell 7

WSL 2则已经配置好了GPU直通和CUDA支持预安装了VS Code、GitHub Copilot、Git、Python和Node.js 也就是说，你拿到机器开机就能用不需要再花精力来配置开发环境安全方面

Surface RTX Spark Dev Box建立在符合微软零信任原则的芯片到云安全之上包括Secured-core PC架构、BitLocker加密和Microsoft Defender保护并且可以与Entra ID和Intune集成实现大规模的管理和治理 Surface RTX

Spark Dev Box将于今年晚些时候在美国上市仅在Microsoft.com独家销售另一款Surface Laptop Ultra是专为开发者、创作者和技术专业人士设计的高性能笔记本电脑已经于早些时候推出两者共同代表了Surface的下一步为构建AI打造的专用设备除了开发者工作站

微软还带来了一个更具前瞻性的硬件项目叫做Project Solara 这是一个从芯片到云的新平台基于Android而非Windows 目的是在让设备能够运行AI Agent而非传统应用

微软应用科学部门负责人史蒂维·巴蒂什（Stevie Bathiche）解释了这个项目的出发点他说界限正在崩塌你不一定需要传统的应用模式也不需要传统的方式来开发体验这句话点出了Agent时代的一个重要趋势未来的计算交互可能会通过一个统一的Agent来完成所有的任务在这次大会上

微软还展示了首批两款基于Project Solara的概念设备第一款是桌面中心设备，放在PC旁边能够响应语音命令通过面部识别登录用户呈现当天最紧急的事项连接显示器后它还能变成一台在云端运行的完整Windows机器这款设备采用联发科平台支持Windows Hello企业身份认证

用户走近就能完成安全登录直接访问自己的Agent服务它会基于工作上下文持续提供信息和建议提醒待办事项、规划工作流程甚至直接把任务交给Agent执行还能和Windows PC、Windows

365云电脑无缝协同第二款是可穿戴工牌设备重新构想了标准的员工ID卡它的体积小于传统移动终端采用高通骁龙平台打造一键按下指纹就能唤醒Agent 轻触可以录制和转录对话内置的摄像头让Agent能根据用户所见采取行动史蒂维·巴蒂什（Stevie

Bathiche）在现场演示了这款工牌的使用方法他通过指纹验证后调用个人Agent 按下录制按钮侧边摄像头采集画面向Agent下达指令，整理大会现场素材生成内容发给团队审核后续的内容收集、整理、归档、分发全由Agent自动完成这款设备真正的价值是把Agent的能力带到工作发生的地方

比如在医疗保健领域护士佩戴这款工牌后可以通过语音交互自动完成病历记录和护理整理微软表示他们不会自己生产这些设备而是设想硬件制造商和其他行业合作伙伴将这些参考设计转化为自己的产品针对特定的行业、公司或场景进行定制目前 Best

Buy、CVS Health、Levi's、Target等公司已经在参与探索最后我们来看看微软在前沿科技领域的突破这次大会上微软发布了下一代拓扑量子芯片Majorana 2 相比前代Majorana 1 这次的核心变化是超导体材料从铝换成了铅这个调整使量子比特的可靠性提升了1000倍

平均量子比特寿命达到20秒部分实例甚至可以持续一分钟要知道其他技术路线的量子比特寿命通常只有微秒级基于这个进展微软将可扩展量子计算机的预期实现时间缩短了一半目前预计在2029年前达成更有意思的是这款芯片的研发全程使用了Microsoft Discovery平台的Agentic

AI能力 AI Agent承担了制造管理、量子态自动化测量和跨学科数据分析等任务将原本数周的测量周期压缩了几个数量级并且从近二十年积累的数据中识别出了人类难以察觉的关联

微软技术院士切坦·纳亚克（Chetan Nayak）说 Agentic AI几乎渗透到我们所做的一切事情中但是他也强调，AI只提供指导始终是科学家在回路中 Microsoft Discovery平台也在本次大会上正式发布这是一个面向前沿研发的组织级平台

允许研究人员部署由人类指导的自主Agent团队进行假设生成、实验优化和理论验证目前药物研发、半导体等行业的企业已经在使用这个平台微软同时推出了Microsoft Discovery应用的早期预览版个人可以免费下载使用GitHub Copilot账户在本地运行好了

以上就是这次微软Build 2026开发者大会的所有核心内容我们可以看到微软这次可以说是下了血本从自研AI模型，到Agent产品再到硬件设备平台微软在Agent时代的每一个环节都布下了棋子如果说去年的Build大会微软只是提出了Agent时代的愿景

那么今年的大会微软正在把这个愿景变成实实在在的产品和技术我觉得这次大会最值得关注的一点还是微软全面转向自研AI模型过去微软的AI产品主要依赖OpenAI的技术 GPT系列模型是微软Copilot生态的核心但是这次微软一口气发布了七款自研模型覆盖了推理、编程、图像、语音等多个领域

并且性能也在追赶SOTA 这标志着微软已经摆脱了对OpenAI的依赖虽然双方在很多领域仍然会继续合作但是微软显然已经不再想受制于人了微软的全栈布局也标志着AI技术已经从模型竞赛阶段进入到了Agent落地和生态建设的新阶段所有AI头部公司也都在争抢这个赛道可以预见到的是

未来几年竞争将会非常激烈那么你觉得微软能在这场Agent时代的竞争中胜出吗？

你最期待哪一项技术的落地呢？欢迎在评论区留言讨论感谢收看，我们下期再见

微软Build 2026开发者大会 | Agent优先 | 七款自研AI模型 | 前沿微调 | Scout | ACS控制规范 | ASSERT | MXC执行容器 | Rayfin | 拓扑量子芯片 · 全文文字稿