大家好,这里是最佳拍档,我是大飞 6月2日 微软在旧金山梅森堡举办了一年一度的Build开发者大会 在这次大会上 微软正式宣告了“Agent优先”时代的全面到来 一口气发布了七款从零训练的自研AI模型 还有从系统级安全沙箱到1P FLOPS算力的开发者工作站 从能别在胸前的AI可穿戴设备

到量子计算的重大突破 总共20多项更新 覆盖了从芯片到云、从软件到硬件的全栈布局 这标志着微软在AI领域的战略已经发生了根本性的转变 从过去深度依赖OpenAI 到现在全面转向自研 今天这期视频 我就为大家详细拆解一下这次Build大会的所有内容 看看微软为我们描绘的AI未来 到底是什么样子的

在正式开始之前 我们先回顾一下去年的Build大会 2025年 微软在Build上第一次明确提出了“AI Agent时代”的方向 发布了Copilot Studio多Agent编排工具、Windows AI

Foundry平台 并且宣布全面支持模型上下文协议MCP 当时GitHub Copilot还推出了Coding Agent 如果说2025年微软解决的是Agent的标准和框架问题 那么2026年的这次大会 微软要解决的就是Agent真正落地的问题 整场大会以微软CEO萨提亚·纳德拉(Satya

Nadella)的愿景陈述为主线展开 在抛出Agent优先的战略框架后 各业务线高管依次登台 用一众具体产品把这套框架落地 首先我们来看模型层面的更新 这也是这次大会最核心的内容之一 微软AI部门负责人穆斯塔法·苏莱曼(Mustafa Suleyman)在大会上宣布

推出七款由微软AI内部开发的全新模型 统一归入MAI家族 MAI也就是Microsoft AI 苏莱曼将MAI的使命 描述为构建一台爬山机器 通过持续投入计算量、更优数据和更精准的评估 实现循环往复的自我改进 让用户始终保持在技术前沿

他还提到了一个数据 用来训练前沿模型的计算量已经增长了一万亿倍 预计未来三年内还将再增长一千倍 而微软所有的MAI模型 都坚持从零开始进行爬山 零蒸馏的原则 不依赖任何第三方模型的输出进行训练 因为蒸馏技术虽然能快速提升小模型的性能 但是也会带来数据来源不清晰、商业授权风险和能力天花板受限等问题

微软坚持从零训练 就是为了从根源上保证模型的安全性、可控性和商业可用性 在这七款模型中 最受关注的无疑是旗舰推理模型MAI-Thinking-1 这是一个中型模型 采用MoE混合专家架构 拥有350亿激活参数 总参数约1万亿,上下文窗口达到256K 微软表示 它在关键的软件工程测试中

性能可以跟市面上最好的模型打平 在盲测对比中 人类评判员对它的偏好程度 跟Anthropic的Sonnet 4.6不相上下 特别值得一提的是 这个模型没有针对特定基准做过优化 完全是自然训练的结果

然后是编程模型MAI-Code-1-Flash 这是一个高效推理的编码模型 只有50亿参数 专为GitHub Copilot、VS Code和微软技术栈量身定制并且深度集成 微软表示 它的性能可以和Anthropic的Haiku媲美 但是成本更低 在SWE-bench Pro测试中

MAI-Code-1-Flash取得了51%的成绩 对于一个50亿参数的小模型来说 这个表现已经算是相当不错了 文生图方面 微软推出了MAI-Image-2.5以及Flash版 支持文生图和图像编辑功能 微软称 MAI-Image-2.5在Arena评分上 超越了谷歌的Nano Banana Pro

在大模型竞技场图像编辑排行榜上排名第二 目前这两款模型已经集成到了PowerPoint中 用户可以直接在PowerPoint里生成和编辑图片 未来还会推广到OneDrive等更多微软产品中

转录模型MAI-Transcribe-1.5具备SOTA级别的准确性 速度比竞品模型快五倍 内置支持43种语言的领域特定术语识别 适合用于需要处理多语言音频内容的场景 语音生成模型MAI-Voice-2则提供了高质量、自然听感的语音生成 支持15种语言 能够根据短样本适配声音

并且具备完善的防滥用保护措施 它的Flash版也即将推出 以更低的成本实现同样的功能 特别适合实时语音交互的智能体场景 所有这些MAI模型都共享相同的数据规范、基础设施和评估框架 除了在Azure Foundry上分发以外 这些模型还将在Open

Router、Fireworks和Baseten等第三方平台上向开发者提供 更重要的是 开发者能够自行调整模型的权重 这对于企业定制化来说是一个巨大的利好 意味着企业可以根据自己的业务需求 对模型进行深度的个性化改造 说到企业定制 微软在大会上还介绍了一项非常重要的技术

叫做Microsoft Frontier Tuning 这是一种让企业用自身工作数据定制模型的方法 萨提亚·纳德拉(Satya Nadella)解释说 最有价值的数据不是通用语料 而是Agent在企业里执行任务的真实轨迹、步骤和决策 Frontier

Tuning的逻辑就是把MAI模型接入实际的业务流程 让模型在真实环境中边做边学 这样一来 企业就相当于构建了自己的模型 在自己的环境中,用自己的数据训练 由自己来控制模型 机构的知识会成为模型的一部分 并且只属于企业自己 微软内部测试显示 为Excel调整的MAI模型 性能与GPT-5.4水平相当

但是效率提高了10倍 全球知名咨询公司麦肯锡采用Frontier Tuning后 MAI在所有测试模型中实现了最高胜率 同时成本降低了大约10倍 在医疗健康领域 微软还宣布与梅奥诊所合作 共同打造一个用于医疗保健的前沿AI模型

这个模型将梅奥诊所的临床专业知识、去标识化的临床数据和纵向洞察 与微软的基础AI能力结合 有望在医疗诊断、患者管理、医学研究等方面发挥重要作用 除了模型本身 微软还在软硬件协同方面取得了重要进展 MAI模型正在与微软自研的Maia 200芯片进行协同设计 通过软硬件联合优化

每瓦性能可以达到英伟达GB200的1.4倍 目前Maia 200已经在美国爱荷华州投入运行 计划今年晚些时候扩展到更多的区域 讲完了模型 我们再来看这次大会的另一个核心 Agent生态的全面落地 微软在这次大会上正式宣告了向“Agent优先”的宏大转型 目标是自动化知识工作者使用软件的方式

将AI助手植入到日常办公的每一个交互中 这次发布的核心Agent产品叫做Scout 它被称为“永远在线”的AI Agent 构建在OpenClaw开源框架之上 可以在微软Teams中像人类同事一样与你交互 简单来说

Scout能浏览你的工作消息、日历和电子邮件收件箱 自动完成各种任务 重新安排有冲突的会议 还能起草听起来非常专业的回复 你可以在Teams中直接向它发送指令 甚至可以为它取一个你喜欢的名字 微软新任命的企业副总裁奥马尔·沙欣(Omar Shahin)解释了Scout的设计理念

它不是一个你需要主动去调用的工具 而是一个24小时在线的虚拟同事 帮你处理那些繁琐和重复的工作 让你能专注于更有价值的事情 Scout会通过微软Frontier计划提供 需要GitHub Copilot订阅 微软目前还正在测试一款Scout桌面应用

将向选择了“Frontier”功能访问权限的订阅用户推出 在微软内部 销售部门目前是使用Scout最大、增长最快的群体 除了Scout以外 另一项重要的Agent产品是GitHub Copilot桌面应用 GitHub首席产品官马里奥·罗德里格斯(Mario

Rodriguez)介绍说 这是一款构建在GitHub之上的、Agent原生的桌面体验 通过统一的“My Work”视图 开发者可以看到跨所有连接仓库的动态工作 包括活动会话、议题、PR和后台自动化任务 每个会话都在其自己的Git worktree中运行 这样多个并行的Agent就不会互相干扰

开发者可以同时处理多个不同的项目 这款应用还具备Agent Merge功能 可以带领PR完成审查、检查和合并的整个流程 最有意思的是Canvas界面 它用于人机之间的双向交互 让开发者可以检查、引导和验证Agent代表自己执行的工作 全程掌控工作的进展和质量 避免智能体出现错误或者不符合预期的行为

GitHub Copilot应用面向Windows 11、Windows 11 on Arm、Mac和Linux提供技术预览版 同样需要GitHub Copilot订阅 未来还会向Copilot

Free用户开放 应用支持云端和本地沙箱 两者都附带策略支持 方便企业进行统一的管理和治理 随着Agent变得越来越强大和自主 一个不可回避的问题就是安全和治理 Agent越自主越有用 但让它不受护栏约束地在企业网络上运行 也就越危险 微软将这个问题描述为一个“多层系统问题”

Agent与人类、工具、应用、模型以及其他Agent之间的每一次交互 都会暴露新的攻击面 同时引入不同的故障模式 为了解决这个问题 微软推出了一系列Agent安全治理工具 首先是Agent控制规范,简称ACS 这是一个新的开源标准 目的是为开发者提供更一致、更细粒度的方法来控制AI Agent的行为

ACS让开发、合规和安全团队能够为Agent定义策略文件 明确规定Agent可以做什么、绝对不能做什么、何时需要人类批准 以及应该记录哪些证据供后续审查 ACS会作为一个SDK发布 附带了LangChain、OpenAI

Agents SDK、Anthropic Agents SDK、AutoGen、CrewAI、Semantic Kernel、Microsoft ExtensionsAI、MCP工具等插件 由于策略可以写成单个文件 它可以与Agent捆绑在一起 跟随Agent穿越不同的框架和环境

这对于跨平台、跨系统的Agent部署来说 是一个非常重要的特性 它确保了智能体无论在什么环境下运行 都能遵守相同的安全策略 另一项重要的测试工具是ASSERT 全称是自适应规范驱动的评估与回归测试评分(Adaptive Spec-driven Scoring for Evaluation and

Regression Testing) 这是一个开源框架 通过AI将对目标、策略或预期行为的高级自然语言描述 转化为结构化的评分测试 具体来说 ASSERT会接收关于AI模型预期行为的简明语言描述

然后生成可接受与不可接受行为的集合、问题场景和测试用例 然后针对目标系统运行这些测试并给出评分 它还能记录AI系统所采取的路径 包括中间操作和工具调用 以便开发者检查失败的位置 这大大降低了Agent测试的门槛 让非专业测试人员也能轻松地对Agent的行为进行评估和验证

如果说ACS和ASSERT是在应用层为Agent设置护栏 那么微软接下来推出的MXC 就是在操作系统层面为Agent划下了一道不可逾越的红线 MXC全称是微软执行容器(Microsoft Execution Containers) 这是一个内置在Windows操作系统本身的、由策略驱动的执行层

微软Windows和设备执行副总裁帕万·达武鲁里(Pavan Davuluri)强调 MXC对于AI Agent的商业落地至关重要 它围绕安全性、容器、隔离和用户控制 让Agent对普通消费者和企业部署来说都足够安全

MXC本质上是一个SDK和策略模型 嵌入在Windows和适用于Linux的Windows子系统(WSL)中 提供微软所称的“可组合的沙箱频谱” 这个频谱的范围非常广 从轻量级的进程隔离 到轻量级虚拟机、Linux容器 再到在Windows 365上运行的完整云实例

开发者可以根据Agent的风险等级和功能需求 选择合适的隔离级别 比如,对于简单的Coding Agent 使用轻量级进程隔离就足够了 而对于需要访问敏感数据的企业级Agent 则可以使用虚拟机甚至云实例来进行隔离 MXC的另一个核心特性是身份绑定 每个Agent都被绑定到一个身份 要么是本地ID

要么是由Microsoft Entra支持的云预配身份 这确保了Agent的每一个动作都可被归因、审计和治理 也就是说 如果一个Agent执行了违规操作 企业可以准确地追溯到是哪个Agent、在什么时间、执行了什么操作

从而进行相应的处理 目前MXC已经提供早期预览版 与微软企业安全栈集成的Agent 365将于2026年7月推出预览版 它将把Entra身份服务、Intune设备管理、Defender威胁防护和Purview数据治理能力 层叠到MXC之上 让IT部门能够集中管理所有智能体的隔离和安全策略

在合作伙伴方面 OpenAI、英伟达、Manus、Nous Research 也就是Hermes Agent背后的公司 以及OpenClaw 都已经宣布将在MXC上构建他们的产品 特别值得一提的是OpenClaw的合作 这是创建者彼得·斯坦伯格(Peter

Steinberger)主动联系微软表达合作兴趣 最终发展成了全面的平台级伙伴关系 在大会的现场演示中 OpenClaw拿到了删除桌面文件的命令 但是因为MXC被设置为只读模式 所有的操作都被成功阻止了 直观展示了MXC的强大安全能力

除了系统级的安全更新 微软Edge浏览器也获得了重要的本地AI能力升级 微软表示 自Build 2025引入Phi-4-mini模型后 团队根据开发者的反馈 进一步扩展了端侧AI的能力 这次主要带来了三项更新 第一项是Aion-1.0-Instruct

这是一个比Phi-4-mini更小、更快、更高效的本地小语言模型 它可以在GPU和CPU能力较弱的PC上运行 目前以开发者预览版提供 将于7月登陆Hugging Face 第二项是语言检测和翻译API 随Edge 148版本提供 这两个API由Edge内置的端侧AI模型驱动

允许网站和浏览器扩展识别文本语言 并且在不同语言对之间进行翻译 微软称 这个翻译服务提供快速、高质量的翻译 支持超过145种语言 并且针对网络上的翻译工作负载进行了优化 最重要的是,这个服务是完全免费的 第三项是通过Web Speech API实现语音识别

目前在Edge Canary和Dev频道中以实验形式提供 这个API帮助开发者将语音或音频 输入整合到网站和浏览器扩展中 所有的处理都在设备本地运行 当然也可以选择基于云端的语音转文本和文本转语音服务作为后盾 本地运行意味着不需要联网 速度更快 延迟更低 其次,所有的数据都在设备本地处理

不会上传到云端 大大提高了隐私性和安全性 作为一场开发者大会 微软自然也带来了大量面向开发者的工具和云服务更新 首先是在数据智能层面 微软发布了Microsoft IQ 它把此前各自独立的四个上下文源 合并成了Agent的共享基础 微软Fabric首席技术官阿米尔·内茨(Amir

Netz)打了一个非常形象的比方 他说《黑客帝国》里那些绿色代码瀑布不是装饰 而是构建那个世界的地基 而微软想在数据世界做的事 就是给Agent造一个基于数据的现实 Microsoft IQ的四个上下文源分别是Work

IQ、Foundry IQ、Fabric IQ和Web IQ Work IQ负责捕获组织日常运作的方式 利用电子邮件、文档、会议和日程安排等数据 了解公司的人员结构、工作流程和沟通方式 Foundry IQ负责管理机构知识 策划和索引企业的知识库 让Agent能够快速找到所需的信息 Fabric

IQ则通过数据对业务的实时运营状态进行建模 定义基于Fabric实时信号所锚定的实体、关系和业务规则 这个功能预计在未来几个月正式发布 最后是Web IQ 它可以添加来自网络的实时全球上下文 让Agent能够获取最新的外部信息 有了这套完整的上下文体系 Agent就不再是一个只会机械执行命令的工具

而是一个真正了解公司运转情况的虚拟员工 光有共享的上下文地基还不够 当Agent开始生成应用时 每个应用都需要一个后端 如果放任不管 这些应用就会在上下文层之外形成新的数据孤岛 为了解决这个问题

微软发布了Rayfin 这是一个开源SDK和CLI 它能把Agent构建的应用 直接部署到Fabric平台作为受治理的生产后端 应用产生的数据默认会进入统一的OneLake数据湖 然后再反馈回Microsoft IQ 微软把Rayfin定位为Supabase和Neon的竞争对手 核心区别就在于治理

所有通过Rayfin部署的应用 都走同一套数据和合规通道 阿米尔·内茨(Amir Netz)解释说 这是一个双向过程 Agent构建应用的时候 从企业的数据规则里获取信息 而应用运行起来产生的数据 又反过来更新这套规则 这样下一个Agent就能用上最新的东西 除了Microsoft

IQ和Rayfin 微软还推出了WSL容器功能 让开发者能在Windows上直接创建和管理Linux容器 微软还给它配了命令行界面和API 允许在本机Windows应用里运行Linux容器

这个功能将在未来几个月提供公开预览 为了不让开发者在环境配置上浪费时间 微软还发布了Windows Developer Configurations 可以快速设置一台新机器 并且套用开发者优化配置 自动安装WSL、PowerShell 7和Visual Studio Code

同时在文件资源管理器里启用Git版本控制并显示隐藏文件 这些工具虽然看起来不起眼 却能大大提高开发者的工作效率 让他们能把更多的时间花在真正有价值的事情上 这次Build大会更新的硬件部分也同样很丰富 当AI计算越来越吃算力 Agent工作流又需要持续不断地运行时

微软索性把目光投向了开发者手边的设备 与其每次都去租昂贵的云GPU 不如让这些AI重活直接在本地机器上完成 为此,微软发布了两款新硬件 首先是Surface RTX Spark Dev Box Surface产品公司副总裁安德鲁·希尔(Andrew

Hill)宣布了这款紧凑型的开发者PC 它搭载了英伟达RTX Spark超级芯片 结合了NVIDIA Blackwell RTX GPU和NVIDIA Grace CPU 提供高达1 Petaflop的AI算力 配备128 GB统一内存 可以在本地运行1200亿参数、100万上下文的大模型

还能对模型进行微调 设备采用铝制机箱兼作散热器 专为长时间运行的训练任务、大模型推理和复杂的Agent流程设计 更贴心的是 这款设备预装了Windows 11 Pro 并且在镜像层面为开发者做了全面的预配置 包括深色主题、为开发简化的任务栏、开启开发者模式、以及默认使用PowerShell 7

WSL 2则已经配置好了GPU直通和CUDA支持 预安装了VS Code、GitHub Copilot、Git、Python和Node.js 也就是说,你拿到机器开机就能用 不需要再花精力来配置开发环境 安全方面

Surface RTX Spark Dev Box建立在符合微软零信任原则的芯片到云安全之上 包括Secured-core PC架构、BitLocker加密和Microsoft Defender保护 并且可以与Entra ID和Intune集成 实现大规模的管理和治理 Surface RTX

Spark Dev Box将于今年晚些时候在美国上市 仅在Microsoft.com独家销售 另一款Surface Laptop Ultra是专为开发者、创作者和技术专业人士设计的高性能笔记本电脑 已经于早些时候推出 两者共同代表了Surface的下一步 为构建AI打造的专用设备 除了开发者工作站

微软还带来了一个更具前瞻性的硬件项目 叫做Project Solara 这是一个从芯片到云的新平台 基于Android而非Windows 目的是在让设备能够运行AI Agent而非传统应用

微软应用科学部门负责人史蒂维·巴蒂什(Stevie Bathiche)解释了这个项目的出发点 他说 界限正在崩塌 你不一定需要传统的应用模式 也不需要传统的方式来开发体验 这句话点出了Agent时代的一个重要趋势 未来的计算交互 可能会通过一个统一的Agent来完成所有的任务 在这次大会上

微软还展示了首批两款基于Project Solara的概念设备 第一款是桌面中心设备,放在PC旁边 能够响应语音命令 通过面部识别登录用户 呈现当天最紧急的事项 连接显示器后 它还能变成一台在云端运行的完整Windows机器 这款设备采用联发科平台 支持Windows Hello企业身份认证

用户走近就能完成安全登录 直接访问自己的Agent服务 它会基于工作上下文持续提供信息和建议 提醒待办事项、规划工作流程 甚至直接把任务交给Agent执行 还能和Windows PC、Windows

365云电脑无缝协同 第二款是可穿戴工牌设备 重新构想了标准的员工ID卡 它的体积小于传统移动终端 采用高通骁龙平台打造 一键按下指纹就能唤醒Agent 轻触可以录制和转录对话 内置的摄像头让Agent能根据用户所见采取行动 史蒂维·巴蒂什(Stevie

Bathiche)在现场演示了这款工牌的使用方法 他通过指纹验证后调用个人Agent 按下录制按钮 侧边摄像头采集画面 向Agent下达指令,整理大会现场素材 生成内容发给团队审核 后续的内容收集、整理、归档、分发全由Agent自动完成 这款设备真正的价值 是把Agent的能力带到工作发生的地方

比如在医疗保健领域 护士佩戴这款工牌后 可以通过语音交互 自动完成病历记录和护理整理 微软表示 他们不会自己生产这些设备 而是设想硬件制造商和其他行业合作伙伴 将这些参考设计转化为自己的产品 针对特定的行业、公司或场景进行定制 目前 Best

Buy、CVS Health、Levi's、Target等公司已经在参与探索 最后 我们来看看微软在前沿科技领域的突破 这次大会上 微软发布了下一代拓扑量子芯片Majorana 2 相比前代Majorana 1 这次的核心变化是超导体材料从铝换成了铅 这个调整使量子比特的可靠性提升了1000倍

平均量子比特寿命达到20秒 部分实例甚至可以持续一分钟 要知道 其他技术路线的量子比特寿命通常只有微秒级 基于这个进展 微软将可扩展量子计算机的预期实现时间缩短了一半 目前预计在2029年前达成 更有意思的是 这款芯片的研发全程使用了Microsoft Discovery平台的Agentic

AI能力 AI Agent承担了制造管理、量子态自动化测量和跨学科数据分析等任务 将原本数周的测量周期压缩了几个数量级 并且从近二十年积累的数据中识别出了人类难以察觉的关联

微软技术院士切坦·纳亚克(Chetan Nayak)说 Agentic AI几乎渗透到我们所做的一切事情中 但是他也强调,AI只提供指导 始终是科学家在回路中 Microsoft Discovery平台也在本次大会上正式发布 这是一个面向前沿研发的组织级平台

允许研究人员部署由人类指导的自主Agent团队 进行假设生成、实验优化和理论验证 目前 药物研发、半导体等行业的企业已经在使用这个平台 微软同时推出了Microsoft Discovery应用的早期预览版 个人可以免费下载 使用GitHub Copilot账户在本地运行 好了

以上就是这次微软Build 2026开发者大会的所有核心内容 我们可以看到 微软这次可以说是下了血本 从自研AI模型,到Agent产品 再到硬件设备平台 微软在Agent时代的每一个环节都布下了棋子 如果说去年的Build大会 微软只是提出了Agent时代的愿景

那么今年的大会 微软正在把这个愿景 变成实实在在的产品和技术 我觉得这次大会最值得关注的一点 还是微软全面转向自研AI模型 过去 微软的AI产品主要依赖OpenAI的技术 GPT系列模型是微软Copilot生态的核心 但是这次 微软一口气发布了七款自研模型 覆盖了推理、编程、图像、语音等多个领域

并且性能也在追赶SOTA 这标志着微软已经摆脱了对OpenAI的依赖 虽然双方在很多领域仍然会继续合作 但是微软显然已经不再想受制于人了 微软的全栈布局 也标志着AI技术已经从模型竞赛阶段 进入到了Agent落地和生态建设的新阶段 所有AI头部公司也都在争抢这个赛道 可以预见到的是

未来几年竞争将会非常激烈 那么 你觉得微软能在这场Agent时代的竞争中胜出吗?

你最期待哪一项技术的落地呢?欢迎在评论区留言讨论 感谢收看,我们下期再见