我的 @Google 同事 @NormJouppi、Sridhar Lakshmanamurthy、Cliff Young 和 David Patterson 最近撰写了一篇论文,题为《从 TPU v2 到 Ironwood 的 Google 训练超级计算机:五代演进中的架构稳定性、规模、韧性、能效与可持续性》,该论文将发表在 2026 年 7/8 月刊的 @ieeemicro 上。文中涵盖了大量关于 TPU 芯片代际演进、Google 工作负载演变(提示:Transformer 模型占比大幅增加!)以及每 flop 能效提升约 30 倍的精彩数据。 这些代际间发生了诸多变革: - 从 TPUv2 的风冷转向 TPUv3 及后续版本的水冷 - 从 2D 互连转向 3D torus 互连 - TFLOPS/Watt 提升 30 倍 - 每个 Pod 的芯片规模从 256 颗 (TPUv2) 扩展至 9216 颗 (Ironwood) 阅读全文:https://t.co/D5NFYFv19V
2026-06-18 · JeffDean · 打开 ↗
今天的比赛看得真过瘾。Vozinha和整个佛得角队对阵西班牙的表现太棒了!
2026-06-16 · JeffDean · 打开 ↗
@pgasawa 和 @profjoeyg 的一篇佳作,对 AI 的进展提出了更细致的见解。
2026-06-15 · JeffDean · 打开 ↗
@uwcse @MBalazinska 分享一篇 @ToddBishop 为 @GeekWire 撰写的关于毕业典礼的精彩文章,其中还包含了我演讲的一些片段。 https://t.co/11K4Iq8NO9
2026-06-13 · JeffDean · 打开 ↗
@uwcse @MBalazinska 这是我分享的一些建议:https://t.co/iFXdeRIxKM
2026-06-13 · JeffDean · 打开 ↗
今晚很荣幸能在华盛顿大学艾伦学院(@uwcse)的毕业典礼上发表演讲。看到这么多学生及其亲友如此喜悦,我也深受感染。 热烈祝贺2026届全体毕业生!🎓 感谢 @MBalazinska 的邀请!
2026-06-13 · JeffDean · 打开 ↗
人们平均每4年更换一次手机。这意味着每年有数亿部旧手机被丢弃,但它们作为计算设备仍完全可用。Google正与UCSD合作,探索如何将这些旧手机转化为云端计算的“手机集群”。通过这种方式让手机重新投入使用,可以避免进一步开采原材料,并利用制造设备时已产生的隐含碳,从而直接降低计算带来的环境足迹。此外,现代手机本身就是性能强大的计算机。详情请阅读下方博客 ⬇️
2026-06-13 · JeffDean · 打开 ↗
关于真实生物神经元能力的系列推文非常有意思(剧透:它们的能力远超感知器中的传统人工神经元)。@IdoAizenbud 及其合作者们干得漂亮!
2026-06-12 · JeffDean · 打开 ↗
拒绝一名入选世界杯裁判名单的索马里足球官员入境,这实在令人汗颜。世界杯的核心意义在于通过充满活力的体育竞技将人们凝聚在一起,因此,允许他参与执法显然才是正确的做法。
2026-06-09 · JeffDean · 打开 ↗
更多详情请见:https://t.co/mDg1zOOLuD
2026-06-09 · JeffDean · 打开 ↗
语音翻译是 Google 开展时间最久的机器学习项目之一,我们已取得了长足进步。Gemini 3.5 Live Translate 是我们最新的语音对语音模型,支持 70 多种语言,能让日常产品和应用中的跨语言对话更加自然。 以下是 @InsideGrab 的合作伙伴如何利用该技术连接旅客与司机的示例。🚗 该功能正逐步在 Google 翻译及 @GoogleAIStudio 的 Live API 中推出。
2026-06-09 · JeffDean · 打开 ↗
恭喜 Ayanna Howard @robotsmarts!斯佩尔曼学院任命你为新任校长,真是明智的选择!
2026-06-06 · JeffDean · 打开 ↗
欢迎体验我们的 Gemma 4 12B 模型:这是一款性能强劲的开放权重模型,可直接在笔记本电脑上运行。
2026-06-04 · JeffDean · 打开 ↗
看到这一幕真好。科学界与大众都应养成习惯,为卓越的科学成就起立鼓掌。🎉
2026-06-03 · JeffDean · 打开 ↗
Károly,感谢这次精彩的 @twominutepapers 对话!
2026-06-02 · JeffDean · 打开 ↗
非常享受这次与 @OfficialLoganK 以及我的 Gemini 团队负责人同事 @OriolVinyalsML、@NoamShazeer 和 @koraykv 的交流。
2026-05-29 · JeffDean · 打开 ↗
2分钟内回答四个问题。感谢Google社交团队的建议,在昨天的#googleio上安排了这段小插曲!
2026-05-20 · JeffDean · 打开 ↗
高性能且快速的模型至关重要。我们全新的 Gemini 3.5 Flash 模型完美兼顾了速度与性能。
2026-05-19 · JeffDean · 打开 ↗
在 #GoogleIO 度过了美好的一天,Gemini 的发布消息满满!和我的 Gemini 团队同事 @OriolVinyalsML 及 @borgeaud_s 在一起。 每听到一次 "Gemini",就喝一口水吧!
2026-05-19 · JeffDean · 打开 ↗
3/ Gemini 3.5 Flash 今日开始全球上线。我代表整个 Gemini 团队,非常期待大家利用这一模型所能创造的无限可能! 详情请见:https://t.co/PvGpSXACtm
2026-05-19 · JeffDean · 打开 ↗
2/ 看看 Gemini 3.5 Flash 如何瞬间消化晦涩的学术论文,并自主编写出一个全交互式的可视化网站,来解析研究中的复杂细节。这是一场惊人的压力测试,完美融合了海量长上下文、深度推理、复杂编程和超低延迟。 它能帮你直击论文本质,助你深度理解!
2026-05-19 · JeffDean · 打开 ↗
1/ 今天在 #GoogleIO 上,我们发布了最新的 Gemini 3.5 系列模型,将前沿智能与执行力相结合。 我们首先推出 3.5 Flash,旨在帮助用户执行复杂的长周期智能体工作流。 Gemini 3.5 Flash 是我们在编程和智能体领域最强的模型。在 Terminal-Bench 和 MCP Atlas 等智能体及编程基准测试中,其表现优于 3.1 Pro,且运行速度比其他前沿模型快 4 倍。 在 Google Antigravity 中,3.5 Flash 经过进一步优化,速度最高可提升 12 倍。它是部署协作式子智能体、运行高频迭代循环并大规模解决现实问题的强大引擎。 以下是我们激动人心的部分亮点 🔽
2026-05-19 · JeffDean · 打开 ↗
早期谷歌全员滑雪旅行真开心!我是第一排左起第八个,穿着白色浴袍(如果算上苏珊的宝宝 Ari,就是第九个)。
2026-05-15 · JeffDean · 打开 ↗
很高兴看到 @percyliang 将在 #cais2026 发表主旨演讲!
2026-05-12 · JeffDean · 打开 ↗
唔。说是演讲,但说是“菜肴”也行。主题演讲就像是一场多道菜的品鉴盛宴!
2026-05-06 · JeffDean · 打开 ↗
很高兴看到我的朋友 @andykonwinski 将在月底举行的首届 @CAISconf 上担任主讲嘉宾!
2026-05-06 · JeffDean · 打开 ↗
Google 翻译 20 岁啦!🎉 下面的推文串里有 20 个有趣的知识点和使用技巧。 翻译是我最喜欢的 Google 产品之一,因为它拉近了我们彼此的距离! 这些年来我参与了几项相关工作。第一项是 2006 年初始系统的部署,它在翻译质量上实现了巨大飞跃,因为它采用了基于数万亿词汇训练的更大规模的 5-gram 语言模型(事实上,这可能是世界上首次万亿 token 级别的语言模型训练:论文中的图表展示了随着数据和算力规模的扩大,质量提升呈现出类似 Scaling Law 的规律)。 参见《机器翻译中的大语言模型》,Thorsten Brants, Ashok C. Popat, Peng Xu, Franz J. Och 和 Jeffrey Dean,https://t.co/QnK7lllpoj 第二次重大协作发生在 2016 年,当时我们将翻译技术从统计机器翻译转向了深度神经网络。这一转变依赖于两项关键创新:第一项是 Google 在 Sequence-to-Sequence 模型上的研究;第二项是我们开发的 TPU(定制芯片),它将深度神经网络的推理性能提升至当时 CPU 和 GPU 的 30-80 倍(并将延迟降低了 15-30 倍)。这使得像翻译这样计算密集型的语言模型服务,能够面向数亿用户大规模落地。参见《张量处理单元(TPU)在数据中心内的性能分析》,Norman P. Jouppi 等人,https://t.co/qpJl7FM6
2026-04-28 · JeffDean · 打开 ↗
我上周在 Cloud Next 与 Amin Vahdat、@gilbert 及 @djrosent 的对谈视频现已上线。 https://www.youtube.com/watch?si=vUY3hI_aDX8K6gco&v=BpnJYJmbXcM&feature=youtu.be 感谢这场精彩的对谈!
2026-04-27 · JeffDean · 打开 ↗
Decoupled DiLoCo 新论文已上线 Arxiv:https://arxiv.org/abs/2604.21428v1
2026-04-24 · JeffDean · 打开 ↗
值得一提的是,在过去的 14 年左右,我们一直致力于大规模训练和异步技术的研究。这是我们 2012 年发表在 NeurIPS 上的论文,我们在文中证明了该方法可以用于训练超大规模神经网络(在当时,其规模比以往任何神经网络都大 30 倍),并能以容错的方式将训练任务分布到数千台机器上。 PDF: https://t.co/UK1GlSt91h (这篇论文关注度不高,是因为我们当时忘了把它传到 Arxiv 上:哎呀!)
2026-04-23 · JeffDean · 打开 ↗
TPU 8i 与我们的 Gemini 研究团队共同设计,旨在支持低延迟推理。其核心特性之一是拥有海量片上 SRAM,这使得更多计算可以在芯片内部完成,从而减少了频繁访问 HBM 获取权重或 KVCache 状态的需求。 Boardfly 网络拓扑(见下图)通过以下方式连接 8i pod 中的全部 1152 颗芯片,实现了更低的网络直径:首先将单板上的 4 颗芯片全连接,再将 8 块板组成一组进行全连接,最后将 36 个“8 板组”进行全连接。此外,每颗芯片都集成了专门的集合通信加速引擎 (CAE) 电路,用于将各种归约 (reduction) 及其他全局操作从主计算单元中卸载,从而将片上延迟降低高达 5 倍。 综合来看,这些特性将为大规模模型(包括通常需要映射到多颗芯片进行推理的 MoE 模型)提供极高的吞吐量和极低的延迟。这将使智能体 (agentic) 工作负载和交互式应用在 TPU 8i 上大放异彩。
2026-04-23 · JeffDean · 打开 ↗
首先,我们来聊聊 TPU 8t,它专为大规模训练和推理吞吐量而设计。 Pod 规模略微增加至 9600 颗芯片,单 Pod 的 FP4 性能约为 Ironwood 的 3 倍(8t 为 121 exaflops/pod,而 Ironwood 为 42.5 exaflops/pod)。此外,单芯片的 ICI 网络带宽提升了 2 倍,数据中心扩展网络带宽提升了 4 倍。 更重要的是,该系统的能效比(performance/watt)提升了 2 倍,延续了我们多代 TPU 以来能效显著提升的趋势(8t 的能效比约为 TPU v2 的 60 倍)。
2026-04-23 · JeffDean · 打开 ↗
很高兴昨天能在 Cloud Next 上与 Amin Vahdat 以及 @AcquiredFM 的主持人 @gilbert 和 @djrosent 共同探讨 Google TPU v8t 和 v8i 的发布。 官方博客详细介绍了这些新芯片的信息: https://blog.google/innovation-and-ai/infrastructure-and-cloud/google-cloud/eighth-generation-tpu-agentic-era/ 以下是我非常期待的一些亮点:
2026-04-23 · JeffDean · 打开 ↗
很荣幸能为 Decoupled DiLoCo 训练系统的开发提供一些建议。该方法允许在单个单元故障时,仍有 (N-1)/N 个单元继续运行,从而实现了大规模训练任务的优雅容错。 推文串 ⬇️
2026-04-23 · JeffDean · 打开 ↗
很荣幸能与这群优秀的委员们共同参与评选。本次收到的申请质量极高,评审过程也充满了精彩的讨论。 入选提案见下方,更多详情请访问:https://t.co/s3b8aXrp6Y
2026-04-15 · JeffDean · 打开 ↗
补充说明一下:点击第一张图中的图片即可了解更多关于 Ricardo 和该奖项的信息。我猜 Twitter 把我原本的链接 https://t.co/r6Xkt7poSW 自动转换成图片了。
2026-04-15 · JeffDean · 打开 ↗
很高兴看到 Ricardo Baeza-Yates (@PolarBearby) 荣获今年的 ACM Luiz Barroso 奖(该奖项旨在纪念我的 Google 老同事)。 Ricardo 被公认为全球信息检索领域最顶尖的研究者之一,你们中许多人可能读过他与 Berthier Ribeiro-Neto 合著的优秀教材《现代信息检索》。此外,他在壮大拉丁美洲计算社区方面也发挥了关键作用。 Ricardo 的成就和此次获奖定会让 Luiz 深感自豪!
2026-04-15 · JeffDean · 打开 ↗
太棒了!我小时候,阿波罗计划的影响还在,我一直以为人类会定期开展登月任务。真不敢相信自1972年以来我们竟然没再去过!祝贺NASA的所有人!🎉
2026-04-11 · JeffDean · 打开 ↗
祝贺 @matei_zaharia 荣获今年的 ACM 计算奖!实至名归!🎉
2026-04-09 · JeffDean · 打开 ↗
很高兴看到大家对能力出众的 Gemma 4 模型反响如此热烈!
2026-04-09 · JeffDean · 打开 ↗
很多人都注意到了,刚才的 YouTube 链接发错了。这是正确的链接: https://t.co/Vui7wYoN1O
2026-04-08 · JeffDean · 打开 ↗
对冲请求(Hedged requests,显然灵感源自我和 Luiz Barroso 撰写的《Tail at Scale》论文)被应用于单机环境:通过在不同 DRAM 通道间复制数据,并向所有通道同时发出读取请求,最后采用最先返回的结果。这使 p99.99 读取延迟降低了约 5-15 倍。 https://t.co/1OSmAKyCD3 太酷了,@lauriewired! 附带的视频是朋友转发给我的,我也是通过它了解到的: https://t.co/onS2NWFjMP
2026-04-08 · JeffDean · 打开 ↗
标签页 太多? 转向 垂直!
2026-04-07 · JeffDean · 打开 ↗
太震撼了!从地球上看,这些紫红色的色调并不明显(而漆黑的背景更衬托出宇宙的浩瀚)。
2026-04-07 · JeffDean · 打开 ↗
大型新闻机构怎么能犯下如此离谱的标题错误?🤦‍♂️
2026-04-04 · JeffDean · 打开 ↗
各类模型基准测试结果及 Gemma 3 对比:https://t.co/FQ5fUPfFRE
2026-04-02 · JeffDean · 打开 ↗
今天,我们正式发布全新的 Gemma 4 开放基础模型系列,其核心研究与技术源自 Gemini 3 系列。这些模型树立了开放智能的新标杆,提供顶尖(SOTA)的推理能力,涵盖从边缘端规模(支持视觉/音频的 2B 和 4B 模型)到 26B 参数 MoE 模型及 31B 稠密模型。 通过以 Apache 2.0 协议发布 Gemma 4,我们希望能够激发研究与开发者社区的更多创新。此前,Gemma 3 系列的下载量已达 4 亿次,并衍生出超过 10 万个模型变体。我们非常期待看到社区利用性能更强的 Gemma 4 创造出怎样的成果! 了解更多详情:https://t.co/BW6O3Gr8bc 和 https://t.co/8M0XSQSP4u 向所有参与其中的成员致敬! #Gemma4 #AI #OpenSource #ML
2026-04-02 · JeffDean · 打开 ↗
我的朋友 Aaron Katz (@ceo_clickhouse) 说,这次 Google Cloud 的活动一定会非常精彩。
2026-03-30 · JeffDean · 打开 ↗
“给我你们疲惫的、贫穷的、蜷缩着的、渴望自由呼吸的民众。” 🗽 正如查尔斯·巴克利所言,我们正辜负了自己的理想。
2026-03-30 · JeffDean · 打开 ↗
上周我在 GTC 与 Bill Dally 对谈的视频上线了。我一直很享受与 Bill 的交流,这次我们广泛探讨了计算机架构、模型训练、专用推理硬件、定制互连等诸多话题! https://t.co/mEBhHasuC6
2026-03-27 · JeffDean · 打开 ↗
Prism is open source · ⭐ Star on GitHub · about