Jeff Dean

我的 @Google 同事 @NormJouppi、Sridhar Lakshmanamurthy、Cliff Young 和 David Patterson 最近撰写了一篇论文，题为《从 TPU v2 到 Ironwood 的 Google 训练超级计算机：五代演进中的架构稳定性、规模、韧性、能效与可持续性》，该论文将发表在 2026 年 7/8 月刊的 @ieeemicro 上。文中涵盖了大量关于 TPU 芯片代际演进、Google 工作负载演变（提示：Transformer 模型占比大幅增加！）以及每 flop 能效提升约 30 倍的精彩数据。这些代际间发生了诸多变革： - 从 TPUv2 的风冷转向 TPUv3 及后续版本的水冷 - 从 2D 互连转向 3D torus 互连 - TFLOPS/Watt 提升 30 倍 - 每个 Pod 的芯片规模从 256 颗 (TPUv2) 扩展至 9216 颗 (Ironwood) 阅读全文：https://t.co/D5NFYFv19V

2026-06-18 · JeffDean · 打开 ↗

今天的比赛看得真过瘾。Vozinha和整个佛得角队对阵西班牙的表现太棒了！

2026-06-16 · JeffDean · 打开 ↗

@pgasawa 和 @profjoeyg 的一篇佳作，对 AI 的进展提出了更细致的见解。

2026-06-15 · JeffDean · 打开 ↗

@uwcse @MBalazinska 分享一篇 @ToddBishop 为 @GeekWire 撰写的关于毕业典礼的精彩文章，其中还包含了我演讲的一些片段。 https://t.co/11K4Iq8NO9

2026-06-13 · JeffDean · 打开 ↗

@uwcse @MBalazinska 这是我分享的一些建议：https://t.co/iFXdeRIxKM

2026-06-13 · JeffDean · 打开 ↗

今晚很荣幸能在华盛顿大学艾伦学院（@uwcse）的毕业典礼上发表演讲。看到这么多学生及其亲友如此喜悦，我也深受感染。热烈祝贺2026届全体毕业生！🎓 感谢 @MBalazinska 的邀请！

2026-06-13 · JeffDean · 打开 ↗

人们平均每4年更换一次手机。这意味着每年有数亿部旧手机被丢弃，但它们作为计算设备仍完全可用。Google正与UCSD合作，探索如何将这些旧手机转化为云端计算的“手机集群”。通过这种方式让手机重新投入使用，可以避免进一步开采原材料，并利用制造设备时已产生的隐含碳，从而直接降低计算带来的环境足迹。此外，现代手机本身就是性能强大的计算机。详情请阅读下方博客 ⬇️

2026-06-13 · JeffDean · 打开 ↗

关于真实生物神经元能力的系列推文非常有意思（剧透：它们的能力远超感知器中的传统人工神经元）。@IdoAizenbud 及其合作者们干得漂亮！

2026-06-12 · JeffDean · 打开 ↗

拒绝一名入选世界杯裁判名单的索马里足球官员入境，这实在令人汗颜。世界杯的核心意义在于通过充满活力的体育竞技将人们凝聚在一起，因此，允许他参与执法显然才是正确的做法。

2026-06-09 · JeffDean · 打开 ↗

更多详情请见：https://t.co/mDg1zOOLuD

2026-06-09 · JeffDean · 打开 ↗

语音翻译是 Google 开展时间最久的机器学习项目之一，我们已取得了长足进步。Gemini 3.5 Live Translate 是我们最新的语音对语音模型，支持 70 多种语言，能让日常产品和应用中的跨语言对话更加自然。以下是 @InsideGrab 的合作伙伴如何利用该技术连接旅客与司机的示例。🚗 该功能正逐步在 Google 翻译及 @GoogleAIStudio 的 Live API 中推出。

2026-06-09 · JeffDean · 打开 ↗

恭喜 Ayanna Howard @robotsmarts！斯佩尔曼学院任命你为新任校长，真是明智的选择！

2026-06-06 · JeffDean · 打开 ↗

欢迎体验我们的 Gemma 4 12B 模型：这是一款性能强劲的开放权重模型，可直接在笔记本电脑上运行。

2026-06-04 · JeffDean · 打开 ↗

看到这一幕真好。科学界与大众都应养成习惯，为卓越的科学成就起立鼓掌。🎉

2026-06-03 · JeffDean · 打开 ↗

Károly，感谢这次精彩的 @twominutepapers 对话！

2026-06-02 · JeffDean · 打开 ↗

非常享受这次与 @OfficialLoganK 以及我的 Gemini 团队负责人同事 @OriolVinyalsML、@NoamShazeer 和 @koraykv 的交流。

2026-05-29 · JeffDean · 打开 ↗

2分钟内回答四个问题。感谢Google社交团队的建议，在昨天的#googleio上安排了这段小插曲！

2026-05-20 · JeffDean · 打开 ↗

高性能且快速的模型至关重要。我们全新的 Gemini 3.5 Flash 模型完美兼顾了速度与性能。

2026-05-19 · JeffDean · 打开 ↗

在 #GoogleIO 度过了美好的一天，Gemini 的发布消息满满！和我的 Gemini 团队同事 @OriolVinyalsML 及 @borgeaud_s 在一起。每听到一次 "Gemini"，就喝一口水吧！

2026-05-19 · JeffDean · 打开 ↗

3/ Gemini 3.5 Flash 今日开始全球上线。我代表整个 Gemini 团队，非常期待大家利用这一模型所能创造的无限可能！详情请见：https://t.co/PvGpSXACtm

2026-05-19 · JeffDean · 打开 ↗

2/ 看看 Gemini 3.5 Flash 如何瞬间消化晦涩的学术论文，并自主编写出一个全交互式的可视化网站，来解析研究中的复杂细节。这是一场惊人的压力测试，完美融合了海量长上下文、深度推理、复杂编程和超低延迟。它能帮你直击论文本质，助你深度理解！

2026-05-19 · JeffDean · 打开 ↗

1/ 今天在 #GoogleIO 上，我们发布了最新的 Gemini 3.5 系列模型，将前沿智能与执行力相结合。我们首先推出 3.5 Flash，旨在帮助用户执行复杂的长周期智能体工作流。 Gemini 3.5 Flash 是我们在编程和智能体领域最强的模型。在 Terminal-Bench 和 MCP Atlas 等智能体及编程基准测试中，其表现优于 3.1 Pro，且运行速度比其他前沿模型快 4 倍。在 Google Antigravity 中，3.5 Flash 经过进一步优化，速度最高可提升 12 倍。它是部署协作式子智能体、运行高频迭代循环并大规模解决现实问题的强大引擎。以下是我们激动人心的部分亮点 🔽

2026-05-19 · JeffDean · 打开 ↗

早期谷歌全员滑雪旅行真开心！我是第一排左起第八个，穿着白色浴袍（如果算上苏珊的宝宝 Ari，就是第九个）。

2026-05-15 · JeffDean · 打开 ↗

很高兴看到 @percyliang 将在 #cais2026 发表主旨演讲！

2026-05-12 · JeffDean · 打开 ↗

唔。说是演讲，但说是“菜肴”也行。主题演讲就像是一场多道菜的品鉴盛宴！

2026-05-06 · JeffDean · 打开 ↗

很高兴看到我的朋友 @andykonwinski 将在月底举行的首届 @CAISconf 上担任主讲嘉宾！

2026-05-06 · JeffDean · 打开 ↗

Google 翻译 20 岁啦！🎉 下面的推文串里有 20 个有趣的知识点和使用技巧。翻译是我最喜欢的 Google 产品之一，因为它拉近了我们彼此的距离！这些年来我参与了几项相关工作。第一项是 2006 年初始系统的部署，它在翻译质量上实现了巨大飞跃，因为它采用了基于数万亿词汇训练的更大规模的 5-gram 语言模型（事实上，这可能是世界上首次万亿 token 级别的语言模型训练：论文中的图表展示了随着数据和算力规模的扩大，质量提升呈现出类似 Scaling Law 的规律）。参见《机器翻译中的大语言模型》，Thorsten Brants, Ashok C. Popat, Peng Xu, Franz J. Och 和 Jeffrey Dean，https://t.co/QnK7lllpoj 第二次重大协作发生在 2016 年，当时我们将翻译技术从统计机器翻译转向了深度神经网络。这一转变依赖于两项关键创新：第一项是 Google 在 Sequence-to-Sequence 模型上的研究；第二项是我们开发的 TPU（定制芯片），它将深度神经网络的推理性能提升至当时 CPU 和 GPU 的 30-80 倍（并将延迟降低了 15-30 倍）。这使得像翻译这样计算密集型的语言模型服务，能够面向数亿用户大规模落地。参见《张量处理单元（TPU）在数据中心内的性能分析》，Norman P. Jouppi 等人，https://t.co/qpJl7FM6

2026-04-28 · JeffDean · 打开 ↗

我上周在 Cloud Next 与 Amin Vahdat、@gilbert 及 @djrosent 的对谈视频现已上线。 https://www.youtube.com/watch?si=vUY3hI_aDX8K6gco&v=BpnJYJmbXcM&feature=youtu.be 感谢这场精彩的对谈！

2026-04-27 · JeffDean · 打开 ↗

Decoupled DiLoCo 新论文已上线 Arxiv：https://arxiv.org/abs/2604.21428v1

2026-04-24 · JeffDean · 打开 ↗

值得一提的是，在过去的 14 年左右，我们一直致力于大规模训练和异步技术的研究。这是我们 2012 年发表在 NeurIPS 上的论文，我们在文中证明了该方法可以用于训练超大规模神经网络（在当时，其规模比以往任何神经网络都大 30 倍），并能以容错的方式将训练任务分布到数千台机器上。 PDF: https://t.co/UK1GlSt91h （这篇论文关注度不高，是因为我们当时忘了把它传到 Arxiv 上：哎呀！）

2026-04-23 · JeffDean · 打开 ↗

TPU 8i 与我们的 Gemini 研究团队共同设计，旨在支持低延迟推理。其核心特性之一是拥有海量片上 SRAM，这使得更多计算可以在芯片内部完成，从而减少了频繁访问 HBM 获取权重或 KVCache 状态的需求。 Boardfly 网络拓扑（见下图）通过以下方式连接 8i pod 中的全部 1152 颗芯片，实现了更低的网络直径：首先将单板上的 4 颗芯片全连接，再将 8 块板组成一组进行全连接，最后将 36 个“8 板组”进行全连接。此外，每颗芯片都集成了专门的集合通信加速引擎 (CAE) 电路，用于将各种归约 (reduction) 及其他全局操作从主计算单元中卸载，从而将片上延迟降低高达 5 倍。综合来看，这些特性将为大规模模型（包括通常需要映射到多颗芯片进行推理的 MoE 模型）提供极高的吞吐量和极低的延迟。这将使智能体 (agentic) 工作负载和交互式应用在 TPU 8i 上大放异彩。

2026-04-23 · JeffDean · 打开 ↗

首先，我们来聊聊 TPU 8t，它专为大规模训练和推理吞吐量而设计。 Pod 规模略微增加至 9600 颗芯片，单 Pod 的 FP4 性能约为 Ironwood 的 3 倍（8t 为 121 exaflops/pod，而 Ironwood 为 42.5 exaflops/pod）。此外，单芯片的 ICI 网络带宽提升了 2 倍，数据中心扩展网络带宽提升了 4 倍。更重要的是，该系统的能效比（performance/watt）提升了 2 倍，延续了我们多代 TPU 以来能效显著提升的趋势（8t 的能效比约为 TPU v2 的 60 倍）。

2026-04-23 · JeffDean · 打开 ↗

很高兴昨天能在 Cloud Next 上与 Amin Vahdat 以及 @AcquiredFM 的主持人 @gilbert 和 @djrosent 共同探讨 Google TPU v8t 和 v8i 的发布。官方博客详细介绍了这些新芯片的信息： https://blog.google/innovation-and-ai/infrastructure-and-cloud/google-cloud/eighth-generation-tpu-agentic-era/ 以下是我非常期待的一些亮点：

2026-04-23 · JeffDean · 打开 ↗

很荣幸能为 Decoupled DiLoCo 训练系统的开发提供一些建议。该方法允许在单个单元故障时，仍有 (N-1)/N 个单元继续运行，从而实现了大规模训练任务的优雅容错。推文串 ⬇️

2026-04-23 · JeffDean · 打开 ↗

很荣幸能与这群优秀的委员们共同参与评选。本次收到的申请质量极高，评审过程也充满了精彩的讨论。入选提案见下方，更多详情请访问：https://t.co/s3b8aXrp6Y

2026-04-15 · JeffDean · 打开 ↗

补充说明一下：点击第一张图中的图片即可了解更多关于 Ricardo 和该奖项的信息。我猜 Twitter 把我原本的链接 https://t.co/r6Xkt7poSW 自动转换成图片了。

2026-04-15 · JeffDean · 打开 ↗

很高兴看到 Ricardo Baeza-Yates (@PolarBearby) 荣获今年的 ACM Luiz Barroso 奖（该奖项旨在纪念我的 Google 老同事）。 Ricardo 被公认为全球信息检索领域最顶尖的研究者之一，你们中许多人可能读过他与 Berthier Ribeiro-Neto 合著的优秀教材《现代信息检索》。此外，他在壮大拉丁美洲计算社区方面也发挥了关键作用。 Ricardo 的成就和此次获奖定会让 Luiz 深感自豪！

2026-04-15 · JeffDean · 打开 ↗

太棒了！我小时候，阿波罗计划的影响还在，我一直以为人类会定期开展登月任务。真不敢相信自1972年以来我们竟然没再去过！祝贺NASA的所有人！🎉

2026-04-11 · JeffDean · 打开 ↗

祝贺 @matei_zaharia 荣获今年的 ACM 计算奖！实至名归！🎉

2026-04-09 · JeffDean · 打开 ↗

很高兴看到大家对能力出众的 Gemma 4 模型反响如此热烈！

2026-04-09 · JeffDean · 打开 ↗

很多人都注意到了，刚才的 YouTube 链接发错了。这是正确的链接： https://t.co/Vui7wYoN1O

2026-04-08 · JeffDean · 打开 ↗

对冲请求（Hedged requests，显然灵感源自我和 Luiz Barroso 撰写的《Tail at Scale》论文）被应用于单机环境：通过在不同 DRAM 通道间复制数据，并向所有通道同时发出读取请求，最后采用最先返回的结果。这使 p99.99 读取延迟降低了约 5-15 倍。 https://t.co/1OSmAKyCD3 太酷了，@lauriewired！附带的视频是朋友转发给我的，我也是通过它了解到的： https://t.co/onS2NWFjMP

2026-04-08 · JeffDean · 打开 ↗

标签页太多？转向垂直！

2026-04-07 · JeffDean · 打开 ↗

太震撼了！从地球上看，这些紫红色的色调并不明显（而漆黑的背景更衬托出宇宙的浩瀚）。

2026-04-07 · JeffDean · 打开 ↗

大型新闻机构怎么能犯下如此离谱的标题错误？🤦‍♂️

2026-04-04 · JeffDean · 打开 ↗

各类模型基准测试结果及 Gemma 3 对比：https://t.co/FQ5fUPfFRE

2026-04-02 · JeffDean · 打开 ↗

今天，我们正式发布全新的 Gemma 4 开放基础模型系列，其核心研究与技术源自 Gemini 3 系列。这些模型树立了开放智能的新标杆，提供顶尖（SOTA）的推理能力，涵盖从边缘端规模（支持视觉/音频的 2B 和 4B 模型）到 26B 参数 MoE 模型及 31B 稠密模型。通过以 Apache 2.0 协议发布 Gemma 4，我们希望能够激发研究与开发者社区的更多创新。此前，Gemma 3 系列的下载量已达 4 亿次，并衍生出超过 10 万个模型变体。我们非常期待看到社区利用性能更强的 Gemma 4 创造出怎样的成果！了解更多详情：https://t.co/BW6O3Gr8bc 和 https://t.co/8M0XSQSP4u 向所有参与其中的成员致敬！ #Gemma4 #AI #OpenSource #ML

2026-04-02 · JeffDean · 打开 ↗

我的朋友 Aaron Katz (@ceo_clickhouse) 说，这次 Google Cloud 的活动一定会非常精彩。

2026-03-30 · JeffDean · 打开 ↗

“给我你们疲惫的、贫穷的、蜷缩着的、渴望自由呼吸的民众。” 🗽 正如查尔斯·巴克利所言，我们正辜负了自己的理想。

2026-03-30 · JeffDean · 打开 ↗

上周我在 GTC 与 Bill Dally 对谈的视频上线了。我一直很享受与 Bill 的交流，这次我们广泛探讨了计算机架构、模型训练、专用推理硬件、定制互连等诸多话题！ https://t.co/mEBhHasuC6

2026-03-27 · JeffDean · 打开 ↗