大家好,这里是最佳拍档,我是大飞 5月30日 谷歌官方发布了一个对谈视频 Google DeepMind团队的四位巨头 第一次同时坐在了同一个镜头前 毫无保留地分享了Gemini从诞生到现在的所有幕后故事 以及他们对AI未来五年甚至更长远的预测 这四个人,随便拿出一个 都是AI行业大佬级的人物

几乎参与了过去十多年谷歌AI最重要的每一次技术跃迁 他们分别是Google Brain的奠基人、谷歌AI的灵魂人物杰夫·迪恩(Jeff Dean) Transformer论文的共同作者之一、混合专家模型架构的重要推动者诺姆·沙泽尔(Noam Shazeer)

Gemini的联合负责人、曾经领导AlphaGo和AlphaStar项目的奥里奥尔·维尼亚尔斯(Oriol Vinyals) 以及DeepMind的联合创始人兼首席技术官科雷·卡武库奥卢(Koray Kavukcuoglu)

主持这次对谈的是DeepMind的高级产品经理洛根·基尔帕特里克(Logan Kilpatrick) 他深度参与了Google AI Studio和Gemini API的产品开发工作 对Gemini的技术细节和产品规划了如指掌 在这场长达一个多小时的对话中 四位巨头不仅揭秘了刚刚发布的Gemini

3.5 Flash的研发内幕 还首次公开复盘了谷歌从PaLM到Gemini的融合阵痛与算力集中的战略 更是抛出了一系列颠覆性的预测 比如,科雷·卡武库奥卢直言 五年后的谷歌可能只有一款产品 杰夫·迪恩透露 Gemini很快就会用自己写的代码来改进自己 而奥里奥尔·维尼亚尔斯则坦言

他至今都对蒸馏技术的进化速度感到不可思议 接下来 我们就来给大家分享一下这期访谈的核心内容 首先 我们从Gemini 3.5的发布开始说起 这次I/O大会上 谷歌推出了以Flash为首的Gemini 3.5系列模型

这已经是Gemini的第三代半版本了 主持人问到 Gemini 3.5推出的这一刻有什么特别的感受时 奥里奥尔·维尼亚尔斯首先分享了他的看法 他说 Gemini项目从2023年正式启动开始 就一直建立在多模态、工具使用和智能体这三大基础架构之上 并且一直在不断地提升这些能力 这次发布的3.5

Flash版本 最核心的升级就是编程能力的大幅提升 同时也保留并增强了其他所有原有的能力 科雷·卡武库奥卢补充说 现在正是编程能力和智能体体验定义AI体验的时代 而Gemini 3.5在这方面迈出了非常大的一步 他认为 现在市场已经普遍认可了Gemini 3.5是一个非常强大的模型

这让整个团队都感到非常自豪 有意思的是 诺姆·沙泽尔却提出了一个不同的视角 他说,从某种程度上来说 这些重大的发布时刻反而变得没那么让人兴奋了 因为现在整个团队最关心的 已经不是对公众的重大发布 而是日常的使用体验

比如,他每天都会想 我明天要用什么工具来做我的工程和研究?我周围办公室的朋友们会用什么来进行他们的工程和研究?他们会对我有怨言,还是会觉得满意?这种来自同事和用户的日常反馈 其实才是最有趣也最有挑战性的 聊完Gemini 3.5的发布 话题自然就转到了Gemini项目的起源上 主持人问 在大家最初聚在一起组建Gemini项目的时候 是否就已经清楚地意识到 通过产品路径来改进模型本身会如此重要呢?

也就是说,是否从一开始就明白 只有让更多的人使用模型 才能获得足够多的反馈 从而不断地改进模型?对于这个问题 杰夫·迪恩的回答非常肯定 他说,这在当时其实是显而易见的 如果你的模型有很多人在使用 你就会获得大量的经验和教训 知道什么是行得通的 什么是行不通的 这一点在搜索领域已经被验证了很多年 用户对搜索的使用 真正启发了谷歌哪些地方做得不好、哪些地方应该做得更好

通过聚合大量有趣的日常使用数据来更深层次地理解这些问题 然后致力于改进它们,这至关重要 AI模型也不应该有什么不同 所以这从一开始就显而易见 但前提是我们要有一个产品摆在那里供人们使用 诺姆·沙泽尔也表示赞同 他说,真正的考验就是有人去用它 并且它对人们有用 如果你只是关起门来

试图在基准测试上盲目刷榜 那你最终得到的就只是好看的分数 甚至还可能导致基准测试数据泄露 结果并不会好 科雷·卡武库奥卢进一步阐述了这个观点 他说 你不想在一个黑盒里闭门造车的构建智能 你希望人们去使用它 因此,理解用户的需求至关重要 探索前沿不仅是指在技术能力上探索研究的前沿

也是在探索你下一步能为用户做什么 如果不把它和产品结合起来 你就无法做到这一点 这两者相辅相成 共同定义了"前沿"的含义 奥里奥尔·维尼亚尔斯则回忆了Gemini启动时的情况 他说,在Gemini启动时

其实已经有很多机器学习模型应用到谷歌的产品中了 当时大家都非常清楚 如果能创造出一个单一的、能力超越其他模型平均水平的模型来驱动一切 那绝对是一个巨大的飞跃 至于是否能围绕一个单一模型创造出一个单一的产品 当时可能还没那么清晰 但有一点非常明确 那就是将所有的算力和智能投入到一个单一的强大模型中

将会使谷歌已经在使用机器学习的许多业务实现跨越式发展 在最初被赋予如此多的算力和责任时 大家都感到非常兴奋 而现在 Gemini确实已经被证明成为了谷歌智能的核心引擎 说到这里 杰夫·迪恩抛出了一个非常重磅的观点 他说 甚至在我们启动Gemini项目之前

就有很多人在思考如何构建具有超强通用能力的模型 奥里奥尔当时在DeepMind领导一些工作 而我则在协助推进Pathways项目以及PaLM和PaLM 2等项目 我当时说,这太蠢了 我们正在分散我们的精力和算力 如果我们想打造一个极其强大的模型

我们就必须联合起来 集中力量构建一个单一的模型 这其实就是Gemini这个名字的由来 听到这里 奥里奥尔·维尼亚尔斯开玩笑说 我们先进行了Map,然后进行了Reduce 而科雷·卡武库奥卢则幽默地补充道 我还以为是因为我有双胞胎呢 杰夫·迪恩笑着回答,那也是原因 这个小插曲之后,主持人继续追问 当时将Google Brain和DeepMind这两个团队联合起来的决定 有多大的争议?

显然 现在大家已经看到了Gemini的成功 所有组织层面的复杂问题都已经成为了过去 但在当时,这件事是显而易见到了 如果我们不这样做,我们就无法赢 也无法为客户构建出正确的产品和模型的程度 还是说它最初更像是一个不切实际的高远想法呢?杰夫·迪恩说,他当时非常确定 将大家联合起来才是正确的做法 他甚至写了一份半页纸的备忘录 在里面明确阐述了分散精力的做法太蠢了 当时他感觉

把谷歌最好的想法分散在不同的、并没有真正协同工作的研究团队中 同时也分散了宝贵的算力 这两个问题显然都是应该去解决的 虽然在组织层面上确实有点复杂 而且还有时差问题 比如伦敦有很多人 山景城也有很多人 相隔8小时从来都不是轻松协作的方法 但他认为谷歌在协调和把大家聚集在一起方面做得非常好 现在

谷歌在世界各地拥有了一个非常棒、令人惊叹的团队 并且正在源源不断地打造出优秀的模型 诺姆·沙泽尔补充说 当时谷歌内部确实有一堆团队在各自构建大语言模型 你基本上只需要把他们融合在一起就行了 拥有一个这样的大团队 总好过五个规模很小的团队 科雷·卡武库奥卢则从行业发展的角度分析了这次合并的必要性

他说,在过去的某个阶段 人工智能研究其实更偏向学术界 如果你回到10年前 它更多的是学术研究 在那个阶段 你如何组织它并不是最关键的要素 更多的是关于探索 探索的速度才是重要的 但随着目标越来越集中

你真正想要的就是像杰夫所说的这种聚焦式的运作 因为这些工作需要更多专注的投入 而且就众多研究人员聚集在一起解决许多问题而言 其中的每一个项目都是一项重大工程 我们不再需要尝试并行地去构建各种东西 在那个节点上 将两个组织融合在一起真的是一个非常棒的主意 Google

Brain和DeepMind对此都行动迅速 并且促成了这件事 虽然把两个组织融合在一起从来都不是一件容易的事 但是每个人都意识到了这是正确的时刻 并且能从中获得巨大的价值 现在 整个组织都为大家共同构建的成果感到非常自豪 Gemini真正就是这个融合的果实 聊完Gemini项目的起源和团队融合的故事

话题转到了Gemini的技术架构上 特别是刚刚在I/O大会上发布的Gemini Omni 主持人首先提到 在这次I/O大会的主旨演讲中 谷歌似乎把Omni放在了类似世界模型的板块里 他非常好奇

这里面实际上是否包含了之前Genie世界模型的技术 还是说这只是一种面向下一阶段的市场定位 即输入任何东西并输出任何东西 而这就是谷歌对世界模型的呈现方式呢?这个问题可以说是很多人心中的疑问 而科雷·卡武库奥卢给出了非常明确的答案 他说 世界模型意味着你真正理解了动力学、物理学和视觉效果

然后你还必须能够对它进行模拟 因为这种模拟能力非常关键 它既能让我们理解模型是否掌握了正确的知识 而且当你想要依赖这个模型时 你也会希望模型能够向前推进这种模拟 并且模型做出的决策是基于对未来的模拟 这就是为什么他认为Gemini Omni属于另一个不同的范畴

它真正改变了谷歌之前对Gemini的定义 之前主要侧重于理解和文本输出 以及像Veo这种通过文本输入并进行视频建模的割裂状态 而Omni将这些能力融为一体 变成了一个真正意义上的世界模型 奥里奥尔·维尼亚尔斯进一步解释说 Gemini

Omni是通过联合训练 将这些能力转化为了一个真正意义上的世界模型 谷歌当然希望所有的东西都能实现迁移 建立一个更好的文本理解模型 也有助于提升世界建模的能力 但每次尝试都会发现这并不容易 不过,随着谷歌掌握了正确的诀窍 大家终于看到了成果 回想当年

推出一个复杂的视频场景、保持前后一致性等等所有这些事情 你几乎必须手动去思考它们 甚至要预先指定如何让视觉效果随着时间推移保持正确 而过去当你转动画面时 里面的物体就会消失 现在 仅仅通过大规模的训练并不断融合所有的数据 谷歌看到了这些能力的涌现 这才是令人兴奋的地方 也是谷歌一直以来提出的核心前提

现在 Gemini Omni终于还能输出令人惊叹且一致的3D世界、声音以及所有的一切 如果几年前有人问他这种方法行不行得通 他觉得这几乎是不可能的 否则谷歌可能10年前就这么做了 但事实是,它确实实现了

杰夫·迪恩则从更广阔的视角谈到了多模态的含义 他说,当你听到多模态这个词时 你本能地会被吸引到人类的模态上 比如文本、图像、音频和视频 但实际上 你更希望模型能够理解更丰富的模态集 比如理解来自基因组序列、化学结构、机器人抓取数据 或者激光雷达数据等有趣的科学数据 让模型接触一点这类数据

能让它在以后遇到更多同类数据时 理解得更好 接下来 这次对谈进入了最核心的部分 谷歌是怎么把Pro的智能 一代代塞进Flash里的呢?

这个问题可以说是整个行业都非常关心的问题 因为大家都发现 现在新一代的轻量级模型 比如Gemini 3.5 Flash 它的表现竟然超过了上一代的专业级模型 比如Gemini 3.0 Pro 这在以前是不可想象的 奥里奥尔·维尼亚尔斯首先坦言 他自己都对这种蒸馏进化速度感到着迷 他说 他真的没想到谷歌能一代接一代地做到这件事 就是把Pro的智能水平重新压缩塞进Flash里

在1.0时代发生这种情况时,你可以说 好吧,那只是第一代跑出来的结果 某些方面还很不成熟 所以我们改进了配方,这说得通 但是在某种程度上 这种进化有时甚至在加速 不管看哪个版本 新一代的Flash表现都超过了上一代的Pro 仅仅去理解蒸馏是如何工作的 他都依然感到着迷 谷歌怎么能在每字节或每个参数里塞进这么多的智能?

主持人紧接着问 是蒸馏技术本身发生了根本性的改变了吗?谷歌之所以能不断把更多能力塞进小模型里 是因为在蒸馏方法上有了架构层面的改进?还是说 现在用的技术其实跟当年最初发明时的基本原理差不多呢?对于这个问题 奥里奥尔·维尼亚尔斯的回答让所有人都感到意外 他说,蒸馏技术不仅没有变得更复杂

反而变得更简单了 最初 谷歌在Softmax中使用了一些温度调节的技巧 而且不得不采用模型集成 但现在,情况已经不一样了 说到这里 科雷·卡武库奥卢开玩笑地提醒他 别泄密

奥里奥尔·维尼亚尔斯笑着说,哈哈 不,我不会说出来的 杰夫·迪恩则接过了话题 透露了一个非常重要的信息 他说 只要你有一个非常非常优秀的老师模型 然后有一个学生模型就行 你不需要一个由50个老师组成的集成 你只需要一个真正顶尖的老师和一个学生 你几乎可以直接使用原始论文中描述的方法

加上一些适度的调整 但这个想法的核心精神基本上是一样的 然后 科雷·卡武库奥卢用了一个极其生动的比喻 来解释蒸馏技术的精髓 他说,这就像是在挤柠檬一样 你挤柠檬,汁水流出来 那些都是精华 然后你把它倒进玻璃杯里 这个杯子就是你的小模型 奥里奥尔·维尼亚尔斯补充说 大家应该去读读那篇原始蒸馏论文的导言

它有一段关于幼虫和昆虫的很诗意的引入 聊到这里,主持人又问了一个问题 在过去三年半里 Gemini在各方面取得了巨大的进展 有没有什么事情是让大家感到既正面惊喜 又负面惊喜的呢?

比如某些方面大家希望能取得更多进展

但很惊讶居然没有 而另一些方面 取得的进展可能远远超出了想象 诺姆·沙泽尔首先从谷歌的历史哲学角度谈到了正面惊喜 他说,回想过去 谷歌一直有这种单搜索框(One Box)的哲学 当年,用户在搜索框里输入某些内容 它会显示体育比分 输入另一些内容,它会显示股票行情 但在后端

这些全都是各自独立的、定制构建的后端 有些带有AI色彩,有些则没有 当时用户会理所当然地认为,噢 这背后一定有一个极其聪明的通用AI 它什么都懂 能处理所有这些不同的事情 而现在,谷歌真的把它做出来了 构建出了这个单框的通用AI 它确实变成了一个框 而且变成了一个统一的后端

谷歌终于为前端配上了正确的后端 因为打造了这个完美的单框 然后 话题转到了大家希望实现但还没实现的事情上 杰夫·迪恩说,他有一部分是工程师 一部分是研究人员 所以工程师可能会更挑剔、更偏向负面一点

他原本觉得谷歌在持续学习和那些不那么结构化的模型架构上 会取得更多进展 比如现在谷歌拥有的都是混合专家模型(MoE) 它们的结构都非常相似 他总觉得一种更具有有机生命感(Organic style)的架构 会是谷歌未来应该探索的方向 虽然目前采用的方法看起来非常管用 但他依然认为更有机的架构会很有趣

诺姆·沙泽尔则开玩笑说 他有那么一点点失望 因为目前谷歌还没有治愈每一种疾病 你不能直接输入 帮我发明一种治愈癌症的方法之类的话 然后它就直接帮你搞定了 但是,谷歌正在朝这个方向前进 主持人也分享了他的感受 他说,让他感到惊讶的是 把各种能力融合到单个模型中 居然需要耗费如此多的能量和心血

这显然是一场非常艰难的杂耍 你融合进一种新能力 它并不会直接开箱即用 你往往要拿其他能力做权衡 并且必须做出一些调整来弥补这些差距 从他的角度来看,这并不符合直觉 科雷·卡武库奥卢则从另一个角度看待这个问题

他说,有一点让他对模型感到惊叹 那就是模型内部依然蕴含着令人难以置信的巨大容量 谷歌一直在不断往里塞东西 试想一下 目前的模型其实并没有比三四年前的尺寸大多少 但谷歌却在不断塞进越来越多、越来越强的能力和信息 模型里居然还有这么大的空间 这也许就是硬币的另一面 对他来说,谷歌一直在这么做

而且里面依然有空间 这些模型里还有如此巨大的潜力 这也是为什么他其实感到很兴奋 因为就AI算法的发展而言 还有非常大的想象空间 他深信 这些模型的实际容量远远超出了谷歌目前所压榨出来的水平 未来将会有重大的创新 让谷歌能够利用这些模型做更多的事情 杰夫·迪恩进一步阐述了这个观点 他说

谷歌确实需要构想出一些算法层面的创新 好让模型从看到的每一级数据、每一个示例 或者每一个Token中获取多得多的信息 因为如果你看一下人类的学习效率 它比现在这种大语言模型的学习效率要高出一千倍

大语言模型需要看比一个真正聪明的人类多出一千倍的数据 然后才能达到与人类大致相当的能力水平 也许在某些方面稍好一点 在另一些方面又稍逊一筹 但它需要多出一千倍的数据 所以 如果谷歌能让模型从每一个示例中获取一千倍的信息 那将是非常惊人的 诺姆·沙泽尔补充了一个非常震撼的数字对比

一个人一生中大概能听到10亿个词 而一个模型却要在数万亿的数据上进行训练 并且还能记住它们 奥里奥尔·维尼亚尔斯则提出了一个不同的视角 他说,其实人类也是被预训练过的 你又不是第一个人类 所以关于这一点也是有一些争论的 但杰夫·迪恩反驳说 人类的基因库其实非常小 我们只有几个GB的源代码 聊到这里

奥里奥尔·维尼亚尔斯又提到了一个一直困扰着整个AI行业的难题 那就是评估 他说 关于什么事情一直很困难这件事 他有一个比较硬核的体会 那就是评估非常困难 即使是从科雷提到的学术界时代开始 在社区里这都有点被低估了

孤立地评估模型的能力 或者评估接下来的大事件将是什么 以及如何以一种不会让数据泄露到训练集里的方式进行评估 并且还要让用户认同这个评估数字 这里面有大量的工作和进展 但他感觉这依然出乎意料地难 也许是因为过去大家习惯了论文里的一张数字表格 而现在面对的是真实的用户和反馈

这虽然让人意外,但也很让人兴奋 因为每当你发现困难的事情时 你就会有动力去尝试解决它 评估是一件大事 它需要不断变得更好 杰夫·迪恩也表示赞同 他说 所有AI研究人员一直以来的梦想 都是如何构建出能够泛化到它们从未面对过的事情上的系统 这正是核心所在 即使你是在针对特定任务训练特定模型

你也希望它能泛化到该任务的新示例上 但现在谷歌尝试做的是 泛化到任何人可能提出的任何问题上 这确实是一个难题 但是通过拥有大量的用户 谷歌可以获得大量的反馈 在有些问题上可以泛化得很好 但在其他类问题上还不够好 接下来

主持人问了一个非常有趣的问题 四位巨头显然已经以不同的身份在一起工作了很长时间 有哪些研究领域是他们至今仍然没有达成共识的呢?科雷·卡武库奥卢想了想说 他倒不觉得大家意见完全一致 但也不认为会有什么重大的原则性分歧 因为在Gemini设计的宏大蓝图里 这个团队已经对各种各样的方案进行了实验

大家通过实验提炼出了很多想法 他知道杰夫一直有这样一个想法 构建一些更具灵活性、更具可塑性且更流动的系统 谷歌目前还没有走到那一步 但这并不意味着大家对此有分歧 只是现有的系统已经在经验上为大家指明了道路 这就是谷歌正在打造的模型 除此之外 大家并没有什么巨大的分歧 杰夫·迪恩补充说,在任何特定时期

每个人都会把更多的精力花在某一个或几个特定的事情上 而其他人不一定在那个事情上投入同样多的时间 比如,他现在把大量时间花在 未来的推理硬件应该是什么样子的这个问题上 因为他认为这是一项超级重要的核心能力

其他人可能没花那么多时间在上面 但当他向大家描述时 大家都会说 噢,听起来很棒!我们什么时候能用上它?诺姆·沙泽尔则说 现实是让大家达成共识的一种很好方式 你看到了实验结果 看到了什么是管用的 什么是不管用的 总的来说,Gemini是相当数据驱动的 很多人在小规模上运行实验,然后说 看,这是结果 大家就会说,这看起来很有前景 你有没有试过把它和这个东西结合起来?

而且大家必须以最有效的方式去使用研究级算力池 并且以数据为驱动来进行决策 科雷·卡武库奥卢最后总结说 如果你思考一下Gemini 或者更广泛的谈谈AI 它融合了太多层面的东西 从硬件到模型设计 再到产品以及所有的一切 所以 能有这样一个团队聚在一起协同工作 实际上是让它真正运转起来的最核心因素之一

聊到这里 对谈进入了对未来的预测部分 主持人说,大家应该做一些预测 这样一年后当大家回顾这段对话时 就能有一些被打脸的谈资

科雷·卡武库奥卢首先抛出了一个重磅预测 他说 他认为一年后可能会发生的一件事是自我学习 主持人问 自我学习和持续学习是一回事 还是有区别呢?科雷·卡武库奥卢回答说 它们是相关的 也许对某些人来说它们是一回事 但是现在谷歌正处于一个模型更具有智能体特性的时代 而且它们非常擅长写代码

谷歌已经在研究中开始使用它们了 他认为慢慢地 谷歌会在研究中越来越多地使用它们 并且迟早会走到一个节点 至少在某些实验层面上 谷歌将依赖模型来改进Gemini的不同部分 他的预测是 明年谷歌绝对会在这条路上前行 而且很可能会开始探讨这个问题 杰夫·迪恩补充说,到那时 谷歌可能可以明确指出

模型中某个非常重要的部分 其实是由模型和智能体自己协同生成的 诺姆·沙泽尔也表示赞同 他说,没错 到时候你不用再对团队成员说,嘿 你为什么不针对这个做点实验 下周告诉我进展如何?

你直接让模型去干就行了

奥里奥尔·维尼亚尔斯则从持续学习的角度提出了他的期望 他说 如果把自我学习建立在持续学习的基础上 作为一种更进一步的能力 模型能够通过其经验和交互来提升自己 而不需要去更新它的权重 比如某种运行得非常好的知识库更新 谷歌确实有这方面行得通的例子 但这项能力还没有迎来那种陡峭的增长曲线

还没好到成为每个人都会在模型中 理所当然去使用和开启的必备功能 所以,这是他希望届时能看到的一点 一年时间似乎是有可能的 杰夫·迪恩则提出了一个非常深刻的观点 他的另一个预测是 这些智能体将会把谷歌的所有工具都逼到极限 暴露出它们太慢的问题 这些智能体依赖的很多工具

即使你把模型本身的速度提升到无限快 你也会在提升实际工作效率时遇到瓶颈 因为工具的交互往往是为了适应人类的延迟或工作频率而设计的 诺姆·沙泽尔开玩笑地补充说 那30天里有29天半都花在等待各种列表的加载上了

最后主持人问了这次对谈中最引人深思的一个问题 五年后,谷歌是要么只有3个产品 要么拥有10,000个产品,大家怎么看?哪种情况看起来更说得通?科雷·卡武库奥卢毫不犹豫地回答说 只有1个产品 那个产品就是模型 这个回答震惊了所有人 主持人说,他喜欢这个回答 然后问其他人怎么看 杰夫·迪恩说

如果你有一个能力极其强悍的模型 它就能做非常非常多的事情 大家在这次I/O大会的搜索演示中也看到了 它甚至可以在搜索内部为你量身定制、创建出各种小应用和可视化效果 并且能写代码 所以从某种意义上说 如果用户量巨大 他不知道这算是一个产品,还是10 000个产品,甚至是1000万个产品

科雷·卡武库奥卢进一步解释说 认真的讲 他觉得人们希望以不同的方式来消费信息 所以像搜索这样的功能很重要 五年后谷歌肯定还会有搜索 可能会配上一个更具魔法感的搜索框

但是人们想要获取信息、并为了自己去消费和吸收这些信息的这种学习活动 依然是本质的需求 所以它一定会存在 并且,谷歌大概会有多得多的产品 因为做产品会变得非常容易 因为它们背后越来越多地由同一个智能核心来驱动 杰夫·迪恩也表示赞同 他说,谷歌会有很多的产品外显形式 而让这些产品变得惊艳的核心要素

其实只有少数几个 这就好比在这次I/O大会上展示的那款智能眼镜 它是一个独立的产品 但是它会因为模型变得更好、更懂音频、能更好地与你对话而变得更出色 但它依然是一个有别于搜索的、独立的产品 奥里奥尔·维尼亚尔斯则从用户体验的角度 提出了一个极具人情味的视角 他说,大家很清楚 无论具体产品是什么

背后绝对是由同一个模型来驱动的 但是作为用户 有时他觉得自己在操作数字设备时会做出主动的选择 比如想查看日历、发邮件 或者买点东西 这种界限分明可能更多是出于人类习惯的考量

而不是技术上无法将这些功能整合到一个产品里 但他感觉 决定自己想要专注于做什么的这种选择 到底是最终会消失 还是大家纯粹进化到不再需要它 他还不确定 但他发现自己有时依然喜欢这种所谓的关注点分离 所以,至少目前就他自己而言 他是不会去赌未来只有一个产品的 诺姆·沙泽尔则把话题延伸到了更远的未来 他说

大家一直在讨论的是信息形态的产品 即传递信息的产品 在这一层面上 你只需要探讨人类想要如何消费这些信息 是通过视觉?

文本?眼镜?还是某种直接将模型内部嵌入直接输入到你神经元里的脑机接口 或者类似古怪的东西?也许未来谷歌会涉足物理实体产品 开始去搬动原子 而不仅仅是处理比特 不过,这是对遥远未来的预测了 好了 以上就是这次谷歌DeepMind四巨头对谈的全部核心内容 几个人非常真诚、坦率地分享了他们的想法和思考 希望能给大家带来一些帮助 感谢收看,我们下期再见