大家好,这里是最佳拍档,我是大飞 今天这期内容 我想带大家走进一位反潮流的AI领域巨擘 迈克尔·I·乔丹(Michael I Jordan)教授的思考 他是加州大学伯克利分校(UC Berkeley)和法国国家信息与自动化研究所(Inria)的顶尖学者 甚至被《自然》杂志评为最具影响力的计算机科学家
但是他却对当下AI行业的狂热炒作、AGI概念的滥用 乃至整个领域的发展方向 提出了犀利的反思 今天 我们就顺着他在《Machine Learning Street Talk》播客中的访谈 聊聊AI真正该有的样子 放弃追逐通用智能的幻梦 回归到以人类为中心、以统计和经济为根基的务实路径
首先,乔丹教授最反感的 正是当下行业里对智能的过度拟人化 以及AGI这个概念带来的集体误导 我们经常会在各种媒体上 看到AGI即将超越人类这种吸引眼球的标题 但是乔丹教授直言 这种表述不仅毫无必要
更是对整个科研群体 尤其是年轻人的巨大伤害 他说 现在有大量20到25岁的年轻研究者 他们满怀热情想靠技术帮家人、帮自己的社区做点实事 却被行业里的意见领袖灌输了两种极端的论调 要么是 我们这代人已经把核心算法都搞定了 你们没机会了 而且AI还大概率会毁灭人类 要么是AGI很快就会到来 你们做的这些小研究根本没意义 这种话有多伤人呢?
教授用了“令人彻底泄气”来形容 他说这是他最在意的问题 一群本该充满创造力的年轻人 却被剥夺了对科研的期待 这会导致整个行业的创新根基都被动摇 而比打击年轻人更严重的 是当下AI研发完全缺失的经济思维 乔丹教授毫不避讳地说 现在的行业现状就是一场脱离现实的狂欢 只要能从互联网上偷走数据
没错,教授用的就是“偷”这个词 他强调 互联网让数据盗用变得轻而易举 却没人把价值返还给那些创造数据的普通人 只要能凑到足够多的钱
哪怕这些钱来自根本没有深入思考技术价值的投资者; 只要能在偷来的数据上跑一跑梯度下降这类经典算法 不管模型架构多临时、多随意 就敢宣称自己做的是前沿AI 教授说 他并不反对构建我们暂时无法完全理解的系统 但是这种“为了做而做”的研发模式 在人类科技史上都是罕见的 科技的本质是服务社会
而不是单纯的技术堆砌 可现在的AI研发 连最基本的“谁创造价值、谁获得价值”的经济逻辑 都抛在了脑后 说到AGI,教授的评价更是一针见血 这就是个纯粹的公关术语 除了制造噱头、吸引投资 只会扭曲科研方向、混淆商业逻辑 他说 那些常在播客、论坛上露面的行业领袖 要么把AGI吹成能解决所有问题的万能神
要么把它渲染成会毁灭人类的洪水猛兽 但事实是 AI的核心价值从来不是追逐这种虚无缥缈的通用智能 而是要回答一个根本问题 这些技术如何整合数十亿人的输入 又如何服务数十亿人的需求?
人类作为技术的生产者和消费者
这些角色应该被尊重、被放大 而不是被AGI这种空洞的噱头掩盖 可能有人会问 为什么乔丹教授能跳出这种AI迷思呢?答案就藏在他的学术背景里 他从来都不是传统意义上的AI研究者 教授自嘲说 自己是统计学家和认知科学家出身 这辈子从没读过一本专门的AI专著 就连AI这个术语
都是上世纪50年代约翰·麦卡锡(John McCarthy)等人提出的 当时他们想靠逻辑推理等方法实现人工智能 结果这些方法根本没落地 而真正推动工业进步的 是60到80年代发展起来的机器学习 包括决策树、最近邻算法、逻辑回归、隐马尔可夫模型这些核心方法 其实都来自统计学、运筹学等领域
比如亚马逊的云服务 最初就是为了处理机器学习的算力负载而搭建的 我们每天接触的供应链、商业配送、交通调度系统 至今也都在靠这些机器学习方法实现高效的运转 乔丹教授正是从工业落地派的视角出发 才看清了当下AI炒作的本质
很多人把能生成流畅文本的大语言模型 当成了解决所有问题的AI 却忘了机器学习真正的价值 从来都是解决具体的、落地的社会问题 也正因如此 他最近发表了一篇名为《AI的集体主义经济视角(A Collectivist Economic Perspective on AI)》的论文
核心就是想把AI拉回“服务集体”的轨道上来 教授说 当下的AI研究者大多没有清晰的目标 他们只是想当然地认为,人类有智能 大脑是计算机 只要模仿大脑、把模型并行化 就能做出厉害的AI 却没想过这些技术要解决社会的什么具体问题 他甚至直言 自己离开硅谷的核心原因 就是厌倦了这种空洞的讨论
硅谷的AI圈已经变成了内卷的“老鼠赛跑” 满是金钱竞赛 却缺乏深层和长期的思考 而他提出的集体主义 本质到底是什么呢?
教授在访谈中解释道 我们现在的AI技术 本质上是聚合了数十亿人的数据输入 最终要服务数十亿人
这本身就是一个巨大的集体网络 要理解这个网络 不能只靠计算机科学 还要结合社会科学,尤其是经济学 比如在博弈论的视角下 人与人之间既有合作也有竞争 我们需要把这些社会互动转化成可落地的数学框架 而不只是空喊“集体主义”的口号 教授反复强调,他不是要批判AI 而是想让AI变得更好、更安全、更有价值
而这需要把社会科学的思考 转化成具体的、可操作的数学方法 而不是停留在口头 聊到这里 就不得不提一个经典的认知偏差 “第一步谬误(first step fallacy)” 这是上世纪70年代德雷福斯(Dreyfus)提出的概念 也常和麦考德克效应(McCorduck effect)联系在一起 简单说
就是因为AI能生成流畅的文本、解决编程问题这类具体任务 就觉得我们离无所不能的通用智能 只差一步 但是乔丹教授说,这完全是错觉 现在的AI系统 本质上就是大型的统计盒子 只做输入到输出的映射
根本还谈不上系统级的思考 举个例子,现在有人鼓吹 大语言模型能当你的私人秘书 随时给你提建议、帮你处理琐事 但是教授直言 这是个糟糕透顶的商业模式 人终究是想自己思考的 没人愿意一直被一个智能秘书缠着 顶多需要每天结束时的总结 而不是全程的干扰 反观我们的医疗、交通、金融系统 这些系统里流动着数十亿参与者的数据 本身就有大量机器学习的应用 却没人从经济视角去分析 这些系统里的参与者有什么诉求?
他们之间的合作与竞争如何优化?要知道,市场体系几千年前就出现了 我们完全可以用技术去优化它 而不是盯着私人秘书这种小众的场景 主持人提到,硅谷的一些研究者 比如伊利亚·苏茨克维尔曾说过 只要把大语言模型做成多智能体系统 就能自动实现经济层面的价值 但是教授对此的评价是 这根本不是合格的工程思维 他举了个例子 上世纪四五十年代的化学工程师 如果只靠把一堆化学品混在一起做实验
只会导致爆炸、经济上不可行 还会伤害很多人 现在的AI研发也是如此 Facebook这类平台已经伤害了很多年轻人的心理健康 而新的AI技术还可能带来大规模的就业替代 却没人考虑这些现实伤害 只轻飘飘地说 旧工作会消失,新工作会产生 这种态度完全不负责任 教授还对比了传统工程学科和现在的AI研发
电气、化工、机械工程 都有像麦克斯韦方程、牛顿定律这样的核心理论做支撑 行业里既有动手实践的工程师 也有深度思考的理论家 但是现在的AI研发 只有一群聪明的程序员靠直觉来写代码、堆数据、拼算力 根本没有像之前学科一样深层的智力支撑 整个领域更像是在写科幻小说 而不是做严谨的工程研发 不过
教授也不是全盘否定构建我们无法完全理解的系统 他说,就像你无法解释 我为什么选这家Airbnb而不是那家一样 人的选择本身就无法完全拆解 但你只需要知道 我的选择有一定的可预测性 就能和我有效互动即可
这也是经济学的核心思维 不用理解每个个体的内部逻辑 只要能做定量预测 就能避免伤害、创造价值 我们再举个实际的例子 如果银行用AI拒绝了你的贷款申请 你要的绝对不会是 看神经网络电路是如何拒绝你的 而是和我情况相似的50个人里 哪些人拿到了贷款 他们和我有什么不同 这种基于最近邻算法的解释
才是普通人能理解、能操作的 所以 我们不需要强行拆解AI的内部结构 而是要在这个统计盒子周围搭建配套系统 理解它的输入输出行为 明确它的约束条件 就像化学工程领域 虽然很多现象长期无法被完全解释 但是工程师会聚焦于理解输入输出规律、利用这些规律解决问题 而不是只盯着为什么会这样钻牛角尖 教授说
神经网络的缩放特性确实很好 会长期存在 但是我们必须把它放到更大的生态里思考 它在生态里能做什么?
缺什么?多个神经网络之间如何互动?以及需要什么样的透明度 才能保证整体系统有效运转?主持人又提到
很多人把AlphaFold当成AI的高光时刻 教授也承认 AlphaFold是极其优秀的“靶向AI” 针对蛋白质结构预测这个特定的问题做得极好 但是它也暴露了基础模型的核心短板 教授的团队做过一项针对性研究 他们用AlphaFold预测的2亿个蛋白质结构
去验证蛋白质的量子涨落是否和磷酸化(phosphorylation)相关 磷酸化简单说就是蛋白质在细胞里是否处于活跃状态 如果只用已知的、有晶体结构的蛋白质数据 样本量太少,统计检验的效力不够 根本无法拒绝两者无关联的原假设 但是用AlphaFold的2亿个预测数据 检验效力足够了
却发现统计量的置信区间极窄 还严重偏离了真实值 为什么会这样?
核心原因是训练数据里 有量子涨落的蛋白质样本极少 这类样本不仅难结晶,相关研究也少 模型根本没学到相关规律 更不会针对这类边缘问题给出误差棒 而科学家恰恰最关注这类知识边缘的问题 针对这个问题
教授团队提出了预测驱动推理(prediction-powered inference)方法 在2亿个预测数据里 加入少量真实的ground truth数据 就能保证结果拥有高检验效力 同时覆盖真实值 教授强调 科学家总是关注知识的边缘 而基础模型在这些地方最容易出现偏差
所以必须在模型周围搭建配套机制 比如收集少量真实数据 用这类方法修正偏差 给出可信的答案 而不是像现在很多人那样 要么无视偏差 要么只会批判模型架构 却拿不出任何解决办法 而关于AlphaFold,还有一个关键的点 理解 教授在访谈里提到 他和谷歌的John Jumper聊过这个话题
Jumper对于AlphaFold理解生物学这个说法极其反感 Jumper明确说 AlphaFold不是整个细胞的模型 它只做两件事 预测和控制,理解是科学家的任务 也就是说 我们可以用它的2亿个预测结构进行实验、提出假设
但它永远不会替我们完成理解这个动作 乔丹教授对此完全认同,他反问 为什么非要让AlphaFold理解呢?他举了2000年左右亚马逊的例子 当时亚马逊用随机森林这类机器学习算法做供应链建模 能够精准预测印度洋的货船是否会延误 进而优化数十亿商品的全球配送 服务上亿用户 没人能完全理解这个大盒子的内部逻辑 但是这重要吗?
一点都不重要 因为它完成了关键的优化和预测 降低了整个供应链的不确定性 让整个工程系统能高效运转 给这类系统贴上理解、智能的标签 只是媒体为了博眼球的噱头 对研发和应用毫无实际意义 最后 我想总结一下乔丹教授想传递的核心观点 他从来不是反对AI 而是反对AI的错误方向
我们不该把AI当成有自我意识的智能体 不该追逐AGI这种公关话术 更不该脱离经济和社会视角 只靠偷数据和堆算力来做研发 AI的本质是一种预测工具 它的真正价值在于整合数十亿人的集体输入 服务数十亿人的集体需求
这需要我们结合统计学、经济学、社会科学 构建可落地的数学框架 搭建配套的保障系统 AI的未来 不该是科幻小说里的超级智能 而是能让普通人的生活更美好的集体工具 这或许就是乔丹教授想给整个行业的提醒 那么你认同乔丹教授的观点么 欢迎在评论区留言 感谢收看,我们下期再见