Hello,大家好,我是明浩。现在是北京时间是一月十一号的凌晨零点二十四。我刚从北京飞回上海,到我的家。然后在刚刚过去的一月十号这个星期六。我去参加了一场在北京的活动啊,这场活动叫 A G I Next。如果你是关注 AI 行业的话,应该在卡斯克、赛博禅心、机器之心、新智元、腾讯科技、三十六克、凤凰科技应该都看到了相关的推送。
对,在北京有一场非常非常重要的关于 AI 的论坛,我去参与这场论坛。嗯,这可能是少有的,我觉得整场活动,非常的干,非常的紧凑,嘉宾阵容非常强的一场活动。在现场,我认认真真的听完了所有内容,然后觉得需要跟大家分享一下这样的内容,然后,所以有了这次准备。其实我在极客上,在我的粉丝群里也跟大家说,我说我在准备这个内容,所以今天下午的活动大概是在。
五点半多结束,然后我打车去机场。去机场的路上,我把这场活动的速记,对你们现在看到的绝大部分的公众号的推送的内容,应该都来自于现场的速记。我也拿到了现场的速记,我的照片,我在我的日记上记录的一些纪要,包括一些观点,我全部把这些资料放给了 Notebook LM,让 Notebook LM 生成了几个 PPT 的文档,然后基于这三四个 PPT 的文档,然后又做了加工跟整合。
有了现在这份二十五页的PPT,嗯,这可能也是我第一次真正意义上在播客里,在自己的主节目上用AI生成的PPT来作为。PPT的展示,我觉得这似乎也可能是一个比较关键的节点。然后今天这一期博客也是我在二零二六年的第一期的博客。虽然说新年快乐有点晚,但是还是说一声嘛,祝大家新年快乐。啊,我正式开始今天的这个内容的讲述,啊。
Notebook和LM写的标题,其实是我给他的建议。这个标题叫“一场亲历的中国AI全明星赛”,AGI Next峰会前沿观察与思考。首先呢,我是在昨天下午大概六点左右接收到这份邀请的,是智谱的小伙伴跟我说,他们有这样一场活动,觉得我会有兴趣,所以看他们能过来。然后本来我在今天是安排的一个很重要的事情,是我的儿子就是小庄有一个比赛,我带他去比赛。
然后呢,临时跟老婆商量了一下,然后我们家还有老二,还好老二周六的课不是太多,就让老二周六请了假。然后他那个比赛是早上八点要签到,所以早上起来一家人六点多起床,收拾了一下,我们七点多出发,我带着他们几个,去到了我儿子比赛的现场,把他们送到那儿安顿好之后,我直奔机场。坐岛上的飞机,在中午落地了北京,参与到这场论坛里。
然后,我觉得这一切都是值得的,对。然后当然也很感谢我的太太给我这样的空间。然后这场活动叫AGI Next前沿峰会,它其实是清华大学基础模型北京市重点实验室作为主办。质谱的首席科学家唐杰教授作为召集人召集的这些嘉宾,当天的这个嘉宾包括谁呢?比如说,当然第一个开场的发言嘉宾是唐杰,啊。清华大学教授智谱的创始人,也是智谱的首席科学家。
第二位,杨智林,月之暗面Kimi的CEO。第三位,林俊阳。这个名字可能有一些不是那么了解行业的人对这个名字有些陌生啊,他是千问的技术负责人,你可以认为是今天这个时间点千问大模型的技术的一把手。对,然后,呃,当时我看到这个邀请函的时候,看到这三位,我当时就觉得哇,这个论坛的。这个阵容跟嘉宾的状态,不得了。
然后我再往下看,在三位演讲论坛演讲嘉宾的这个演讲之后,有一个论坛环节。论坛环节的嘉宾是杨强,啊,也是一位院士,研究AI的。然后唐杰,然后林君阳以及姚顺宇,对,就是那个刚刚接手腾讯AI大模型。一把手的姚顺宇,前OpenAI的研究员。然后更更更重要的是,这场论坛的主持人是广密,对,就是石相跟哈维多教授的创始人。
如果大家听张小俊的博客,你应该知道,小俊跟广密每个季度的大模型季报,应该是这个行业几乎所有人都会听的事情。所以,当我看到姚顺宇跟广密的名字出现的时候,其实我内心就在纠结说。这是一场非常值得去的活动,然后最后的最后,这场活动的总结是清华大学的院士,也是人工智能研究院的负责人张伯俊院士。他已经九十一岁的高龄了。
其实我之前上过一个清华的班啊,张院士给我们讲过课啊。他可能是中国当前人工智能这个领域最德高望重的一位院士。所以看到这儿的时候,把这个阵容称之为全明星,应该没什么毛病,对吧?然后把这个邀请发到群里,粉丝群有人说这就是元婴强者交换会嘛?这个梗可能如果你不看《凡人修仙》应该不太能了解。啊,《凡人修仙》最近的进度是主人公升到了这个元婴这个这个这个这个level,然后元婴的强者开了一个大的集会,然后他用这个梗来形容。
所以,这个note notebook IM的总结是群群星璀璨,中国大明星领域的首发阵容。啊,当天在现场开场的时候,唐杰唐杰教授在介绍嘉宾的时候,我数了一下,除了张院士之外,还有另外三位院士在下面坐着,所以整场活动有四位院士。然后,整整场活动的开场是清华大学的学学校的校长,第二个发言的嘉宾是海淀区区委的党委书记,嗯,你就知道这场活动的规格,然后。
产业内、产业内的核心玩家,这几位,呃,唐杰、杨志林、林俊阳、姚舜宇、广明,对。这个阵容基本集齐了中国大模型领域的核心力量,除了刚上市,今天晚上应该在忙年会的 MiniMax,然后几乎从来不对外露面表达的 DeepSeek,以及以边缘模型为主的字节 C 的团队,因为这场活动更多的还是在讲开源,对,它是 AGI Next 的开关键路径与中国的开源影响力,所以字节没在也合理。
所以,除了这几家之外,我觉得这已经是全明星全明星首发级别的阵容了。对,然后我们一个一个看,首先看三位演讲嘉宾:唐杰教授、Kimi的杨志林,以及前文的林君阳。唐教授的这个这个标题叫“让机器像人一样思考”。啊,他的逻辑是说,是否或者说他一直以来的学术的研究的方向一直是从人的角度去让机器,啊,成为一个类似人的状态。
然后他总结过去这些年,AI大模型经历了从最开始的小模型到大模型,到transformer到今天这个时间点的状态,从语言走到coding,走到agent,然后在二五年,大家所有人都在强调RLV二就是可验证的、可验证奖励的强化学习成为主流。也提到,智谱在今年,嗯,bad coding,然后做了auto G L M,然后在coding领域的进展也很强。
但在唐教授的这个整个的聊天过程中,其实有几句话让我们印象蛮深的。他说,他表达了一个他的观点:他说,我们的差距也许还在拉大,这个我们的差距是相对于美国的开源模型。他说,美国大模型更多在闭源上演进,我们不能仅仅为开源的成果而沾沾自喜。从这个角度来说,无论是作为一个科研人,还是作为一个产业的。公司的核心的创始人,我觉得这个认知还是很谨慎的。
对,然后,在整个唐教授的最后的演讲的最后,他放了一页叫“二零二零年的专注加创新”。我觉得这页内容基本上代表了,可能不仅仅是智谱,大部分今天市场上头部模型公司在二零年的研究重点。比如说,第一件事情是探索探索智能上界,仍然是AGI最本质的事儿。然后去scaling loud已知的是基座模型的关键,比如coding agent,甚至物理世界。
然后探索未知的是除了O系列之外,也是推理模型之外的新的范式是什么?然后第二点是技术创新,比如说全全新的模型架构,解决超长的上下文,更高效的知识压缩,然后记忆机理与持续学习。模型自主学习是AI超越人实现超级智能的关键,啊,自学习或者叫自主学习是今天这场论坛被提及最多的关键词,没有之一。后面会无数次讲到,然后多模态融合。
然后agent完成复杂任务,机器人AI for science,AI for science也是这场聊到比较多的话题。可能这是一个更偏学术的论坛,所以大家会聊到这些。然后这些关键词基本上代表了在这个时间点主流的模型厂商对二零年的期待。其实我还在准备一个一月底的超长的PPT的内容,关于模型进展跟二零年趋势上的演化,其实基本上还是这些内容。
这是唐杰教授,然后下一位就是Kimi的杨志林。嗯,我刚才回来的时候看,刘晶老师他们已经推送了一篇文章。是讲这个这个Kimi的创始人杨智林的演讲。其实大部分科技媒体都发了杨智林的这个演讲的全文,大家有兴趣可以看一下。然后,因为这场是一个偏技术的论坛,然后是唐杰教授组织的,所以唐杰教授在跟所有嘉宾去表达这场论坛的时候,都会说是偏技术的。
所以,杨智林遵守这个规则,他的整场演讲几乎全部围绕Kimi的训练的方式、方法、路径跟可能得到的结果。他当时的说法就是回归第一性原理,推动A G I的边界。其实这件事情跟刚才唐杰教授的二零年展望的第一条是一模一样的。然后Kimi在这件事情上其实核心只做两件事情,一个是偷坑的效率,一个是长长内容或者叫记忆的上下文的超长的这个事情。
然后。在杨振林的这个、这个、这个整个演讲的最后,除了讲这些技术技术之外,如果大家有兴趣了解内容,可以去看腾讯科技的推送,应该是杨振林的演讲的全文都在,我就不展开了。但是,我只说我自己有印象的一些内容,比如说,杨振林最后谈到了模型是具有独特 taste 的创造,他会认为今天这个时间点,在做模型的人。本质上来讲,是在把自己的品味融入到模型的创作过程中。
他说,一个好的AI应该追求什么样的价值?这种test将一个模型与另一个区分开,它不是商品。然后在演讲最后,他分享了一段他跟Kimmy的对话。啊,那段对话大概意思就是说,他想问Kimmy,AI发展这么强,到底我们该怎么与它相处?会不会担心很多事情?然后。杨林说:“我选择乐观,因关因为悲观意味着停滞,而乐观即使有风险,也代表着无限的可能性。
”他的终极愿景是将A G I作为探索未知的终极工具,用于解决人类在科学。健康、能源等领域的宏大挑战,他第几?马上他们会发K三,因为他们现在是K二,然后他可能还有K四,甚至K一百都有。这是杨志敏。然后第三位林俊阳,他的演讲我觉得,或者说今天整场论坛下来。林俊阳是圈粉最多的一个,表达非常的犀利、有趣,而且很直接。
啊,他年纪应该跟杨志林是一样,哎,对,应该是九三的,对,他跟杨志林应该是差不多大的。姚顺宇应该是九八的,对,这这一批呢,创始人跟核心的负责人真的非常的年轻。然后他演讲中提到,比如说像上来先提到,要体验千问的各种各样模型能力,推荐大家用 Chat 点千问点 AI,而不是那个 App。嗯,这个懂大家知道最近阿里的整个架构调整的话,应该知道他为什么会强调这一点。
然后他会解释为什么今天这个时间点,千问的模型的尺寸特别的多。因为这是一次一次面对客户的要求,从最最开始的最小的1.8b到7b到72b,然后中间可能有三点几b、四b的这样的模型。然后在今天的整个陈述过程中,林旭阳把比较多的篇幅放在这多模态上。对,在与智谱跟Kimi的对比上来讲,千问的多模态能力确实要更走得更远一点。
他也提到了一点点推理跟
coding,然后在这个这个这个核心的这个逻辑上来讲,嗯,林军阳说千问在真实世界的需求中迭代核心技术,现在在做的是高级推理、上下文,然后业界顶尖的代码能力跟真正的原生全模态能力,啊,这个可能是林军阳相较于。杨志林跟唐杰教授更多强调的一个观点就是多模态或者全模态,然后在整个全模态进化当中,他特意强调了他们在过去这一年在图像领域的进展,比如说在图像的推理能力上,他们现在他举个例子是说,它可以生成一张。
可能有十二宫格的照片,然后代表一一个人的一天。这个人的一天,每天固定时间在做什么,然后这个对应的时间跟做什么这些文字,跟当时的动作本身,这样一张图是一一指就是一下子生成出来的。那代表着图片生成有了类似今天我们看到南都不南等的那样的理解能力。然后他讲了跟另外一个更有意思的例子是说。他们做开源,把他们的图片的编辑的这个能力也开源到社区里。
然后一些开源社区的技术贡献者们给他提到一个他们原来完全没有想到的角度。他举这个例子说,啊,有一张图是一个女性的模特,她举了右手,然后你给AI模型下的指令是把她的右手放下来,然后这样就出现了第二张结果。然后他们做了一个事情,就是说是把这两张图混合在一起。你会发现那个图有点虚,虚就代表着,除了被挪下来的右手之外,其他的这个模特的身上的,比如衣服、身体的部位、脸部的特征,其实都出现了漂移。
那如果是罗先生说,如果大家用PS的话,其实除了那个被放下来右手之外,其他部分应该是可以贴在一起的,才是一个合理的或者说合格的做了这样编辑的功能。所以他们在改进模型的过程中,通过这样的方式去验证他模型有没有改进。所以他们在最新的二五一版本里面又做了类似的实验,发现这个漂移的问题得到了很好的改进。你想他为什么会把这个事情放到这么位置、这么重要的场合上来讲?
我觉得,大家似乎可以期待一下,千万在二六年在多模态跟全模态领域的进展。然后这是三位这个发言嘉宾的内容。其实他们内容,科技媒体上应该也有一些媒体发了他们的全文,有兴趣可以去翻一下。然后我稍微再多讲一讲那场论坛,因为确实这场论坛可能更是我期待的,甚至其实大部分的。我们看过去这几个小时,公众号的推送里面,很多公众号应该都选择了把这场论坛的速记作为核心的内容推送出来。
我没错的话,卡斯克是机器之心是,啊,还有哪个媒体应该也是。然后,这场对话叫。他其实当天这个会议现场没有对这个对话起名字,但是 Notebook LM 起了个名字叫 AGI 的下一个篇章。啊,广密跟针对这四位嘉宾的背景设计了四个我觉得非常好的问题,而且每个人都问到。你要想这四位嘉宾,啊,杨强跟杨强算特殊一点,他是加拿大皇家学院的院士。
是香港科技大学的荣修教授,所以他是偏学术的。但另外三位,唐杰、林俊阳跟姚顺宇,完全是产业界的从业者。当然,唐杰教授可能也有学术的身份,但是更多他作为今天,呃,质朴的首席科学家来参与这场会议。这四位嘉宾的角色、年纪、位置、行业经验完全不同。或者不尽相同。那针对这样的嘉宾构成,设计了四个偏通用的问题,我觉得广义能力还是非常强的。
啊,这四个问题分别是赛道的分化,就是今天这个实验你会发现,虽然都是大模型公司,但是大家在 bet 的东西出现了变化。第二个问题叫下一个范式。啊,刚才前面提到自主学习或者叫 continual learning 这件事情,似乎看上去是共识。第三件事情
agent。嗯,大家会认为,或者说现场,广义的引导会说,agent经历了二五年的发展之后,似乎二六年是一个很重要的,我们期待agent真正能带来所谓经济价值的爆发的这样一个年份。
那如果看待agent第三个问题,呃,第四个问题更宏观一点,或者说更。强烈一点是中美对抗的问题,就是四四问几位嘉宾,在三到五年之后,比如说世界上最领先的一家公司有没有可能是一家中国公司,这概率是多少?那如果是的话,为了达到这个目标,我们需要什么样的条件?所以四个问题,我们一个问题一个问题看。首先,很多媒体我看都很默契的,大家选择了差不多的同一张照片作为今天这个新闻的推送的头图。
啊,这张照片就是姚顺宇的大头照。为什么是他大头照呢?因为今天在现场,姚顺宇是没有来的,他是在线参与。所以当时的论坛是现场有四位嘉宾,就是广密加三位嘉宾。然后姚顺宇的那个腾讯会议的那个大头照是在屏幕上,所以头显得特别特别的大。呃,所以大家开玩笑说,这个腾讯的AI巨头参与了这场会议,对吧?真的是非常非常巨的巨头。
然后这应该姚顺宇入职腾讯后的第一次公开亮相。对,这可能也是当天现场很多人期待去听到他的表达的原因。然后,这位年仅二十八岁的中国最大互联网公司AI的一号位。看起来是有点紧张的,但随着讨论的深入,我觉得他答的还是不错的。然后先看一个问题,第一个问题关于赛道分化的,每家巨头有自己的选择。然后姚顺宇被第一个问到,广斌第一个问的是姚顺宇,对。
然后姚顺宇的解答方式是,或者说今天我在现场跟晚点的曼奇聊天的时候,曼奇也在问,说你听完这个论坛,你觉得姚顺宇。怎么样?或者说有什么想到的点?我觉得想到唯一的最重要的点是,今天有四个问题啊,每个问题姚春雨的回答方式跟逻辑是一模一样的,或者说他的切入点是一模一模一样,就是他把所有的问题分成了To B跟To C。
那似乎我们可以推演是说,在过去一段时间,啊,他加入腾讯这段时间,跟腾讯管理层、业务部门和同事各种各层人聊的过程中,可能或多或少的被很多今天这个十年我们在中国To C互联网的很多东西熏陶过了,所以他在这件事情上有非常强烈的界限感,这这是我最大的感受。然后在今天的这个。我们问的第一个问题就是巨头分化怎么看?
然后,现场姚顺宇的答案是这样:他说,从结论上来说,今天这个时间点,to B跟to C是分化的。to C领域似乎我们今天去问ChatGPT一个问题,跟我们一年前去问一个问题,得到答案的差别没有那么大。那似乎。to C的用户可能并不那么真正意义上需要一个那么强的模型,但是to B领域反过来,to B领域在用越来越多强的模型,跟越来越多强模型伸展到业务当中,比如说高定是最典型的。
然后他同时说,模型跟应用层也出现了分化。然后在To C领域,这种耦合性会更强,所以出现了类似大一统奥运One的这样的趋势,但是To B领域的拆分会更强烈,这是他的观点。然后顺着这个问题,广义又追问了姚春宇这个问题,是说,那你今天作为加入腾讯之后,你作为腾讯AI一号位,你在Bet的是什么?呃。他姚春宇依然用to B跟to C的角度去拆分。
他说,to C领域核心还是复杂的上下文跟记忆,然后to B领域他觉得更难一些,没有说更多。但是他说,今年十年,因为腾讯是一家有非常多场景跟业务的公司,所以。自身模型能力的提升应用到自身的已有的场景的业务当中来提升生产力这件事情已经足够大了,所以这是他的答案。然后第二个回答是千问的俊阳,俊阳俊阳说了一个很有意思的话,他说,这个虽然他是千问的技术负责人,但是他似乎也不能代表公司。
反问一下,他觉得春雨也不能代表公司。对,他说他的表达会认为今天这个时间点,每一家公司的核心或者说。类似他在这个这个他在苗星苗他在他的主题演讲中提供一个角度是说,还是更多以用户的角度去思维,就是如何服务好用户,可能还是更重要的。这是巨强的答案。然后,呃。这个这个,杨强的观点是说,因为他是学术界,他会认为今天学术界跟工业之间也跟业界就产业之间也出现了比较大的分化。
然后,产业界在疯跑,但学术界在过去一段时间开始慢慢跟上。然后最后是唐杰教授,唐杰教授说,似乎Chat的这场仗已经打完了。下一仗应该就是做事儿,然后就是通过 agent 来解决实际的问题,来实现差异化。这似乎也可能是为什么智普在过去一年比较积极的在推进,比如 coding 跟 agent 领域的演进。
对,这是第一个问题,关于啊分化。然后第二个问题啊,下一个问题是关于范式的。啊,下一代范式到底是什么?有没有什么苗头?然后依然是姚顺宇第一个回答。他说,在硅谷,自主学习基本上已经是共识了。但是他会认为,今天这个时间,大家谈论 online learning 跟肯定的 learning 之的时候,其实大家的概念也是模糊的。
就每个人都在说自己的角度,这可能跟 AI 行业过去几年很多的概念都一样。他有两个观点:第一,就是说他学 online learning 或者肯定的 learning
可能不是方法论。它不是一个新的研究范式,它是数据跟任务,以及包括数据任务在内的奖励函数,就是他会认为是偏数据跟机器模型的事情。然后呢,他会说,你比如今天个事情,大部分今天在用的各种各样的聊天工具变得越来越个性化,它变个性化的一个过程,其实也是一种广义上的LLM,对吧?
然后呢,AI coding工具随着使用越来越多,这些coding工具越来越了解每家公司代码的倾向跟不同跟习惯,那这算不算?自主学习呢?第二,他说,可能是一种非共识。他这种非共识是什么呢?他说,呃,ChatGPT用户。数据拟合成聊天风格,沿着这个角度来说,他说有一种非共识是说,那 ChatGPT 用用户的数据拟合聊天风格,算不算是自主学习?
然后今天世界上最好的 AI coding 工具 Cloud Code,他自己的百分之九十五的代码是 AI 写的,那他算不算呢?对吧?所以他会觉得今天这个实验在一些特定场景下。其实持续学习或者自主学习已经在发生了,只不过受限于场景。然后他会认为这件事情是一个渐变的过程,不会说因为突然间某一个事件或某一个产品或某个什么东西做出来之后,说这个就是自主学习。
他认为不是这样,他说在二五年其实很多东西已经出现了信号,然后。俊阳的观点是说,他从另外一个角度去解读这件事情。他说,R敖的算力就是强化学习的算力,在国内的这家大模型厂商里面的分布并不太多,没那么激进。但是在海外的,尤其是像比如马斯的S A I,他的很多的算力都投到了比较激进的强化学习这个板块。然后呢,他会认为。
如果把这个角度再往前推演,他说,大家讨论的 AI for science
就是让模型自己去研究一件事情,找材料,确定问题,解决问题,然后实验得到结果,甚至产出报告。这个过程本身似乎也是一种学习的过程。然后,他然后他说。这个问题就主动学习的反面可能会引发更多的安全问题,因为你模型在利用,比如说环境,因为今天事情大家是用用户的提示词来让模型产生答案,但如果未来环境本身也能给模型产生刺激的话,那模型会自己做一些事情的时候,必然会产生安全的问题。
对,这是他的观点。然后,唐杰教授是一个偏乐观派的观点,他会认为二零二二年会出现新的范式创新。因为scaling的效率的瓶颈已经是所有人都看到的事情,啊,并且学术界的深入研究也跟上了。虽然可能学校的卡跟业界的卡相比还少了一个零,但至少学术界已经开始有经验,并且做过一些尝试了。所以从逻辑上来讲,应该会有什么新的东西出现了。
啊,唐宁教授是比较乐观的在这件事情上。然后他会认为,更重要的是,对于一家模型公司而言,你每年的算力投入如果是一个固定的值的话,你今天重点是要把这个算力到底是投到预训练、投到后训练,还是投投到新的数据训练,还是新的什么东西上?你需要有一个整体的思维。要做全局的考虑去投入,考虑投入产出比了。然后是第三个问题,agent创造的经济价值的关键点。
二零二六年,大家会认为,二零二六年agent执行的任务的时长会变得更长,会做更多部署的相关的工作。然后首先还是姚顺宇,他会认为,to B的这件事情的曲线应该是一个肉眼可见一直会上升。他甚至举了个更极端的例子,说哪怕今天这个时间点,所有的模型研发停止,就模型能力就是这样了,但是就基于现在的模型能力做更多的渗透跟部署在to B领域这件事情,依然可能有十倍到一百倍的空间。
然后他会认为,在新的时代。嗯,人类跟 agent 合作当中,教育变得更重要,就是如何发挥让人类的能力帮助 agent 变得更好。这个更重要。这件事情可能跟最近,另外一位刚刚离开Meta的田云栋,也是一位技术大神,在知乎上发的二六年的总结趋势与展望里面,与与之相匹配的内容是他提出一个观点,他提出一个观点是说,类似费米能级,就是人类一个人到底能让A I能变得更好多好,才决定了未来人类的价值。
在这个问题上,俊阳的角度是说,今天这个时间点,A I呢更多还是跑在电脑的环境下。那肉眼可见,二六年大家会越来越多尝试非电脑,也就是说物理世界的环境,然后自然而然的引发到了类似机器人、具身这个角度。然后杨强院士会说:“我们如果按目标和规划,然后是人为的还是机器自动的这样方式来划分四个象限的话,今天时间我们在看到的很多位置呢,还处于比较早期的第一象限的一个阶段。
未来其他几个象限的发展依然还是会非常值得期待的。”然后。唐杰教授的观点是说,一个agent成功取决于三个要素的平衡:解决问题的价值、运行的成本以及迭代的速度。然后今天的最后一个问题,广明问了一个更直接的问题,就是未来三到五年,中国会是否诞生世界第一的AI公司?如果希望达成这个目标,我们需要做一些什么事情,或者有一些什么关键要素得到补充?
嗯,姚顺宇的观点是说他会认为比较乐观,嗯,因为我们在电力,我们在基础设施,我们在人才。在很多因素上,我们都跟得很紧,并且跟得越来越紧。但是当然也会有一些客观现实因素,比如说光刻机,比如说to B的市场的交付情况跟付费意愿。但是这些事情可能会有一些转机。然后他期待的是说,越来越多有冒险性精神的啊,能够做创新的人才的出现,这是姚的观点。
然后俊阳的观点会相对冷静一些,他会认为。我们在算力层面上,今天在美国跟美国相比,可能差了,一到两个量级。而且,美国的头部供应商已经把更多的研发的算力跟能力投入到下一代的范式研发上了,但我们还不是。呃,然后他举了个例子是说,之前阿里的光头哥,就是他们那个芯片业务的负责人,找到过李阳说,他在三年前就问,三年之后未来是不是还是传输方模,是不是还是多模态?
然后他说,他当时回答是说,三年之后我再不在阿里都不知道。了为什么是三年这样一个时期?因为。当时那个光头哥的人说,三年是我们留片的时间,对,所以似乎这件事情我们还有一定的差距。然后在这个问题上,广民就追问了俊阳:的你觉得这个概率到底有多大?然后俊阳说。百分之二十可能都是乐观的,对我觉得他相对会比较悲观一点。
他甚至在担心这个gap中间的gap是在是否在变大。在最后,唐杰教授做类似层次总结的时候,他说他更期待的是类似刚才尧尧舜禹讲的那个故事:一群聪明的人敢冒险,然后更好的营商环境,然后希望越来越多人在一些偏笨的事情上做坚持,我们能够得到一些好的结果。这是。唐教授的一个期待,对,然后到这儿的话,就是今天整场论坛演讲加论坛基本结束,然后最后一个环节本来是一个总结环节,但是意外的是,九十一岁的张院士,我觉得做了一个非常非常精彩的总结,啊,他的这个这个这个。
观点叫超越语言模型,通往可验可检验AGI之路。他似乎把我们上面聊到的很多事情做了一个更精炼的总结。当然,张院士应该之前做过类似很多这样的演讲,可能很多观点不是今天才有的,但是他把很多的东西变得更收束了。还有点更现实的问题是,张院士是最后一个发言,所以他的速记是最后发出来的。很多媒体在发稿的时候,他的速记还没有给到,所以很多媒体的文章里面并没有记录张院士到底聊了什么。
我就稍微展开点点。第一个观点似乎也不需要去论证,就是我们要从原模型到agent,嗯,要做复杂环境下的复杂任务,对L M到agent,从语言到行为,我也讲过很多次了,然后。一个可执行、可检验的AGI的定义到底是什么?他觉得会有五大关键能力。第一呢,叫时空一致的多模态理解与落地。他把多模态放在了第一位,并且加了很重要的一个形容词,叫时空一致性。
第二,可控的在线学习与适应。可控的在线学习适应,第三,可验证的推理与长期规划执行;第四,可校准的反思语言认知;第五,跨任务的强泛化,就是他会认为今天这个十年,我们在未来一段时间要解决的问题。那如何去解决这些问题?啊,张院士说可能有六个路径或者六个研究方向:第一,多模态;第二,具身与交互;第三,检索与证据落地;第四,结构化的知识对齐;第五,工具的执行与落地;第六,对齐与约束落地。
然后,分别这六件事情可能跟另刚才说的那五件关键能力是有一定的对应关系的。然后,这个问题再上升到一定高度,因为毕竟张院士是一个做学术研究,他会认为今天这个时间点,哲学层面。人工智能作为未来世界可能的主体存在,我们人类到底跟人工智能该如何相处?这个问题其实也是很多人探讨的问题。他会认为有三层,第一层叫功能到行动主体。
就是AI有了功能,那其实今天我们已经达到了,并且再往上提升。第二层叫规范跟责任主题,就是它真的很强的时候,它的规范跟责任到底是什么样子?第三个是最最最科幻的那个想象,就是它真的有了意识,它有了所谓的体验,我们人类该如何与之相处?然后他会认为,从这个角度去思考,从那个中局去思考来说,当务之急的事情还是对其跟治理。
最主要的治理不是治理机器,而是治理人类,也就是今天你甚至在做AI研究的跟大模型的相关的使用者。然后他最后提到了。企业家啊,这个其实我有点意外。他最后会提到企业家。他说:“大模型之后,我觉得最优秀的学生,他的学生都是搞人工智能,都应该去搞企业,因为人工智能跟企业家做了重新的定义。”AI企业提供的不简不再是简单的产品跟服务,而是知识、伦理和应用变成了可复用的工具,这样造福全人类。
目标是把人工智能变成水和电一样的通用技术。企业家是一个光荣而神圣的职业。人工智能时代的企业家必须担起新的社会责任,包括治理和实现普惠的可持续增长,这是新的使命,使得AI时代的企业家成为一个光荣跟神圣的职业。张院士最后把问题拔到了这个高度,这可能大概就是今天绝大部分现场论坛的内容。然后我做成PPT,大家有兴趣可以去下。
然后,在所做所做完所有这些整理之后。然后我回看我今天做的记录,我发现我记录了一些很有意思的发言。这些发言都或多或少代表了这些今天这十年世可能是世界上最优秀的AI相关的研究者跟呃创业者们在想的事情。我一个一个说,当然是一些偏零散的tips。第一个我记住了很深的一句话,是唐杰教授说的。他说今年可能是多模态的失一年,就是二五年。
这个结论其实有点意外的。对,因为很多人会觉得多模态在二五年发展很好,然后当时唐教授就是说,除了Nanopanda之外,大家似乎并没有看到其他厂商在多模态上非常强的进展,他会认为这是多模态的试一年,所以是从他的厂商的角度来看。那反过来讲,似乎如果厂商意识到这件事情,那二六年多模态领域的竞争应该可想而知的会变得越来越激烈。
第二。因为杨志林,在他整篇演讲的最开始写,他说这一轮的AI的智能提升本质上来讲是能源到智力,所以他为什么会那么强调token的ROI,就token的使用效率?就是在做的这个事情,然后第三句话是林俊阳说,他说今天大如果做大模型,如果不是为了全人类来做,就不要做了。我我完全没有想到一个九三年的技术研究员会以这样的方式去看待这件事情,十分钦佩,respect。
然后第四句话依然是林俊阳讲,他说他们在期待千问在二零二六年可以做到三进三出,就是全模态模型。输入跟输出都是多模态的。嗯,我在去年做总结的时候,我说过,这个这个,如果以桌来去论论述AI的话,大家会说语言模型是一桌,多模态是一桌,可能口顶是半桌。那似乎看上去,在今天这个时间点,无论是Google的。这个这个Gemini模型,还是千问今天所表达的这个状态,以及其他一些门厂商在努力的方向,看上去。
语言多模态高定可能是一种,而不是分开的三种。对,然后下一句话叫“吃的好了很多”,对,这个是姚顺宇说的。现场广密第一个问这个姚顺宇的问题,其实是。感觉怎么样?因为这是他第一次回国接受公开的这样的采访,然后他当时有点紧张,然后说了一个吃的好了很多啊,我觉得还是挺挺挺挺平和的一个人,对,然后。下一句话其实刚才前面提到,也是俊阳在回答哪个问题的时候说,他说那个他他们应该是在谈论巨头的分化的时候,林俊阳说了这样一句话,他说,啊,理论上我是不能评论公司的,但我觉得公司也不一定有那么多基因之分,啊,一代一代的人可能就塑造了这些公司,比如今天顺宇到腾讯之后,可能腾讯就变成了一个有着顺宇基因的公司。
当时现场大家都笑了,对我觉得这一代的研究员跟这一代的这最年轻的企业家有一种特别怎么讲?特别云淡风轻,特别开玩笑,特别那样的状态,我觉得挺好的。对,然后,啊,最后两句话是张院士说的。九十一岁的张院士,他在总结陈词的时候,虽然说第一句话说:“我可能没资格来做这个总结。”你要知道,张院士是今天这个时间点,整个中国人工智能行业最德高望重的那一位,他的学生遍布在。
各家头部的AI公司里,但是今天他说了这样一句话,他说:“当然,他说这句话的逻辑是说,可能他,嗯,比如他听到前面很多嘉宾去讲很多新的问题、新的议题、很多年轻人的状态的时候,他会觉得他已经老了。但是今天这位九十一岁的院士,你现场看到他,你完全不会觉得那是一位九十一岁的老人,特别。”特别有能量,特别,特别强的状态。
这这个体验到哪儿?就是最后一句话,他说:“我在听今天的下午的活动过程中,还在中间的时候去休息室改了他的最后的PPT。”我当时听到这个时候,我都惊了,就是。就是一位九十一岁的院士,啊,为了这样一场活动,在会议的中间听到很多人的新的内容去改他的PPT,你会觉得啊,就是特别的佩服,特别的respect。然后今天的活动,只想停下来,你会觉得对中国的人工智能行业。
还是挺期待,跟挺有信心的,呃,这些嘉宾其实的年纪跨度非常大。杨顺宇是九八年的,然后林俊阳跟Kimi的创始人杨振林是九三年的,唐姐这会应该是七零后吧,然后Minion创始人严俊杰应该是八零后,然后你会发现,今天这年可能在很多AI的公明星公司里面有很多零零后,这些人构成了AI行业的中国的群像,我会觉得。
我第一次的这么明显的感觉到这些人的群像的状态在今天的活动当中,然后再把问题扩扩一点是说,啊,我本来。参加完活动就特别想表达,也想把这些事情告诉大家。然后,因为受限于我要去机场,我在机场没法录,我只能做内容。然后看到很多的在场的媒体朋友们,在很快的时间就把速记发出来。然后你会有一些小小失落,你说哦,我不是那个最早把这些内容跟信息传播给大家的人。
但后来又一想。我只是一个记录者,对吗?我是司马迁,我只负责记录就好了。但在记录过程中,我也会有我的倾向、偏好,更想表达的东西。然后,甚至包括这种方式是博客,是PPT,是带着感情,带着一些别的东西的。我也似乎觉得那些事情,这些东西是有作是有作用的。然后,我刚才下飞机回来的路上。张胜胜听这期《四十二财经》采访曲凯采访金建,然后在最后结尾的时候,那个曲凯问张金建未来三年有什么这个这个建议。
金建说,随着AI能力的越来越提升,人类已经越来越难去伪装跟掩饰什么了,所以做真。那个双引号的“真”可能是唯一的出路。对,这也是我今天想表达一些东西。可能有些零散,有些临时,有些不成体系,但我觉得我很想在最短的时间把这些东西告诉大家。然后,感谢大家收听我的播客。然后我的PPT在生动那里,如果需要可以去下。
当然,我说了这是Notebook做了大部分工作,我做了小部分工作。对,然后再预告一下,一月底不出意外的话,应该一月底或二月初的时候,我会再更新一版,应该超过一百五十页的PPT吧。然后全部推翻去年十一月份做的内容。啊对,感谢大家,我去睡觉了啊不,我要去剪辑,然后写note,呃,大家听到的时候应该已经应该是凌晨了,感谢。