在中国的这些 AI 团队里面,什么公司的人被搜的最多呀?啊,目前肯定是千问嘛,不是 DeepSeek 吗?千问现在不是。你觉得钱对这些人意味着什么了?比如说 Meta,他祭出这种天价挖人的策略,他到底是在打动谁了?我说实在,我不知道,因为就是人类历史上很难有一个时期,就是搞智力的这个人能拿这么多的钱。
你会被这种反差和戏剧性所吸引?我当然啊。那比较有代表性的就是啊,其实大家可能知道 GPT 之父发布 GPT 的时候,只是一个二十多岁的一个来自波士顿近郊富兰克林-莫林工程学院毕业的一个本科生。就这种人,就让我就很容易联想到文艺复兴时期的这种艺术创作者,或者这种这种呃艺术家,就是他完整的在做一个作品。
是的,是的,最典型的作品其实就是你的论文。我觉得非常舒服的一点是,就当你有了作品,没有人会面试你这个写代码这种东西了,因为不重要了。欢迎收听晚点聊,我是曼奇。今天的节目分两次录制,嘉宾是高岱恒 Sam,他在 AI 技术圈和开源社区非常活跃,曾是双飞土木老哥,后来因为对 AI 开源项目的贡献进入了阿里达摩院,现在自己创业做了一个找到 AI 人才的 agent 产品 DINQ D I N Q。
而本期我们聊的主要话题却是他的副业和消遣,挖掘 AI 人物故事。Sam 对此非常着迷,在达摩院时他就很喜欢搜集 AI 大牛的人生故事。那些非典型的、充满反差的成长经历尤其吸引他。本期的第一部分,我们聊了上周刚发生的阿里千问的人事变化。Sam
分享了他作为开源模型受益者和前大模型成员的一些观察。这整个过程的更具体的情况,大家也可以看晚点 Late Post 从上周到本周发布的三篇报道,以及我们的上期播客。
本期第二部分是春节前的聊天。我们聊了 Sam 熙熙乐道的 AI 人物英雄传,在他的眼里,这些不问出处、不拘一格的研究者就像文艺复兴时期的大师,他们有各自的性格、癖好、执念和技术浪漫,这对大型商业组织来说是陌生的,需要适应和理解的。我们也由此聊到了未来的研发型人才市场会如何变化。接下来你即将听到的第一部分是我们的最新讨论。
呃,Sam,你可以先和我们的听友简单打个招呼。Hello,Hello,大家好,我是Sam高岱恒。然后我之前是在阿里达摩院和通义做算法工程师,然后后面的话自己在做AI Agent方向的创业,主要是做人才招聘啊相关的这个方向。对,因为我和 Sam
其实春节前已经聊过一次,那这周想再补录一下,也是因为我们聊的话题就是 AI 人才这群最聪明的研发者他们的故事和个性,以及现在这群人怎么来推动这个新的技术和应用的发展,和上周发生的一个大新闻非常相关,就是。
阿里千问的人事震荡,林正阳就是作为千问的负责人,他突然提出了离职。所以想嗯补充,就这个话题稍微展开聊一下。一个是我我比较好奇的呀,就是因为你们的产品 DINQ 本身它就是一个帮公司或者帮一些 AI 的研究项目。啊,包括一些投资人去寻找 AI 人才和有可能会创业的高潜的这种 AI 方向的领袖。那在上周的这个新的变动发生之后,比如说你们自己平台上看到的搜索量有什么变化?
有更多人去找千问这个团队的候选人吗?呃,从定量来看呢,主要是搜索的量翻了三倍,然后有差不多两三千条 query 在查千问相关的人,或者说千问过去发表论文里面的作者信息。对,然后主要的集中方向还是大语言模型、强化学习和 agent RL 这些方向,这些比较热门的。方向,然后图像和语音的话会比较少一些。
那搜索方是什么类型啊?你能看出来吗?大概主要还是在 HR猎头这个群体会比较多。对我们还看到了像 Meta 的 Executive Search 叫 George Lindner 这样的人也在搜千问的这些候选人。OK,所以也有国外的公司,对吧?你说有 Meta
的,就专门负责这块的人也在搜。对,是的,因为其实上次我们也聊到过,就是在没有发生这个事情之前,你说海外的很多公司或者研究机构来搜中国的候选人的时候,其实最后匹配给他们最多的也是千问团队的人。
但另一方面,千问的人总人数并没有那么多。其实这个就在通义实验室这个大的实验室里面,千问其实呃自己就一百多人嘛。那相当于有了这么一个新的变动之后,就直接针对性的来找他们的人更多了。嗯,是因为有这变化嘛,大家就觉得可能有些人可能想看一看其他的机会这样子。因为你一直也是在开源社区比较活跃,也认识很多机构和研究者,就是这次的这个事儿,开源社区大概是一个什么样的反应?
大家觉得。挺奇怪的,因为就从现实角度来讲,千问在呃,我我不知道商业这个部分,因为我也不是很了解。那我就从影响力的这个角度,千问是开源一个第一梯队,在国外的话呢。呃,应该跟他比较类似的是法国团队做的一个公司叫 Mistral。Mistral 呢是世界上第一个开源模型 Llama 的背后的团队的一些核心成员出来做的。
那作为千问来讲,它本身其实没有先发优势的情况下,它现在的这个模型的下载量在两个世界级的开源模型托管平台,一个叫 Hugging Face,叫抱抱脸。中文叫,一个是摩大社区,呃,阿里搞的叫 ModelScope,那下载量都是远超于呃 Mistral 这个公司的开源模型,也就是它事实上成为开源模型领域的这个霸主。
然后它因为有非常多的这个模型的系列啊,各种小模型,然后各种啊图像相关的、视频相关的,还有呃各种。什么推理相关的模型,还有 embedding
模型,就这样的模型让整个生态,让整个学术界得到了很多的这个益处。因为很多在学校里面做研究的这个同学,无论是国外还是国内,其实大家都没有什么计算资源。那所以在这种情况下,你会看到一个现状,就是呃,学术会议就 AI 领域,我们说评估一个研究员有没有能力,有一个很重要的方向就是你。
能否在顶级的学术会议上面发表你自己的论文?比如说,这里面有一些什么神经科学的这个会议叫 Neurips,然后还有一些这个计算机视觉的会议叫计算机视觉与模式识别(CVPR)这样的会议上。你会越来越多的看到这些会议的论文在引用千问的这个技术报告啊,然后用千问的模型作为,无论是这个呃作为一个 agent 的一个大脑也好,还是作为一些其他的这个链路里面的重要环节,就又被用的越来越多。
所以,在这个角度来讲,千问其实推动了整个 AI 的这个就学术界或者工业界的一个比较重大的发展。呃,我觉得它的价值和意义是非常非常大的。然后,但商业上的话呢,这块儿确实我个人的话,我不是特别了解,对,因为你刚才在对比他在开源社区影响力的时候,你是和 llama 和 mistral
去对比的。其实可能对就是中国的关注这个块的人来说,大家更熟悉,比如说像 deepseek,包括后面 Kimmy 和 Midimax 和这些月智普也都做了很多开源的模型。
那千问的就是在开源里的影响力,包括你说的下载次数,然后开发者的数量,和中国这些其他的开源模型来比,是个什么情况?呃,现实来看,就是千问的模型的总的下载数量,在刚才我们提到两个开源模型托管平台的下载数量,是后面这些人加起来的总和还要多。主要原因就是因为它的尺寸非常多,对吧?就是你说的,它其实能用的。零点六B的什么一B的,然后呢,就是它它的家族生态也特别的完善,嗯,对,呃,再加上其实从二三年开始,二三年下半年开始,也已经有一些团队开始用千问的模型写在自己的论文里面了,然后它就对于学术界来讲是一个标准实践,叫事实的标准defacto
standard,然后在这个行业里面。
所以这个心智非常非常重要,因为你如果没有这个心智的话,你的营销你宣传起来你成本是非常高的。其实巨身智能行业用千问也比较多,这个我知道,因为就是机器人本身它对尺寸对,因为它有些端测的得用那种相当于延时啊比较小,然后算力消耗也比较小的,就巨身也会用到很多千问的积木啊。是的,是的。然后你刚还说了一个点,我觉得也挺有意思,可以展开一下,就是你说的那个摩搭社区和
Hugging Face,因为 Hugging Face 是个还挺老的社区嘛,一六年就开始做了。
然后摩搭其实是阿里,应该是从二二年底到二三年开始做的,对吧?你那会儿应该还在达摩院啊,所以其实摩搭也是。就是作为阿里发起的一个生态,它成长得很快,可能也跟就是阿里整个的开源策略以及千问后面的一系列生态的完善也挺相关的。那个时候,ModelScope 就是摩搭这个社区呢,其实说实在的,还不是特别的流行。
对,然后当时我们还内部的同学,最开始的时候还被要求在里面贡献一些自己的模型、数据集之类的。然后后来没想到,这个现在的访问量在上面模型的下载量也越来越多了,越来越好。对,这个可能也是一种证明,就是说中国或者华人领域用呃在 AI 上面的这个从业者、开发者也是越来越多。像比如说摩搭社区这种东西,它长期来说对阿里会有什么比较大的商业价值吗?
这个是个很大的问题,这个我只能从我很狭小的这个视角去理解这件事情。呃,我的看法呢是说。呃,像 Hugging Face 或者像摩搭社区,本质上是 AI 时代的呃 GitHub 类似这样的东西。那这样的东西的价值在于说,你需要有一个地方,有一个 hub 去承载这些多种多样的模型、数据集和一些应用。这个应用呢,我们会放到 Hugging Face 或者摩搭有一个叫 Spaces 就空间的这个栏目里边。
那这样的东西越多呢,就是大家就会越来越多的来到你的平台去使用你平台的内容,然后呢,在你平台上做贡献,然后留下一些 comments。那这些东西其实对于模型的发展,对于这个技术的迭代,其实有一个重要的指导意义,是说你知道这群开发者、这群研究员、这群 AI 领域最前沿的实践者,他们关心什么。因为他关心的东西,显然他的调用量就会高,他的 likes 点赞的就会多,然后会有更多的评论。
什么东西是他不关心的?那这些东西反过来学习的信号来讲呢?它其实是能够去反向指导说,OK,今天我们应该花更多的精力在哪些项目上面,然后到底应该把精力集中在做什么事情?我认为它是一个很好的环境,然后不是每个公司、每个组织都有这样的能力去搭建这样一套环境的啊,所以我认为从这个角度来讲是很有用的,因为从二五年其实下半年开始。
我们看到 AI 领域最挣钱的公司其实就是卖强化学习环境的公司,对,是这样。然后你说如果这个平台直接挣钱的话,其实它有很多方式,比如说,呃,像 Hugging Face
这样的平台,它有一种直接挣钱的方式,就是说我可以把你的模型部署在这儿,然后如果有人调用的话,然后。你可以这个就是向他收取一定的费用啊,然后呢,你可以相当于把你的模型托管在我们的平台上去提供推理服务,包括存储的话,如果你有一个比如说几B的数据集。
啊,比如说像图像里面有什么 Live 五 B 这样的数据集,对吧?然后你想托管在我这儿,你也需要给我这个存储费用,就是它相当于做了一个云服务啊,是这样的一种。思路就是,这是一种比较常规的呃,挣收入的一种方式了。但我觉得对阿里来讲,LoScope 的战略意义应该远大于说今天你给我带来一千万人民币或者美元的收入了。
对,因为你说那收入肯定,它从体量上对阿里的意义应该没那么大。作为一个前阿里员工和这个呃开源社区的贡献者和一份子,你怎么看这个变化?接下来一段时间的影响?呃,我觉得就是。就第一呢,我能看到的情况就是,这些人肯定会被什么 Meta 啊、 X I 啊、 OpenAI 这些疯抢,尤其是在 X I 马斯克把自己的十二个、十三个 co-founder 开除的只剩下一个之后,对吧?
马斯克对这群人如饥似渴,对吧?啊,然后正好他们今年不是这个 Space X 跟 X I 合并,应该会做二零二六年。我不知道是会比 Anthropic 更大的这个 IPO,所以它有一个很强的财富效应,也会吸对于这些开发者或者研究员有一个很强的这个牵引或者吸引作用。然后第二块的话,我认为就是对于公司啊,或者对于这个。
市场来讲,我觉得其实会进入到一个收敛状态,就是当大家发现大语言模型的这条路线呢,我只要继续 scaling,我还能继续压榨出新的智能,那大家就会不停的在这个方向上去加注。那对于公司来讲,可能它更多的关注的就是说,OK,那我可能开源的方面投入的就会慢慢会少一些,更多的点就在提升我模型的智能表现,然后以及在 agent 领域的这个 to use 的能力,对,就这种东西就会变得越来越重要,然后。
我能看到的现实就是说,就会招更多的可能在国外的公司里面有在做 post training,然后做 RL 经验的人,然后来到公司,或者说无论是顾问也好,还是干嘛也好,应该去会让这个千万模型在实战上面有更强的表现能力。我觉得这个是公司比较 care 的东西。因为今天来讲,其实呃,很多公司说我在什么各种 benchmark 上面刷的这些榜单,呃,对于绝大多数人来讲,他可能更不是那么的 care。
那这种情况下,又会呃让一些新的行业诞生,比如说呃,据我了解的情况,无论是千问就国内的这些企业,其实大家对这个强化学习环境这块儿的重视程度之前是不够的,或者说大家都是喜欢在体内去做这样的东西。然后我觉得二零二六年。会看到更多的这个第三方的数据提供商,或者说强学习提供商,来为这些前沿的实验室来提供这些数据。
我觉得这个是一个比较明显的。方向和趋势的,我我觉得这次这个事儿也引发很多讨论啊,就是关于特别前沿的核心的研发团队,他们的目标和整个公司的。大的目标之间怎么去对齐,或者说大家相互之间怎么协调?因为这个目标肯定是不完全一致的。也许在最早期是一致,就是在大家卯足劲儿都要去搞模型性能的时候。但慢慢其实到现在也能看到,整个 AI 的应用发展非常快,然后商业化的竞争,还有这种超级 App 的竞争也都非常激烈。
其实你是很了解这群人的嘛,然后他们也都挺特立独行的,然后非常自驱,有很多自己的个性和追求。你觉得他们和这种大的商业组织之间可以怎么相处了?或者说,他长期来说会是个什么关系了?其实长期来看,我觉得他会很像文艺复兴时期的那些 workshop 和这个金主的这种关系。这种逻辑是说,因为今天大家去到一个 workshop 里面去当学徒,他的目标是我要做我的作品。
什么意思呢?我是要靠我的作品去在世世界上混的。就他某种程度上很像艺术家。怎么讲?我不是靠我的这个在你这儿工作了几年然后出去混,因为这东西越来越没有意义了。就像文艺复兴之前,其实就是艺术的工匠本质上跟其他的这个什么木工、瓦工其实是一样的,没有什么区别。但是就是因为文艺复兴之后呢,大家对这个方向有巨大的投入和需求。
所以就把这群人的社会地位和待遇都提升了一大截,就典型的就是美第奇家族对于这个让这个达芬奇对吧,让米开朗基罗可以上桌了,然后可以跟贵族一起吃饭了,原来这个你都不能想象了。那典型的这件事情,你映射到今年。和去年的话,就会发现这个扎克伯格挖明星研究员的待遇,竟然能开的比这个NBA球星和这个英超足球的球星工资还要高。
那这个趋势呢,我认为一旦形成,就不太可能有任何逆转。对,因为最终来讲。谁能把这个算力发挥出最好的性能,它的溢价当然就是非常非常的高。那同样就是说,文艺复兴时期,大家最开始从画画开始。然后到教堂去画那个顶端的壁画,然后最后开始做建筑设计工程的体量越来越复杂。那如果我把这个项目交给一个这个小白,我靠,那我给他再少的钱,他给我干砸了,我也接受不了。
然后在这个过程里面,我觉得会有这么几个阶段,就第一个阶段呢,就大家会体内的去整这些组织,但是其实到了今年或者明年,我我觉得会看到很多体外的组织,就是这些组织专门就帮你在大模型的这个产业链帮你做一环,比如说你需要做 agent RL 的训练,结合你自己的场景,那它可能就是你的一个就完成你委托的这么一个服务商,类似这样的一种角色。
那这样的话,它会让智能其实更快的在各个行业生根,因为毕竟如果是一个体内的组织的话,其实它的这个威力的发挥还是很局限。然后再到再到最后的话,它可能就是呃有完全的这种偏独立的这种模型公司。所以我目前看到有这样的公司,呃,在国外会比较多,像 Cohere,嗯,啊,它就是典型的这个 enterprise,就是企业 level 的这样的 AI 公司。
它就是相当于哎,帮你去做这个服务啊,然后结合你的场景去做一些东西。然后那这种公司呢,我们说之前的架构呢,它人会比较多,但现在随着产业链这个各种工具的成熟,然后这个 agent 这个叫调度能力啊越来越强,所以可能未来这样的公司的人也不会那么的多。就是我觉得是生态里面毛细血管嘛。你说像 Cohere
这种公司,包括像之前就是 Mirah 做的那个 Think Machines Lab,他们也推出了 Tinker,这个专门帮一些其他企业或者需求方做呃强化学习的训练。
这些公司它能找到的所谓的金主啊,就比如类似于美利奇家族的这种角色,那我理解还是一些自己并不掌握核心 AI 技术的公司。最大的科技公司,最大的科技巨头,他们应该还是倾向于在体内去做这件事情吧,比如说像阿里这样的公司。字节,包括 Meta、Google。我说说我的这个就整体的一些看法或者观点吧。现实的情况,美国也好,中国也好,或者新加坡、日本、德国 AI 领域的这些 PhD 教授,大部分现在都是华人。
嗯,那会出现啥?就中国的文化是比较排他的,说实在的,就如果你当了一个AP,一个印度的学生,除非是那种I IIT的超级天才,和一个比如说厦门大学的,或者说一个什么西电的一个学生特别卷。你肯定招后者呀,因为他能能听你话呀,你能把它当成小龙虾用了,对吧?你就天天微信或者 WhatsApp 命令它,不就完事儿了吗?
那这种情况下,我他这个人群供给只会更多。那这样的人,他有更强的环境,然后去锻炼自己的技能,因为所有人进入这环环境,都把自己当演艺圈的人。就这个圈儿,它不像是传统的工程,就是我老师傅带着你一步一步,它不是这样的。无论是创业还是自己做工作室,大家不是说我靠,我以我的目标进入什么千问、Kimi为荣,那只是中间过渡的部分。
而已,就我需要用顶会让我有这样的门槛,然后我进入这个之后,我后面再要做别的,而不是说 OK,我的目标叫进入千问,或者说进入 DeepSeek 就结束了。就是你越这么想的人,你的人生会越悲剧的,因为我是完整经历过这个传统计算机视觉 Deep Learning 那一套进入到大模型,或者进入到这个 Stable Diffusion 那一套的人。
那如果就是说你二零年二一年做干做这个这个 V A E,然后到了二二年二三年你不拥抱扩散模型,那你就被干掉了。就谁会觉得我靠,你好在大厂有几年经验有优势了没有啊?然后你今天你应该知道,就所有的公司,就尤其是像微软这种公司啊,包括千问,包括什么 DeepSeek、 MeMax,都实习生在 carry 的,不是说全职员工都很牛逼的,不是的。
你说哪个行业能出现这种情况啊?所以它的规则,我认为本质上是跟其他行业不一样了。就如果说你把它类比成,就类似于你知道,呃,演艺圈也好,或者说这种艺术家也好,就是他们在追寻自己的代表作。那这个事情它最终的目标、长期的目标是什么?长期目标是让自己有发展。那自己有发展的目标,就得有作品吗?有有发展是为了为了什么了?
有发展当然有更好有更好的待遇,这个我能理解啊。但是一般来说,你的呃获得的金钱到了一定程度之后,人的需求肯定会再上一层嘛。那个东西是什么了?对这些研究人员来说,呃,我觉得就是说,比如说我我今天做一个模型,我做一个开源项目,很多人点
star,然后给我提反馈,我觉得这个就是自我实现的一个过程。他的自我实现并不是说我做一个,因为这个游戏是无限游戏,你要想玩也能玩到一百岁,但是很多人的精力、体力不够嘛,对,或者说心力也不够,他可能玩到三十多岁就累了嘛,他就想 OK,我去玩点轻松一点的事情之类的。
就是我觉得这就是很好玩的一点。我猜想他这个可能是很多元的,也许有的人是为了在科学或技术史上,他想留下自己的贡献,或者其中还有一部分特别有使命感的人,他就是想实现某种 AI 系统,某种更强的智能状态。对我觉得那属于潜意识,潜意识,然后直接的意识就是说,OK,我需要一些作品去证明我。我是有能力的,因为你今天没有东西,就是算法时代奖励的是结果嘛,奖励的是你的这个产出,而不是奖励一些不成形的东西嘛。
所以你从结果上也能看出来,今天奖励的就是OK,今天这个DINQ
高岱恒聊传奇AI研究员们,们本身性能很强,对吧?然后这个千问的强化学习技术也非常牛皮,那奖励是这样的东西,就是我接触的开源社区,就大家一看这个项目觉得有前途,就疯狂往上贡献了,这个是我看到了。就大家就非常强的动力去干这个事儿,然后你说他直接想为了挣钱,好像我觉得也也不是,可能他想证明的就是说,OK,今天我在这个很牛的项目上面,比如说我在千问的
technical report 上面有我一个名字。
或者我在一个小龙虾的这个 contributors 里面,我能排到前一百,那这个东西就能让我越来越有自信,有一个正反馈嘛?那这个正反馈的就可能让我就是我有更大的那个动力和信心,就是在未来,好像我去胜任一些工作或者创业或者干嘛也好,它应该是这样一种思路。OK OK,感谢赛姆的分享。以下是春节前我和 Sam 的聊天。
当时 OpenAI 刚刚火起来,Peter Stoneberg 还没有加入 OpenAI,千问也没有发生现在的变动,所以我们聊的是当时的一些情况。我们漫谈了 AI
英雄人物的一些上古事迹和成长历程,也讨论了这群人的性格、喜好和畏惧,和正在被他们改变,也把他们自己卷入其中的人才市场与工作的变化。我可以先从就是你们最近在 DINK 上有一个小火的功能开始讲起啊,这个叫 DINK Roast,就是来辣评一下大家感兴趣的研究员。
你可以简单讲讲这是个什么东西,以及有什么好玩的,就是用户的一些使用方法啊。这个东西其实特别简单,就是在二五年三月份的时候我有这个想法,然后四五月份的时候我其实就开发了这个功能。啊,他其实是干嘛呢?就是用户输入自己的谷歌学术的链接,然后输入自己的这个呃 GitHub 的这个账户名称,或者输入自己的领英账号。
那就可以对它生成一个就是过往经历的一个分析,然后和一个蜡评。那这个其实呃特别有意思的一点就是那个时候,因为整个市场就充斥着比较疯魔的情绪嘛。啊,对于研究员说啊,为什么这个人都挣几亿年薪了,对吧?那个人几千万,那那个时候的市场,大家就说,哎,那我值多少钱,对吧?我我到底是什么情况?就大家就很喜欢玩这样的一个小小产品,所以那个时候的做的这个东西,就跟当下的那个市场环境是比较符合的。
在那个最开始的版本里面,我们这价格其实就是瞎估的,就定了几个区间,然后就根据不同人让模型自己去定义啊,基本上就是最高一档就是十米连以上嘛,然后一千万美元以上,对对对,一千万美元以上的年薪,然后其他几档就是一百万以下。一百万到三百万,三百万到五百万,所以那个时候你你们这个想象力也比较有限啊,因为后来 Meta 天价挖人应该是七月份之后的事儿。
对,是是是,人家直接能开出一亿美元哦。对,是的是的是,这个太夸张了。嗯,而且现在这个事情变成一个就是很正常的事情,就是最近也听到一些做 AI infra 的朋友讲。然后说,如果他选择不创业,然后去到像 Meta 这样的实验室的话,其实能给到几千万美元的年薪。我觉得这个确实太夸张了。所以相当于你在 Meta 待一年,可能跟你创业成功有一个小的退出的收益是差不多的。
呃,我觉得甚至比那个还要多,因为我听说。呃,Meta 也好,这个这些公司,他们都是按月去支付你的这个期权对价的。你会看到很离谱的情况,就是有些人他的年薪可能只有五十万美元,但是他的期权可能是两千万美元分四年。那这代表着可能他每个月就是股票或者期权兑现的现金比他的年薪还要多。那在这个小的功能里面,用户测试谁测试的最多呀?
呃,在呃去年的那个时间点,就是六七月份的时候,大家其实测呃这个伊利亚比较多。啊,测一俩比较多,因为那个时候他自己好像也是在出来做那个超级智能,嗯,然后包括 OpenAI 的一系列比较重要的人物,像约翰舒曼做强化学习的人,包括欧阳龙,包括这个像汪家义,他们也都被测的比较多。嗯,那后来大家热点会去测的人物是怎么变化的?
后面的话,其实大家更关心的是测自己,就是说啊,我测一测自己或者测一测身边的人。所以针对这一点呢,我们还做了一个 PK 功能。啊,什什么叫PK呢?就是我们把一些客观的指标拿出来,然后大家去对比。比如说啊,你的论文的总引用量,然后你的一作的引用量,然后以及你顶会论文的数量,就这些是相对比较客观的指标。但是这个其实也不是很公平,因为有些可能做理论方向的论文,它引用就不是很高,但是它也很有影响力。
但我觉得这种东西没有什么两全的办法。然后当时做完 P K 的这个功能,其实给不少朋友看,这个他们就觉得很有意思。我当时印象很深是,呃,我做过林俊阳和周畅的那个学术 P K,发给他,觉得就很好玩。呃,结果是什么了?啊,结果就是他们这个势均力敌,在去年的那个时间节点,对林君阳和周畅,对对对对对,当时我记得他们引用应该都是两万多吧,对。
你发给他们之后,本人有什么反馈啊?直接觉得绷不住了。后后面又又有一些什么变化了?因为那个 Meta 来抢人那会儿,应该有几个人选是大家比较关注的。啊,对对对,是的,那个时候有几个人选,确实大家关注的比较多。后来其实这个东西,因为这个东西其实就是我们做 DINQ 之前的一个小小的尝试嘛,嗯。啊,其实我发现哇,就是通过做这个东西,我我发现其实很多人有这种,就是更了解自己的需求,否则的话他不会来的。
那我们后台其实,我那个时候就看到了很多来自国外的这种,呃,这个炸牛是吗?对对对,然后我这边可能。随便举一些例子的话,就是他很多都超出我的想象了,比如斯坦福、MIT 的一些教授。你怎么知道是他本人来测的了?呃,这个我看邮件就能看出来了。哦,对他看他的邮件就能看出来,包括像这个谢赛宁老师也在用,杨迪斯坦福的杨迪希老师也在用,包括这个呃 M O E 混合专家模型的这阿尔伯特奖。
包括《月之暗面》的联创周新宇这些,嗯,对,也都在用这个,反正都用过吧,用过这个平台,所以我就发现,呃,大家可能某种程度上还是比较喜欢玩这种小工具,嗯,那我就从这个点出发,就想说,OK,那我们。Maybe 是不是能做点,就是更更严肃一点的东西,然后也不叫严肃,就是可能更更能够满足呃这群人的一些东西,然后所以才有了 DINQ 这个创业的想法。
这群人你是怎么定义什么范围的这群?呃,我的定义我认为比较宽泛,就是他有创造能力的人,就他直接对 A G I 的这个毕竟他有贡献的那些 A I 领域有创造力的各种人,对吧?对对对对,就是你觉得这群人的核心特质是什么?呃,我觉得它核心特质其实跟这个大时代特别呼应。就为什么今天研究员可以挣呃几千万美元到几个亿?
但是这个可能在美国啊,就是在中国可能,但是现在也挺贵了。我认为它的特点就是跟呃,比如说过去的在公司上班的人有个很大不同的是,他们是一个呃,就是他会做一完整的一套流程的,类似一种工匠的这种这种逻辑。就我今天要发现一个问题,就我觉得这个事情不好,我要提出一个问题。然后在解决问题的过程中做很多实验,然后最后我交付一个结果,那他很很相当于就是,呃,一个能闭环的这么一个一个角色的人,那就这种人就让我就很容易联想到文艺复兴时期的这种啊。
就艺术创作者或者这种这种啊艺术家,我觉得他跟这样的角色某种程度上是比较类似的,就是他完整的在做一个作品,是的,是的,就是一个一个作品。那这个作品其实从过去这个呃深度学习浪潮来的这十几年,我们看到其实。最典型的作品其实就是你的论文,比如说某些人做的这个具体的算法技术,有些人做的这个底层的训练框架,像 PyTorch、 TensorFlow 这样的。
那有些人可能做的是一些数据处理,或者说一些其他方面的底层的叫基础设施之类的东西。那他都算是自己的一个作品。那今天其实呃。我们说前沿的研究院,呃,就无论是
OpenAI、这些机构,然后包括国内的机构,其实大家都在根据作品找他,相当于你做了一个作品,就是哦,OK,他就是我的这个一个一个成果,因为他的定价很多时候是根据他的作品来的,不是说他呃,好像就过往的学历也好,或者说工作经历也好,就那个东西可能也重要,但是今天嗯,我觉得它贬值的速度是非常非常快的,作为。
求职或者创造的这个角度来讲,就是有点英雄不问出处的这种感觉。呃,其实挺明显的,挺明显的。今天我们看,比如 Sora Two 的一些关键的研究员,其实很多是甚至都没没有上过大学的。这个这个趋势感觉还是有有一些,他们是。比如说高中的时候,或者说大学没有上完就被 OpenAI
聘募了,是吗?也不是,就是我印象比较深的是有一对兄弟叫呃什么 Eric Luman,然后他的哥哥还是弟弟叫 Troy Luman,这两个人就是典型的,可能从二零年左右的时候就开始用扩散模型去做一些比较简单的科研任务,但他们的这个科研呢也没有投稿到任何的需要同行评审的这个学术会议,他们就发到。
这个不需要公开评审的这个叫 Archive 这样的平台里面,就康奈尔大学做的这个公开论文的收集的这个平台,那其实就是因为他不断的做这关相关的研究,然后 OpenAI 可能就发现了这个东西,就把他给招走。就这个东西会,我觉得还挺明显的这样的趋势。你觉得这个在中国、美国都明显吗?哎,都明显。中国公司也有很强大的这个,就是叫找人团队,然后他们会在 GitHub、会在这个顶会论文上面去寻找蛛丝马迹。
其实另一方面,这也导致就是这个群体本身,其实他也要更多的在这些平台去传播自己。当然,嗯,当然,因为今天我们看一个数字是什么呢?就是我们看二零二零年的时候,那一年其实已经暗暗地埋下了很多条线,比如扩散模型的基础技术,U C Berkeley 博克利大学的 Johnson
和。啊,他其实当年已经提出了这个叫 DDPM 这个技术,啊,那前一年呢,这个斯坦福的宋阳也提出了就是相关的扩散模型的技术,嗯,啊,其实这些基础技术,包括之前像 Transformer 啊相关的一些,就是后验的技术,包括我们说现在跨文本的这些图像模态的这个 T5。
啊,叉叉叉啊,就这些东西其实都已经 ready 了,在那个节点。那那个时候呢,我们去看学术会议的这个论文投稿量,比如说像现在很有名的就 ICLR。啊,叫就国际这个会议,关于表征学习的一个会议。那这个会议那年的投稿量,我如果没有记错,应该是一两千篇的样子。嗯,你说二零年?对,二零二零年啊。那今年的话,其实它的这个投稿量好像已经超过了这个。
三万篇还是多少?嗯,那这才五年、五年、六年的时间,而且不光是这个会议,各种各种学术会议跟AI,这属于强相关的会议都在暴涨。那弱相关的,或者说交叉学科的这个领域论文就更多了。那除此之外,其实还有像。其他的平台,像呃像 GitHub,像 Hugging Face 这样的平台,能承载大家的这个才华的平台也越来越多。
而且今天其实我们看到的一个点是,就大家都在说什么像 Hugging Face 这样的平台,或者说 AI AI 界的这个 GitHub,它上面的中国模型数量已经这个应该从去年二五年的下半年六七月份的时候。他的 CTO 那个
Julian,然后刚官宣就是已经这个数量已经超过美国的开源模型了啊,那这个其实就代表着就是中国 AI 或者说华人的这个力量其实非常非常的强大,然后再结合到嗯我在 2022 年的时候,因为我过往的背景其实一直在做图像和视频嘛,我就会关心那些重要技术的作者。
那在我这个领域,什么技术是比较重要的呢?是,啊,文生图的那个跨模态的对齐技术,有个叫 CLIP 的模型。嗯,也是 OpenAI 的。嗯,对,就是如果没有这个模型呢,其实你就可以理解像什么稳定扩散模型,或者说像 OpenAI 的那个。达利艺的那个模型,就致敬艺术家那个达利的那个名字嘛,就这样的模型它都不可能诞生。
那这个是 OpenAI 的那个 ChatGPT 之父啊,Alex Russel 做的,那个时候他那边非常小,然后也没到这个三十岁。然后再结合到像这个中国人做了很多很重要的技术,像旋转位置编码,就苏建林做的二零年那时候他也没有三十,包括这个叫混合专家模型 mixture of expert,这个是在 MISTRAL 的阿尔伯特讲。
这也都是三十岁以下,然后还有就是呃,就稳定扩散模型 Stable Diffusion,这个是来自德国的德国的慕尼黑大学的这个罗宾啊,他们这个团队做,那个时候他也没有三十岁,所以当年的我,因为二零二二年其实正好我也三十岁了,然后我就看到这些最重要的技术都是这个三十岁以下的人做的,然后从数学期望的角度来说呢,我觉得我能做出一个。
呃,因为我之前是因为开源进入到这个这个大模型,对对对,这个地方工作的嘛,然后我当时就分析,我可能很难通过在公司工作做出有这么大影响力的事情啊,所以那个时候我就在想,OK,我后面应该做点做点事情。对,就是呃,我觉得可能做研究是不是有一个所谓的最近很火的这个词叫“斩杀线”,对吗?啊,就是可能你过了一定年龄,这个好作品就和你无缘。
所以你是转而想到可以去做社区或者做平台,让这些好的人更能脱颖而出,包括项目就需要他们的公司和团队也能找到他们。对,是的,因为这个东西特别明显的一点是,呃,因为今天其实对他们来讲,他关心的就是能。产出这些重要技术的人,但是重要技术就根据我们的分析呢,大量其实都是年轻人做的,哪怕是这个国国人最近呃,就二四年开始很火,像 G R P O 这样的技术。
包括千问用的这个 G S P U 这基本都是这个二十多岁的人做,那这其实背后就带来了一个点,就是说,OK,那既然这些东西是是他做的,那 OK,那你从哪去找他呢?或者什么样的人有这个特质呢?就是。公司非常关心的问题,因为其实我们说 AI 是一场无限游戏。那无限游戏的话,你需要永远去在智力这个赛道上把这个位置卡住嘛?
你需要最好或者最有。呃,想法的年轻人,可能他不是有直接相关经验的,那这个东西对呃很多机构来讲是很重要的。你觉得对这些年轻人来说, GitHub、Twitter 包括领英这些已经存在挺久的平台不够吗?啊,是够的,是够的。但是问题就在于说,其实很难把这里面的有效信息进行筛选和整理。因为他的渠道太多元了。
今天对于一个做 AI 的研究的这个人来讲,他可能有十个社交媒体账号。因为我有一个朋友现在在西湖大学,就我看他的主页,他像有什么像 Hugging Face 这样的渠道,有 GitHub。有谷歌学术,有 Open Review,有什么这个,呃,知乎,有 B 站,还有 YouTube,啊,还有什么 X,甚至有的人可能还有像 Sub Substack、 Medium 这样的渠道。
那这些渠道,有些人他可能都在产出信息,那都在产出信息里,怎么有效的把它。聚合就做所谓的像 Linkin Bell 这样的东西,我认为是更有效的,因为它其实解决的不是内容的丰富度问题,是解决的是这个分发的问题。就是说,今天这个人其实很厉害,尤其是年轻人,他很厉害,但是他没有被发现,因为他可能是来自一个大家不知道的地方。
那这个其实就啊很难,因为如果他不是说好像在清华或者在北大,在最好的学校的话,其实。这个发现机制就开始变得困难,但北美其实在这个方面,它已经有一套完整的人才。这个查询的系统啊,就是有个别公司吧,他们的做法就是他们的人才招聘官啊,就是叫英文叫做 member of recruiting staff
啊,就这个人呢,他们就会经常会在各种顶会里面,会在各种的这个开源项目里面去寻找那个可能值得他去付出千万年薪 offer 的那个候选人,对,是这样的,嗯嗯嗯。
但是问题就在于说,就像我刚才讲了,其实这个人群的供给也在迅速的扩增,因为大家都想成为那样的人。因为这个里面有一个比较典型的特点是说,呃,就过去其实你做这个方向没有问题的点,就是 AI 的方向收敛到很具体的某几个方向,但今天的 AI 其实有非常非常多的细分方向。那AI科科学的结合,对吧?AI的基础设施,然后什么图像、视频这种这种经典的,我们就不提了。
包括各种什么语音的模型、双工模型这些东西,都是新的方向。那你需要人来做,也需要卡。那你怎么能够找到那个适合去调配这几百甚至几千张卡的人?其实就变得非常非常。重要和有趣,嗯,这属于是我们叫做呃造F1赛车的人嘛?那今天其实,尤其是这两天,这个小龙虾机器人这个爆火,其实你会发现一个现象,就是这些不但是这个造高造高达也好,造F1赛车这些人之前,那这种能做出一些有创造力作品的。
人,包括像二零二五年的这个 Cloud Code 的作者 Boris Cherny,像这样的人也开始越来越站在台前,也开始出现,因为他就在我的这个视野里,可以把他类比成 F1 的车手。还是高达的驾驶人哦?你就指造 F1 的人?你是指做 AI 研究的人?你说驾驶的人?你是说用这些研究得到的模型的能力来做一些应用,或者说做一些呃更具体的产品的人?
你你是这个意思,是吗?是的,因为他们其实对大众的影响力是比研究员要高的。因为我们呃,我自己做过一个调研,就是我在 X 上面经常会看到一些研究员或者一些教授在发自己的作品的宣传。其中你经常会看到的一个画面是,这条推特下面有几百个点赞,然后评论的话零星的两三条,嗯,青黑色的就是呃恭喜你那种,就是非常。非常就是没有什么含营养的这种话。
然后呢,当你看像这个呃最近很火这个小龙虾的作者这个 Peter,包括就原来在特斯拉的这个大神李飞飞的学生安德鲁卡帕西,嗯,他们这样的人的 Twitter,包括这个 Clock 的作者 Boris,他们的 Twitter
下面的这个点赞和评论比是惊人的,能达到这个一比四、一比五。啊,这种比,也就是说,他的这个一条评论可能对应的五个点赞,比如说你看他一条推特可能几千个点赞,然后对应的就是大几百个这个评论这样子。
从研究这个角度,其实很多人觉得可能还是有一个天线在说,OK,我要研究这个东西到底有什么用,它可能不是立竿见影的看到这个直接的收益,所以有些人会觉得,OK,这个离我的很远。但是当他看到一个具体的任务啊,对我的人生效率产生巨大的影响啊,我只要去这个。逼迫这个我的这个代理帮我干活,就帮我整理邮件,帮我去可能骚扰别人,帮我去订个外卖。
那我觉得哎,这个对我的生活产生影响啊,我觉得很爽,我就想试一试。嗯,所以所以其实大部分就是我觉得从影响力的角度来讲,其实我们无数的时代我们看下来,那都是车手本身,F1 车手本身比。造 F1 的这个工程师,他的影响力会更大。对,我觉得他这个背后其实也是这个 AI 阶段演进的一个变化,就说什么样的人在人才市场上更受关注,或者说他整体在舆论上、在社交媒体上影响力更大。
就是可能前一段时间,比如从二三年前后,大家都看到 OpenAI 做出这个成果,然后更多公司来投入,肯定你是先要去,比如说对标或者说追赶这个能力,对吧?那研究的人是很重要的。那慢慢其实模型的能力到了一定水平之后,再往下肯定自然就是要做各种应用,而且出现了很多,就是你刚刚说到的,比如像那个呃
Cloudboat 那个开发者,他其实就是个独立开发者,他也不在一个公司里面,嗯,对他已经财富自由,实在是太闲了,就自己做了一个。
你最开始是怎么变成 AI 研究员呢?就怎么通过开源?社区的一些贡献能进入打磨院吗?对,我觉得我的这个路线其实还挺,就是确实不是能规划出来的,因为我那个时候我只是单纯觉得我在继续学那个方向,可能未来连个工作都找不到了。嗯,什么时候?就二在二零一七年的时候,所以在那个时候正好就碰上这个市场上就有一波宣传AI的一些。
呃,课程也好,或者这个 AI 的这些新闻,对,那是上一波 AI 热潮,一六年刚刚有 AlphaGo,对对对。那个时候最有代表性的其实就是啊,像吴文达老师 AI 的课程啊,当时上完他的课程,我记得具体的技术我都已经忘完了,所以但是有一句话我印象非常深,就是他说你只要是按部就班的学完了我的这个公开课,你会超过硅谷百分之九十五的还是九十九的工程师。
嗯,然后就我估计很多人是没有信这个东西,但是我那时候真信了。然后后面的话呢,我毕业之后也在找相关的工作嘛,也进了一家公司。然后在工作的过程中,我发现其实大部分的工作内容其实没有那么难啊。那个时候主要都集中在做一些视觉的这个图像的检测呀、目标理解呀、啊行人的重识别就这样的一些任务啊。这些任务其实说实在是,嗯,对我来讲,我认为是相当简单的。
然后我那个时候就有一个想法是说。哎,我能做点啥?就是说能让我这个自己的这个经历有一些增值啊。那个时候其实我当时就看到,其实呃有一个东西叫做 PyTorch,就是深度学习框架。嗯啊,那个东西其实当在一八年的时候,我就明显感觉到它的潜力是比当时的。深度学习的那个框架的巨头就是谷歌的 Tensor,哎对 Tensor Flow,要潜力要强很多。
就最大的一点,特别就是它可以随时在你编写这个神经网络的这个过程里面,你可以随时进行断点调试,啊,这个技术上来讲,我们叫它动态图啊,动态图的这个技术,但呃 TensorFlow 呢,它用的是静态图技术,所以就是说,你当发现它错了,就是你可能已经浪费了很多时间,你才能发现你写的这个东西是错的,啊,它其实就在一开始就能帮你解决这个问题。
然后,所以在那个时候我就开始说,哎,我能不能在这个里面贡献点代码啊?有可能就是他能帮我去合并进这个主仓库。哦,就是贡献 Pytorch 这个框架这个社区是吧?对对,因为那个时候我的想法就特别简单,就说。哎,如果我贡献了,那你无论谁训练模型,那其实背后的这个代码里面起码有我写的,这个我可以出去吹牛,对吧?
所以在那个时候,我就开始就密集的跟这些。当时拍 Toer 时的一些核心的人就有一些邮件,比如说去了啊这个呃叫 Thinking Machines Lab 的这个 Softsumis,然后比如说这个现在负责拍 Toer 是一个台湾人,叫艾尔阳,他在纽约,对,就是就跟这些人就开始认识。当时大家交流是一个什么氛围啊?
啊,当时主要就是给大家发邮件,就是说我对这个方向比较感兴趣,你觉得我这么改是不是对的?对,然后因为那个时候其实我印象如果没错的话,那个时候 patterns 贡献者也非常少,也没有很多,嗯,因为相比当时谷歌的 TensorFlow 的话,那都已经动辄应该是六七万的,在 GitHub 上面那个星星已经那么大了,但当时我印象如果没有记错,Pattern 只有一两万星,就那么一个情况。
啊,在当时最开始,其实本质上我对 Python 的底层代码,我可以说是十窍通了九窍啊,一窍不通,根本看不懂。那我怎么贡献呢?所以最开始我用了一种比较抽象的方法,我就进每一个代码里面,就每一个文件里面去看,因为它我当时想的很简单,我在想它里面总会有地方就语法会有错误,就是英文叫 typos,嗯,就比如说我说一个词,我可能这个词儿拼错了。
因为那个时候也没有所谓的这个辅助的 AI 编程的东西,啊,我确实找到了几个,然后我就改了,然后正好他们也给我合并进这个代码主仓库了。虽然这样的东西没有任何技术含量,但是在当时给我了一个非常强的正反馈,嗯,所以我后面就一直在做开源,就是从这个开始就一直在做开。然后后面就会觉得,因为有了正反馈,就很自然就会进入下一个阶段,就说 OK,那我不能整这种东西了,我要做一些真正有价值的东西。
然后后面就开始做这个像图像、视频的一些技术的开源,嗯,大概就是这样。那你能进入达摩院,是因为那个时候一七一八年的时候,达摩院就是按照作品去找人呢,是吗?我觉得不是,因为我包括到现在为止,很多地方还是看学历去卡。嗯,因为按学历卡人最大的点,其实大部分人是没有什么所谓的叫代表作或者叫 signature paper呀。
嗯嗯,那你自己是通过什么项目?呃,我自己是通过一个换脸项目,英文名叫做。DeepFaceLab 这个项目,因为我我的这个问题就是说,我一直不知道我的这个定位到底是什么样,因为我相当于一天的所谓的科班的这个科研培训,我也没有经历过。然后直到有一些呃做完这个东西,直到有一些人会主动来这个联系我说,OK,其实可能你适合这A工作,你适合B工作。
那在我的下意识,我会觉得,我靠,这个东西不应该都是什么清北的人去的,对吧?就很神秘。然后在那个。DeepFaceLab
是什么时候做的?然后你发布之后有哪些还挺出人意料的反馈的?我觉得我我参与这个项目应该是一九年,然后主要我进去是做那个算法的部分。它其实这个项目就是一句话介绍,就是让一个不懂技术的人,他可以在电脑上面通过点点点那些脚本的,能够合成这个特别高质量的影视级的换脸效果,啊,就是不需要懂任何一行代码,所以在那个时候就还比较火。
因为那个一八到二零年的时候那几年,其实 A I G C 的应用没有特别出圈的,除了这个叫 Deepfake,做完那个东西之后呢,其实我印象比较深是。第一个机会应该是在 ICCV,就是计算机视觉的一个顶级的会议,当时二零一九年在韩国的首尔举办啊。那个时候,呃,当年的这个 Meta 就是 Facebook 吗?
啊,他们其实就在办一个叫这个深度伪造的人脸的挑战赛,然后正好他们就看到,哎,说我好像在这个项目里面贡献了挺多,他说你要不要聊一聊什么之类的。然后后面的话就。就是有些朋友就会说啊,你这个其实你这完全可以去什么字节这种公司,而且我觉得非常舒服的一点是,就当你有了作品,就没有人会面试你这个写代码这种东西了,因为不重要了。
啊,所以其实因为我又是特别,我觉得我我也没有什么特别严格的计算机的这个基础,也没有人问你学校和专业的事儿啊,也没有人问这些东西了。对,嗯,啊,可能 HR 会问吧,但是他是这是公司最后他们决策的层面的事情,但起码是这个技术的负责人,他们都不许管这些东西。啊,这就让我觉啊,我觉得这个好爽,这个东西的正外部性很强,就是你做完之后,你不需要跟别人解释了,就是我真的能干的,我不需要解释。
那你后来开始对就是 AI 人物特别感兴趣,因为你我知道你二三年底开始写这个 AI 人物英雄传嘛,那个时候我觉得大家没有那么关注 AI 的一些研究员。那你自己对这群人的兴趣你是怎么来?呃,我觉得是这样。就我最开始对这些人产生兴趣,其实有一个特别具体的点,是因为我在一九年的时候做,因为做这个换脸项目,所以我就一直在研究最先进的那个生成技术。
当年二零一九年最先进的生成技术是有一个叫啊风格对抗生成网络,叫 StyleGAN,英文是英伟达做的。然后那个时候它的代码只有在这个生成框架,只有在那个 TensorFlow 这个版本上有。然后所以那个时候我就在想,哎,我能不能把它迁移到 PyTorch 上面?然后我就开始迁移。然后也搞了 pattern 型的这个版本,然后反正也有个大几百星、一千星这样的样子。
然后在做这个过程中,其实我就被他的这个代码质量深深的折服了,我就觉得。这个代码写的这么好,是个什么样的人做出来的?然后我就去挖他的作者啊,然后这个作者是一个,就本来在我的认知里面,可能是一个来自就是英伟达总部在。啊,湾区总部的这么一个这个白人,这个比如说三四十岁的人,结果我一看,哇,这个哥们儿原来是来自英美达赫尔辛基芬兰的研究院的一个啊,一个北欧的一个人啊,而且这个人竟然都甚至连大学文凭都没有,这个人叫。
呃,叫泰罗卡拉斯啊,就是英文名叫 Terro Caras,我就觉得哇,我说这个可太太牛了。然后后面我又跟 Patr 的人,我就了解的越来越深。我会发现,其实 Pytorch 的贡献最多的人,那个时候还在波兰的华沙大学读大三,叫 Adam Paz。嗯,但这个人呢,就亚当,就帕泽克呀。但是我这个确实不太会翻译啊。
嗯啊,然后,但是他现在应该是在谷歌做。就是一个深度学习框架叫 JAX。哦,JAX。嗯,对对对,我就特别哎,我就我靠,我说这这这这都哎,这些哥们都挺神的是吧?嗯,然后我就想要了解他更多的故事,就是啊,这个人原来干嘛的,然后有什么信息能去挖一挖。就这样啊,就是对我来讲,就是我在工作之余的一个兴趣,啊,就是一些呃比较关键的技术时间节点下面,哎,我就说这个里面作者他们到底都是。
这个干嘛呢?然后怎么怎么弄呢?就这些东西,对我来讲是一个,就是怎么讲,就是我工作之余的一个消遣。其实我在一九年、二零年的时候,其实我也在跟身边很多人就讲一些所谓的。叫八卦也好,但是我发现其实很多人对这个东西不感兴趣。研究员,因为很多人可能就是可能我不知道是不是纯理工科思维的原因还是什么,就他还说,哎呀,你这个这个东西,我感觉我也听不太懂啊。
就可能因为确实有时代背景,就是,就哪怕我们当时说的像这个 StyleGAN 这样的技术,其实,在那个年代,真正对他有兴趣的人也不是那么多。嗯,所以其实这个东西我就自己不停的。就我自己去了解了,就是变成一个我自己跟自己对话一个故事。所以从二零年开始,你就在陆续收集这些人的故事。是的,是的。你也跟他们一些人是建立了直接联系的,是吗?
对,是的,是的。这中间有什么好玩的事儿?我印象里面有一些比较有意思的事情,就是我当时在跟。啊,比如 OpenAI 的前联合创始人、技术联合创始人有一个叫德克金马,他是一个荷兰人,但是现在也在那个 Anthropic。我跟他建联的这个点在于说,我当时觉得,因为他也是做图像视频起来的,他做过那个变分自编码器,然后他也是这个深度学习里面最重要的优化器,叫亚当优化器 Adam。
嗯,Adam。嗯,这篇论文是在全世界 2015 到 2020 年所有学术论文里面引用最多的了。我那时候跟他建联的一个点就是。他当时我印象比较深,他好像获得了这个一个学术会议的这个时间检验奖。然后我当时给他发个邮件,就是去祝贺他。然后,因为他是荷兰人,所以我我们画了一个就是他的大头照,然后配上一个荷兰风车。
然后给他发邮件,就说:“哎,我很想跟你认识。”当时发完这个,他就非常感兴趣。他说:“你这个太好玩了。”然后就开始跟我有一些邮件上的联系这样子。然后你当时想联系他,你就是想知道更多他的故事,是吗?对,我想知道更多的故事。然后最后,其实,在二四年的时候,就是尤其我记得印象,印象应该是在七八月份还是九十月份,然后其中给他发了一封邮件,就是说我想看一看他对未来的一些建议。
因为那个时候我其实也出来了,我也在想啊,未来我应该做点什么,嗯啊。然后他的建议当时给的很明确,他说你一定要做 AI 代理,就 AI agent 这个方向啊。那那个时候其实很早呀,其实算比较早,算比较早。然后那个时候我就觉得,哎,对,我就去研究这个方向了。对,那差不多是二三年底二四年初的时候,差不多。
因为他讲的逻辑很直接,他说如果现在你去做。底层模型的话,那这个东西其实不是你技术的问题,是你基础设施,就是你能不能一次,比如说你训用一千张卡,那不是一个搞算法的人的能解决的问题,那你需要去到去到一个公司,它有这样的。能力嘛,但是你做 AI 这种本身就是靠你的创造力和这个个人能,你个人能力很强,你能做出很好的东西,就没有什么东西能拦得住你,所以我就特别喜欢这一点。
我发现你比较感兴趣的人物都是他的背景和成长路径和想象中的最典型的不太一样的那些人。呃,我觉得这种东西它其实就能让人有比较深刻的记忆,因为如果一个人你看到他的成长路径是一帆风顺,从小什么开始这个。一路学霸,然后拿了什么各种呃计算机或者数学的金牌,他很难有那个人物的张力出来,就是大家会觉得我靠,这样的人太牛了,就跟我没有什么关系。
你你会被这种反差和戏剧性所吸引?我当然,我觉得我觉得每个人应该都某种程度上会被这种东西吸引。嗯,啊,那比较有代表性的就是。啊,其实大家可能知道 GPT 之父,只是一个发布 GPT 的时候,只是一个二十多岁的一个来自波士顿近郊富兰克林工程学院毕业的一个本科生。哦,你可以讲讲,不一定大家都知道。对对对,一个在阿莱克拉德福德的一个年轻人。
嗯,Alex Radford。对对对,他当年其实进入 OpenAI 的时候就是非常早期,当年的 OpenAI 其实很多人都在做。强化学习这个方向,在那个年代的话,那个是主流方向。大家因为用它有非常多的正反馈,无论是这个机器人拧魔方,还是去打那个 Dota 的那个游戏比赛,都获得了很好的成果。但是当时其实只有他一个人在做这个叫下一个词预测,就是叫英文叫 next token prediction。
啊,而且做的这个东西呢,也是做的磕磕绊绊。啊,也是做了半天,也不能说什么成果没有啊,有一些成果,有一些被拒稿的经验,有一些这个实验跑得很拉的经验,啊,所以那个时候就是我在想,就是在大家都取得成果的这么一个研究型实验室里面,啊,对于。阿莱克这样的人,我觉得他可能心里能承受很大压力。嗯,他是 GPT 一的一作,对吧?
GPT 一和二,嗯,但是那个时候我印象很深,就是他把这个 GPT 一投稿到学术会议,应该是叫 ACLR,然后就被拒稿了。然后后面,所以你可以看到 GPT 二,它就是以一种 OpenAI 博客的形式发布的。他就不想让自己太难受,因为投稿会被拒。直到第三代,他正式的在这个就计算机那个顶级会议。啊,叫 Neve 死了啊!
叫这个神经这个这个信息处理会议上面得到了发票。对啊,就那个时候才开始投稿,可能把这个伤痛啊,需要化几年的时间化解被拒稿的痛,每个人都遇到过。为了接触研究员,你做过什么?你觉得最神奇的事儿?呃,我印象最深就是今就是二五年的二月份,我就去欧派门口蹲点儿去了,因为我当时我认为有几有几个重要的人我没有采访到,谁?
啊,像 Jason Wei 这样的人,Jason Wei 为什么二五年二月份你你想采访他们?你你是想那时候有个机缘巧合,就正好去那边了。然后我正好想着头几天没有事儿,因为我那天那那一段时间一直住在那个君山市区嘛,就离 OPAI 的那个办公室也不是特别远,嗯,然后再坐个公交车就去了。我我是指你采访到你想采访到他们是为了一个什么事儿?
为了一个什么目的?当时了解到他说他的这个深度思考就是。思维链这个技术是他在冥想的时候被他搞出来的,所以我就想你挺好奇这个过程,我就很好奇,我这个过程到底他是怎么做的,然后想看看有没有机会跟他交流一下。就其实是像这样,当然也有很多其他人。包括这个 GPT 四 O 的那个印度人,对,就这些人我都比较感兴趣。
但是,但是最后反正也没有,就是采访到,只是说让我把那个我的宣传贴纸放到他们的这个公告板上面。你说放到公司里的公告板上,那你怎么进去了?了,对,反正他最后就是让我进去,然后给,因为他有两层保安,一层是外面保安,一层是里面,就给里面的保安。他们那个楼应该是原来 Uber 的楼,嗯,因为我当时二五年二月份去的时候,很多 Uber 那个痕迹还没擦掉,是吧?
你怎么社会工程学进去的?我主要社会工程学外部了,然后啊,我当时的点就是他一看我拿着传单,以为我要什么卖货还是干嘛呢?还要这个要干嘛?然后我就给他讲了一下我的这个逻辑,就是说我今天是一个呃,类比于文艺复兴时期记录这些名人事件的这个叫类似于一个 Vasari 那样的角色。啊,瓦萨里这个角色,他们知道就是其实是他他的这个人存在,就是开启了西方艺术史这个开端啊。
然后我就说这个东西多么的重要,这个对未来对大家对这群人的理解,因为这群人就是啊,米开朗基罗、达芬奇。嗯,然后我就想那个了解一下,然后所以你给他我远道而来,嗯,我花了很多的钱,然后我今天终于来到这儿嘛,对吧?然后他就说,OK,那我知道你的。这个目的了哦,所以你这是个组合拳。首先营造历史感,嗯,对啊,就是有一个宏大的目标。
你在这个过程中,你能起到很很重要的作用,对吗?嗯,然后同时也有那个讲述自己的不容易啊。是是是,他就放你进去了,对,他就放我跟里面的网友去聊了,然后我就跟他说,我想看有没有机会能看奈康泰来道,对,然后就放了几张传单那里。那你去了工区,是你没有找到 Jason Wei 这些人是吗?啊,没有找到,没有找。
你本来准备怎么找到了?你你是靠认他们的脸吗?还是我我去那儿没有一个特别,就是因为我之前约了有一些人,有一些人是约到了,但是像这些人没有约到呢,我就说是完全想凭运气,就看万一有可能,嗯,万一偶遇了,嗯。这种这种方式能够跟这些人接触上,我觉得那对我来讲,那就是一个额外的奖励嘛。嗯,对对对,所以我就相当于采取这种比较鲁莽这种方式。
你会担心万一碰到赛博奥特曼怎么办吗?那不是好事儿吗?啊,那不是好事儿吗?那他可能会觉得公司安保出了大问题啊。那也不行,所以就所以还好。那还有什么你能想到?你觉得比较有意思的可以分享一下?我觉得实在太多了。我就讲那个,讲一个技术,这个技术可能这两年已经,尤其是二零二五年已经没有什么人提了,但是在前几年非常火的一个技术叫,就是 RAG 这个技术,嗯。
现在也不是没有人提了,对,现在感觉很少有人提这个东西,但前两年非常火,嗯,其实每个人逢人必提这个技术,但今年好像热度就被 A 任的这个东西给带下来。那我当时去写他的这个故事的时候,我觉得。特别有意思一点,你说他是就是这个 rag 的作者,当时是在英国的这个叫 UCL 伦敦大学学院博士毕业的,然后最开始是在一些小公司工作,帕帕特里克·刘易斯,然后这个就是他在这个。
大学毕业之后,我如果印象没有错的话,他去越南,然后在欧洲旅居了非常多时间,应该有半年到一年的时间,就是某种程度上可能是对代表他自己对这个教育体制或者什么的一个,他觉得太累了,需要有一些休息的这种情况。然后他运气很好,他当时。进入 Meta,他我印象没错,应该就是进入 Meta 去做了这个技术。他是怎么进入 Meta?
因为他在之前那两份工作,我印象很深,都不是什么特别好的工作。但是很幸运的是,应该是 2017 年一月份,他加入了一家叫 Blue Spruce 的一个医疗的 AI 公司。但同年七八月份,这个公司就被 Meta 收购了。哦,他就进去之后,然后 20 年做出了这个 Red 这个技术。对,然后但是他现在应该已经去了那个 Cohere 那个公司。
嗯啊。啊,穿松儿之其其中的一个作者就艾登·戈麦斯他们做的那个作品,嗯,他薛面现在也在做
agent,反正就就很多这样的故事。你觉得这个故事你觉得有意思的地方是什么?我觉得有意思一点就是他很多东西他不是,就是你能规划出来,他可能就是稀里糊涂啊,通过这个一个被收购的过程,包括他之前。嗯,这是一个比较随性的这种态度,就是可能正是因为这种随性的态度,去国外旅居,然后包括就是在小公司随便做一做这种态度,可能就让他能够在复兴一些发现这样的比较好的。
技术的创新,我觉得有可能跟这事有关系。对,我觉得一些创新的东西,有的时候是来自边缘地带。以前凯文凯利就写过这个嘛。对对对,嗯,就是一些比较大的创新,以及他可能确实需要一个,就是你又在想着这个事情,但是你又处于一个相对放松的状态之中。你可能是比如说散步啊,或者在。像你说,他在越南,可能什么冥想,对,这次未在冥想之中,对吧?
就一个相对精神的状态放松,但是他可能又在思考着他长期思考的一些事情的这个状态里面,会有一些创新啊。嗯,是的,是的。牛顿当时的发现不也是他为了躲疫情,然后跑到那个乡下去避难的时候啊?他写了这个最最重要的几篇论文,但是这个事儿他肯定之前一直在想,他肯定想了一段时间了。是的,就首先相当于进入这个上下文,然后在这个这个环境里面让自己就是这个沉浸下去,然后又让生活工作有一个平衡。
因为如果说你优化的话,在这种复杂系统里面,你甚至某某种程度上,你优化任何一个点都是没有尽头的。那何况更何况你要优化这个复杂系统,嗯,这就更难一步。对你说到这个,其实牛顿就是一个很有故事意识的人。嗯,关于那个被苹果砸到这个事儿,有很多历史证据证明啊。这应该是他自己编的,嗯,好吧,好吧,就是就是因为被苹果砸到,有了这个万有引力的灵感这件事情啊。
对对对,这个这个可能就是欧洲人比较会给自己把自己的经历添一笔这种传奇的色彩。其实还有一个比较有意思的事儿,就是我们提到那个拉马,拉马不是那个叫雨果人,一个法国人,二十九岁的时候做的这个东西。那为什么提二十九岁呢?就是因为我当时看了一眼,他是应该九四年出生的这个人啊,那到二零二三年不就是二十九?然后。
就很自然的就会你会会想到那个那个大文豪雨果,就巴尔扎克呀,什么福楼拜那个时期的,这是法国当时第一文豪了,名作雨果。然后发现,哎,这个这个老雨果,对吧?一百九十二年前,对吧?在这个二十九岁的时候,也写出了这个人生最重要的这个作品,叫。巴黎圣母院,然后他上下一部很有名的作品,那都是岁数很大的时候写的《悲惨世界》嘛。
然后你一看啊,这个感觉好像看起来,也就是你如果就是你讲述的方式如果够好,哎,你会觉得我靠,这个是命运的这个联动,啪就开始输电了。啊,如果你讲得不好,就它就是一个很平常的故事。在了解这些人的过程中,其实就会有很多这些点,我就会会把它给串起来。嗯,你还挺能联想的。那我确实挺能联,但这个联想确实也啊也觉得挺有意思的,所以就记记能能记住。
你自己是理工科背景的学生,对吧?是的,嗯,你你为什么会对故事这么感兴趣?我不知道啊,这个可能就是就是与生俱来的,我就喜欢这些东西,就反正就是看了一遍我就能记住,而且我是对于很多细节挖掘是怎么讲?我觉得是一种享受。啊,就包括这个,就是很有意思一点。其实我们说前一段时间不是那个 Thinking Machines Lab 的那个离开了三个人吗?
其实有一个人叫。卢克梅兹,那为什么单独提这个人呢?其实不还有俩人?那这个人为什么他重要呢?那我今天跟你说,这个人是。GPT之父阿莱克拉德福德的本科同学,你就说那个欧林工业学院对吧?对对对,富兰克林欧林工程学院啊,欧林工程学院,对对对,这个学校也是好像是零几年才成立的一个学校。嗯,其实这个学院,呃,这个学院可能很多人也不是很了解。
对,但是张一鸣,张一鸣老师应该很了解。哦,他和对欧林有有什么渊源吗?他应该是跟上海交通大学的老师他们一起办了一个参考欧林工程学院模式的一个。你指的是知春创新中心?和于勇一起弄的啊,对,和上海交大的于勇老师。嗯,之前李泽湘会经常提这个学校,嗯,就是东莞松山湖机器人基地的创始人李泽湘老师,他每年都会组织人去欧林考察,嗯,因为他觉得欧林是一个很好的新工科教育的典范。
典范,在他那个框架里,他这个可能跟 AI 的关系没有那么直接啊。是的,是的,嗯。所以这个学校其实也培养很多计算机的人才,是吗?呃,反正目前来来讲,在这个这个时代里面培养的最厉害的人,那肯定就是阿莱克拉德福德。嗯,你可以说。然后这个阿莱克拉德福德,还有你刚刚说那个,他们是同学,本科同学。嗯,他们最开始其实一直毕业之后就在波士顿去创业了。
然后创业的这个过程中,其实就结识到了那个最近刚去 Thinking Machine Lab 当 CTO 那个 Sumit Chintal。嗯,啊,这印度人原来派塔式的总监嘛。他们当时一起做了一篇论文,也是图像生成里面非常重要的论文,叫 DCGAN。那这个技术呢?其实,还引发了一点矛盾,因为在那个时期,啊,黄日勋应该是在二零一六年的四月份的 G T T 大会上面就说把这个技术归功于。
Meta了,因为那个时候这个印度这个哥们儿他就已经在 Meta 了啊,相当于把这个阿莱克呀和他这个卢克的这个相当于信用啊,或者说我们英文叫什么 credit,对,叫 credit credit 中文我不知道叫,没事你就说 credit
吧,啊,把这荣誉相当于就把这两个哥们儿给忽略了,嗯。啊,那个时候其实他们就想一个东西,就说,哎呀,我就算再努力,我再做出好的东西,人家不信这个 AI 的东西是能是来自波士顿的人做的,所以我得去湾区。
所以他俩都去了,他去的 OpenAI,那个卢克·梅兹去的是谷歌。嗯,但是后面他们自己又在 OpenAI 重遇了,相逢了一段时间。对,然后后来就阿莱克就开始退休了。对,阿莱克。二五年的新闻里面说是说他去 Thinking Machines 当顾问了,对,嗯,其实本质上他们他这俩人是跟那个
Thinking Machines 的那个 CTO 在十年前这个学术会议上面这个论文上面有一点点矛盾的,嗯啊,因为这个这个事情,哎,那我随便说一个我想了解的人的故事,你会知道吗?
如果你说你看过的细节都记得的话,不一定,不一定。不一定,我真真的不太一定。比如说,伊利亚有什么有趣的故事啊?伊利亚好像,但是伊利亚被写的比较多了啊。DINQ 的故事也挺有意思的。他的故事可以从他主动说起。他太多了,讲他故事人太多了,嗯,很全面,嗯,对,而且他确实家世也比较,就是算是一个学术世家,嗯,对,传奇很传奇的这个。
他的姑姑不是还来参加,还来支援中国革命了吗?好像是。寒春,嗯,哦,非常厉害,嗯,这种就是就典型,其实大家都已经知道了这些。你跟他们接触的过程中间,就是你从他们身上看到,比如说他们追求的是什么,他们害怕是什么,他们讨厌什么。呃,我觉得这个这个问题特别好。我其实之前也没有仔细的思考过。那现在来讲,我从,嗯,我从直觉上面,我可能能给几个我的观察。
我觉得第一个点是说,叫抗挫折的能力。就抗挫折的能力是什么意思呢?就是说,当你在研究某些方向的时候,其实,它就是可能很难出成果。它不像有些,比如说同年龄的时候那些其他的人做成果,很快的会出,有很快正反馈。那在这种情况下,你要不要坚持?还是说你也要做那个方向?其实这是个特别大的这个战略定力的,你能不能抵抗这种挫折和所谓的我们叫坐冷板凳的问题?
其实哪怕我觉得在今天这种。啊,连叫什么代码都可以用 AI 去写的这种情况下,我觉得这个东西其实就相对好一点。但是这个方向真的非常非常重要。因为如果你选一个热门方向,你可能花了很久的时间,你做的也只是一些跟随性的工作。但是对于他们来讲,我认为他们更关心的是。我做的这个东西有能不能有影响力,能不能真正的影响到这个世界的这个尽可能多的人?
你指的就是有引领性,就不仅是跟随的工作,是在开一些新的方向的意思。这个过程中探索的过程中会有非常多的这个苦闷和痛苦。嗯,就因为想开创新的方向,所以他他们普遍会遇到挫折,然后需要有一个对抗挫折的过程。是的,是的,是的。我看到的这个情况是这样。嗯,这是第一个啊。嗯。第二点的话,其实就是,呃,他们其实不太关心,就是呃,像商业名人或者说这种。
就是所谓的 CEO 这样的人,就是哎呀,就外界对他的说,哎呀,你你可真厉害。他好像不太追求这样的,他们追求的更多是说,呃,你对我的这个研究方向,或者你对我过往这些事情的这个发展路径的这些兴趣,他其实比较看这种。不行,就如果你找一个人,你去跟他谈论这种很具体的就是你对某些未来发展方向的看法,他们很愿意跟你聊。
哦,所以你你说的第二点是,你在 pitch 他们的,或者说你要跟他们建联的时候,如果你去跟他说,我说,哎呀,这个这个谁谁谁,你你真的太厉害了,你这影响我们这一代人,就这种东西呢,他们很多是,就是据我的观察,好像不是很感冒。嗯,对,你现在找他最好就说一个很具体的事情啊。你这个倒是一个挺好的
tips,就是对那些需要联系这些人的人,比如说各个公司的你说的招募人才的团队啊,或者想招人的 CEO 来说,嗯,就他们喜欢去聊一些他们这个方向他自己的研究的具体的事儿,对吧?
是的,而不是被非常宽泛的恭维。嗯,是这样的。其实我觉得每个领域的比较顶尖的人都是这样的。嗯嗯嗯,是这样的,是这样。然后其他的话。我感觉,呃,这些人可能普遍的点,可能就相对低调一点,就好像不是那种在。就是我们说最就是真正干出这种普遍哈,在社交媒体上,他都是一种观察者的角度,就他自己很少去发一些东西,但其实他们又很活跃,活跃给别人点赞,给别人评论,或者在呃讨论讨论一个话题。
嗯,是的。嗯,那他自己主动发观点这个东西是比较少,我觉得这个也分人吧。对对,也分人。现在其实越来越多,嗯,就那一波其实很多是比较过一种隐士般的生。你说那一波,你是指的二零二零年之前就做了很多?呃,我觉得应该是叫二二二零到二三年这一波。你说就是热潮之前?对对对对对对,嗯,包括我们说。嗯,这个第一个开源大模型的作者,这个拉马的这个叫雨果,他也在社交媒体上基本上属于销声匿迹的这么一种状态。
但是现在的这些研究员在这些。公司工作,他们是非常活跃在 X 上的。对,因为我觉得现在的竞争也更激烈了。就像你说的,比如说你看顶会的论文数量也是涨了很多,然后整个可能研究群体或者说做 AI 开发的群体也变多了。对,可能是吼的声大点儿,有可能能让扎克伯格扎哥看到我,就是嗯。加个推特挖人直接啊!你你觉得钱对这些人意味着什么了?
比如说 Meta 他祭出这种天价挖人的策略,他到底是在打动谁了?我说实在我不知道,因为就是人类历史上很难有一个时期,就是搞智力的这个人能拿这么多的钱,好像很少。啊,好像很少有这种时期发生啊。那我认为,其实对大部分人来讲,就是我了解到的情况是,大部分人比较发懵,啊,发懵的第二件事情就是说,哦,我拿这么多钱,我赶紧悄悄干活,尽可能多的多挣几年钱,然后后面退休了,啊,然后这个是一种比较普遍的心态。
我在想,你是有直接接触过一些就是获得这种比较高的 offer 的人是吗?不用讲名字,你觉得不方便的话不用讲名字。嗯,我只想知道他们的心态是什么,可能就偏我说的这种心态吧。你就说干几年退休,嗯,凭这种心态,可他们很年轻耶,那不三十几岁就退休了?嗯,那个时候就可以做一些所谓的自由的研究了,就是不是被 K
P I 推着的研究,因为今天的研究某种程度上在这些地方你是要所谓的在这些一些所谓的我们叫任务上面,一些基准测试上面你要有特别好的性能。
嗯,完了这些研究其实是。就非常非常卷,就会让你心里有很大的压力,因为这个心理压力不但在于说你的这个模型或者你的这个调度,还在于说今天你跑这个实验用了四千张卡,你生怕这个在实验跑着跑着就挂了,对吧?这些压力其实是就是从无形的去侵占这个人各方面的时间。对,嗯,就让人很难能够得到轻松嘛,所以在这种全方位的压力之下,我认为某种程度上这种高薪可能也是对这方面的一个补偿。
对,因为其实从这些大的训模型的公司的角度,它最大的开支肯定还是在算力成本这一块。如果你找到一个足够优秀的研究员、研究团队,他们可以在技术判断、在实验设计上做得更好,有可能是能让你的算力的利用效率是大幅提升。所以我觉得从公司角度,它从经济上来算肯定是应该是合理的,嗯,只是说这个非常对,就是这种非常超出想象力的这种薪资,我我在想他怎么他可能会怎么改变这些工作的人的心态啊,嗯嗯嗯。
就是可能某种程度上,他们拿的钱有没有可能也其中包含一部分替代未来很多这个白领工作的这个工资,我不知道。嗯,我不知道这个东西会发展成什么样。哎,你觉得这些人的弱点是什么?这些人的弱点,说实在很不知道,没有想过这个问题。嗯啊,你觉得现在什么样的人最能在这个领域有所建树、做出成绩?我认为最最大的一个点,其实就是你得真喜欢、愿意坚持。
嗯啊,就是有一些挫折,或者说有一些不顺利,你也觉得没有问题,你能坚持下来。嗯,我觉得可能不太适适合那种,好像嗯遇到一点问题或者遇到一点挫折就说哎呀算了,我不弄了,那样的人可能就不太适合,因为在这个领域本来其实特别典型的就是实验科学,然后就会有很多的错误,很多不顺利的地方,所以其实。就有一个平常心也很重要。
有时候你对这个某个方向,你要对它取得一定成果有特别强的执念的时候,反而可能。也拿不到什么东西,所以这是一个平衡,对吧?就一方面,你可能对这个方向你是你要有一个长期的,你是你要相信也好,或者说你的技术品味让你有这个判断也好。但另一方面,可能是说你平时一天一天的这种工作里面,你不要特别执着于短期的结果。
对对对,就是今天,比如说你做的这个训练的模型可能也好干嘛,它的效果就是不行。啊,因为它现在已经是一个很复杂的这个系统工程了,它可能是数据的问题,可能是你这个集群的问题,然后再再到后面,有可能是你这个参数优化的问题。啊,是你这个什么 M O E 里面的各种各种细节的问题,这种东西太多了。那在这个过程里面,我觉得你如果是每一个点都让自己精疲力尽的话,你会把自己累死。
那这种情况下就是平常心一点,然后就是尽自己最大的这个,就是享受这个这个东西,然后去尝试就好。嗯啊,因为这我认为还是一场无限游戏。无限游戏,你为什么非要执着在明天就拿到第一名?那也是短暂的第一名,对吧?那我觉得也需要给自己营造一个小环境,因为有的时候确实,比如说你在的
team,然后公司。啊,包括包括你看到同行的进展,这个这个肯定的,这个很重要,对,需要给自己可能就是跟一些志同道合的人去去链接,嗯,那其实这就是说对个人来讲,你要有一个。
分发也好,或者你有一个个人品牌,那别人就更容易找到你,对你感兴趣的人就更容易跟你连接。因为你们现在做的这个
DINQ,它其实有一个就是你的商业模式,我理解最后你是其实是帮公司找人,或者说是公司和人才的匹配。嗯,那可以分别讲讲,就是在这个匹配的过程中间,匹配的各方都是看重什么?呃,对,那从公司的角度来看呢,其实他比较关心,因为大家都是在追追热点,比如现在叫 personal AI agent
火这个方向,就个人 AI 的代理比较火,那他就希望能找到一些在这个方向上面有一些成果的人,无论是通过论文,还是通过代码,还是通过一些项目,还是甚至通过你写的博客也好。
那其实我们提供的是一种多元的异构的数据的聚合模式,然后能够让他通过自然语言把这个人找到。嗯,这是我们这个平台的价值。对于个人来讲,我们对他最大的价值就是这个是他一个低成本的这个分发渠道。那他通过来到我们平台,尤其是一些就是年轻人。他可以在这个里面获得来自这个所谓的我们说,如果你的 level
比较高,或者你的潜力比较高,那 OpenAI 和什么 Anthropic 或者 XAI 的 HR 更容易接触到,发现。
啊,然后呢,在这里边呢,你可以把它理解成一个你跟这个机会的链接的更高效的一个平台。那在你们这个平台上,你们能观察到?哪些团队和人,然后哪些人和人之间是匹配成功了吗?开始有合作了,能观察到吗?啊,我们现在这个阶段还没没到那个部分。我们现在的产品只是目前只是一个信息聚合、展示、信息展示和这个搜索的部分。
嗯,它会一步一步做到那个。那现在如果是一个招募方、招人方公司来用,你们是免费可以用还是一个订阅?还是但订阅付费的?嗯,找人这个事情本身,其实你把这个信息聚合起来。提供给这个人的信息,然后跟他类似的这些用户画像,其实是需要挺多的投研成本。然后目前这个国外有一些公司在做类似的事情,然后也有。比较好的这个现金收入嘛?
那可以分享一下你们的一些数据洞察。就你刚才说到了一点,你就说现在招人有很多在招 personal
agent。那如果更完整的来说,还有哪些趋势啊?这是招人方面的。然后另外就是来你们这儿注册愿意展示自己信息的这些人是一些什么样的人?然后他大概的一个变化趋势是怎么样?就招人的话,其实。呃,国外的话,普遍的做法会,他们的 CTO
或者说叫招聘管经理,他们会其实拿很具体的一些论文,就来到这个平台上,哦,来搜,对对对,就是我就给你这论文,然后你帮我把这个作者联系方式啊这种先去找出来,啊,或者相关方向的找出来,是这么一个东西。
那这个。就国内的,其实他更倾向于是说找一片,就是说啊,我今天想找在某个学术会议上面,或者说某个方向上面这个比较热门的项目也好。啊,或者模型里面有贡献的一些华人,可能是因为中国有一个特点,他会限制年龄,所以有的人他会说啊,我想要这个九五年以后出生的,零零年以后。好吧,嗯,对,这个时候我们就根据满足他的条件,把这个人给他找出来,是这样子。
嗯啊,然后对于个人来讲的话,就什么样的人愿意来到这个平台?其实典型的是那种数据比较富集的人。对他来讲,因为其实他相当于是一个各种各样的渠道做聚合。这个英文有一个词叫 linking well,就是我的简历是由我各个渠道聚合起来的。比较有典型的这个例子就是。澳洲做的那个公司叫 Linktree,就他那个就是给 KOL 聚合各种渠道信息的。
但今天其实你会发现,搞 AI 的很多人也是信息非常非常的多和杂嘛。那其实帮他聚合起来,然后做一个这个有效的展示,这个效效果是非常好的啊。它可以放视频、放图像,然后分时交错的去摆放,就很好了。那在人群上有什么特点啊?比如说什么方向的人多?呃,目前这个阶段其实还是我们说修F一赛车的人,那就是招人的这个方式。
你刚刚说到中国公司是可能会找一片,他有一个几个条件,嗯,然后美国的很多公司是按照具体的论文来搜的。你自己觉得哪种效率会更高?呃,我觉得啊,其实肯定是前者效率高,因为你已经本质上你已经锁定一批具体的人,比如说我今天就要找那个懂 AI agent 里面就是工作流调度,或者说 data flow 的这样的人,那我。
他就很明确的,这个人就能你找出来,我就知道这人满不满足我画像了。嗯,然后就是我就直接跟他联系。但是就是比较泛泛的需求,就会出现就是OK,我可能一次出来的人我不满意,那我需要多次的去。跟这个 agent,跟这个代理去迭代,说啊,我找出来这些人,第一批第一次问题找出来的人,我总感觉差点意思。那我可以第二次再修正,说啊,你能不能帮我调一调?
可能我想要啊,另外的这些特征,我可能要新加一些特征,去掉一些特征。嗯,那在这个过程里,我可能认为还是前者更高效,但是。代理的作用其实就是帮助你,无论你输入的是什么样的问题,我都应该通过跟你的对话把这个可能你希望的人帮你找到,然后帮你建立联系啊,这个其实就是,啊,我们的这个平台的价值。在中国的这些 AI 团队里面,什么公司的人被搜的最多呀?
啊,目前肯定是千问吧。千问的人为搜的最多,不是 DeepSeek 吗?呃,现在不是,不是。你说的是美国的公司会搜千问的人,对。如果美国公司搜就是千问或者 Kimi 的人,那他们是直接把人从中国招到美国吗?嗯,对。他首先就是说这个搜索出来的这个情况是这样,因为他搜的是一些他不是直接去搜某某团队的人,他可能就是搜哎,我想要找懂这个方向的,然后可能有一些什么经验在这种。
研究机构干过,那我们的 agent 就会理解为 OK,可能来自千问或者说 Kimi 或者某个团队的这个人是比较适合这个需求。哦,我明白你说的意思是被搜到的人,对对对,很多是千问和 Kimi 的,是是是,因为他们确实比较满足这种需求。我觉得 DeepSeek 比较少被搜到,可能有一个原因是不是因为 DeepSeek 的人在公开的网上的信息相对少一点?
好像还真是,因为我确实很少看到 DeepSeek 的人在 X 上面去发东西,好像确实比较少。反而确实像 Kimi、像千问这样的人发的会比较多。对 DeepSeek 官方的 Twitter 的账号还是有很多关注的啊,但是他们特别活跃的内部的研究员好像是比较少,好像没有太,太了解。对,我觉得这可能也跟每个团队的 leader 的风格有关系。
可能,比如说千问的俊阳,他其实自己在社交媒体还是挺活跃的。梁文锋显然是一个非常隐身的人啊。嗯嗯嗯嗯嗯。如果从关键词的角度,就直接就是说想找哪个公司的人的这个角度,嗯,被搜的团队最多的是什么?国内好像。比较少,就大部分还是搜国外的公司比较多,搜啊 DinQ 的人比较多,搜 DinQ
的人多,因为最近的话,可能视频或者都不太理解,开始这个方向比较火,大家比较想了解一下 W3,嗯,然后这个团队里面都有谁,然后还有一些这个,比如搜 Runway,搜搜德国有一个公司叫黑森林实验室,啊叫 Black Forest Labs,就搜这种的比较多啊。
对他们,比如关心某个模型背后这个贡献者是谁啊啊啥的啊,还有就是。呃,其实大部分人,其实他都是搜的很很具体的那个东西,他搜机构也好,搜组织可能还是比较少啊。中国人可能会这么去搜,我想要找一个斯坦福毕业,发过三篇顶会,然后这个零零后出生,然后又有干劲的,社交媒体比较活跃。那这个时候我们AIG就会分析啊,什么什么是顶会,对吧?
什么这个最近一年的,嗯啊,什么什么news啊,ICLR啊,什么CVPR啊,啊一顿分析,嗯,把这人找出来。嗯,中国中国人这么搜都不一样。你觉得这么搜反映了一个什么思维啊?我自己不太知道哎,就是我只是从用户的这个查询能感觉出一点,就是。可能中国人某种程度上他还是更看重这个,就虽然说今天本质上啊,我们说学历这个东西越来越弱化,他可能还是希望有一些锚定的,啊,就是他还是会认为,OK,你今天从啊好的大学博士毕业了,那你还是很厉害,嗯,啊,我也希望要这样的人,然后让我们的团队什么更上一层楼,对吧?
然后。呃,对,然后用一些具体的指标,我把一些可能不满足条件的人,把它所谓我们叫卡出去,嗯,啊,可能能体现这些东西。对你说到这个,其实我想起来,就是有的时候看一些初创团队的BP。在团队那一页,经常就会写创始团队来自什么斯坦福、CMU,对,什么什么,是的,是的。我觉得这可能是这个中国人的思想刚硬吧,就是觉得这个老钟说,我这怎么着,我学历也得这个这个刷一下,对对对,这个往上怼一怼,对。
我觉得他有的时候是可能也不见得说这个团队自己觉得这个事儿很重要啊,但可能这个环境,比如他认为别人觉得这个事情重要,比如说他觉得投资人觉得这个事情重要啊。我觉得是的,因为。大部分这种呃资源,其实某种程度上可能还是掌握在这个好学校的这些老师手里。嗯,如果你有机会去跟他读博士,或者说在本科期间能进他的组去做实验的话,这个我觉得确实是一个很大优势。
嗯,啊,所以其实你去看吧,今天这个无论啥 MIT 还是斯坦福,就是就都有 AI 专业了。嗯。从二零二五年开始,像加州的一些公立学校,什么圣地亚哥分校啊,这些学校也都开始开 AI 专业,然后本科生的人数也越来越多。我觉得很有可能就是看学历这件事情,在概率上是没有错的。对概率上是嗯,其实你们平台可以做个定量分析,就比如说影响力,比如说靠前多少的这些人,他的成长的路径啊,他大概的一个履历背景是怎么样的?
是的,嗯,是的,是。因为你印象比较深刻的故事,很多人他他其实是就不拘一格降人才嘛,就各种成长路径的。你刚刚说的有,比如说没上过大学的,有大学没上完的,有各种。对,我觉得这个这个时期是这样的,要不然你就是一个超有能动性的,你不需要学历,确实不需要,你就是。我们所谓的就是在公开场合构建,英文叫 building public,你就这样就可以了。
这你一定不会被埋没,你只要真的在做一些好的东西,一定会有人找你,这是必然。但这样的。这样的人可能还是少数,对大部分人来讲,他会有一种没有安全感。他说:“我,就是很多人的思维模式是说,哎呀,我今天做了这件事情,我能不能明天看到回报?那你抱着这样的心态呢,那你就需要选一条稳定的路。那稳定路,那可能目前来看,可能还是升学。
”那升学的话,你有机会认识到比较好的人,然后能获得一些这个互相的一些这个,呃,支持和帮助。嗯,那这样的话,其实它就所谓的是那种比较稳健的路线。嗯,你说的那个 building public,它可能上限很高,对,但它也有可能下限很低。是是,但是如果你按照一个相对呃成熟的既定的路线去发展的话,我觉得就可能大家觉得至少下限不会特别低。
但今天其实我们进入这个时代,就是我觉得,尤其是程序员这个群体为代表,其实大家都意识到一个事情,就是今天的这个 AI 写的代码的质量、能力。然后还有它的各方面的这个综合的情况来讲,都比人要强大的太多。嗯嗯,哪怕是这个小龙虾代码。据他的那个创始人说,也都完全是我们叫这个 web coding 吗?对,用 AI 去 web coding 出来的。
嗯,啊,那这其实说明更,我觉得人类更陷入这个存在主义危机。哦,其实 Cloud CoWork 也是,对,就是 Anthropic 也说 Cloud CoWork 是 Cloud Code。Web coding 出来的,然后人主要做的是,比如说架构设计了,然后包括什么安全测试这这样的工作。从这个角度来讲,那所有人都没有安全感。
那所以其实这个所谓的你去读书,找安全感这回事儿,就慢慢就开始不存在了。对,我觉得你讲到了这个,就是技术发展很快的时代的另一个特性,就是你按照以往相对你认为有安全感的路线去发展。但很有可能,这个整个职业市场环境的变化是超过你的成长和适应速度的。当然,因为一方面就是整个二零二五年 coding 有很大的进展,但另一方面,这个在美国更明显啊,看到很多大公司有很大规模的裁员。
像 Amazon 的话,他一次就裁了一万多对,就好像就前两天一万六嘛。那所以在这个环境下面就没有所谓的安全第二这个概念了。这个我想起纳瓦尔在 2021 年在推特上发了一句话,就是就我们进入一个全民创作者经济的时代。全民创作者经济,对对,就是这个路线,就是第一呢。就像他们之前说,要不然就每个人第一呢是有个低保,就全民基本收入,叫 universal basic income。
嗯,啊,那这个东西能给多少钱,其实没人知道。就是那大家的这个惯性说,哎,我还能做点啥,对吧?我怎么还能让我自己的生活有个保障?要不然就是我们说所谓去干蓝领工作,对吧?要不然在白领工作里面是需要有一些创造力,那个东西是让自己可能能获得一些注意力,然后能够得到一些收入的一个好的办法。那其实体现在我们说程序员,或者说搞开发的,然后搞 web coding,搞什么?
那其实关键就在于说你能不能做出一些比较好玩的,然后让人愿意用的一些东西。就经常有一些人,一些比较技术乐观主义者,会把 AI 替代重复工作之后,我们更多的时间可以去投入创造力的工作,描述成一个比较乐观美好的未来。但其实有一句话是这样说的:王兴应该之前引用过,人为了逃避思考,可以做任何事情。就是你想很深度的思考,然后有创造力这件事儿,对我觉得很难。
嗯嗯,我可能如果你是一个小孩子,你就是在一个确实非常以创造力为目标的这个环境一路成长起来,我我不知道会怎么样。那可能是未来人类可以有的一种体验。至少我觉得在现在这种应试教育的环境之下,其实本身在成长过程中间,很多人的创造力是被压抑的,或者他渐渐就迷失了。那有可能就在。这个时代下面,它的这些东西有可能会被激发,重新被激发出来。
对,我觉得有可能新的技术环境下。确确实有可能,就是度过这个过渡期之后,他会到一个新的状态。但也许我这个想法就是错的。也许当所谓的技术基点来临之后,它无所谓什么过渡期,它就是一路加速发展也有可能。对啊,那那就所有人都领低保,快乐的这个去公园溜达了也行。那或者说可能有一些更极端的事情发生,那我觉得这个事情我们没有办法去预估。
嗯。啊,只能做好,就是当下觉得比较重要的事情,有乐趣的事情。你研究了很多这种 AI 研究员、AI 创造者,就是你说的做 F1 赛车或者开 F1 赛车的人,你觉得他们对他们现在在做的事情之后带来的更广泛的社会,或者说对很多人的生活的影响,他们是怎么想?我觉得其实大部分人其实没有想,很多人没有想太多,就是除了极少数像。
伊利亚这样的人会想很多,其实大部分人想的就是说,哎,我怎么能更高、更快、更强?如果我是做视频的,我怎么能一下生成这个,甚至分钟就是几十分钟的这种视频?然后我现在做视频,我或者说我怎么能生成那种?啊,就是实时生成这种视频,然后怎么能让它分辨率更高,然后画质更好,人物的一致性更好?那做大语言模型的呢?就是说我怎么能让这个推理的成本变变低?
我怎么能让我自己的模型,然后也有像 Anthropic 的 Open 4.5 一样这种这种智力的能力?啊,很多人是关心这种这种东西。因为你们现在做 DINK 也是解决工作匹配、人才匹配的问题。当 AI
越来越强,你觉得这件事儿本身会怎么被改变?未来很更多的。那智力工作就是,我认为未来可能出现一种情况啊,我认为大概率会出现一种情况是,我今天可能需要找一个人帮我这个业务去分析一下,我为什么需要一个做微调的人,RL fine tuning
的人,就过去这种那天得雇一个人,然后给他很多钱,那今天可能某种程度上你只需要雇。
一个人花一周的时间就可以把这事儿搞定了,那会造成什么了?会造成什么样的组织形态和就业方式了?我就外包化或者顾问化,或者怎么着?哦,也许以后就不是人和公司来匹配,也许是人和一个和一个事儿啊,和一个任务。对,因为过去就智力劳动,大家觉得最困难的点就是在需求,其实我我也不清楚我要什么东西。所以最后有招标,然后有甲方这个乙方这样的,因为我不清楚需求,我需要乙方在跟甲方磨合的过程中把这需求确定,然后啪,你告诉我应该干嘛,我去干。
干半年,干这个九个月、一年,然后来交付这样子。嗯,那今天这个干活这这个九个月、半年,你就可以压缩到这个几周时间了。然后你需求的对齐在模型帮助下也。非常非常容易啊!那有没有可能会出现一种智力劳动的这种所谓的外卖或者滴滴化?这个我不确定。因为你们自己现在做 DINQ 的话,其实它广义上来说就是一个招聘的平台,对吧?
你对未来招聘市场会怎么变化?你有什么推演?我我可能比较偏向我刚才介绍的那个逻辑。就我觉得它会变得越来越快,然后越来越零散,就是大家彼此之间没有什么所谓的责任或者忠诚度这种东西了。就我觉得这个世界会变成六年前的世界。跳槽还会看你是不是五年三跳?今天没有人关心这个问题了。对于智力的这个劳动,就尤其对于嗯程序啊,或者说
AI 这群人来讲啊,你这么一说的话,可能很多挺顶尖的研究员非常符合你说的五年三跳的这个状态啊。
对,是嗯是。那如果整个变得非常零工化,然后非常流动性,就是提供。人才匹配的服务的具体产品,它会怎么发展啊?我认为它会收敛到一些很具体的指标,嗯,就就比如说。我们做现做了一个东西,叫做看你的 Claude 的你的 token 的消耗量。对,那这个东西它就是一个指标,这个指标就是
OK,你这个人啊,就可能经常玩 Cody,因为这个很自然嘛,你玩 Cody 多了,你就你就跟大家有交互,然后有反馈,然后你又有奖励或者有负面的奖。
其实之前 Cursor 就用这种类似的指标招过人,他们招的有一些人就是他早期产品的非常重度的用户。嗯,是的,是的。对,嗯,就相当于一叶知秋,我就相当于如果一个人经常在这消耗头粉,他一定这个有点有点事儿干,他肯定是相对有点想法的人。然后对于工作来讲,其实啊,对于大部分的这种非头部的工作,其实大家关心的是。
不是这个人,而是关心你到底能不能解决我这个问题。所以你现在看到很多 AI 的初创公司关心,就是 OK,这人是不是比较 AI native?然后甚至会会问你,比如说投函消耗量是多少啊?你用过多少产品?嗯,那体验是什么?然后你自己做某些东西的时候,你自己的这个经验是什么?他就比较关心这种东西。或者或者你个人任务的自动化率是多少之类的?
是的,是的,是的,就大家很关心这些事情。像你们这种产品,什么时候可能会扩散到 AI
领域之外的更多类型的工作呀?呃,我我认为它其实应该很快,就如果是白领工作的话,应该会比较快,因为如果真的就像我刚才预设的那个场景发生,就很多东西都是零工化,啊,那你你确实要接单啊,你需要宣传啊,你需要有这个渠道,所以其实我们今天能看到的,在抖音、在 TikTok
上面,在小红书上面去接单的人,本质上也就是这群人,那只是来到我们平台,我们也会帮他匹配一些机会而已。
你觉得你的同行是谁?广义的同行?就是做我们类似的这个产品,嗯,好,甚至可能在外界看来不类似,但你觉得它其实内核是接近,或者它满足的需求是接近的。内核比较相信就是摩科这个平台,嗯嗯,因为其实很多人会看,哎,说你们怎么好像在做两件事情,一件事情是搜索着。啊,然后你先做匹配嘛,你一件怎么你又给 C 端做点东西啊?
但我觉得这其实内核都是 C 端的这条,只是那个匹配是,你今天有一个场景能够把你的匹配引擎打打的效率很好,把这 agent 做的很好。那他今天做需求和人的匹配,明天就可以做人和机会的匹配。他就是一个可逆的这么一个东西。哦,你说内核是 C 端,你是指内核是那些有创造力、有工作能力的人,是你们的第一服务的对象。
是是是,你未来是要把它匹配给各种东西,可能现在是匹配给一个公司,一个一个团队,以后可能就是我刚刚说的,可能是一一份工作。就除了匹配给公司之外,你们已经出现了这种匹配给,比如说一个比较短期的零工化的项目的。现在还没开始上这个东西啊?这是一个新的功能。对对对。二六年什么时候会上?二六年预期的话,应该是在这个四五月份的时候。
那个最后你可以总结下,你你对现在就是在做这个AI研究和AI开发的人,你有什么作为前AI研究员?当然你现在也做AI开发啊,前AI研究员,现AI公司创始人啊,你有什么想说的啊?呃。我我想说一点,就是在这个时代,其实更关心的是你个人的发展,就是你个人的这个通用性。就是过去我们都在想说,啊,我今天进入一个公司,我去升职加薪,然后爬所谓的梯子。
我说这个东西在未来。就是如果是我们说所谓的就是编程也好,或者研究员或者开发者,这个东西可能越来越不重要。那不重要的点就在于说,呃,我们就看最头部的公司也没有说什么这种特别明显的职级这个划分了,统一都叫 MTS,就是 Member of Technical Staff。嗯,对,统一都是这个划分了,就大家都叫工人啊,都都是工人阶级这个样。
那这个阶段,我认为。其实更多的就是要把自己生活自己自己照顾的很好,然后让自己有一个很开心的这种状态。啊,健康的这种情绪,然后呢,在这个过程里面去享受每天跟 AI 的这个碰撞,然后这样的话也有可能能有一些比较好的想法和玩具,或者说东西能做出来。嗯,还挺激励人、安慰人的啊。虽然我觉得在如此残酷的竞争之中,就可能比较难啊。
嗯嗯,这还需要挺强的心态调整能力。对,这心态很重要,因为你今天写代码,大部分人也写不过他。嗯啊,然后那个这个。那很多人其实过往锤炼的那个价值,很多时候就在这些细分领域里已经被他超越了。那你你的价值更多,就是人的价值更多的就会变成人独有的价值,就是说跟人沟通或者在组织里面做协调工作的这样的角色啊,或者判断的这样的角色能力。
那这个东西其实不是说我一天玩命干这个十六七个小时就可能能有一个线性提升的这么一个东西。就如比如说像,呃,这个 DeepMind 的这个负责人德米斯·哈萨比斯爵士说的那样,可能再过几年大家没有工作,那都都领低保了,对吧?那你你这个身体不更重要吗?对吧?对,嗯,我的想法。嗯,马斯克有一个建议,他认为长寿就保持健康,然后等待人类可以普遍比较长寿的。
阶段到来,嗯,他也觉得挺重要,是是是,嗯,他身体也搞垮了,然后其实没什么太大意义。OK,那今天非常感谢 Sam 做客晚点聊,分享了他自己从研究员到开始创业做 DINQ 的经历,他对 AI 研究员还有 AI 开发者这个群体的痴迷,收集了很多的故事,呃,以及和这些顶尖的研究人员是怎么建立联系的。和现在这个时点 AI 人才市场的一些变化,那今天节目就到这里,感谢大家的收听,拜拜,谢谢。
本期零点呈现推荐第一百三十四期,我和 Pokyder AI 的创始人朱哲清聊 Meta 当时的 AI 人才和组织变化。朱哲清创业前在 Meta 工作了七年,内切讨论了本期涉及的几个主题:一是最顶级的 AI 研究者在追求什么。朱哲清当时的答案是,能成为促进 AGI 出现的那个时刻的一份子,而且是核心的一份子。
换言之,如果将来有一篇被称作 AGI 的论文,或一个被认定为 AGI 的模型,他们希望自己的名字出现在作者里。这和我们这期聊到的研究者其实有一些像文艺复兴时期的大师,他们在追求自己的代表作是有一点相似的。也和本期的嘉宾高岱恒类似,朱哲清聊到了个人和小团队在 AI 前进中的重要作用。当时我们是在讨论,不论中美。
绝大多数的资源和人才看起来都在投入优化大语言模型这个方向,少有人去开辟新的方向。后来,伊利亚也在公开场合中说到。他说,大语言模型和 scaling
抽走了房间里的所有空气。我当时就问朱哲清,这是不是和重大技术的更新本身隔一段时间才会出现有关?是有周期的。他说他不太认同周期,他认为很多时候一个创新如果往前溯源,就是因为某一个人或者某个小团队突然决定要挑战既有的方向,去提出或解决一个新问题,只是这件事的风险特别大。
在现在的环境下,你可以选择加入大公司,用更多资源去快速的做实验和迭代,但这就不得不受限于公司想投入的方向。你也可以选择坐冷板凳,但确实有可能没有成果。后来我们也可以看到,这种张力在持续显现。比如二六年年初,在 OpenAI 带了七年的元老 Jerry Torik 离职后,就说 OpenAI 已经没有做高风险研究的空间了,因为所有主要的 AI 公司都面临多重压力。
既要驱动用户增长,又要承担昂贵的 GPU 成本,还要拼模型的第一。一百三十四期还有一些有意思的讨论,比如工程型人才会决定公司未来两到三年的发展,科学家型人才会决定公司未来十年的发展。但是很多公司有可能活不过眼前的两到三年。我们也聊了一些不同公司的风格,比如 XAI 更偏工程驱动,Google 更偏科学驱动。
后来也可以看到,XAI 近期也发生了很多人事变动,马斯克请走了许多早期的成员。他认为 XAI 到了更加规模化拓展的下一个阶段。本期节目就到这里,欢迎收听。如果你对今天聊的话题有观察、好奇或疑问,欢迎在评论区分享想法,这也会成为我们节目的一部分,让整个讨论更完整。你也可以把我们的节目分享给对这个话题感兴趣的朋友,欢迎推荐更多你想听的主题和嘉宾。
你可以从小宇宙、苹果 Podcast 等渠道关注晚点聊 Late Talk,也欢迎关注我们的公众号晚点 Late Post。下期再见。