欢迎收听晚点聊,我是曼奇。加更一期,简短的来说一下阿里Qwen,也就是千问团队最近的变动。我录这一期节目的时间是三月四日晚上,所以今天指的是三月四日周三,昨天指的是周二。今天早上晚点发布了关于Qwen,也就是千问团队负责人林俊阳提出离职的独家报道,是我的同事陈佳慧和我撰写的。林俊阳提出离职,Qwen多位负责人离开。

这之前,困还有两个技术leader离职,一是节前已经离职的原困code的负责人惠冰源,二是刚好在昨天,也就是周二,是last day的困的后训练负责人喻博文。我先总结一下这两天发生的事情。首先,根据我们得到的信息,我觉得有几个从逻辑和事实上都缺乏证据,但广为传播的事情,可以先澄清一下。第一个是说。啊,我看有社交媒体上一些信息说林君阳是被通知离职的。

据我们了解,他是自己主动提了离职。今天白天我陆续了解更多信息之后,我觉得在很长一段时间里,林君阳是为了他想追求的目标,知其不可为而为之,努力到了最后一步,到了某个瞬间。他是有点儿道心破碎了,所以宣布自己要离开的方式确实很突然,也没有给阿里管理层太多的反应时间。那最后大家看到的结果,就是我们在三月四日的凌晨看到林群阳在。

Twitter上发的那条动态,Missetting down by my beloved Queen。另一个广为传播的信息是说,Queen团队改变了考核方式,要在考核中纳入千问App的日活。这个目前是没有什么事实证据的。而且逻辑上它也说不通,因为技术还在快速的变化,各个公司的模型团队的核心目标肯定还是要确保模型在性能和效率上的领先。

Qwen还是一个一整套的开源模型,它还要满足不同开发者对不同尺寸、不同特性的模型的需求。而产品DAU的这个目标,它还是直接和产品团队相关的。千问App这个产品,它也并不在昆仑团队所在的整个阿里云的体系里面,而是在吴佳管理的智能信息事业群。第三个需要澄清的是,二六年一月新加入的周浩,据我们了解,并不是来接替林俊阳的。

今天早上有朋友问我,说是不是阿里给俊阳空降了一个leader,所以他才想走。这个不符合事实。目前的情况是,周浩是接替郁博文来负责后训练团队,他直接汇报给Qwen所在的通义实验室的整体负责人周静仁。静仁也是阿里云的CTO,他刚在二五年的下半年晋升成了阿里最新的一位合伙人。但确实,Qwen的大部分团队成员之前是不知道周浩已经加入了,也不知道他要接手后训练,所以这对一线的干活的同学来说,也是一个突然有点被通知的感觉。

然后来简单说一下整个事情的大致经过。据我们了解,三月三日周二的下午,俊洋是在Qwen的钉钉群里告诉了大家他决定要离开了,无颜面对大家。随后是第二天凌晨,他发了那条说自己setting down的Twitter的动态。整个过程很快。为什么他会感到无颜面对大家了?综合现在得到的信息,这个背后的情况就是晚点在今天早上发的独家报道里提到的,整个Qwen团队正在经历组织调整。

具体的方向就是拆成不同的部分。在这之前,坤一直以来的一个做法是把预训练和后训练做非常紧密的结合。这两个 team 的核心人员刘大一恒、郁博文等也都是长期共事、相互很信任的同事。刘大一恒是应该是二一年就加入阿里了,他之前在华为短暂工作了一段时间。郁博文是阿里自己培养的应届生,他是二二年到二三年左右加入的。

预训练和后训练的紧密的结合,本身也是一些。Qwen的成员认为,Qwen的训练效率比较高的重要原因。然后到后面,随着原生混合多模态成为一个越来越明显的趋势,Qwen在大语言模型之上也做了更多的模态探索。比如做纹身图的 Queen Image,还有语音模型 Queen

Audio,而这次的调整计划,首先是把模态给拆出来,语音可能会并到同在通义实验室的另一个专门做语音的团队,也就是百灵;纹身图可能并到通义实验室专门做多模态生成的通义万象。

预训练和后训练实际上也分开了,因为前面提到了郁博文他作为后训练负责人离职之后,接替他的是周浩,周浩是直接汇报给通义实验室的整体负责人晋人的,所以这个团队就不在林君阳的管理范围了,就是从困成员的角度来看,他们会认为预训练和后训练也给分开了。而关于从二五年年终开始,中间的中,可能陆续招募的一些自己来做infra的团队会怎么调整,这个目前还不太明确。

所以总体来说,Qwen就是从之前预训练和后训练密切沟通、整合infra和预训练垂直整合,然后不同模态也在一个team的状态,变成了按照不同模态和训练。环节来划分的一个一个分开的水平的团队,这个变动是让林君阳最终决定离开的一个比较主要的原因。而且这个调整对林君阳和Qwen的技术团队来说也比较突然,它发生在Qwen三点五系列刚刚训练完的时刻。

整个团队在这之前其实也加班比较久了,比较疲惫,然后突然遇到了这样一个挺大的变化。这件事情的后续是,今天也就是三月四日的下午,整个千问团队召开了全员会。阿里参与的高层包括阿里集团CEO,也是阿里云的CEO吴永明(吴妈),阿里云CTO和通义实验室的负责人周靖仁。阿里的首席人才官蒋方总结下我们获得的全会的信息:一是关于团队调整的回应,管理层的说法是这个调整不是要收缩Qwen,而是要扩大对积模的投入,把Qwen做好是集团的事情,而不只是积模团队的事情。

所以要引入更多的厉害的人才,这必然会涉及到阵型和组织的变化。整个调整是完全没有考虑公司内的政治因素的,但可能在沟通形式和节奏上没有处理得很好。这里需要补充的是,这个全员会上其实没有特别详细的提到接下来 Qwen 这个团队会具体怎么调整。我前面提到的这个调整方向是这一周林俊阳还有困的一些成员得到的信息。

从流程上,它还不是一个真实的决定。现在发生了这么大的变化之后,具体困的阵型会怎么变?接下来可能还有变化。二是关于Qwen团队认为阿里云内部给到他们的infra的支持不够的这个问题,近人的回应说这是历史原因。这里稍微展开解释一下这个背景。就是在二五年,Qwen开始自己建立infra能力和招这方面的人之前,Qwen的训练部分的infra是派这个团队来支持的,就是阿里云人工智能平台。

然后推理的部分是阿里云百炼团队来支持的。阿里云也对外部的客户,比如说像Kimi智谱这样的大模型厂商,提供训练和推理的infra的服务。Qwen团队自己的感受是认为,阿里其实在服务外部客户上的效果是好于对Qwen这个基模团队的支持的。三是关于林正洋离开这件事情是否还有转圜的余地,这也是Qwen团队成员当前最关心的问题。

管理层的回应是。不能把个人推上神坛,也不能不计代价的来挽留。如果我们把时间线拉长去总结,从二三年大模型热潮到现在,整个千问的核心模型研发团队和阿里这个大环境的一些变化,大概是这样一个时间脉络。其中的一个关键核心就是全员会,像团队成员也专门提到的 infra 能力的问题。最开始,其实,在 ChatGPT 之前,阿里就在做大模型,是中国非常早开始投入大模型的公司之一,仅晚于百度。

二零二零年的时候就有相关投入,因为达摩院本身当时就在探索各个前沿方向,Transformer这个方法是二零一七年Google提出的,到二零年GPT三发布,在AI从业者里。还是引起了不少的关注。到二一年的时候,阿里就对外发布了M六还有Plug这两个大模型。然后是到二三年初,这轮热潮开始之后,阿里当时做大模型的主要是两个团队,一个就是M六团队,之前是杨红霞负责。

到二二年九月前后,杨红霞离职,加入字节,就是周畅在负责。这个团队是在周静仁当时负责的智能计算实验室之下,周畅向周静仁汇报。第二个是达摩院的NLP团队,当时是由黄飞来负责。在二三年早期的时候,这两个团队处于一种赛马的状态,最终是 M6 这个团队取得了比较好的成果。之后,资源和人也都集中到了智能计算实验室的 M6 的团队。

这前后,达摩院也进行了重组。以智能实验室为主体,合并了视觉、语音等团队,组成了后来的通义实验室。近人成为了整个通义实验室的负责人。早期Qwen团队在资源相对有限的情况下,训练的成功率比较高,这和团队的数据能力很强有关。其中的一个核心人物是刘大一恒,也是从那时Qwen这个团队一直沿袭的做法,就是预训练和后训练有非常紧密的结合和沟通,而不是说。

出了问题,相互甩锅,因为这些 leader、这些核心成员之间也都共事很久,信任比较深。然后从当时开始,后训练的负责人就是最近刚离职的郁博文。郁博文此前是黄飞负责的,就是 NLP 团队的。他是在二三年之后转岗到了通义。再往后,通义在组织上的一个比较大的变化是二四年夏天周畅离职,也带走了一些做多模态的比较核心的人员。

为什么当时周畅想走?据我们了解,有两个原因,一个是周畅自己的兴趣和技术判断在多模态模型、视觉模型这个方向,而当时大部分公司里能给到最多资源的还是大语言模型,因为在整个24年,中国大模型公司包括大厂和创业公司的核心目标还是去追赶语言模型全球最领先的水平。另一个原因是周畅认为当时整个千问团队的待遇没有和市场特别匹配,这一点其实在周畅离职之后是有比较大的改善的。

下一个变化的节点是到了二四年九月前后,就是 OpenAI 发布 O1 之后,整个业界也看到了 OpenAI 验证了在后训练强化学习上投入更多的资源,包括算力,包括时间,会取得很不错的成果。这个技术也带来了一个变化,就是对 infra 提出了更高的要求,而这又带来了组织上的变化。我会讲一下这是怎么发生的。

在O1之后,其实千问的团队也做了很多强化学习后训练的尝试,但最开始的效果都不是特别好。团队归因花了一段时间,他们最开始认为可能是算法的问题,但后来对这个事情的定位是infra的问题。做出这个判断的比较直观的原因是,最开始Qwen是用阿里的派支持的infra来跑强化学习后训练,然后中间有段时间应该是在二五年春节前后。

团队用了字节开源的强化学习框架,这也是现在业界比较主流的一个框架,就是 Ro V E R L。来做训练,发现效果有了比较明显的提升,相当于是通过控制变量确定是 infra 需要优化。这之后派来支持 Queen 的 infra

的团队也确实人员上有些调整,也有一些扩充。接着是到了二五年的年终。这个时候,Qwen在infra上又遇到了瓶颈,因为他们当时在更新新一代的核心模型时,已经度过了之前在小规模的模型上做实验的阶段,要开始训更大的模型,比如几百B size的这种模型。

这个时候就会发现,基于之前字节的那个框架 VRL,然后加派的团队的一些改动没有那么大的优化的 infra 已经不够用了,它比较难支持更大规模的训练。差不多也是从同期开始,千万团队比较努力的想去自己招一些 infra 的人员,一个是他们就已有的人可能会去学学 infra 怎么做,就大概知道你招什么样的人能合适,然后就是去扩充人。

这个变化我们在之前的几篇报道和去年春节。发的年终播客总结里都有提到,但是在寻求这个新的Hi抗的过程中间遇到了一些阻力,因为从近人的角度,他要从整个通义实验室乃至整个阿里云来考虑组织的布局,他其实不太倾向组织上的这种变化,而是。希望继续让派来支持通义实验室的各个模型团队的infra的工作,而林俊阳认为这样会影响整个模型的训练效果。

最后,他为了实现自己能自建infra的这个目标,其实是绕过了近人,向吴妈去争取了在招人上的一些支持。据我们了解是这样,这在公司组织里其实就是越级汇报了嘛?这也为之后千问面临的一些组织上的调整和变化埋下了伏笔。最后预测和推演一下接下来团队可能会面临的一些变化。在周三下午这个全员会之后,其实整个 Qwen 的团队对高层的一些解释和表态,他们是感觉比较失望的,依然处于一个士气相对低落的状态。

在内部感到灰心的同时,这种非常公开的变化也导致呃外界有很多人向 Qwen 的团队伸出橄榄枝。今天白天,我和同事就感受到了很多这种连锁反应。比如说,有其他公司的高招人员,三月三日这天晚上也是整夜没有睡,挨个在给自己认识的Qwen的团队的人发信息,沟通一些工作机会。有猎头想联系林君阳,说哪些哪些公司都有岗位找他。

也有不少投资人在寻求Qwen的一些核心人员的联系方式,因为他们认为近期可能会有不少人陆续的离职,那其中可能也会有一些人想创业。甚至也有一些技术leader做好了准备,说接下来一段时间可能自己得花精力想想怎么帮手下去推荐好的去处。以下不是一个事实啊,这是我主观的一个推测。就是我看到林俊阳在今天下午的时候,他是发了一条朋友圈,他说Qwen的兄弟们按照原来安排继续干没问题的。

我觉得他可能从心里会认为他不想因为自己。决定离职这个原因,让整个团队分崩离析。但接下来这个事情会怎么发展?现在确实有比较多的变数。这可能是坤团队迄今为止面临的最大一次组织上和团队上的危机。它背后有一个老生常谈的问题。就是个人和小团队的目标与更大的组织的目标之间的对齐,这个在越大的公司、层级越多的公司里面就会越明显,也越难解决。

具体到Qwen这个团队,它首先是在通义实验室里,然后通义实验室又在阿里云,阿里云又在整个阿里集团里。那一方面,困在全球的开源社区确实有很高的声誉,有大量的开发者拥趸。其实,在美国最知名的中国的模型就是 DeepSeek 和 Qwen,而且相比 DeepSeek 的话,Qwen 确实有更多的尺寸,它是受到很多中小创业公司的喜爱的。

比如说像 Cursor 这种很知名的公司,也会基于 Qwen 的系列模型去做一些微调和后训练。然后 Qwen 的多模开源系列也是很多中国巨声智能公司选择的基模。这个其实你从巨声智能公司发的一些技术论文啊,中间都是可以啊找到非常直接的这种。事实的另一方面,阿里内部也在持续评估 Qwen

的成果和价值,其中有一些是对开源模型商业化效率的追问,因为开源模型它理论上所带来的这个整个生态的繁荣,肯定对 AI 云这个业务是有帮助的。

但它的转化有没有这么直接?它不是特别好量化,反而是可以明显的看到,因为开源你会影响,就是直接通过买模型API获得收入。整个阿里内部也有对Qwen的一些具体产出的评价,比如说我们了解到。阿里内也有一些技术高管对除夕夜亮相发布的 Kun 3.5 并不完全满意,认为这是一个半成品。当然,Kun 团队自己可能也没有那么满意。

这个和前面提到的,他们觉得在后面训更大 size 的模型的时候,比如说包括 infra,然后包括一些其他的优化,并没有做的那么极致有关。从整个阿里的角度考虑,技术影响力和开源社区的声望,你对开源的贡献并不是目的本身,而是要达成AI云、还有超级App等战略和商业目标的手段。在AI云上,现在阿里云是面临火山引擎非常激进的追赶,而字节其实走的是B端的模型。

在超级App上,豆包确实是领先国内其他大公司的。那刚刚结束的春节补贴大战上,千问App也没有明显缩小与豆包的差距。当然,这有一个背景,就是千问App。它其实是在去年底才又被阿里视为最主打的AI应用,所以它的这个发展的周期以及它之前获得的资源,可能和豆包相比本身也是有差距的。所以现在不到一个说判断AI app胜负的最终的时间点。

其实,在二三年的AI热潮之前,就已经开始开发大模型的Qwen这个团队,它曾经有一个相对独立于阿里大环境的小环境,它成长于一个少有人注意的角落,少被打断,少被拉扯。他们可以把更多精力用在模型本身的迭代上。Qwen确实也是阿里那一个很特别的团队,它的两任直接的团队一号位周畅和林俊阳都在一个大公司的环境里,给这个小团队注入了自己的个人印记。

这包括这个团队之间的密集的协作、相对稳定的核心成员,他们之间长期一起共事、一起奋战获得的信任和默契,以及他们对开源的坚持。其实,Qwen Max 系列就它最大的那个旗舰模型是没有开源的。不过,林君阳在一月的 AIGN Max 上,我记得他是说过,嗯,一 T 的这个模型就是万亿参数模型,他也想推动开源。

但是现在,整个 AI 已经成了所有大型科技公司输不起的全局战争。这种不被打扰的相对边缘地带的小环境是很难持续存在的。AI的商业化和应用竞争也变得更激烈了,在强调组织目标、集体目标、指哪打哪的大公司的运行惯例和那些最聪明的、自驱的、有创造力的。一个个个体之间本身就存在冲突和张力。一个大公司愿意在多大程度上去包容一个小团队的这种个性或者说各色,你可以说它是一个原则问题,也可以是一个选择问题。

阿里后续会继续如何处理这件事情?管理层的态度还是会和现在全员会上一样吗?我觉得这可能需要更长的时间来观察。我们也会尽我们的努力来持续报道和跟踪。也欢迎各位听友在评论区留下更多讨论。今天的节目就到这里,各位拜拜。