事件爆发:林俊阳主动离职与三大误读澄清

3月4日早间,《晚点LatePost》独家报道了阿里千问(Qwen)团队负责人林俊阳提出离职的消息,引发行业广泛关注。据我们了解,林俊阳是主动提出离职,而非被通知离职。他在经历了一段“知其不可为而为之”的挣扎后,于3月3日下午在Qwen钉钉群中宣布离开,并于次日凌晨在Twitter发布动态:“setting down by my beloved Queen”。这一离职过程极为突然,未给阿里管理层预留充分反应时间

与此同时,Qwen团队接连出现关键人员变动:节前已离职的原困(Qwen)Code负责人惠冰源,以及3月3日(周二)为last day的后训练负责人喻博文。此外,2026年1月加入的周浩,被证实是接替喻博文负责后训练团队,而非直接接替林俊阳。他直接向通义实验室负责人、阿里云CTO周靖仁汇报——这一安排并未提前同步给一线成员,加剧了团队的意外感。

“林俊阳是为了他想追求的目标,知其不可为而为之,努力到了最后一步,到了某个瞬间,他是有点儿道心破碎了。”

“周浩是接替郁博文来负责后训练团队,他直接汇报给Qwen所在的通义实验室的整体负责人周靖仁。”

围绕此次变动,有三个广为传播但缺乏事实依据的说法需澄清:其一,林俊阳系被强制离职——实际为自主辞职;其二,Queen团队将千问App日活纳入考核——无事实依据,且逻辑上不成立,因DAU属产品团队指标,而千问App归属吴妈(吴永明)领导的智能信息事业群;其三,周浩空降为林俊阳继任者——实为接替喻博文,汇报线亦不同。这些误读进一步放大了外界对事件的误判。

组织裂变:从垂直整合到水平拆分

此次变动的核心,是Qwen团队自成立以来最深刻的结构性调整:从预训练与后训练高度协同、infra与模型垂直整合、多模态统一研发的“整合型”架构,转向按模态与训练环节划分的“水平型”架构

此前,Qwen的高效训练被团队普遍归因于预训练(刘大一恒)与后训练(喻博文)团队的深度绑定——二者长期共事、高度互信,形成“问题不过夜”的快速反馈机制。而此次调整中,喻博文离职后由周浩接任,其汇报线直接指向通义实验室负责人周靖仁,实质上将后训练从林俊阳的管理范围中剥离;语音模态(Queen Audio)或将并入通义实验室的百灵团队,图像模态(Queen Image)则可能划归通义万象。至于原生infra团队的归属与整合方式,目前尚无明确结论。

这一调整发生在Qwen 3.5系列刚刚训练完成的关键节点,团队此前已长期高强度投入,身心俱疲,突如其来的架构重组成为压垮林俊阳的最后一根稻草。他在内部沟通中坦言“无颜面对大家”,反映出其对团队凝聚力瓦解的深切忧虑。

“预训练和后训练的紧密的结合,本身也是一些Qwen的成员认为,Qwen的训练效率比较高的重要原因。”

3月4日下午的全员会上,阿里云CEO吴永明(吴妈)、CTO周靖仁与首席人才官蒋方共同出席。管理层强调:调整并非收缩Qwen,而是扩大对多模态的投入,将Qwen成功视为集团责任而非单一团队任务;同时承认组织沟通节奏存在疏漏,但否认涉及公司内部政治因素。然而,会议未公布具体执行方案,前述拆分方向仅来自林俊阳及部分成员一周内的非正式信息,后续调整仍存变数。

历史脉络与未来变数:infra之争与人才外流潮

Qwen团队的危机,实为长期积累的组织张力集中爆发。回溯时间线:2020年阿里即启动大模型投入,2021年发布M6与Plug;2023年大模型热潮中,原M6团队(周畅负责)与达摩院NLP团队(黄飞负责)赛马,最终M6胜出并整合为通义实验室核心。2024年周畅离职后,团队待遇显著提升;2024年9月OpenAI发布O1后,强化学习后训练对infra提出更高要求,Qwen团队通过控制变量实验确认:使用字节开源框架RoVERL后训练效果明显提升,问题根源在于阿里云派团队提供的基础设施不足

自此,Qwen开始自建infra能力,但遭遇阻力——周靖仁倾向于维持阿里云统一支持模式,而林俊阳坚持自建以保障训练效率。为推进自建,林俊阳曾越级向吴妈争取支持,这一行为埋下了后续组织调整的伏笔。

全员会后,团队士气低落,外部机会迅速涌入:猎头连夜联系林俊阳及核心成员,投资人积极接洽潜在创业者,部分技术leader已着手协助下属规划下一站。林俊阳虽在朋友圈安抚“兄弟们按原计划继续干没问题”,但其离职已引发连锁反应。

“它背后有一个老生常谈的问题:个人和小团队的目标与更大的组织的目标之间的对齐,这个在越大的公司、层级越多的公司里面就会越明显,也越难解决。”

作为中国开源模型生态的中坚力量,Qwen在全球拥有极高声誉——与DeepSeek并列为海外最知名的中国模型,尤其受Cursor等中小公司青睐,因其提供从几十亿到数百亿参数的完整尺寸矩阵。此次危机若持续发酵,或将动摇其技术领导力与社区信任根基。

组织目标与开源价值的张力

在大型企业中,组织目标对齐的难度随层级增加而显著上升,Qwen团队正身处这一结构性挑战的核心:它隶属于通义实验室,通义实验室又归属阿里云,再往上则属于整个阿里集团。这种嵌套结构使得Qwen既需回应开源社区的期待,又需满足阿里内部的战略与商业诉求。从外部看,Qwen在开源社区享有极高声誉——在美国最知名的中国大模型中,Qwen与DeepSeek并列领先,且因其丰富的模型尺寸谱系(从轻量级到超大规模),成为Cursor等知名创业公司的首选基座模型;其多模态开源系列也被大量中国智能硬件公司用作技术底座。然而,阿里内部对Qwen的评估则更趋务实:一方面承认开源生态对AI云业务的长期价值,另一方面也质疑其商业化转化效率是否足够直接与可量化——毕竟开源会稀释模型API的直接收入。此外,技术高管对Qwen最新成果Kun 3.5的评价并不乐观,认为其为“半成品”,反映出团队在基础设施(infra)与训练优化上尚未做到极致。这些矛盾揭示了一个根本性问题:技术影响力与开源声望本身并非目的,而是服务于AI云与超级App等战略目标的手段

Qwen 确实有更多的尺寸,它是受到很多中小创业公司的喜爱的。

在AI云上,现在阿里云是面临火山引擎非常激进的追赶,而字节其实走的是B端的模型。

应用竞争与战略优先级的再校准

Qwen团队的外部声望与内部资源分配之间,正经历新一轮校准。在AI应用端,千问App虽被阿里重新定位为“最主打的AI应用”,但其在刚刚结束的春节补贴大战中未能明显缩小与字节豆包的差距。这一滞后有其历史背景:千问App直到去年底才被正式纳入核心战略轨道,其资源投入与发展周期天然落后于已深耕多时的豆包。因此,当前尚难断言AI应用赛道的胜负。更深层看,阿里对Qwen团队的容忍度,正与其在AI全局战争中的战略紧迫性密切相关——AI已成所有头部科技公司输不起的战场,过去那种“少有人注意的角落”所赋予的独立研发环境,已难以为继。Qwen团队曾因相对封闭、稳定的内部生态而快速迭代,其两任负责人周畅与林俊阳为团队注入了密集协作、长期共事建立的信任与默契,以及对开源的坚定信念(尽管旗舰模型Qwen Max并未开源)。但如今,当组织强调“指哪打哪”的执行力,而个体又渴望自主性与创造性时,大公司对小团队个性的包容,已从原则问题演变为战略选择

Qwen确实也是阿里那一个很特别的团队……他们对开源的坚持。

AI的商业化和应用竞争也变得更激烈了,在强调组织目标、集体目标、指哪打哪的大公司的运行惯例和那些最聪明的、自驱的、有创造力的。一个个个体之间本身就存在冲突和张力。