阿里千问变局:天才与巨头的分叉口

一个关于“实验室理想”与“AI帝国”的故事

阿里千问变局:天才与巨头的分叉口

文|魏琳华编|王一粟

3月4日凌晨,林俊旸在 X 上发布“me stepping down. bye my beloved qwen”,那时他是否会想到如此之大的舆论震动,我们不得而知。

阿里千问变局:天才与巨头的分叉口

但在前一天宣传模型,后一天就宣告离开的情况下,千问大模型(下称Qwen)裂开了一条缝隙,外部得以嗅到来自阿里内部变化的气息。

一天后,阿里集团CEO吴泳铭签发了林俊旸的离职令,并以前所未有的姿态组建了一个由集团最高权力核心构成的“三人小组”,这个三人小组包括吴泳铭、阿里云CTO周靖人和现任饿了么董事长兼CEO的范禹,共同接管Qwen资源调度的问题。

放在今天,Qwen在中国开源生态的贡献上有目共睹,但带头做出Qwen2.5、Qwen3系列模型的两个技术负责人周畅和林俊旸,先后离开了阿里。

在这场离职风暴的中心,隐藏着一个关于“实验室理想”与“AI帝国”如何注定分离的命题:

阿里需要的,是一个能够证明阿里AI实力的先进模型,为阿里拿下 AI 时代的新入口;一个能在MaaS战场上,为阿里云收割付费Token消耗的稳定引擎。而林俊旸追求的,是极致的开源精神和垂直整合的组织架构。

两者的故事中,谁都没错,但林俊旸和阿里,已经逐渐来到了分道扬镳的岔路口。

告别Qwen

周畅和林俊旸先后出走的背后

 

要理解这场离职风暴的深层逻辑,需要将时间拨回更久以前。

在林俊旸之前,阿里巴巴在大模型领域已经经历了一次核心人才的变化。

第一次,以周畅为首的AI团队跳槽,是阿里Qwen团队技术骨干出走的一个关键节点。

曾作为阿里P9级别员工的周畅,选择加入了字节跳动。据悉,加入字节后,周畅不仅获得字节4-2职级,相当于连跳两级,且薪资高达千万级别,比之前翻了好几倍。

周畅的离职,不仅是因为薪资,一部分原因也在于对个人对技术路线的偏好。据晚点LatePost报道,彼时的周畅看好多模态方向,但放在2024年,也就是大厂集中押注大语言模型的情况下,周畅看中了字节视觉团队抛来的橄榄枝。

人才的流失,显然引起了阿里的警觉。作为接过周畅重任、担任阿里Qwen模型团队的技术负责人,从校招P6级别进入阿里,到几年内多次升职,林俊旸成为了阿里最年轻的P10级别员工。

用马云的话说,离职无非两种原因,一是钱没有给到位,二是“心委屈了”。林俊旸的走,显然属于后一种。

3月4日凌晨,林俊旸在X上宣布离职,到第二天阿里批准离职。两天时间内,通过阿里员工发言和媒体报道,基本已经还原出林俊旸的离开,其中难免有和阿里组织的摩擦问题。

最影响到Qwen本身发展的,可能是对团队内部资源不足的摩擦。

一个小切口是,林俊旸需要牵头为Qwen码来更多资源,难免对Qwen团队内部是否为AI Infra额外投入、投入多少的想法不同。

林俊旸本人对Infra非常看重,这一点,他也在公开场合强调过。

“今天还有一个激动人心的事情,算法和Infra联合优化的事情是真真实实存在的。”林俊旸在AGI-Next峰会上说,“除了像DeepSeek提到的提升训练效率、节省资源成本外,我们要完成难度高的任务,都需要Infra的相关支持。”林俊旸说。

虽然阿里有额外的机器学习平台PAI负责提供这部分的支撑,但在林俊旸看来,还需要进一步加码,比如在团队中招聘更多相应人才。在林俊旸的社媒平台中,也公开放出过招聘Infra相关人才的信息。

阿里千问变局:天才与巨头的分叉口

林俊旸在社交媒体上招RL Infra岗位人员

对Infra的看重,不只是林俊旸对阿里的判断。落在今年对AI失意的腾讯身上,Infra也成了“天才少年”、OpenAI前研究员姚顺雨加盟后的重点之一。

在光锥智能此前的文章《腾讯重构AI的1000天》中,也曾提及,在腾讯年会上,内部表示,此前模型训练的一些问题原因可能在于基础设施Infra的不足。在姚顺雨进入腾讯后,公司单独成立了AI Infra部门和AI Data部门,区别于之前的部门架构,TEG中和AI训推相关的工作不再和其他业务合并,而是独立为AI服务。

但在后期,林俊旸希望自建Infra的实现并不顺遂。在晚点播客中,提及林俊旸为了达成相关目标,发生了越过周靖人向阿里集团CEO兼阿里云CEO吴泳铭寻求HeadCount(正职名额)的情况。所幸最终,林俊旸如愿以偿。

至于在其它资源上的不足,在3月4日阿里内部召开的会议中,阿里也承认了这一点。据智能涌现报道,关于招聘问题、内部算力有限问题,周靖人表示,团队处于“资源紧张状态”,内外差异有很多历史原因,未来会进一步规划。

发力顶尖模型

阿里对内动刀

 

在“为什么做”的问题上,阿里与林俊旸之间同样存在深刻的裂痕。

作为纯技术人才,林俊旸在Qwen开源模型名气的打响上,起到浓墨重彩的一笔。也是在AGI-Next峰会上,林俊旸曾经分享过团队为什么会考虑做小尺寸模型,起始是因为团队中有人曾建议开源用于预训练试验的1.8B小尺寸模型,会对一些开发者起到帮助。

阿里千问变局:天才与巨头的分叉口

林俊旸

林俊旸对开源政策的激进,也在公开发言中有所体现。他曾表示,自己希望推进Qwen3-Max大模型的开源,但未能如愿。

“全尺寸、多模态、重开源”的策略,帮助阿里在开源社区中建立了无可匹敌的生态优势。以最新发布的Qwen3.5为例,除了最先开源的版本,阿里还后续发布了Qwen3.5系列的0.8B、2B、4B和9B四款小尺寸模型,在X上获得了马斯克的点赞。

但在阿里的视角中,从追求AGI的愿景上,阿里需要的是一个能够领先于“六小虎”和字节、腾讯的多模态大模型;于阿里云需要靠MaaS扩张业务的情况下,集团希望有一个能打的大模型,像Kimi K2.5、字节豆包模型那样,在API上收入进一步扩大。

在Qwen核心人员百余人、资源有限的情况下,Qwen系列的旗舰模型在国内大模型混战中,无法做到在所有系列中都拿到最好成绩。

以最新发布的Qwen 3.5旗舰模型为例,作为一个参数397B的原生多模态大模型,讲究“力大砖飞”的情况下,让它和月之暗面万亿参数级别的Kimi-K2.5放在一起比分数,似乎有些尴尬。在Coding当前更看重模型质量阶段,Qwen3.5虽然做到了性价比优势,但它不是当前“掰腕子”的核心。换言之,Qwen3.5的发力和阿里内部的期许,走偏了。

回顾之前Qwen2.5、Qwen3系列大模型,阿里当前在模型生态上的成绩有目共睹,甚至被称为“源神”。但在大模型发展如此迅速的情况下,阿里也依然很着急。

出于对AI的焦虑,挖人、组织架构的调整,就变成了顺理成章的思路,这一点在大厂上,基本是必选项。

在谷歌担任L7级别、参与Gemini研发的周浩,是阿里从硅谷挖回来的人才。据悉,周浩将接手的是Qwen团队的后训练负责人一职,这也对应了前后训练负责人郁博文的离开。

人才是第一步,接下来,阿里将到对准内部,开始对组织架构动刀。据悉,这也是引爆林俊旸和阿里冲突的导火索之一。

多家媒体报道,通义实验室近期计划将Qwen团队分拆,从涵盖不同训练流程和模态的“垂直整合”体系,变成预训练、后训练、文本、多模态等一个个分开的水平分工团队。更进一步的是通义实验室内部之间的合并,比如将Qwen负责图像模态的部分并入负责图像生成的通义万相。语音模型部分并入通义百灵。

但在林俊旸之前所在的架构来说,他更坚信“垂直整合”的思路——将模型训练的全流程,从数据处理、架构设计、预训练、后训练到推理部署,都控制在同一个团队内部,形成高度协同的闭环。

而在这种整合完成、Qwen模型团队分割成多个水平团队后,留给林俊旸的位置和空间变得有限。在刘大一恒继续担任预训练负责人、周浩担任后训练负责人的情况下,林俊旸原定的位置成迷,且职责范围相比于之前“一手抓训练、模型”的情况,压缩到分管某个领域的位置。

可以预见的是,在完成组织架构调整后,阿里还需要一位类似姚顺雨、吴永辉之类的技术大牛,来把控这个进一步扩大、拆分的组织架构。

至此,林俊旸和阿里,走到了不得不分手的岔路口。

在 AI 时代,核心顶级人才从来不缺机会,也拥有比普通人更理想的追求;但在时代的巨变前,科技巨头需要把握根据趋势不断调整方向盘,以确保整体的利益最大化。这里没有绝对的对与错。

我们祝愿林俊旸能够在“狂飙”的AI大模型行业中,找到自己的位置;也祝阿里在下定决心修整组织架构后,能够做出心目中的Qwen-4,在旗舰模型中找到自己理想的生态位。

本文来自投稿,不代表增长黑客立场,如若转载,请注明出处:https://www.growthhk.cn/cgo/model/155202.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 11小时前
下一篇 11小时前

增长黑客Growthhk.cn荐读更多>>

发表回复

登录后才能评论