文 | 光子星球
" 進(jìn)達(dá)摩院研技,是少林僧一項(xiàng)尊崇之極的職司,若不是武功到了極高境界,決計(jì)無(wú)此資格。"
馬云癡迷于金庸武俠,也曾懷抱一個(gè)技術(shù) " 江湖夢(mèng) "。
2017 年云棲大會(huì),阿里成立了自己的 " 達(dá)摩院 ",揚(yáng)言三年內(nèi)技術(shù)研發(fā)投入超過(guò) 1000 億元。金庸小說(shuō)里," 三十余高僧,得進(jìn)達(dá)摩院僅八人 "。但全盛時(shí)期,阿里直接對(duì)外公布了十三位 " 掃地僧 ",再加上后來(lái)的賈揚(yáng)清組成了最強(qiáng)陣容。
" 達(dá)摩院要活得比阿里巴巴長(zhǎng)。"
馬云當(dāng)年的話猶在耳邊,經(jīng)歷過(guò)一次次調(diào)整、洗牌之后,如今達(dá)摩院所剩下的 " 火種 " 寥寥。據(jù)公開信息統(tǒng)計(jì),十三位 " 掃地僧 " 目前已經(jīng)出走九人。過(guò)去繁榮的 "4+X" 研究領(lǐng)域,僅留下了 " 智能 + 計(jì)算 "。
俱往矣,達(dá)摩院所剩不多的榮光凝結(jié)在了 " 通義實(shí)驗(yàn)室 ",在原有 M6 大模型的基礎(chǔ)上進(jìn)化成 " 通義千問(wèn) " 系列模型。
對(duì)阿里這家公司來(lái)說(shuō),商業(yè)高于技術(shù),技術(shù)素來(lái)服務(wù)于業(yè)務(wù)。從達(dá)摩院到通義實(shí)驗(yàn)室,都不是一個(gè)純研究性部門,技術(shù)理想和商業(yè)思維互搏,好比一群閉關(guān)修行的科學(xué)家也得走出山門,學(xué)會(huì)混跡江湖。
阿里深諳 " 定戰(zhàn)略、拉架構(gòu)、找對(duì)人 " 這套策略:馬云定調(diào),吳泳銘上任,"1+6+N" 隨之瓦解。目標(biāo) AGI,作為先鋒兵的通義實(shí)驗(yàn)室現(xiàn)在面臨著代際更迭、人員變動(dòng)和引領(lǐng)集團(tuán) AI 化的新挑戰(zhàn)。
達(dá)摩論劍
2020 年 5 月,OpenAI 發(fā)布參數(shù)規(guī)模高達(dá) 1750 億的大模型 GPT-3,大模型的競(jìng)爭(zhēng)正式起步。據(jù)阿里官方披露,也是在同一年,開啟了語(yǔ)言模型體系 AliceMind 和多模態(tài)大模型 M6 的研發(fā)。
現(xiàn)在大家熟知的阿里通義大模型實(shí)際包含了三部分構(gòu)成,分別為模型底座、通用模型(通義 -M6、通義 -AliceMind、通義 - 視覺),以及行業(yè)模型,其中 AliceMind 主攻文本模型方向,M6 側(cè)重多模態(tài)方向。
據(jù)一位原達(dá)摩院人士描述,AliceMind 和 M6 由達(dá)摩院的兩支團(tuán)隊(duì)分開訓(xùn)練。彼時(shí),達(dá)摩院下方一共分為機(jī)器智能、數(shù)據(jù)計(jì)算、機(jī)器人、金融科技、X 實(shí)驗(yàn)室(量子計(jì)算)五大領(lǐng)域。
M6 是現(xiàn)在通義千問(wèn)大模型的前身,其團(tuán)隊(duì)隸屬周靖人負(fù)責(zé)的智能計(jì)算實(shí)驗(yàn)室,由楊紅霞帶著幾個(gè) P7 和實(shí)習(xí)生一起研發(fā),團(tuán)隊(duì)里青年才俊頗多,例如周暢、林俊旸等人。另一個(gè) AliceMind 團(tuán)隊(duì)隸屬于司羅負(fù)責(zé)的 NLP 實(shí)驗(yàn)室,由其下屬泳春(花名)帶著差不多配置的團(tuán)隊(duì)同時(shí)進(jìn)行。
知情人士表示,GPT-3 的出現(xiàn),并沒有引起阿里的完全重視," 僅是出于技術(shù)跟進(jìn)考慮,就拉著不到十個(gè)人的團(tuán)隊(duì)開始了復(fù)刻 "。
在訓(xùn)練的過(guò)程中,AliceMind 和 M6 兩個(gè)團(tuán)隊(duì)中逐漸形成了賽馬機(jī)制,話事人意志、數(shù)據(jù)、資源傾斜和技術(shù)路線選擇最終讓楊紅霞團(tuán)隊(duì)勝出。
楊紅霞的直系領(lǐng)導(dǎo),周靖人起到了關(guān)鍵性的作用。
彼時(shí),周靖人兼任達(dá)摩院智能計(jì)算實(shí)驗(yàn)室負(fù)責(zé)人和阿里搜索及廣告技術(shù)事業(yè)部負(fù)責(zé)人。在第二重身份之下,他負(fù)責(zé)管理阿里搜索 AI 中臺(tái)以及效果廣告業(yè)務(wù),向蔣凡匯報(bào)。不知是否因?yàn)檫@層關(guān)系,M6 在訓(xùn)練時(shí)采用了大量淘寶數(shù)據(jù)。而 AliceMind 則處于劣勢(shì),只能通過(guò)第三方采買的方式獲取數(shù)據(jù),由于缺乏 C 端的數(shù)據(jù),致使數(shù)據(jù)訓(xùn)練豐富性不足。
原機(jī)器智能實(shí)驗(yàn)室人員向光子星球透露,訓(xùn)練大模型過(guò)程中遇到了用卡限制。他表示," 靖人不給我們卡,我們只有 500 張,但我猜楊紅霞至少有 5000 張。" 另有知情人士提及類似情況,只是沒有十倍卡那么夸張,但用卡傾斜現(xiàn)象的確存在。
官方顯示,2021 年初,阿里相繼發(fā)布了 AliceMind 和 M6。但隨著 GPT-3.5 的發(fā)布,技術(shù)路徑逐漸收斂至多模態(tài) M6 上。
2021 年 1 月,阿里首次發(fā)布百億參數(shù)規(guī)模的中文多模態(tài)預(yù)訓(xùn)練模型 M6;同年 3 月,擴(kuò)展至千億參數(shù),5 月擴(kuò)展至萬(wàn)億參數(shù),10 月擴(kuò)展至十萬(wàn)億參數(shù);2022 年,發(fā)布通用統(tǒng)一大模型 M6-OFA,實(shí)現(xiàn)架構(gòu)、模態(tài)和任務(wù)統(tǒng)一,成為后來(lái) " 通義 " 大模型系列的底座。
劍氣合一
" 跟老板搞不好關(guān)系,怎么做得好業(yè)務(wù)?"
2022 年前后,AliceMind 在賽馬機(jī)制中被淘汰,文本和多模態(tài)大模型團(tuán)隊(duì)迎來(lái)了第一次融合。達(dá)摩院達(dá)成短暫共識(shí),由楊紅霞統(tǒng)一領(lǐng)導(dǎo)兩個(gè)團(tuán)隊(duì),繼續(xù)訓(xùn)練通用大模型,其余仍留在達(dá)摩院的人后面訓(xùn)練行業(yè)大模型。
差不多同一時(shí)間,達(dá)摩院發(fā)生巨震,被很多出走的老阿里人形容為 " 大清洗 "。
自動(dòng)駕駛、XR、智慧城市這類直接涉及到改造物理世界的業(yè)務(wù),如同劍宗,技術(shù)為輔,場(chǎng)景為主。而 AI 與大模型則更像是以氣御劍的氣宗,氣(技術(shù))是主,劍(場(chǎng)景)是從。
當(dāng)達(dá)摩院副院長(zhǎng)金榕、NLP 負(fù)責(zé)人司羅、城市大腦實(shí)驗(yàn)室負(fù)責(zé)人華先勝、XR 實(shí)驗(yàn)室負(fù)責(zé)人譚平、達(dá)摩院自動(dòng)駕駛實(shí)驗(yàn)室負(fù)責(zé)人王剛等多名 " 掃地僧 " 相繼離職," 劍宗 " 失去了領(lǐng)頭人。而 " 氣宗 " 亦出現(xiàn)了人員變動(dòng),比如即便曾被 " 組織 " 委以重任的楊紅霞也轉(zhuǎn)身投入到了字節(jié)。
核心人物離開的同時(shí),集團(tuán)還開啟了 "1+6+N",組織架構(gòu)調(diào)整隨之而來(lái),阿里進(jìn)入多事之秋。原機(jī)器智能和應(yīng)用相關(guān)的團(tuán)隊(duì)被打破重組,除了決策智能實(shí)驗(yàn)室外,語(yǔ)言、視覺、NLP 等團(tuán)隊(duì)從達(dá)摩院剝離出來(lái),一起并入到了阿里云的通義實(shí)驗(yàn)室。至此,達(dá)摩院完成了 " 劍氣切換 ",聚焦大模型和 AI 的通義實(shí)驗(yàn)室成為了主力。
達(dá)摩院受到 " 重創(chuàng) ",通義實(shí)驗(yàn)室群龍無(wú)首。在此背景下,周靖人回歸,升任阿里云 CTO,兼任通義實(shí)驗(yàn)室負(fù)責(zé)人。
阿里內(nèi)部對(duì)周靖人的評(píng)價(jià)中,有人說(shuō)他的身上帶著些許微軟的辦公室文化氣息,熟諳職場(chǎng)規(guī)則,擁有一定的向上管理能力。平常不茍言笑,喜怒不形于色,有點(diǎn)像典型的外企出身的 " 職業(yè)經(jīng)理人 "。
也有人見證過(guò)周靖人執(zhí)拗的一面,感嘆 " 靖人啊,有時(shí)候比較實(shí)在,也比較直接 "。有知情人士提到,在某次大會(huì)上,CPO 童文紅讓大家各抒己見,指出阿里出現(xiàn)的問(wèn)題。周靖人被點(diǎn)名發(fā)言,他想了半天道," 那我就實(shí)話實(shí)說(shuō),淘寶之前寫的代碼太爛了 "。
統(tǒng)籌云和大模型,對(duì)外統(tǒng)一輸出為 " 通義千問(wèn) "。在周靖人的領(lǐng)導(dǎo)下,2023 年 4 月,阿里云發(fā)布自研大模型 " 通義千問(wèn) ",開源和閉源兩條腿走路,跟隨技術(shù)路線迭代至今。
達(dá)摩院時(shí)期埋下隱患仍影響至今,動(dòng)蕩的陰霾揮之不去。2024 年,通義千問(wèn)大模型技術(shù)負(fù)責(zé)人周暢被字節(jié)挖走,引發(fā)了第二輪人事 " 洗牌 "。鄢志杰、薄列峰緊隨其后。十個(gè)月,三位一線核心人物離職,語(yǔ)音、視覺、模型三個(gè)方向自此失去了 " 帶頭大哥 "。
隨著吳泳銘的上臺(tái),達(dá)摩院再一次走到了十字路口,年輕的林俊旸們被推到了臺(tái)前。
風(fēng)流一代
阿里集團(tuán)年輕化早在張勇時(shí)期就初露端倪,重用蔣凡、提拔莊卓然、大膽啟用葉軍。到吳媽上臺(tái),則愈加清晰,針對(duì)跨部門流動(dòng)、年輕高潛人才升遷等組織機(jī)制調(diào)整和人才考核已提上日程。
阿里老人下,年輕人補(bǔ)位,要分兩方面來(lái)看待。在一個(gè) " 沒有誰(shuí)服誰(shuí),只有誰(shuí)管誰(shuí) " 的體系內(nèi),前輩給后輩騰位置,可以讓一些有競(jìng)爭(zhēng)力的年輕人被看到,并獲得晉升。提拔林俊旸多少帶著點(diǎn)樹典型的意味,暗中給后面的年輕人沖刺吹響了哨聲," 吳媽重視年輕人不是說(shuō)說(shuō)而已 "。
新王朝,需要立一面旗幟,往往會(huì)樹一位典型。
但也要看到周暢、鄢志杰、薄列峰等阿里老人,不屬于躺在功勞簿上 " 坐吃等死 " 的一批人。在大模型競(jìng)爭(zhēng)的語(yǔ)境下,他們同時(shí)具備技術(shù)研發(fā)和領(lǐng)導(dǎo)團(tuán)隊(duì)的競(jìng)爭(zhēng)力。這些人出走,一方面透露出 AI 搶人的殘酷性,另一方面也說(shuō)明阿里體系的 " 強(qiáng)吸引力 " 在被稀釋的可能性——革命最重要的是充滿激情。
流失的人才等待補(bǔ)齊,加之老人和新人之間的融合,將成為阿里云未來(lái)一段時(shí)期的過(guò)渡態(tài)。團(tuán)隊(duì)一號(hào)位面臨著兩個(gè)選擇,內(nèi)部年輕高潛人才急速補(bǔ)位或外來(lái)業(yè)界大??战?,而無(wú)論哪種都要經(jīng)歷調(diào)整適應(yīng)。
值得慶幸一點(diǎn)是,即便派系不同,內(nèi)部仍然有著技術(shù)上的共識(shí),尤其是當(dāng)集團(tuán)將 AI 視為核心戰(zhàn)略之后,通義實(shí)驗(yàn)室不必像之前達(dá)摩院一般,需要說(shuō)服西溪邊上的 " 首長(zhǎng)們 " 去 All in。
一方水土養(yǎng)一方人,不同的土壤結(jié)出不同的果子。阿里對(duì)待技術(shù)的態(tài)度一直很明確:服務(wù)于業(yè)務(wù),追求商業(yè)轉(zhuǎn)化。
iDST(達(dá)摩院前身)時(shí)期,從實(shí)驗(yàn)室出來(lái)的科學(xué)家 " 上山下鄉(xiāng) ",被 " 發(fā)配 " 到阿里業(yè)務(wù)一線,思考如何把前沿的學(xué)術(shù)成果與龐雜的場(chǎng)景對(duì)接,并帶來(lái)商業(yè)成果。成立之時(shí),馬云對(duì)達(dá)摩院的愿景是," 具備自營(yíng)自利能力,未來(lái)靠自身賺錢 "。
據(jù)阿里云人士回憶,行癲掌管達(dá)摩院時(shí)期,常掛在口頭上的便是:" 你有什么價(jià)值?怎么證明你的價(jià)值 "。阿里云的財(cái)報(bào)數(shù)據(jù)透明,無(wú)論誰(shuí)上去都得立 " 軍令狀 "," 經(jīng)常出現(xiàn)上半財(cái)年大吹影響力,下半財(cái)年大搞營(yíng)收項(xiàng)目的情況 "。
現(xiàn)在到吳媽時(shí)期,這種現(xiàn)實(shí)主義下的結(jié)果導(dǎo)向仍在以另一種形態(tài)出現(xiàn)。通義大模型要看影響力、開源聲量,所有業(yè)務(wù)單元 2025 年的績(jī)效考核直接與 AI 技術(shù)應(yīng)用成效掛鉤。一言以蔽之,結(jié)果為王。
老問(wèn)題和新任務(wù)接踵而來(lái),純粹 AI 技術(shù)團(tuán)隊(duì)定位顯得極其擰巴。在龐大的集團(tuán)機(jī)器體制下,職級(jí)就像是套在人身上巨大的枷鎖,無(wú)論老少派,往上晉升才是首要任務(wù)。
如果人們過(guò)分執(zhí)著于晉升,往往會(huì)抹殺團(tuán)隊(duì)創(chuàng)新的可能性,當(dāng)然這并非是阿里一家正面對(duì)的挑戰(zhàn),這也成為了 DeepSeek 誕生于大廠之外的重要原因之一。團(tuán)隊(duì)的配置和規(guī)模不是重點(diǎn),關(guān)鍵在于是否把大量精力投入在技術(shù)鉆研上。