字節(jié)Seed預(yù)訓(xùn)練負(fù)責(zé)人顧全全在X上發(fā)布了一條簡短的告別帖。
Today marks my last day at ByteDance Seed.
【資料圖】
但顧全全離開Seed,不是字節(jié)故事里*的變化。
豆包6月馬上開始收費才是。
一個*研究者的離開,當(dāng)然值得關(guān)注。更大的關(guān)注點在于,字節(jié)已經(jīng)進(jìn)入了第二階段,AI成為驅(qū)動字節(jié)增長的主引擎。
過去兩年,豆包幫字節(jié)證明了一件事,那就是它有能力把AI產(chǎn)品推到億級用戶面前。
然而收費之后,豆包要證明的是另一件事,這好幾億的用戶里,又有多少人愿意為AI付錢?
從這一刻開始,Seed做出的東西,光有論文和評分是沒用的,得能轉(zhuǎn)化成為產(chǎn)品、收入以及用戶體驗才行。
這就導(dǎo)致字節(jié)必須有取舍,不能再大而全地去探索所有方向。
顧全全的離開,正好發(fā)生在這個轉(zhuǎn)折點上。
顧全全:連接生物AI、基礎(chǔ)模型和scale能力的那類人
顧全全本科和碩士都在清華自動化系,2014年在UIUC拿到計算機(jī)PhD。博士畢業(yè)后先在普林斯頓大學(xué)做博士后(2014-2015),2015年赴弗吉尼亞大學(xué)任助理教授,2018年加入UCLA,研究方向覆蓋機(jī)器學(xué)習(xí)、優(yōu)化算法、統(tǒng)計學(xué)習(xí)理論。
2023年,顧全全加入字節(jié)Seed。
那一年,字節(jié)剛剛完成AI組織架構(gòu)的重大調(diào)整,組建了*大模型團(tuán)隊,由朱文佳負(fù)責(zé)。
2024年初,完成全面重組,F(xiàn)low和Seed升級為與抖音平級的一級部門,直接向梁汝波匯報。
2025年2月,吳永輝加入并接管Seed基礎(chǔ)研究,朱文佳轉(zhuǎn)向模型應(yīng)用。
Seed需要的不只是發(fā)論文的科學(xué)家,更需要那種既懂模型訓(xùn)練、又能把能力落到具體問題里、還真的帶過高強(qiáng)度項目的人。
顧全全恰好符合這個畫像。
他在Seed同時參與了兩條線:一條是AI4S,另一條是前沿LLM。
AI4S(AI for Science),就是用AI解決科學(xué)問題,比如蛋白質(zhì)結(jié)構(gòu)預(yù)測、藥物分子設(shè)計、材料研發(fā),這些過去需要實驗室花幾年才能搞定的事,現(xiàn)在AI可以在幾小時內(nèi)給出答案。
AI4S在當(dāng)時也算是比較熱門的一條線,谷歌的AlphaFold,就是AI4S上的一個里程碑式產(chǎn)品。
然而顧全全的這種跨度在大廠AI組織里并不常見。大部分科學(xué)家要么深耕某個垂直領(lǐng)域,要么專注于基礎(chǔ)模型訓(xùn)練,很少有人能在兩個方向上同時產(chǎn)出。
AI4S這邊,他帶隊做了SeedFold、SeedProteo和DPLM系列。
SeedFold是字節(jié)Seed做的生物分子結(jié)構(gòu)預(yù)測模型,論文里表示,SeedFold在FoldBench多個蛋白相關(guān)任務(wù)上,均超過AlphaFold3
SeedProteo則面向蛋白結(jié)合劑設(shè)計,是一個de novo全原子蛋白設(shè)計模型。
如果說SeedFold是“看懂”蛋白質(zhì)結(jié)構(gòu),那SeedProteo就是“設(shè)計”新的蛋白質(zhì)分子。后者的商業(yè)化想象空間更大,但技術(shù)難度也更高。
DPLM系列則是蛋白質(zhì)語言模型,試圖用類似訓(xùn)練大語言模型的方式,讓AI理解和生成蛋白質(zhì)序列。
這條線在學(xué)術(shù)界已經(jīng)有不少探索,但字節(jié)Seed的特點是把它和自己的基礎(chǔ)模型能力結(jié)合起來,形成了一套相對完整的AI4S技術(shù)棧。
這些成果在學(xué)術(shù)上很有分量。
SeedFold的論文發(fā)表后,被多個研究機(jī)構(gòu)引用和復(fù)現(xiàn)。SeedProteo在蛋白設(shè)計任務(wù)上的表現(xiàn),也被認(rèn)為是當(dāng)時業(yè)界最強(qiáng)的幾個模型之一。
顧全全在AI4S領(lǐng)域的聲譽(yù),很大程度上就是這三年里用這些項目積累起來的。
但AI4S只是顧全全在Seed工作的一半。
2025年初,他又加入了LLM預(yù)訓(xùn)練工作,組建了LLM優(yōu)化和擴(kuò)展團(tuán)隊,參與Seed 2.0的訓(xùn)練。這個轉(zhuǎn)向在當(dāng)時看起來有些突然,但如果理解字節(jié)AI戰(zhàn)略的變化,就會發(fā)現(xiàn)這其實是一個必然選擇。
DeepSeek的走紅,讓所有大廠意識到,預(yù)訓(xùn)練能力不只是算力問題,更是工程化和優(yōu)化能力的問題。
字節(jié)Seed需要一個能夠把預(yù)訓(xùn)練做成體系的人。
顧全全又懂統(tǒng)計學(xué)習(xí)理論、優(yōu)化算法,還懂大規(guī)模訓(xùn)練經(jīng)驗,這就讓他成為了這個位置最合適的人選。
他組建的LLM優(yōu)化和擴(kuò)展團(tuán)隊,目標(biāo)就是建立一套“高度可擴(kuò)展的預(yù)訓(xùn)練棧”,讓Seed 2.0和后續(xù)的frontier-scale模型能夠穩(wěn)定訓(xùn)練和迭代。
從他自己的LinkedIn帖子來看,這個目標(biāo)基本達(dá)成了。他提到團(tuán)隊“我?guī)ьI(lǐng)團(tuán)隊搭建了一套高度可擴(kuò)展的預(yù)訓(xùn)練技術(shù)棧,成功支撐了 Seed 2.0 以及后續(xù)前沿級大模型的訓(xùn)練工作”。
它意味著字節(jié)Seed在預(yù)訓(xùn)練能力上,已經(jīng)不再依賴外部技術(shù)或者單點突破,而是形成了一套可以持續(xù)迭代的工程化體系。
顧全全在字節(jié)Seed的三年,把字節(jié)的科學(xué)問題、基礎(chǔ)模型能力和大規(guī)模訓(xùn)練能力全都連接起來了。
顧全全的價值,就在于他能夠在AI4S和LLM這兩個方向上,同時產(chǎn)出,并且把它們都做成了體系化的能力。
但這也是問題所在。
顧全全做的事情,都是“遠(yuǎn)期價值”很強(qiáng)、但“近期產(chǎn)品價值”不那么明確的事情。
豆包開始收費后,字節(jié)Seed的價值排序必然會變得更現(xiàn)實。
02、AI4S組織調(diào)整
就在顧全全發(fā)布離職消息的前幾天,有這么一條消息,稱字節(jié)Seed旗下AI4S團(tuán)隊正在經(jīng)歷組織調(diào)整。
接近字節(jié)的人士稱“不考慮分拆”,AI4S團(tuán)隊將由楊震原負(fù)責(zé)。隨后才有了肖文之、顧全全等AI4S相關(guān)核心成員已離開或準(zhǔn)備離開創(chuàng)業(yè)的消息。
“不考慮分拆”意味著字節(jié)并不打算把AI4S作為一個獨立業(yè)務(wù)拆出去,也不打算讓它成為一個可以獨立運作的實體。
AI4S仍然是Seed的一部分,仍然要服從Seed整體的戰(zhàn)略優(yōu)先級。楊震原接手,說明字節(jié)對這個方向還有投入,但投入的方式和目標(biāo)可能已經(jīng)發(fā)生了變化。
AI4S是一個很特殊的領(lǐng)域。它的價值很難用我們現(xiàn)在的產(chǎn)品指標(biāo)去衡量。
做出一個超過AlphaFold3的蛋白結(jié)構(gòu)預(yù)測模型,在學(xué)術(shù)上當(dāng)然是重大突破。但這個突破要轉(zhuǎn)化成商業(yè)收入,中間還有很長的路要走。
還有一點,AI4S的成果很容易“跟著人走”。
做豆包這種產(chǎn)品,能力更多沉在公司系統(tǒng)里。比如模型平臺、訓(xùn)練集群、推理架構(gòu)、產(chǎn)品入口,這些都在字節(jié)手里。人走了會有影響,但系統(tǒng)還在。
但AI4S不一樣。它往往依賴某幾個核心研究者對生物、化學(xué)、蛋白結(jié)構(gòu)、藥物發(fā)現(xiàn)和模型方法的交叉理解。很多成果不是一個App功能,而是一套研究路線、模型假設(shè)、數(shù)據(jù)處理方法、實驗判斷和產(chǎn)業(yè)資源。
這些東西很大一部分長在人的腦子里、履歷里和關(guān)系網(wǎng)里。
所以顧全全走后,Seed 2.0受到的影響可能不大。
但AI4S就不一樣了。
肖文之、顧全全這些核心成員的離開,對AI4S團(tuán)隊的影響非常大。
他們帶走的不只是技術(shù)能力,還有在這個領(lǐng)域的聲譽(yù)、人脈和對未來方向的判斷。
楊震原接手后,AI4S團(tuán)隊能不能在學(xué)術(shù)界和產(chǎn)業(yè)界保持存在感,這些都是未知數(shù)。
更關(guān)鍵的問題是,字節(jié)還愿意給AI4S多少資源和耐心。
AI4S是一個需要長期投入、短期回報不明確的方向。
它的價值可能在三年后、五年后才會顯現(xiàn),也可能永遠(yuǎn)不會顯現(xiàn)。對一家商業(yè)公司來說,這種不確定性是很難長期承受的。
尤其是當(dāng)豆包開始收費,AI4S的處境就會變得更加尷尬。
字節(jié)是舍得在AI上投入的,而且在國內(nèi)大廠里,字節(jié)也都是*的。
5月就有消息稱,字節(jié)把2026年資本開支計劃上調(diào)至少25%,AI相關(guān)資本開支從此前討論的約1600億元人民幣提高到超過2000億元人民幣。
但耐心終歸是有限度的,再加上字節(jié)內(nèi)部本身的賽馬機(jī)制,就導(dǎo)致團(tuán)隊必須得在一定時間內(nèi)拿出成績。
當(dāng)組織的優(yōu)先級發(fā)生變化時,那些遠(yuǎn)期價值很強(qiáng)、但近期貢獻(xiàn)不明確的方向,優(yōu)先級可能會被降低。
AI4S團(tuán)隊的組織調(diào)整,本質(zhì)上就是這個過程的一部分。
它不是字節(jié)要放棄AI4S,而是字節(jié)要讓AI4S更明確地服務(wù)于產(chǎn)品和商業(yè)化目標(biāo)。
這對科學(xué)家來說,是一個很現(xiàn)實的選擇題。
留下來,意味著接受組織的新邏輯,把研究方向調(diào)整到更接近產(chǎn)品需求的地方。離開,意味著去一個更尊重“遠(yuǎn)期科學(xué)價值”的環(huán)境,或者自己創(chuàng)業(yè),把技術(shù)理想變成一個新的組織。
肖文之、顧全全選擇了后者。這不是因為他們不認(rèn)可字節(jié),而是因為他們更認(rèn)可自己在AI4S方向上的判斷。他們相信這個方向有長期價值,也相信自己有能力把這個價值做出來。
03、豆包收費,真正的轉(zhuǎn)折點
一切的原因在于豆包要開始收費了。
其實幾乎所有AI產(chǎn)品都在收費,OpenAI的ChatGPT Plus、Anthropic的Claude Pro、谷歌的Gemini Advanced,國內(nèi)的Kimi、智譜、MiniMax都有付費版本。
豆包收費,我認(rèn)為一點都沒有問題。
過去,Seed可以講一個很宏大的技術(shù)版圖故事。
LLM是基礎(chǔ),多模態(tài)是延伸,視頻生成是突破口,語音是體驗增強(qiáng),AI4S是長期布局,Agent是未來方向。
每一個方向都有自己的價值,每一個團(tuán)隊都在做自己的事情。Seed的角色,是把這些能力整合起來,形成一個完整的AI技術(shù)體系。
這個故事在2023年、2024年是成立的。
那時候整個AI行業(yè)都在探索方向,所有大廠都在廣撒網(wǎng),試圖在每一個可能的技術(shù)方向上占據(jù)位置。字節(jié)Seed的技術(shù)版圖足夠?qū)挘沧銐蛏?,這本身就是一種競爭力。
但現(xiàn)在,情況變了。
按照豆包自己的話來說就是,“我將采用最直接、最真相、最不繞彎、最扎心、最硬核、最干脆、最不墨跡、最戳痛點、最不留情面、最一針見血、最開門見山的方式來告訴你。收費就意味著產(chǎn)品要對用戶體驗負(fù)責(zé)”。
這時候,Seed內(nèi)部的每一個團(tuán)隊都要回答這樣一個問題:你做的這個功能,能不能放進(jìn)豆包的會員權(quán)益里?
顯然,AI4S的價值是長期的、戰(zhàn)略性的、面向特定行業(yè)客戶的。它可能在三年后、五年后,成為字節(jié)在生物醫(yī)藥、材料科學(xué)、化學(xué)合成領(lǐng)域的核心競爭力。
但現(xiàn)在的豆包,很難證明自己的產(chǎn)品價值。
這不是字節(jié)的問題,是所有商業(yè)公司在AI商業(yè)化階段都會面臨的問題。
谷歌也是如此。DeepMind曾經(jīng)可以做AlphaGo、AlphaFold這樣的長期項目,但后來谷歌發(fā)現(xiàn),DeepMind的研究方向也應(yīng)該向產(chǎn)品靠攏,所以谷歌才會把DeepMind和谷歌Brain合并成谷歌DeepMind,讓Gemini成為谷歌AI戰(zhàn)略的核心。
此后,那些不能為Gemini、谷歌搜索、谷歌云貢獻(xiàn)價值的項目,就很難再獲得足夠的資源支持。
字節(jié)Seed現(xiàn)在走的,就是這條路。
誰能降低推理成本,誰就能讓豆包的毛利率更高;誰就能讓用戶體驗更好。誰就能拉高留存,讓用戶掏錢。
因為這些能力,都是可以量化、可以考核、可以直接對應(yīng)到收入和利潤的,這些也符合字節(jié)內(nèi)部的價值體系。
與此同時,這里面還有一個問題我們得辯證地去看,AI發(fā)展需要長期投入、需要容忍失敗、需要給科學(xué)家足夠的自由度去探索未知方向,在這一點上是無可厚非的。
但AI的商業(yè)化,需要短期回報、需要明確的價值證明、需要每一個能力都能對應(yīng)到用戶愿意付費的場景。
在AI行業(yè)的早期階段,所有大廠都在廣撒網(wǎng),都在嘗試各種可能的方向,都可以容忍一部分團(tuán)隊做長期的、不考慮短期回報的研究。
但當(dāng)AI進(jìn)入商業(yè)化階段,當(dāng)產(chǎn)品要開始收費,公司要開始對股東、投資人和用戶負(fù)責(zé)。
字節(jié)Seed現(xiàn)在面臨的,就是這個轉(zhuǎn)折點。
顧全全的離開,對雙方來說都不是壞事,更像是一次彼此成全。
對顧全全來說,他在字節(jié)Seed三年里已經(jīng)證明了自己。這些經(jīng)驗和聲譽(yù),讓他的履歷更加豐富,可以回到學(xué)術(shù)界繼續(xù)深耕AI4S,或者創(chuàng)業(yè),就像林俊旸一樣,把技術(shù)理想變成一個新的故事。
對字節(jié)來說,Seed的組織性質(zhì)轉(zhuǎn)變已經(jīng)不可逆轉(zhuǎn)。Seed 2.0后續(xù)迭代并未受影響,豆包還在繼續(xù)迭代,火山引擎還在上線新能力。
一個健康的AI生態(tài),本來就需要不同類型的組織。
顧全全找到了更適合自己的位置,字節(jié)Seed也找到了更清晰的方向。這是一次雙向選擇,也是一次雙向成全。