清華博士們,“賣”算力“融”麻了
昨天,AI賽道,誕生了一個“清華系”當紅炸子雞。
一筆近5億元A輪融資,背后站著15家新股東,在社保基金中關村自主創(chuàng)新專項基金(君聯(lián)資本擔任管理人)、啟明創(chuàng)投和洪泰基金帶頭下,聯(lián)想創(chuàng)投、小米、軟通高科等跑步進場。
順著這筆融資看去,會發(fā)現(xiàn)10個月前,成立僅半年這家創(chuàng)企就獲得超13家機構“團購”天使輪,百度騰訊智譜AI均位列股東名單。
而成立伊始,這家清華系企業(yè)就早被有頭有臉的VC盯上,不僅紅杉北極光金沙江等悉數(shù)登場,原紅杉中國合伙人曹曦也帶著Monolith礪思資本前來押注。
據(jù)獵云網(wǎng)不完全統(tǒng)計,僅“16月齡”,這家AI創(chuàng)企就獲得了超30家資本助力,融資額累計近10億元,可謂當之無愧的風投寵兒。
據(jù)相關投資人透露,三輪融資下來估值基本完成三連跳、接近百億。也就是說,此輪融資過后,一家新晉AI獨角獸也即將誕生。
而它,就是無問芯穹(InfinigenceAI),一家由90后清華系博士夏立雪掌舵的算力運營商。
事實上,如果你翻閱過資料,會發(fā)現(xiàn)無問芯穹總被直接等同于AI基礎設施,但無問芯穹CEO夏立雪更強調“運營商”的角色。
他認為,隨著AI領域逐步發(fā)展,對于算力的需求形成了更豐富的市場環(huán)境,就一定需要有運營商的出現(xiàn)。
在他的勾勒中,運營商,與國內普遍理解的單點優(yōu)化工具或軟件定義的AI基礎設施不同,他能做到All in One,把算力像水電煤一樣標準化的產品推向市場,供給到智能的生態(tài)提供服務或提供應用的所有人去使用。
這一初衷和愿景,亦是無問芯穹的差異化打法所在。
80后清華教授坐鎮(zhèn),超30家VC跑來投
無問芯穹身后,有著一支近百人的清華博士軍團,其中夏立雪的老師汪玉為“吸金石”。
據(jù)天眼查顯示,汪玉為無問芯穹發(fā)起人。而80后的他,身上有很多標簽。
汪玉于1998年入學清華讀完本碩博,自2007年開始留校任教,38歲就成為清華大學電子工程系的系主任,自此他是清華電子工程系首位80后系主任,也是該系創(chuàng)辦以來第二年輕系主任。
專注研究硬件、芯片和基礎軟件方向,汪玉曾多次在頂會拿下最佳論文獎,共發(fā)表IEEE/ACM雜志文章50余篇,谷歌學術引用17000余次。
學而優(yōu)則創(chuàng),2016年汪玉便走入了一級市場VC的心坎。
當時,以汪玉為負責人的深度學習處理器項目,通過清華大學電子信息學院論證并獲得支持。之后,項目團隊以研究成果“卷積神經網(wǎng)絡的逐層變精度定點化方法及裝置”作價入股AI芯片公司深鑒科技,進行產業(yè)化運營。
注冊成立的同月,深鑒科技便拿下了高榕創(chuàng)投跟金沙江創(chuàng)投的500萬美元天使輪,第二年就估值破10億,隨后螞蟻集團、招商局創(chuàng)投、三星風投等“搶購”了A+輪融資,最終以成立2年被FPGA廠商賽靈思3億美元收購,畫上圓滿句號。
由此,深鑒科技一舉成為國內最先上岸的AI芯片創(chuàng)業(yè)公司,也成為清華大學有科技成果轉化制度以來第一家完成轉化與回報閉環(huán)的企業(yè)。
據(jù)投中網(wǎng),一級投資人對汪玉評價頗高:少見的在學術和商業(yè)水平都非常高的學者。
從這一點看,深鑒科技就是絕佳的證明。
也正因此,汪玉接下來的動作一直都是創(chuàng)投圈的焦點,也讓乘著大模型東風、致力于解決算力焦慮的無問芯穹自成立就身處聚光燈下。
跟在深鑒科技,汪玉攜手清華大學電子工程系本科學生姚頌、并由后者擔任CEO類似,這一次,無問芯穹也是名師+高徒的搭配,一來還來了三個清華博士。
首先無問芯穹90后聯(lián)合創(chuàng)始人、CEO夏立雪,是汪玉做博導后帶的博士,一畢業(yè)就拿到了阿里星offer,曾是阿里云用戶增長產品技術負責人,負責過阿里云大語言模型的壓縮加速、生成式AI模型芯片的等戰(zhàn)略項目。
而2022年末大模型的出現(xiàn),讓夏立雪意識到算法在專用走向通用的質變,將帶來足夠廣闊的應用場景后,便與領導清華NICS-EFC實驗室的汪玉一拍即合,成為了無問芯穹的首個聯(lián)創(chuàng)。
據(jù)天眼查股權穿透來看,來自廣西南寧的“數(shù)學學霸”曾書霖,也為汪玉做博導后帶的博士,二人通過持股北京無問啟明企業(yè)咨詢有限公司,間接持股無問芯穹,其中夏立雪持股無問芯穹比例經推算為10.9%,為第一大股東。
而另一個聯(lián)創(chuàng)首席科學家戴國浩,曾是汪玉研究團隊的助理研究員,為清華大學工學博士,持股比例達6.8227%,現(xiàn)任上海交通大學長聘教軌副教授,清源研究院人工智能設計自動化創(chuàng)新實驗室負責人。
一教授帶三博士,自然讓無問芯穹在酷愛清華系的AI VC圈格外耀眼。
老股東近水樓臺先得月,嘗過深鑒科技甜頭的金沙江創(chuàng)投又一次在天使輪搶先占位。隨后超30家機構兵分三路,社保中關村基金、上海人工智能產業(yè)投資基金等國家隊和地方國資、百度、騰訊、聯(lián)想創(chuàng)投、小米順為、軟通高科、智譜AI等戰(zhàn)投方跟達晨財智、德同資本等財務機構“搭配”進場。
據(jù)投中網(wǎng),后兩輪均有超過百家機構與無問芯穹進行了接觸,認購都實現(xiàn)了超募,更有知情人士透露“都是前半程在談業(yè)務,后半程在婉拒,砍份額”。
據(jù)相關投資人回憶,相比純財務資方,當前階段戰(zhàn)投方(產業(yè)方)從業(yè)務賦能角度更容易投進去。
做AI基礎設施、定位“運營商”,“賣”算力成“隱形”獨角獸
一邊,一級市場投得火熱,另一邊,16個月來,無問芯穹也在明確定位、加速狂奔。
時間線再次撥回到2022年末,大模型的興起,讓夏立雪看到了AI行業(yè)面臨的算力焦慮已成為一個不爭的事實。尤其在國內,中國的模型層與芯片層的“百花齊放”,卻讓大量的異構芯片形成了“生態(tài)豎井”,不同硬件生態(tài)系統(tǒng)封閉且互不兼容,使得非常多的算力、硬件,沒有被很好地發(fā)揮出效率、效能。
故而成立初衷,無問芯穹就是要解決國內算力不足的問題。
如何解?無問芯穹選擇了“輕資產運營模式”,也就是連接模型和硬件,去做了一個把算力更好用起來的基礎設施的工作。
簡單來說,就是在中間層做“算力調優(yōu)”,目標提升用戶的使用體驗,通過優(yōu)化易用性和降低成本來不斷拓展市場規(guī)模。
技術層面上,無問芯穹從兩點“啃硬骨頭”:
一是通過M種模型×N種芯片的核心技術,把不同的模型在各類硬件上都能夠快速完成高效的部署,去讓算法和算力之間形成最佳的軟硬件聯(lián)合的優(yōu)化、軟硬協(xié)同,把算力價值發(fā)揮到最大。
二是做混合訓練方式,讓不同異構的集群之間能夠進行高效配合,讓被使用的效率和使用出來的穩(wěn)定性,集群的效果上都能夠達到商業(yè)化的水平。
夏立雪表示,從技術角度講,混訓一般被認為是GPU和另外一種GPU,或和另外一種加速卡這樣的一個集群的混合,難點在于不同的卡之間有不同的算子庫。
目前無問芯穹已經做到了華為昇騰、天數(shù)智芯、沐曦、摩爾線程和AMD、NVIDIA共六種芯片“4+2”組合間實現(xiàn)千卡規(guī)模的異構算力混合訓練,混訓整體的效率是95%以上,能夠達到97.6%。
也就是說,在理想情況下每一張卡之間都是緊密配合的,能夠一個月完成一個訓練。非理想情況是無問芯穹能夠做到將近一個月多一天不到就能夠同樣完成一個綜合的大模型訓練。
而要把不同的模型和硬件直接連接起來,還會包括對GPU性能的預測,把任務拆解分配,從而實現(xiàn)硬件不僅能各司其職,還能夠把通信庫打通、在通信上很好地協(xié)調。
在一個互聯(lián)網(wǎng)公司大模型推理場景的合作案例中,無問芯穹把客戶支撐同樣業(yè)務所使用的算力“砍掉”90%,從而節(jié)省算力資源占用。
這就好比無問芯穹做了一個大模型算力領域的“淘寶”, 其上游主要是跟各地方已經建設成建設完備的智算中心,或者在計劃中建設的智算中心合作,把他們的算力更好地給經營起來,而下游的大模型廠商和應用方,一鍵可以買到來自多元芯片好用、高效的算力。
從這點上看,無問芯穹在朝一個All in one的平臺進發(fā),夏立雪也不止一次強調“算力運營商”的定位,而非AI基礎設施。
無問芯穹戰(zhàn)略運營SVP王夢菲表示,AI基礎設施更多在國內會理解成單點優(yōu)化工具或軟件,而無問芯穹是要滿足客戶真正想要的已經優(yōu)化完善、即插即用的算力服務,也就是“一步到位”的工作。
“把算力做到足夠的標準化,降低客戶使用算力的難度和門檻,是我們跟AI基礎設施類的企業(yè)愿景上的區(qū)別。”
正如打開水龍頭前,人們不需要知道水是從哪條河里來的。
同理,夏立雪認為,未來人們用各種AI應用時,也不會知道它調用了哪些基座模型,用到了哪種加速卡的算力——這就是最好的AI Native 基礎設施。
角逐“算力優(yōu)化”,清華系早就“打”起來了
當然,無問芯穹描述的故事雖好,在市場端也并非毫無挑戰(zhàn)。
就商業(yè)模式來看,無問芯穹是一個完整的云廠商模式,有算力納管的IasS層,算力運營和調度的PaaS層,以及面向應用廠商的MaaS層,整個產品矩陣比較完整。
公司目前主要來源于算力云模式的收入,即銷售算力的收入,算力運營也就是去上游整合資源,通過技術能力把它變?yōu)橐粋€標準化的算力產品,進行一個單位化的定價,再拿到市場上售賣,盈利路徑清晰。
不過,王夢菲也坦言,商業(yè)模式上與云廠商有一定的類似,遠期看可能會有一些重合或者競爭。就當下而言,由于所面向的客戶層級以及定位、技術儲備方向有別,二者還是合大于競。
“過去云廠商是從CPU到GPU過渡,優(yōu)勢可能是很多客戶能復用,但無問芯穹強調GPU異構,會把技術棧做得更加完備、更深入,主要是把沒有用好的國產算力更好用起來,目前主要服務做大模型訓練的客戶,未來在對AI應用場景做技術儲備。”
而與云廠商相比,算力調優(yōu)賽道競爭早已被清華系“打”得硝煙四起,除無問芯穹外,潞晨科技、硅基流動、中科加禾、清程極智、清昴智能等業(yè)內玩家,均為清華系代表。
潞晨科技較早入局,在2021年開始打造面向大模型時代的通用深度學習系統(tǒng)Colossal-AI,促進AI大模型落地應用,由清華計算機系碩士、UC伯克利博士尤洋帶隊,目前已完成4輪融資,資方包括創(chuàng)新工場、藍馳創(chuàng)投、紅杉中國等。
一年后,師從朱文武教授的關超宇帶著清昴智能進入,研發(fā)MLGuider - 硬件感知的自動化模型部署優(yōu)化平臺,今年5月也完成了最新輪融資。
袁進輝帶隊的硅基流動、汪玉和夏立雪帶隊的無問芯穹、崔慧敏帶隊的中科佳禾以及湯雄超帶隊的清程極智則是集中于2023年“卷”入,今年也均完成新一輪融資。
其中,無問芯穹融資額最大,為近5億元,累計融資近10億元。硅基流動2個月前剛完成近億元天使+輪,累計融資達1.5億元,也是攪動一級市場的核心玩家,王慧文、智譜AI、三六零、創(chuàng)新工場等超10家機構均為其背后資方。
據(jù)悉,硅基流動則通過自研SiliconLLM大模型推理引擎,通過內核、框架、機制和模型協(xié)同優(yōu)化,打造標準化、超高效能的生成式AI Infra平臺,創(chuàng)始人兼CEO袁進輝曾創(chuàng)辦Pytorch“挑戰(zhàn)者”O(jiān)neFlow,發(fā)明過世界上最快的大規(guī)模主題模型訓練系統(tǒng)LightLDA。
而清華系玩家的背后,資方名單均由國資、產業(yè)方跟VC組成,可見算力生意不止to VC,更是劍指商業(yè)化落地,這里頭市場很大,但競爭也不容小覷。
王夢菲坦言,無問芯穹今年開始非常重要的一個戰(zhàn)略布局,就是需要占有市場一定的市場份額,反向要求當前市場所消耗的算力規(guī)模里面,要有很重要的一部分要從無問芯穹給出來,作為其戰(zhàn)略儲備。
意味著當下,誰先搶到上下游更多資源,誰就能在大模型“淘金”熱中,以算力“金鏟子”分到更多羮。
而這就需要大量的技術投入和技術儲備,也是無問芯穹獲得大額融資后的用武之地。
王夢菲認為,技術側仍會繼續(xù)做一些配置,包括各種技術棧,人才密度在里面扮演著至關重要的角色。可以認為,在當下小100名博士的人才密度下,無問芯穹還會繼續(xù)招兵買馬。
商業(yè)化上,王夢菲以公司仍還“年輕”沒有給出一定數(shù)據(jù),但透露有一些規(guī)模化的收入,明年會進一步的擴大市場份額,加重商業(yè)化上布局,并加碼生態(tài)建設的投入。
隨著無問芯穹打響清華系算力之爭,立于大模型浪尖的清華,又將在AI新時代續(xù)寫更多濃墨淡彩。