90后清華學(xué)霸,創(chuàng)業(yè)一年估值25億美元
在OpenAI的文生視頻模型Sora引發(fā)廣泛關(guān)注的當(dāng)下,國內(nèi)這家90后清華學(xué)霸創(chuàng)辦的大模型公司,持續(xù)受到知名機構(gòu)追捧。
今日,月之暗面(Moonshot AI)被爆完成超10億美元新一輪融資,投資方包括紅杉中國、小紅書、美團、阿里,老股東跟投,投后估值達約25億美元。
就在春節(jié)前的2月3日,月之暗面則被爆正在進行2億美元融資,由螞蟻和阿里集團共同投資,投前估值預(yù)計15億美元。
針對“最新一輪融資”,月之暗面對獵云網(wǎng)表示,“感謝關(guān)注!公司對具體融資信息暫不方便評論。月之暗面過去未來一直堅持推進中國AGI領(lǐng)域的底層關(guān)鍵技術(shù)進步及產(chǎn)品創(chuàng)新,也會持續(xù)匹配與公司發(fā)展階段相應(yīng)的資本策略,期待未來有更多好消息與大家分享。”
事實上,成立于2023年4月的月之暗面在融資披露方面“鮮有明確說法”。針對成立僅兩個月就被爆完成的首輪融資,創(chuàng)始人楊植麟于2023年10月“更正”道,公司已獲得紅杉資本、今日資本、礪思資本等知名機構(gòu)近20億元投資。
而這,也是月之暗面成立近一年來,唯一一次準(zhǔn)確的融資披露。
清華學(xué)霸創(chuàng)業(yè),攜手同門組建全明星陣容
月之暗面之所以能在成立之初就獲得頭部VC押注,與90后楊植麟本人的“學(xué)霸”身份、豐富經(jīng)歷,關(guān)系匪淺。
清華求學(xué)時,楊植麟師從清華大學(xué)計算機系知識工程實驗室(KEG)帶頭人,智源研究院學(xué)術(shù)副院長、悟道項目負責(zé)人唐杰教授。最終他以滿分成績通過所有程序設(shè)計課程,并以年級第一的成績畢業(yè)。
隨后在2015年,楊植麟進入卡內(nèi)基梅隆大學(xué)(CMU)語言技術(shù)研究所(LTI),跟隨蘋果公司AI負責(zé)人Ruslan Salakhutdinov和Google AI智能首席科學(xué)家William W. Cohen攻讀博士學(xué)位。
畢業(yè)后,楊植麟曾效力于谷歌大腦研究院和Meta(Facebook)人工智能研究院,是Transformer-XL和XLNet的第一作者。其中,XLNet模型曾在18項自然語言任務(wù)中取得了好于谷歌BERT的效果,是當(dāng)時NLP領(lǐng)域熱門的國際前沿模型之一。
據(jù)不完全統(tǒng)計,楊植麟曾在ICLR、NeurIPS、ICML、ACL、EMNLP等計算機頂會發(fā)表論文20余篇,研究成果累計Google Shcolar引用超過17000。
目前,楊植麟還是清華大學(xué)交叉信息研究院的助理教授,研究方向:大規(guī)模預(yù)訓(xùn)練,自然語言處理,自然語言理解與生成,少樣本學(xué)習(xí),零樣本學(xué)習(xí),多模態(tài)學(xué)習(xí)。
90后的楊植麟,在大模型領(lǐng)域,可謂聲名顯赫:循環(huán)智能、智譜AI、智源研究院……到處都有他的名字和身影。
同時,楊植麟和團隊也曾作為核心研發(fā)成員,參與Google Bard、Gemini、Einstein、盤古、悟道等大模型的研發(fā),發(fā)明包括TransformerXL、XLNet、RoPE、Detectron2、Group Normalization在內(nèi)的AI領(lǐng)域里程碑式的成果,被諸如Google PALM、LLaMa等模型采用。
天眼查App信息顯示,月之暗面由楊植麟持股78.97%,擁有絕對控制權(quán)。圍繞在他身邊的創(chuàng)業(yè)伙伴,同樣實力非凡,不容小覷。
月之暗面聯(lián)合創(chuàng)始人周昕宇持有公司10%股份,他和楊植麟、張宇韜,是清華大學(xué)計算機科學(xué)與技術(shù)系2011級本科的同學(xué)。在大四時,周昕宇就加入各方面都符合他標(biāo)準(zhǔn)的曠視實習(xí),并在畢業(yè)之后正式加入,工作內(nèi)容是算法量產(chǎn),就是要把算法的生產(chǎn)效率提高很多倍。
作為持股5.96%的第三大股東,月之暗面聯(lián)合創(chuàng)始人吳育昕畢業(yè)于清華大學(xué)與卡耐基梅隆大學(xué),曾獲2018年歐洲計算機視覺會議(ECCV)最佳論文提名。在2018年10月的GeekPwn國際安全極客大賽上,IYSWIM是6個參賽團隊中,唯一一個破解人臉識別算法的團隊。吳育昕當(dāng)時以IYSWIM團隊的身份參賽,據(jù)他介紹,“自己(以個人名義報名參賽,有名隊友沒有來到現(xiàn)場)用了谷歌的FaceNet開源代碼模型攻破了該算法”。
此外,楊植麟的同門師兄張宇韜,目前持有公司5%股份。公開資料顯示,張宇韜本碩均在清華大學(xué)計算機系就讀。他的研究方向是異構(gòu)數(shù)據(jù)融合和知識圖譜構(gòu)建,在KDD、CIKM等計算機頂會上發(fā)表多篇文章。他作為技術(shù)負責(zé)人,參與了科技大數(shù)據(jù)分析平臺AMiner的研發(fā)。
大語言模型后,正秘密研發(fā)通用多模態(tài)模型
憑借豪華的團隊陣容與深厚的積累,月之暗面成立不到半年,便于2023年10月宣布在“長文本”領(lǐng)域?qū)崿F(xiàn)了突破。
據(jù)楊植麟介紹,針對于“大模型輸入長度受限帶來的應(yīng)用困難”,月之暗面正式推出了首個支持輸入20萬漢字的大模型moonshot,以及搭載該模型的智能助手產(chǎn)品Kimi Chat。
隨后,他以Kimi Chat的一些實際使用案例,進行了詳細介紹。以輸入整本《月亮與六便士》為例,Kimi Chat可以和用戶一起閱讀,幫助用戶更好地理解和運用書本中的知識:
相比當(dāng)前市面上以英文為基礎(chǔ)訓(xùn)練的大模型服務(wù),Kimi Chat具備較強的多語言能力。例如,Kimi Chat在中文上具備顯著優(yōu)勢,實際使用效果能夠支持約20萬漢字的上下文,2.5倍于Anthropic公司的Claude-100k(實測約8萬字),8倍于OpenAI公司的GPT-4-32k(實測約2.5萬字)。
同時,Kimi Chat通過創(chuàng)新的網(wǎng)絡(luò)結(jié)構(gòu)和工程優(yōu)化,在千億參數(shù)下實現(xiàn)了無損的長程注意力機制,不依賴于滑動窗口、降采樣、小模型等對性能損害較大的“捷徑”方案。
就在今年1月26日,Kimi Chat最新發(fā)布了“v1.3 迎春版”: 基礎(chǔ)模型能力全面升級,用友聯(lián)網(wǎng)搜索能力、上下文學(xué)習(xí)能力、文學(xué)創(chuàng)作能力、語言翻譯能力……小程序版Kimi智能助手,則已支持中英文語音輸入。
需要的是,近期,OpenAI的文生視頻模型Sora,憑借突破一分鐘的時長,再加上演示視頻的高度逼真和高質(zhì)量,持續(xù)引發(fā)關(guān)注。
據(jù)多方消息報道,月之暗面也正在秘密研發(fā)通用多模態(tài)模型,預(yù)計今年內(nèi)將推出。
換言之,在以文本為主的大語言模型領(lǐng)域取得階段性進展的月之暗面,未來也將在以圖像、視頻為主的多模態(tài)模型領(lǐng)域,與OpenAI等國內(nèi)外同行展開較量。
而月之暗面在資本市場上的“動作頻頻”,似乎也正是在為更高的訓(xùn)練成本,更大量的資金和人才需求,做更充足的準(zhǔn)備。
以團隊規(guī)模為例,月之暗面在2023年10月有50人左右,目前該公司團隊人數(shù)則已超80人。
未來,月之暗面在“多模態(tài)模型”領(lǐng)域,究竟能否占有一席之地,我們也將持續(xù)保持關(guān)注。
猜你喜歡
月之暗面估值240億,創(chuàng)始人卻被前投資人告上國際仲裁庭!
創(chuàng)業(yè)者與投資人的“相愛相殺”,照進現(xiàn)實?90后清華學(xué)霸,創(chuàng)業(yè)一年估值25億美元
正在秘密研發(fā)通用多模態(tài)模型,預(yù)計今年內(nèi)將推出。