團隊15人,估值80億
根據外媒消息,成立不到1年的日本人工智能初創(chuàng)公司SakanaAI,即將斬獲超1億美元融資,估值飚至1800億日元(約合人民幣82億,11.5億美元),即將躋身AI獨角獸行列。
年初,Sakana已獲Lux Capital、Khosla Ventures及多家日本巨頭聯合注資,政府亦提供了關鍵算力支持。本輪融資中,上述投資方Lux Capital、Khosla Ventures 將再度加碼,顯示出對該項目信心。
盡管融資規(guī)模非行業(yè)之最,但這背后恰恰是其差異點所在。Sakana憑小團隊脫穎而出,年初融資時團隊僅3人,目前也僅有15名員工,若論人均估值,與OpenAI不相上下。
更引人注目的是其低成本創(chuàng)新路徑。Sakana顛覆當前AI生成范式,憑借獨創(chuàng)算法自主工作,節(jié)省人力,也無需使用耗電量巨大的大型計算機,號稱數據學習周期將縮短數百倍。
Sakana的策略也另辟蹊徑,拒絕盲目追求大數據模型,擁抱“小模型”戰(zhàn)略,“以小博大”,通過模型間相互協作,針對性解決問題。
此番“小步快跑”模式,與朱嘯虎的觀點頗有幾分相似,其看淡大模型,力挺小模型商業(yè)化應用,與Sakana實踐不謀而合。
Sakana 的崛起,不僅是日本AI領域的突破,更是地域化AI創(chuàng)新趨勢的有力注腳。全球范圍內,小模型勢力崛起,資本“狩獵”的新圖景也正徐徐展開。
“日本OpenAI”
避開硅谷,落腳東京,Sakana 選擇了一條不同尋常的發(fā)展道路。
“如果我們在灣區(qū)創(chuàng)辦 Sakana AI,那將是一個戰(zhàn)略失誤,因為我們看起來會更像其他人,很難與眾不同”,CEO David Ha 曾如此表示。在他看來,硅谷雖然科技氛圍濃厚,但過度的同質化使得新創(chuàng)企業(yè)難以在其中脫穎而出。
Sakana 另一層面的野心在于,追求跨文化技術突破,開發(fā)非西方AI模型。此外,Sakana 東京的選址,也是創(chuàng)始團隊背景的自然延伸。
David Ha曾任谷歌大腦 Google Brains 日本分部的研究負責人。在這之后,David Ha 曾在 Stability AI 擔任研究主管。據日媒報道,其退出 Stability 可能是因為工作內容與研究存在距離,而他本人對于神經網絡、創(chuàng)意AI和進化計算等多個領域有著廣泛的興趣和深入研究。
CTOLlion Jones同樣來自谷歌,在谷歌人工智能研究室擔任技術主管多年,是Transformer架構的提出者之一,該架構后來成為 ChatGPT 等生成 AI 驅動產品的基礎。Llion Jones對于大型科技公司在創(chuàng)新速度上的不滿促使他離開谷歌,為 Sakana 帶來技術積淀。
后期加入的另一位聯創(chuàng) Ren Ito,則憑借其在推進 Mercari 全球化和 IPO 的經驗,以及在投資領域的人脈,為 Sakana 帶來了豐富的運營策略和國際視角。Ren Ito曾投資過獨角獸初創(chuàng)企業(yè)Stability AI,并曾擔任過 Stability 的研究負責人和首席運營官COO。
另一位聯創(chuàng)Ren Ito則憑借在推進Mercari全球化和IPO的經驗,以及在投資領域的人脈,為Sakana帶來運營策略和國際視角。他曾投資過獨角獸初創(chuàng)企業(yè)Stability AI,并曾擔任過其研究負責人和首席運營官。此外,Ren Ito在日本外交部的背景也為公司的國際合作與市場擴展提供了優(yōu)勢。
Sakana的核心團隊匯聚了來自Google Brain、DeepMind等機構的專家,其中不乏多位亞裔成員。2023年7月成立以來,不僅挑戰(zhàn)硅谷模式,還力求在亞洲建立AI新標桿,目標趕超OpenAI和DeepMind。
年初融資時,公司僅三名創(chuàng)始人,平均每人估值達6670萬美元,超越OpenAI的員工平均估值約800多萬美元,根據CB Insights,其時團隊成員平均估值位居榜首。
可自動“繁衍”的AI模型
技術層面,Sakana 同樣試圖顛覆AI生成范式。
這一變革的靈感來自自然界,Sakana 通過模擬進化過程,使AI模型適應環(huán)境變化,克服傳統大語言模型的脆弱性和不可變性,同時極大降低開發(fā)成本并提升安全性。
核心亮點是“模型合并”技術,Sakana將多個現有開源AI模型融合,催生出新一代模型,這一過程循環(huán)往復,歷經數百代演變。再從每一代中選出最成功的模型,成為下一代的“父母”。
雖然該方法以前也存在,但它需要開發(fā)人員手動合并模型。Sakana開發(fā)的自動化“進化”算法無需人工干預,自主識別并合并每代中最優(yōu)秀的模型,以實現預設目標。
這一自動化流程加速了模型的進化速度,據 Sakana 宣稱,如果能夠在短時間內反復“繁衍”促進AI進化,將有可能把AI學習海量數據的周期壓縮至現有水平的幾百分之一。
生成式AI需要海量數據以及巨量的算力成本,這使得研究先進基礎技術的能力僅限于少數資金雄厚的科技企業(yè)。Sakana 采用的方法,號稱對算力資源的需求極小,幾乎不增加額外成本,就能獲得高性能的模型。
目前,Sakana 已基于其“自然啟發(fā)”的機制,推出了涵蓋語言、圖像轉換和圖像生成三大領域的AI模型,其中兩款開源。這些模型若按常規(guī)方式開發(fā),成本或以百萬美元計,并需數月時間。
不過,目前 Sakana 尚未推出直接面向消費者的應用,如何將這一革命性的技術轉化為商業(yè)成果,是市場關注的焦點。
區(qū)域化大模型頻現
Sakana成功融資,恰逢眾多AI初創(chuàng)企業(yè)深耕本土模型開發(fā)之際,全球資本也開始熱捧地域化AI新星,戰(zhàn)略落子頻繁。
六月間兩起融資案即為例證。加拿大 Cohere 以 50億美元估值攬獲 4.5億美元融資,英偉達、思科助力;法國Mistral AI喜提6億歐元,General Catalyst領投。國際資本追逐各地“OpenAI”的勢頭愈發(fā)兇猛。
然而,誕生于各地的本土企業(yè),亦須直面“初代”大模型的“入侵”威脅。如美國的人工智能開發(fā)商已經在日本建立了業(yè)務。今年4月,OpenAI在東京設立辦事處,正式拓展亞洲業(yè)務。它還聘請了長崎忠雄擔任 OpenAI 日本公司的總裁,并為當地企業(yè)提供了針對日語優(yōu)化的模型。
區(qū)域競爭日漸白熱化,創(chuàng)新與堅守并行成為新命題。盡管盈利模式尚不明朗,Sakana的創(chuàng)新在一定層面為AI領域的可持續(xù)發(fā)展提供了新思路,預示著一個低成本、高效率AI開發(fā)時代的到來。
無獨有偶。法國的 Mistral 同樣追求“性價比”,也是最為投資人稱道的一點。去年發(fā)布的Mistral 7B,以70億參數打敗了數百億參數的開源大語言模型霸主Llama 2;另一款模型Mistral Large開發(fā)成本低于2000萬歐元(約2200萬美元),GPT-4的開發(fā)成本可能要超過1億美元。
Sakana 和 Mistral 的實踐,為中小企業(yè)和開源社區(qū)打開了低成本創(chuàng)新的大門,有望終結大公司在AI技術上的壟斷。
法國、加拿大、日本等地新秀頻現,也勾勒出非硅谷獨角獸的勃興。
CB Insights 數據顯示,截至今年 4 月底,生成式AI領域獨角獸企業(yè)激增至37家,較去年同期近乎翻倍。新增17家中,10家植根海外,美國雖仍占九成份額,但全球分布趨勢顯著。
與此同時,各地政府力量參與濃度提高,投資生態(tài)不再專屬巨頭。
如Sakana在開始時,就獲得了政府提供的算力支持。正如Khosla Ventures的創(chuàng)始人Vinod Khosla曾強調的那樣,本土基礎模型關乎國家安全與文化互動,各國渴求自主掌控。