AI基礎(chǔ)軟件,在大模型時代講出新故事

        獵云網(wǎng)孫媛2023-06-25 08:57 大公司
        “千模大戰(zhàn)”,將由“軟”開始。

        大模型熱潮,讓多家企業(yè)沖在AI產(chǎn)業(yè)底座的路上。

        從交換機到高端AI服務(wù)器,再到云計算和數(shù)據(jù)中心都進(jìn)入新增長周期。從1到10掀起“千模大戰(zhàn)”的AI革命,將首先在軟件和應(yīng)用領(lǐng)域展開。

        其中,算法作為實現(xiàn)AI功能的關(guān)鍵,基礎(chǔ)軟件為其提供運行的平臺和工具。隨著算力性能逐漸同質(zhì)化和標(biāo)準(zhǔn)化,數(shù)據(jù)的差異性和企業(yè)需求的個性化逐漸加大,“AI基礎(chǔ)軟件”作為模型訓(xùn)練效率和算力使用效率的決定性因素,地位更加凸顯。

        在企業(yè)迫切尋求生成式AI應(yīng)用的加速工具和服務(wù)的需求下,一邊NVIDIA AI Enterprise軟件套件和Azure機器學(xué)習(xí)相結(jié)合,供開發(fā)者構(gòu)建、部署和管理大型語言模型的AI應(yīng)用;另一邊在產(chǎn)業(yè)起跑發(fā)令槍尚未響起之時,有前瞻性的國內(nèi)AI基礎(chǔ)軟件玩家也開始蠢蠢欲動。

        沿著“把數(shù)據(jù)變成模型,讓模型變簡單,讓模型真正用起來”的軸線發(fā)展,萌芽于硅谷車庫,由兩位前微軟工程師創(chuàng)辦于2013年的九章云極DataCanvas,經(jīng)歷過去十年隨著AI技術(shù)的不斷普及和深入應(yīng)用后,在這次大模型moment的爆燃之下,也欲發(fā)起新動作。

        微軟工程師回國創(chuàng)業(yè),入局?jǐn)?shù)據(jù)科學(xué)平臺


        作為AI賽道的早期入局者,九章云極DataCanvas背后站著兩個男人:方磊和尚明棟。

        兩人在美國待了10年,不僅是美國雪城大學(xué)攻讀計算機工程碩士時的同窗好友,后又都加入微軟工作。2008年,微軟從各個團隊中,抽取精明強將,組成了類startup的團隊,晚亞馬遜2年沖入云計算,方磊跟尚明棟便是其中之二。

        彼時,身處內(nèi)部,兩人從工程師角度看到了很多趨勢,比如早期微軟只提供PaaS服務(wù),后被市場教育,又變成了提供SaaS和PaaS服務(wù)。在大廠率先試錯的過程中,2011年,云上收入增長迅速,多家企業(yè)規(guī)模量級發(fā)生變化。

        尚明棟觀察到,一些傳統(tǒng)的大公司,開始成批量把算力往云上去遷移,驗證了當(dāng)初杰夫貝索斯對云建設(shè)的初衷。

        “一開始有人嘲笑說云建設(shè)就是弄一堆RDC的機房,但貝索斯的愿景是以后接管所有企業(yè)的IT,從底層計算存儲一直到上層數(shù)據(jù)能力建設(shè)等各種基礎(chǔ)能力的建設(shè)。企業(yè)不需要再有一個IT團隊去維護(hù),以非常低的成本就形成一套很復(fù)雜、高可用、高并發(fā)的架構(gòu)。”

        2013 年前后,美國的數(shù)據(jù)科學(xué)平臺創(chuàng)業(yè)迎來爆發(fā)期,加之,公有云的技術(shù)環(huán)境形成,促使新一代數(shù)據(jù)和人工智能(Data AI)的公司不斷孵化出來....Databricks、Snowflake 等一批后來崛起為頭部的公司大都是從這個時候起步。

        方磊和尚明棟順勢而為,決定回國在數(shù)據(jù)科學(xué)平臺領(lǐng)域創(chuàng)業(yè),九章云極DataCanvas由此成為國內(nèi)最早入局自動化數(shù)據(jù)科學(xué)平臺的供應(yīng)商。

        2014 年,方磊給投資人的郵件中表示:容器技術(shù)自 2012 年出現(xiàn)后,給分析行業(yè)帶來了很大的改變,容器化的方式統(tǒng)一了分析流程的運行基礎(chǔ)。而且,與容器結(jié)合后,機器學(xué)習(xí)、深度學(xué)習(xí)等不再只是在上層增光添彩的小工具,而成為了標(biāo)準(zhǔn)化的基礎(chǔ)設(shè)施。

        同年,這一創(chuàng)業(yè)設(shè)想便拿到了亞杰天使基金的天使輪投資。

        聚焦“AI基礎(chǔ)軟件”擴大版圖,超20家資本競相押注


        尚明棟也深知AI基礎(chǔ)軟件更清晰的定位以及上下游的合作,往往更適用于一個相對來說比較成熟的生態(tài)分工,絕非一蹴而就。

        在花了兩年時間打磨DataCanvas 數(shù)據(jù)科學(xué)平臺后,尚明棟意識到要把產(chǎn)品變成商品,需要對市場需求精準(zhǔn)洞察,而技術(shù)創(chuàng)業(yè)的背景早期讓其在市場化上也走過一些彎路。想要在國內(nèi)把數(shù)據(jù)和算法變成生意,從有數(shù)據(jù)處理需求的大型企業(yè)入手成為了解法。

        尚明棟坦言,模型作為數(shù)據(jù)資產(chǎn)的一部分,從大趨勢上看,數(shù)據(jù)產(chǎn)生、能力構(gòu)建是一個持續(xù)建設(shè)的過程,信息化能力建設(shè)最早的行業(yè)一定相對來說數(shù)據(jù)更剛需和密集。

        彼時,金融行業(yè)的信息化程度遠(yuǎn)高于其他行業(yè),銀行是當(dāng)時國內(nèi)IT 預(yù)算最高的企業(yè)之一,亦成為了九章云極DataCanvas瞄準(zhǔn)金融行業(yè)的最先切入點。時至今日,中國前一百家銀行里,九章云極DataCanvas客戶占比超50 家,驗證了其AI創(chuàng)業(yè)以“business”的核心。

        商業(yè)化驗證的同時,為解決企業(yè)在進(jìn)行數(shù)據(jù)分析時面臨的AI建模難度門檻過高、以及AI推理等問題,九章云極DataCanvas也不斷完善產(chǎn)品版圖。

        在“人工智能基礎(chǔ)軟件”的定位下,公司不僅通過AutoML自動機器學(xué)習(xí)、AutoDL自動深度學(xué)習(xí)和ModelOps提供模型運行的全生命周期,更通過其研發(fā)的HSAP數(shù)據(jù)庫DingoDB落地Data-Centric AI。

        此外,九章云極DataCanvas從DAT自動機器學(xué)習(xí)軟件、DingoDB實時交互式分析數(shù)據(jù)庫,到去年7月發(fā)布的YLearn因果學(xué)習(xí)軟件,不斷以開源重器刷新了業(yè)界對開源基礎(chǔ)軟件的期望。后者作為全球首款一站式處理因果學(xué)習(xí)完整流程的開源算法工具包,填補了可信AI、可解釋AI高性能基礎(chǔ)軟件的市場空白,而這也正是推動AI技術(shù)實現(xiàn)從“預(yù)測”到“決策”的規(guī)模化應(yīng)用的重要工具。

        尚明棟表示,AI基礎(chǔ)軟件不光是一個基礎(chǔ)軟件,還面向國內(nèi)toB的生態(tài)合作。隨著眾多廠商協(xié)作產(chǎn)生的分工細(xì)化,在toB生態(tài)下,面對行業(yè)數(shù)據(jù)、結(jié)構(gòu)的不同,企業(yè)更需要考慮在某一個能力層里進(jìn)行長期的可復(fù)用、標(biāo)準(zhǔn)化。

        這其中,越是偏底層的能力,他認(rèn)為越應(yīng)該參與到開源生態(tài)中,通過更多人適配變成整個標(biāo)準(zhǔn)化生態(tài)分工里的一環(huán)。

        “從這一點上來說,我們尊重且積極參與到開放生態(tài),會開源一些比較底層的計算框架,而偏上面的行業(yè)應(yīng)用,甚至是交互式的應(yīng)用工具鏈,會更支持企業(yè)化特性。”尚明棟表示,九章云極DataCanvas會保持對開源生態(tài)的兼容,處于中間層的位置,向上更靠近應(yīng)用,向下更靠近底層。

        據(jù)了解,九章云極DataCanvas軟件產(chǎn)品收入占六成以上,除在金融行業(yè)客戶滲透率不斷提高外,其在通信、工業(yè)制造、政府、交通等多行業(yè)均有標(biāo)桿客戶落地。

        10年間,九章云極DataCanvas加速狂奔,資本的橄欖枝也接連不斷。

        去年9月,九章云極DataCanvas完成龍門資本領(lǐng)投的C+輪融資,至此,已在9輪融資中獲得超20家機構(gòu)押注,其中中關(guān)村發(fā)展前沿基金、領(lǐng)沨資本、紅點中國、賽富投資基金、襄禾資本等知名機構(gòu)更是多輪加持。

        以“大+小”方式,形成模型訓(xùn)練新范式


        在技術(shù)快速發(fā)展和行業(yè)生態(tài)變遷下,如果說過去的產(chǎn)品矩陣是九章云極DataCanvas針對企業(yè)現(xiàn)有能力來進(jìn)行伴生式的成長,那么大模型則是九章云極DataCanvas的詩和遠(yuǎn)方。

        近兩年,在跟規(guī)模體量特別大的客戶溝通并構(gòu)建大規(guī)模深度學(xué)習(xí)的分布式訓(xùn)練框架時,尚明棟就感受到面向未來的非結(jié)構(gòu)化數(shù)據(jù)越來越多,只不過業(yè)內(nèi)尚無大規(guī)模需求涌現(xiàn)。

        而這些早期的個別需求讓他在訓(xùn)練模型時,注意到隨著模型由小變大,大模型訓(xùn)練成本高甚至可能還會進(jìn)入到空轉(zhuǎn)狀態(tài),形成大量成本浪費,故而需要一面訓(xùn)練,一面監(jiān)控,一面動態(tài)調(diào)整訓(xùn)練參數(shù),讓其持續(xù)進(jìn)入到收斂態(tài)。

        尚明棟坦言,自2019年起,團隊就開始挑可能通過長期投入來形成核心壁壘的點,作為大模型的投入重心。

        在他看來,過去中小模型解決的是場景,現(xiàn)在大模型替代的是分工和角色。想讓企業(yè)更認(rèn)可大模型的價值,一要用大模型的能力,給企業(yè)帶來更多收益,二要為企業(yè)節(jié)省更多人力成本。簡而言之就是實現(xiàn)客戶一些原先不能的,或者是原先效果不夠好的能力,在能力建設(shè)和業(yè)務(wù)結(jié)合時做好開源節(jié)流。

        基于這樣的邏輯,九章云極DataCanvas將與行業(yè)生態(tài)結(jié)合得較緊密的需大量成本消耗的環(huán)節(jié),作為可能被大模型所替代和驅(qū)動的目標(biāo)。

        當(dāng)下,大模型雖表現(xiàn)優(yōu)異,但對于各行業(yè)使用者來說,實際應(yīng)用于業(yè)務(wù)場景仍然存在較高的技術(shù)和成本門檻。模型的參數(shù)標(biāo)準(zhǔn)并不統(tǒng)一,相對于參數(shù)級,模型的效果且是否能夠支持快速迭代對于企業(yè)客戶實際應(yīng)用來說更為重要。客戶能夠在一個白盒大模型基礎(chǔ)上快速地、低成本地微調(diào)和迭代出客制化的小模型,才能高效地實現(xiàn)豐富場景的大模型應(yīng)用。而這正是AI基礎(chǔ)軟件工具鏈的重要性。

        尚明棟表示,大模型未來可能和中小模型更趨同化,而大模型和小模型的融合使用,大模型的小型化,或者說以大模型為底座的小型化微調(diào),也是一種趨勢,能夠以低廉的成本解決大量的問題。AI基礎(chǔ)軟件通過大模型+小模型的方式,正形成模型訓(xùn)練新范式。

        他指出,不管是大模型還是小模型,本質(zhì)上都是模型,實際就是數(shù)據(jù)的濃縮,包含價值、邏輯密度。數(shù)據(jù)不開放,必然要搬運能力,而且是大模型所需的整個能力棧。

        而通過過去啃下的技術(shù)“硬骨頭”,使得九章云極DataCanvas在大模型的落地和應(yīng)用里,能快速找到能力組合的戰(zhàn)略要點,打造更標(biāo)準(zhǔn)化的大模型工具鏈:不僅會在支持現(xiàn)有框架下,把構(gòu)建大模型的能力引入行業(yè)的邊界里去,而且還會給行業(yè)提供能力閉環(huán)。

        “作為AI生態(tài)鏈中基礎(chǔ)軟件環(huán)節(jié)的能力提供者,過去10年我們一直在驗證從模型構(gòu)建到模型推理生產(chǎn)化,甚至到后期的模型管理,形成一個基于以模型全生命周期作為起點和終點來進(jìn)行的能力建設(shè)的閉環(huán),來對行業(yè)產(chǎn)生價值,讓客戶為能力買單。”

        而這樣的閉環(huán)在大模型構(gòu)建下,尚明棟預(yù)測會有新的能力建設(shè)隨新的大閉環(huán)而產(chǎn)生。

        在他看來,大模型很像新時代的制造業(yè),大家在一個流水線上,下游負(fù)責(zé)算力、更底層的一些計算框架,九章云極DataCanvas負(fù)責(zé)好基礎(chǔ)軟件,模型的完整生命周期的構(gòu)建和推理,并賦能于后面的應(yīng)用,是一個更面向產(chǎn)業(yè)的閉環(huán)。

        而其中,相較于專業(yè)能力分工更細(xì)致化,有前瞻性技術(shù)和能力構(gòu)建的頭部客戶,真正進(jìn)行大規(guī)模變現(xiàn)和賦能的是更偏向于最終應(yīng)用的腰部企業(yè),需要九章云極DataCanvas從基礎(chǔ)軟件往應(yīng)用側(cè)提供一部分服務(wù),去把最后這一公里補齊。其透露,目前大模型方面已經(jīng)開始有付費客戶。

        據(jù)IDC預(yù)測,到2026年,大規(guī)模基礎(chǔ)模型將成為大型供應(yīng)商提供的標(biāo)準(zhǔn)行業(yè)實用程序。隨著各大廠商更加投入到底層基礎(chǔ)軟件的建設(shè)中,在時代推動和產(chǎn)業(yè)帶動下,以九章云極DataCanvas為代表的AI基礎(chǔ)軟件公司又將有哪些變與不變,讓我們拭目以待。

        【本文為合作媒體授權(quán)博望財經(jīng)轉(zhuǎn)載,文章版權(quán)歸原作者及原出處所有。文章系作者個人觀點,不代表博望財經(jīng)立場,轉(zhuǎn)載請聯(lián)系原作者及原出處獲得授權(quán)。有任何疑問都請聯(lián)系(聯(lián)系(微信公眾號ID:AppleiTree)。免責(zé)聲明:本網(wǎng)站所有文章僅作為資訊傳播使用,既不代表任何觀點導(dǎo)向,也不構(gòu)成任何投資建議。】

        猜你喜歡

        亚洲色大成网站WWW国产| 亚洲精品国精品久久99热| 亚洲高清成人一区二区三区| 亚洲欧洲另类春色校园网站| 亚洲麻豆精品果冻传媒| 亚洲久本草在线中文字幕| 亚洲男人都懂得羞羞网站| 久久亚洲国产中v天仙www| 国产精品亚洲片在线观看不卡| 亚洲最大av无码网址| 亚洲一本大道无码av天堂| 亚洲人成人网站在线观看| 区三区激情福利综合中文字幕在线一区亚洲视频1 | 久久久久se色偷偷亚洲精品av| 亚洲国产韩国一区二区| 亚洲国产av美女网站| 自拍日韩亚洲一区在线| 亚洲熟女综合色一区二区三区| 亚洲色中文字幕在线播放| 亚洲AV永久无码天堂影院| 成人亚洲国产精品久久| 亚洲精品和日本精品| 亚洲高清偷拍一区二区三区| jlzzjlzz亚洲乱熟在线播放| 亚洲中文字幕无码永久在线| 亚洲国产精品久久久天堂| 亚洲第一区香蕉_国产a| 亚洲校园春色小说| 亚洲a∨无码男人的天堂| 亚洲日韩精品国产一区二区三区 | 亚洲中文无码亚洲人成影院| 亚洲色大成网站www尤物| 国产成人精品亚洲| 伊人久久综在合线亚洲91| 久久久久久久尹人综合网亚洲| 亚洲国产成人私人影院| 亚洲国产综合在线| 亚洲日本VA午夜在线影院| 亚洲成A人片77777国产| 亚洲精品乱码久久久久久自慰| 久久亚洲私人国产精品|