AI基礎軟件,在大模型時代講出新故事

        獵云網孫媛2023-06-25 08:57 大公司
        “千模大戰”,將由“軟”開始。

        大模型熱潮,讓多家企業沖在AI產業底座的路上。

        從交換機到高端AI服務器,再到云計算和數據中心都進入新增長周期。從1到10掀起“千模大戰”的AI革命,將首先在軟件和應用領域展開。

        其中,算法作為實現AI功能的關鍵,基礎軟件為其提供運行的平臺和工具。隨著算力性能逐漸同質化和標準化,數據的差異性和企業需求的個性化逐漸加大,“AI基礎軟件”作為模型訓練效率和算力使用效率的決定性因素,地位更加凸顯。

        在企業迫切尋求生成式AI應用的加速工具和服務的需求下,一邊NVIDIA AI Enterprise軟件套件和Azure機器學習相結合,供開發者構建、部署和管理大型語言模型的AI應用;另一邊在產業起跑發令槍尚未響起之時,有前瞻性的國內AI基礎軟件玩家也開始蠢蠢欲動。

        沿著“把數據變成模型,讓模型變簡單,讓模型真正用起來”的軸線發展,萌芽于硅谷車庫,由兩位前微軟工程師創辦于2013年的九章云極DataCanvas,經歷過去十年隨著AI技術的不斷普及和深入應用后,在這次大模型moment的爆燃之下,也欲發起新動作。

        微軟工程師回國創業,入局數據科學平臺


        作為AI賽道的早期入局者,九章云極DataCanvas背后站著兩個男人:方磊和尚明棟。

        兩人在美國待了10年,不僅是美國雪城大學攻讀計算機工程碩士時的同窗好友,后又都加入微軟工作。2008年,微軟從各個團隊中,抽取精明強將,組成了類startup的團隊,晚亞馬遜2年沖入云計算,方磊跟尚明棟便是其中之二。

        彼時,身處內部,兩人從工程師角度看到了很多趨勢,比如早期微軟只提供PaaS服務,后被市場教育,又變成了提供SaaS和PaaS服務。在大廠率先試錯的過程中,2011年,云上收入增長迅速,多家企業規模量級發生變化。

        尚明棟觀察到,一些傳統的大公司,開始成批量把算力往云上去遷移,驗證了當初杰夫貝索斯對云建設的初衷。

        “一開始有人嘲笑說云建設就是弄一堆RDC的機房,但貝索斯的愿景是以后接管所有企業的IT,從底層計算存儲一直到上層數據能力建設等各種基礎能力的建設。企業不需要再有一個IT團隊去維護,以非常低的成本就形成一套很復雜、高可用、高并發的架構?!?

        2013 年前后,美國的數據科學平臺創業迎來爆發期,加之,公有云的技術環境形成,促使新一代數據和人工智能(Data AI)的公司不斷孵化出來....Databricks、Snowflake 等一批后來崛起為頭部的公司大都是從這個時候起步。

        方磊和尚明棟順勢而為,決定回國在數據科學平臺領域創業,九章云極DataCanvas由此成為國內最早入局自動化數據科學平臺的供應商。

        2014 年,方磊給投資人的郵件中表示:容器技術自 2012 年出現后,給分析行業帶來了很大的改變,容器化的方式統一了分析流程的運行基礎。而且,與容器結合后,機器學習、深度學習等不再只是在上層增光添彩的小工具,而成為了標準化的基礎設施。

        同年,這一創業設想便拿到了亞杰天使基金的天使輪投資。

        聚焦“AI基礎軟件”擴大版圖,超20家資本競相押注


        尚明棟也深知AI基礎軟件更清晰的定位以及上下游的合作,往往更適用于一個相對來說比較成熟的生態分工,絕非一蹴而就。

        在花了兩年時間打磨DataCanvas 數據科學平臺后,尚明棟意識到要把產品變成商品,需要對市場需求精準洞察,而技術創業的背景早期讓其在市場化上也走過一些彎路。想要在國內把數據和算法變成生意,從有數據處理需求的大型企業入手成為了解法。

        尚明棟坦言,模型作為數據資產的一部分,從大趨勢上看,數據產生、能力構建是一個持續建設的過程,信息化能力建設最早的行業一定相對來說數據更剛需和密集。

        彼時,金融行業的信息化程度遠高于其他行業,銀行是當時國內IT 預算最高的企業之一,亦成為了九章云極DataCanvas瞄準金融行業的最先切入點。時至今日,中國前一百家銀行里,九章云極DataCanvas客戶占比超50 家,驗證了其AI創業以“business”的核心。

        商業化驗證的同時,為解決企業在進行數據分析時面臨的AI建模難度門檻過高、以及AI推理等問題,九章云極DataCanvas也不斷完善產品版圖。

        在“人工智能基礎軟件”的定位下,公司不僅通過AutoML自動機器學習、AutoDL自動深度學習和ModelOps提供模型運行的全生命周期,更通過其研發的HSAP數據庫DingoDB落地Data-Centric AI。

        此外,九章云極DataCanvas從DAT自動機器學習軟件、DingoDB實時交互式分析數據庫,到去年7月發布的YLearn因果學習軟件,不斷以開源重器刷新了業界對開源基礎軟件的期望。后者作為全球首款一站式處理因果學習完整流程的開源算法工具包,填補了可信AI、可解釋AI高性能基礎軟件的市場空白,而這也正是推動AI技術實現從“預測”到“決策”的規?;瘧玫闹匾ぞ?。

        尚明棟表示,AI基礎軟件不光是一個基礎軟件,還面向國內toB的生態合作。隨著眾多廠商協作產生的分工細化,在toB生態下,面對行業數據、結構的不同,企業更需要考慮在某一個能力層里進行長期的可復用、標準化。

        這其中,越是偏底層的能力,他認為越應該參與到開源生態中,通過更多人適配變成整個標準化生態分工里的一環。

        “從這一點上來說,我們尊重且積極參與到開放生態,會開源一些比較底層的計算框架,而偏上面的行業應用,甚至是交互式的應用工具鏈,會更支持企業化特性?!鄙忻鳁澅硎?,九章云極DataCanvas會保持對開源生態的兼容,處于中間層的位置,向上更靠近應用,向下更靠近底層。

        據了解,九章云極DataCanvas軟件產品收入占六成以上,除在金融行業客戶滲透率不斷提高外,其在通信、工業制造、政府、交通等多行業均有標桿客戶落地。

        10年間,九章云極DataCanvas加速狂奔,資本的橄欖枝也接連不斷。

        去年9月,九章云極DataCanvas完成龍門資本領投的C+輪融資,至此,已在9輪融資中獲得超20家機構押注,其中中關村發展前沿基金、領沨資本、紅點中國、賽富投資基金、襄禾資本等知名機構更是多輪加持。

        以“大+小”方式,形成模型訓練新范式


        在技術快速發展和行業生態變遷下,如果說過去的產品矩陣是九章云極DataCanvas針對企業現有能力來進行伴生式的成長,那么大模型則是九章云極DataCanvas的詩和遠方。

        近兩年,在跟規模體量特別大的客戶溝通并構建大規模深度學習的分布式訓練框架時,尚明棟就感受到面向未來的非結構化數據越來越多,只不過業內尚無大規模需求涌現。

        而這些早期的個別需求讓他在訓練模型時,注意到隨著模型由小變大,大模型訓練成本高甚至可能還會進入到空轉狀態,形成大量成本浪費,故而需要一面訓練,一面監控,一面動態調整訓練參數,讓其持續進入到收斂態。

        尚明棟坦言,自2019年起,團隊就開始挑可能通過長期投入來形成核心壁壘的點,作為大模型的投入重心。

        在他看來,過去中小模型解決的是場景,現在大模型替代的是分工和角色。想讓企業更認可大模型的價值,一要用大模型的能力,給企業帶來更多收益,二要為企業節省更多人力成本。簡而言之就是實現客戶一些原先不能的,或者是原先效果不夠好的能力,在能力建設和業務結合時做好開源節流。

        基于這樣的邏輯,九章云極DataCanvas將與行業生態結合得較緊密的需大量成本消耗的環節,作為可能被大模型所替代和驅動的目標。

        當下,大模型雖表現優異,但對于各行業使用者來說,實際應用于業務場景仍然存在較高的技術和成本門檻。模型的參數標準并不統一,相對于參數級,模型的效果且是否能夠支持快速迭代對于企業客戶實際應用來說更為重要??蛻裟軌蛟谝粋€白盒大模型基礎上快速地、低成本地微調和迭代出客制化的小模型,才能高效地實現豐富場景的大模型應用。而這正是AI基礎軟件工具鏈的重要性。

        尚明棟表示,大模型未來可能和中小模型更趨同化,而大模型和小模型的融合使用,大模型的小型化,或者說以大模型為底座的小型化微調,也是一種趨勢,能夠以低廉的成本解決大量的問題。AI基礎軟件通過大模型+小模型的方式,正形成模型訓練新范式。

        他指出,不管是大模型還是小模型,本質上都是模型,實際就是數據的濃縮,包含價值、邏輯密度。數據不開放,必然要搬運能力,而且是大模型所需的整個能力棧。

        而通過過去啃下的技術“硬骨頭”,使得九章云極DataCanvas在大模型的落地和應用里,能快速找到能力組合的戰略要點,打造更標準化的大模型工具鏈:不僅會在支持現有框架下,把構建大模型的能力引入行業的邊界里去,而且還會給行業提供能力閉環。

        “作為AI生態鏈中基礎軟件環節的能力提供者,過去10年我們一直在驗證從模型構建到模型推理生產化,甚至到后期的模型管理,形成一個基于以模型全生命周期作為起點和終點來進行的能力建設的閉環,來對行業產生價值,讓客戶為能力買單?!?

        而這樣的閉環在大模型構建下,尚明棟預測會有新的能力建設隨新的大閉環而產生。

        在他看來,大模型很像新時代的制造業,大家在一個流水線上,下游負責算力、更底層的一些計算框架,九章云極DataCanvas負責好基礎軟件,模型的完整生命周期的構建和推理,并賦能于后面的應用,是一個更面向產業的閉環。

        而其中,相較于專業能力分工更細致化,有前瞻性技術和能力構建的頭部客戶,真正進行大規模變現和賦能的是更偏向于最終應用的腰部企業,需要九章云極DataCanvas從基礎軟件往應用側提供一部分服務,去把最后這一公里補齊。其透露,目前大模型方面已經開始有付費客戶。

        據IDC預測,到2026年,大規?;A模型將成為大型供應商提供的標準行業實用程序。隨著各大廠商更加投入到底層基礎軟件的建設中,在時代推動和產業帶動下,以九章云極DataCanvas為代表的AI基礎軟件公司又將有哪些變與不變,讓我們拭目以待。

        【本文為合作媒體授權博望財經轉載,文章版權歸原作者及原出處所有。文章系作者個人觀點,不代表博望財經立場,轉載請聯系原作者及原出處獲得授權。有任何疑問都請聯系(聯系(微信公眾號ID:AppleiTree)。免責聲明:本網站所有文章僅作為資訊傳播使用,既不代表任何觀點導向,也不構成任何投資建議?!?/div>

        猜你喜歡

        久久亚洲AV成人出白浆无码国产| 久久久精品国产亚洲成人满18免费网站| 国产亚洲精品拍拍拍拍拍| 亚洲国产精华液2020| 中文字幕在线日亚洲9| 亚洲av极品无码专区在线观看| 亚洲视频国产精品| 亚洲精品美女久久久久9999| 97se亚洲综合在线| 亚洲网红精品大秀在线观看| 久久亚洲精精品中文字幕| 亚洲欧洲日韩不卡| 久久亚洲精品无码VA大香大香| 亚洲人成在线影院| 亚洲高清免费在线观看| 亚洲毛片基地日韩毛片基地 | 亚洲视频精品在线观看| 少妇中文字幕乱码亚洲影视| 久久久久亚洲精品影视| 在线观看亚洲一区二区| 亚洲免费中文字幕| 亚洲熟伦熟女专区hd高清| 亚洲AV无码成人精品区日韩| 苍井空亚洲精品AA片在线播放| mm1313亚洲精品国产| 亚洲区小说区图片区| 亚洲毛片αv无线播放一区| 亚洲国产精品无码久久一线| 亚洲狠狠综合久久| 亚洲成人午夜电影| 亚洲欧美日韩中文高清www777| 久久久久久亚洲精品无码| 亚洲国产精品毛片av不卡在线| 亚洲性日韩精品一区二区三区| 亚洲人精品午夜射精日韩| 亚洲∧v久久久无码精品| 亚洲成年人免费网站| 亚洲人成色77777在线观看| 国产亚洲精品成人久久网站| 亚洲香蕉网久久综合影视| 亚洲成色999久久网站|