商湯大模型的進化邏輯:認知領(lǐng)先與能力領(lǐng)先帶來的復利效應
1
進化的商湯大模型
筆者在長期的商業(yè)研究過程中發(fā)現(xiàn),企業(yè)競爭不是比拼誰起步更早,而是比拼誰能走得更久、更遠。
而要想走得久遠,最核心的根源便是企業(yè)的進化能力,包括戰(zhàn)略、組織、品牌與產(chǎn)品等各個領(lǐng)域的進化。其中,產(chǎn)品進化最為關(guān)鍵,尤其在一些產(chǎn)業(yè)變化迅速的新興領(lǐng)域。
大模型便是這樣的一個典型領(lǐng)域。
隨著ChatGPT走紅帶來的大模型熱潮,短短數(shù)個月內(nèi),國內(nèi)便有近百家冠以“大模型”之名的企業(yè)出現(xiàn)。好的影響是,這股強大的力量將大大利于中國大模型產(chǎn)業(yè)的加速發(fā)展,但不好的影響是,這些企業(yè)中的大多數(shù)最終都無法逃脫被淘汰出局的宿命。接下來,產(chǎn)業(yè)內(nèi)將面臨一場空前激烈的競爭,誰的產(chǎn)品進化更快,擁有更好的用戶體驗,誰才有可能“剩者為王”。
從目前來看,兼具實力與靈活性的商湯科技表現(xiàn)出了最強的進化能力。就在前不久的2023世界人工智能大會(WAIC)上,商湯科技召開了“大愛無疆·日日新”人工智能論壇,在論壇上重磅推出了“商湯日日新SenseNova”大模型體系的全面升級,以及該體系下的一系列產(chǎn)品更新和落地成果。
例如,商湯商量SenseChat 2.0版本是商湯大模型體系中最為引人矚目的千億級參數(shù)自然語言處理模型,其突破了大語言模型輸入長度的限制,并推出了不同參數(shù)量級的模型版本,在知識信息準確性、邏輯判斷能力、上下文理解能力、創(chuàng)作性等方面均有大幅提升,可完美適配移動端、云端等不同終端及場景的應用需求,部署成本也大大降低。目前,商湯商量SenseChat 2.0版本已落地服務于醫(yī)療、金融、移動終端、代碼開發(fā)等領(lǐng)域。

商湯秒畫SenseMirage 3.0是商湯的自研生成式大模型,參數(shù)從今年4月首次發(fā)布以來的10億大幅提升至70億量級,能夠?qū)崿F(xiàn)專業(yè)攝影級的圖片細節(jié)刻畫,有進階需求的創(chuàng)作者,還可通過簡單拖拽的方式快速完成模型微調(diào),打造個人專屬的生成式AI模型。

商湯如影SenseAvatar 2.0數(shù)字人生成平臺相較1.0版本的語音和口型流暢度提升30%以上,能夠?qū)崿F(xiàn)4K高清視頻效果,并帶來AIGC生成形象及數(shù)字人歌唱功能。

商湯瓊宇SenseSpace 2.0的空間重建效率提升20%,渲染性能提升50%,每100平方公里場景的建圖時間僅需38小時即可完成(1200 TFLOPS/秒算力支持),可更高效地應用于城市級數(shù)字孿生場景。

商湯格物SenseThings 2.0對小物體的紋理及材質(zhì)還原達到毫米級精細度,并突破對高反光和鏡面物體的采集難題,這個突破讓“格物”能夠精確還原物品的外觀和特征,小到珠寶首飾、服飾、鞋包,大到家居裝飾、文物展覽、藝術(shù)展覽等,都能提供精細化的復刻效果。

從上述變化來看,商湯日日新(SenseNova)大模型體系的此次進化絕非簡單升級,而是在多維度實現(xiàn)了重大突破。
另外,值得一提的是,此次升級進化,距離“日日新”大模型4月10日的發(fā)布日期僅有3個月的時間,這與“日日新”寓意“模型迭代速度和處理問題的能力可以日日更新”高度匹配。
那么,商湯是如何在短短3個月時間,便實現(xiàn)了如此大的進化呢?
2
商湯憑什么?
筆者在對商湯科技這家企業(yè)進行詳細研究后發(fā)現(xiàn),其在大模型領(lǐng)域所取得的成績絕非偶然,也非一蹴而就。而是受益其在人工智能領(lǐng)域長期深耕而實現(xiàn)的能力領(lǐng)先與認知領(lǐng)先。
眾所周知,算力、算法與數(shù)據(jù)是人工智能領(lǐng)域的三個核心要素。商湯科技則憑借長期投入,在這三個領(lǐng)域都實現(xiàn)了深厚積累。公開數(shù)據(jù)顯示,截至2022年末,商湯研發(fā)隊伍高達3466人,占員工總數(shù)近70%,全年研發(fā)支出接近40億元。
首先在算法方面,商湯從2016年便開始在計算機視覺領(lǐng)域深耕,2017年發(fā)力決策智能,2019年涉足NLP語言類項目,在這個過程中積累了人工智能各個細分領(lǐng)域的算法,為大模型的研發(fā)打下了很好的算法基礎。并且在2019年還發(fā)布了10億參數(shù)的視覺大模型,到2022年參數(shù)升級到320億,為全球之最。
在算力方面,從2020年開始,商湯便在上海臨港建設了人工智能的算力中心AIDC。這個面積足足有20個足球場大的智算中心,擁有5000個服務器機柜和27000張GPU,規(guī)模遠超業(yè)界廣為流傳的“萬張GPU的大模型入場券”。

算力的優(yōu)勢除了體現(xiàn)在GPU卡的數(shù)量,還體現(xiàn)在多卡并行下的真實有效利用率。由于在大模型訓練時需要大量的GPU卡,當越來越多的卡連在一起,卡和卡之間的通信、網(wǎng)絡消耗就會越多,相應能夠真正發(fā)揮的有效算力就越少。
例如,行業(yè)公認1000塊連在一起的卡往往只能發(fā)揮60%的算力,剩余的40%在鏈接過程中就被損耗掉了。但商湯卻可以把千卡能效做到90%,耗損控制在10%,這也創(chuàng)造了行業(yè)天花板。
在數(shù)據(jù)方面,除了通用數(shù)據(jù)與專用數(shù)據(jù)的積累,商湯科技在整合、處理與使用數(shù)據(jù)等領(lǐng)域也具有豐富的經(jīng)驗。
在算力、數(shù)據(jù)與算法三個核心要素上的積累,讓商湯科技具備了在大模型領(lǐng)域持續(xù)進化的基礎能力。而在這些基礎能力之外,商湯科技還擁有另外一個更為重要,但較易被行業(yè)忽略的軟實力,就是對AI產(chǎn)業(yè)的深刻理解與前瞻判斷。
熟悉人工智能領(lǐng)域的產(chǎn)業(yè)人士,多熟知商湯人工智能算力中心5000P的強大算力,但較為忽視它背后的認知價值。從某種意義上講,5000P的總算力并非獨一無二,國內(nèi)具備5000P規(guī)模的智算中心也還有數(shù)家,但它們大部分都是化整為零、分散布置,由一個個200P、300P的節(jié)點組成。
在傳統(tǒng)的互聯(lián)網(wǎng)應用中,這種分散布置并無大礙。但在AI大模型訓練時,這些算力就必須集中在一個物理點,否則網(wǎng)絡就沒法支撐它去做同一個任務。商湯之所以在兩三年前,便將5000P算力放在一起,與長期深耕人工智能產(chǎn)業(yè)所形成的差異化認知密不可分。目前,商湯的AI大裝置已能夠以最大4000卡規(guī)模集群進行單任務訓練,并可做到七天以上不間斷地穩(wěn)定訓練。
另外,在2021年中推出“AI大裝置SenseCore”時,為了解決AI的長尾問題,商湯果斷選擇了用“超大算力+大參數(shù)模型”來實現(xiàn)AI具備更多通用能力的思路,這在當時是極為前瞻的思路。2022年底,ChatGPT的火爆,最終印證了商湯這種思路的前瞻性。

再以千卡集群90%的利用率為例,其主要得益于商湯科技超前預判市場需求,提前找到一批做高性能計算優(yōu)化以及網(wǎng)絡調(diào)試的細分人才,然后投入大量的時間與資源、一遍遍地調(diào)試,一點點積蓄優(yōu)勢,最終提升了整體利用率。
事實上,不管是大規(guī)模布局算力還是在細微處提升多卡利用率,這些事情并不復雜,誰堅持到最后就能形成難以復制的高核心能力。但關(guān)鍵難點在于,是否能在關(guān)鍵時點確定正確方向。
商湯科技的這種認知優(yōu)勢一方面得益于創(chuàng)始團隊行業(yè)領(lǐng)先的專業(yè)基因,另外一方面則是源于長期實踐過程中的積累。在這個過程中,其一直處在中國人工智能產(chǎn)業(yè)的最前沿,深入芯片、服務器、基礎軟件、工具軟件、算法生產(chǎn)到應用各環(huán)節(jié),形成了對整個AI全流程的理解力,并沉淀了大量的專業(yè)認知與工具。
前期正確預判往往要比后期行動更有價值。正是在上述認知領(lǐng)域的領(lǐng)先,最終帶來了商湯科技在能力上的領(lǐng)先,進而帶來在大模型產(chǎn)品上的更優(yōu)體驗與更快進化。
3
產(chǎn)業(yè)是大模型的最終歸宿
熟悉大模型領(lǐng)域的讀者會敏銳地注意到,最近一段時間中國的大模型產(chǎn)業(yè)正在發(fā)生著一個重要變化,就是越來越多的企業(yè)開始在大模型前面冠上“產(chǎn)業(yè)”二字。
在此背后,源于公眾對大模型的研究越來越多,也越來越意識到通用大模型所采用的通用信息存在一些錯誤、謠言與偏見,且專業(yè)知識與行業(yè)數(shù)據(jù)積累不足,導致該類模型的數(shù)據(jù)“噪音”過大,行業(yè)針對性與精準度不足,無法創(chuàng)造出深層次的價值。
在產(chǎn)業(yè)場景中,專業(yè)服務要求高、容錯性低,需要能夠在實際場景中真正解決具體的問題。因此,企業(yè)使用的大模型必須可信、可用、可控,而且最好是經(jīng)過反復與充分測試。
而商湯科技由于之前在人工智能領(lǐng)域產(chǎn)業(yè)的探索,其深知產(chǎn)業(yè)才是大模型的最終歸宿,“寫寫詩,聊聊天”并不能解決實際問題。所以在大模型領(lǐng)域,商湯一開始便建立了根深蒂固的產(chǎn)業(yè)思維。
在2023世界人工智能大會論壇現(xiàn)場,商湯科技CEO徐立便通過簡單地鼠標拖動,將商湯大模型在產(chǎn)業(yè)場景中的應用進行了直觀展現(xiàn),引得觀眾一片贊嘆。在徐立的現(xiàn)場“炫技”背后,是商湯領(lǐng)先的行業(yè)理解力與場景落地能力。如今,這些能力正通過商湯大模型融合滲透到金融、醫(yī)療、電商、移動終端與產(chǎn)業(yè)園區(qū)等各個產(chǎn)業(yè)賽道。

例如,在金融領(lǐng)域,商湯如影數(shù)字人可以助力金融機構(gòu)智能客服、智慧營銷等工作,并通過大語言模型能力實現(xiàn)投研分析、撰寫等新功能。
在數(shù)字內(nèi)容領(lǐng)域,商湯數(shù)字人與多個短視頻、直播頭部平臺達成戰(zhàn)略合作,共建“云+AIGC+短視頻直播”生態(tài)。商湯科技數(shù)字文娛事業(yè)部總經(jīng)理欒青直言,AIGC讓數(shù)字人進入了一個“真正可用的階段”。
目前,商湯的AI數(shù)字人已支持構(gòu)建數(shù)字人講解員、數(shù)字人主播、數(shù)字人醫(yī)生、數(shù)字人老師等,廣泛部署于購物中心、展館、旅游景區(qū)、銀行等行業(yè)。
在醫(yī)療場景,商湯打造的中文醫(yī)療語言大模型“大醫(yī)”,可提供導診、問診、健康咨詢、輔助決策等多場景會話服務,未來將支持醫(yī)學圖像、文本、結(jié)構(gòu)化數(shù)據(jù)等多模態(tài)分析,并提升醫(yī)療語言理解和推理能力。
而在智能汽車領(lǐng)域,商湯大模型的加持更是全方位的:它們正按照由內(nèi)到外、由淺到深的邏輯展開。例如,在座艙內(nèi),商湯通過視聽多模態(tài)融合,全方位感知、標記用戶偏好,提供更好的個。擬人化交互的“車艙大腦”還能為用戶帶來集安全、娛樂、教育及效率于一體的智能座艙體驗。
在車艙外,商湯與聯(lián)合實驗室首個提出了感知決策一體化的自動駕駛通用大模型UniAD,開創(chuàng)了以全局任務為目標的自動駕駛大模型架構(gòu),為自動駕駛技術(shù)與產(chǎn)業(yè)發(fā)展提出了新方向。同時,這個大模型也斬獲了行業(yè)最佳論文獎。

而在更外圍的智能交通領(lǐng)域,借助路側(cè)視覺感知大模型,瓊宇2.0以及格物2.0構(gòu)建智能交通孿生與仿真,并利用商量2.0的感知推理和人機交互能力,商湯還打造出車路云協(xié)同的交通體系。
在商湯看來,自動駕駛?cè)斯ぶ悄芟到y(tǒng)的核心是決策與判斷,而大模型經(jīng)過反復訓練學習可以無限接近正確決策。而在決策之外,語言大模型還可以輸出中間的邏輯推理過程,這讓未來自動駕駛系統(tǒng)有了可修復性。
上述各個產(chǎn)業(yè)的具體應用案例,充分展示了商湯大模型的技術(shù)領(lǐng)先性。不過大模型的對外賦能,除了技術(shù)領(lǐng)先帶來的用戶體驗,還很重要的是要能夠做到對外服務的成本領(lǐng)先。如果不能以較具競爭力的價格提供服務,也很難獲得客戶的信賴。
商湯科技聯(lián)合創(chuàng)始人,大裝置事業(yè)部負責人楊帆預測,未來國內(nèi)平臺型AI公司或只能存活3-5家,成本控制能力是決勝的關(guān)鍵要素之一。而商湯科技前瞻布局的AI基礎設施“商湯AI大裝置SenseCore”,實現(xiàn)了算法、算力與平臺的打通,以及軟硬件一體化協(xié)同的AI系統(tǒng)工程能力,這為商湯科技低成本,高質(zhì)量的行業(yè)賦能提供了保障,有望讓商湯科技成為大模型領(lǐng)域最具競爭力的角逐者之一。
4
結(jié)語
在2023世界人工智能大會上,徐立表示,商湯科技將“通過‘大模型+大裝置’持續(xù)推動AI基礎設施能力的躍進提升,不僅打造通用能力更加強大的基礎模型,也進一步高效融合不同垂直領(lǐng)域的專業(yè)知識,構(gòu)建更懂行業(yè)、更具專長的專業(yè)大模型,從根本上降低大模型的下游應用成本和門檻,讓大模型的產(chǎn)業(yè)價值在千行百業(yè)中綻放。”
簡言之,“更懂行業(yè)的大模型、更低的成本與門檻、更廣泛的產(chǎn)業(yè)賦能”,是徐立為商湯大模型中短期制定的務實方向。隨著產(chǎn)業(yè)的變遷,推動AGI(通用人工智能)時代的到來則是長期遠景。
一方面是長期深耕AI產(chǎn)業(yè)形成的認知領(lǐng)先,另一方面是在算力、算法與數(shù)據(jù)等領(lǐng)域長期積累形成的能力領(lǐng)先,二者將支撐商湯科技未來在大模型領(lǐng)域的持續(xù)進化。而一個能夠持續(xù)進化的大模型,將是助力商湯科技實現(xiàn)中短期戰(zhàn)略方向的最大底氣,也是支撐其實現(xiàn)未來AGI時代長期遠景的重要前提。
猜你喜歡
商湯完成戰(zhàn)略組織架構(gòu)重組,建立新“1+X”架構(gòu)
“1”代表商湯核心業(yè)務,“X”代表商湯的生態(tài)企業(yè)矩陣。商湯大模型的進化邏輯:認知領(lǐng)先與能力領(lǐng)先帶來的復利效應
一方面是作為AI產(chǎn)業(yè)先行者形成的認知領(lǐng)先,另一方面是在算力、算法與數(shù)據(jù)等領(lǐng)域長期積累形成的能力領(lǐng)先,以及在產(chǎn)業(yè)應用端的落地經(jīng)驗,將支撐商湯科技未來在大模型領(lǐng)域的持續(xù)進化。商湯澄清:控股股東沒有出售股份和出售計劃
7月12日晚,對于市場傳言“公司執(zhí)行董事兼控股股東湯曉鷗減持公司股份”一事,商湯集團股份有限公司(下稱“商湯”)發(fā)布澄清公告。快手一度跌超5%、商湯跌超3%,港股元宇宙概念股集體跳水
2月18日消息,港股元宇宙概念股集體跳水,快手跌超5%,商湯跌3.75%,嗶哩嗶哩跌3.2%,泡泡瑪特跌2.5%。AI四小龍商湯又被傳要上市:3家友商已邁出實質(zhì)性步伐
2月26日,有媒體報道,AI公司商湯內(nèi)部開會啟動A+H股上市,計劃2021年下半年交表。對此,商湯方面回復AI財經(jīng)社稱,市場傳言,不予置評。