商湯大模型的進化邏輯：認知領先與能力領先帶來的復利效應

礪石商業評論路言2023-07-27 10:33 大公司

一方面是作為AI產業先行者形成的認知領先，另一方面是在算力、算法與數據等領域長期積累形成的能力領先，以及在產業應用端的落地經驗，將支撐商湯科技未來在大模型領域的持續進化。

進化的商湯大模型

筆者在長期的商業研究過程中發現，企業競爭不是比拼誰起步更早，而是比拼誰能走得更久、更遠。

而要想走得久遠，最核心的根源便是企業的進化能力，包括戰略、組織、品牌與產品等各個領域的進化。其中，產品進化最為關鍵，尤其在一些產業變化迅速的新興領域。

大模型便是這樣的一個典型領域。

隨著ChatGPT走紅帶來的大模型熱潮，短短數個月內，國內便有近百家冠以“大模型”之名的企業出現。好的影響是，這股強大的力量將大大利于中國大模型產業的加速發展，但不好的影響是，這些企業中的大多數最終都無法逃脫被淘汰出局的宿命。接下來，產業內將面臨一場空前激烈的競爭，誰的產品進化更快，擁有更好的用戶體驗，誰才有可能“剩者為王”。

從目前來看，兼具實力與靈活性的商湯科技表現出了最強的進化能力。就在前不久的2023世界人工智能大會（WAIC）上，商湯科技召開了“大愛無疆·日日新”人工智能論壇，在論壇上重磅推出了“商湯日日新SenseNova”大模型體系的全面升級，以及該體系下的一系列產品更新和落地成果。

例如，商湯商量SenseChat 2.0版本是商湯大模型體系中最為引人矚目的千億級參數自然語言處理模型，其突破了大語言模型輸入長度的限制，并推出了不同參數量級的模型版本，在知識信息準確性、邏輯判斷能力、上下文理解能力、創作性等方面均有大幅提升，可完美適配移動端、云端等不同終端及場景的應用需求，部署成本也大大降低。目前，商湯商量SenseChat 2.0版本已落地服務于醫療、金融、移動終端、代碼開發等領域。

商湯秒畫SenseMirage 3.0是商湯的自研生成式大模型，參數從今年4月首次發布以來的10億大幅提升至70億量級，能夠實現專業攝影級的圖片細節刻畫，有進階需求的創作者，還可通過簡單拖拽的方式快速完成模型微調，打造個人專屬的生成式AI模型。

商湯如影SenseAvatar 2.0數字人生成平臺相較1.0版本的語音和口型流暢度提升30%以上，能夠實現4K高清視頻效果，并帶來AIGC生成形象及數字人歌唱功能。

商湯瓊宇SenseSpace 2.0的空間重建效率提升20%，渲染性能提升50%，每100平方公里場景的建圖時間僅需38小時即可完成（1200 TFLOPS/秒算力支持），可更高效地應用于城市級數字孿生場景。

商湯格物SenseThings 2.0對小物體的紋理及材質還原達到毫米級精細度，并突破對高反光和鏡面物體的采集難題，這個突破讓“格物”能夠精確還原物品的外觀和特征，小到珠寶首飾、服飾、鞋包，大到家居裝飾、文物展覽、藝術展覽等，都能提供精細化的復刻效果。

從上述變化來看，商湯日日新（SenseNova）大模型體系的此次進化絕非簡單升級，而是在多維度實現了重大突破。

另外，值得一提的是，此次升級進化，距離“日日新”大模型4月10日的發布日期僅有3個月的時間，這與“日日新”寓意“模型迭代速度和處理問題的能力可以日日更新”高度匹配。

那么，商湯是如何在短短3個月時間，便實現了如此大的進化呢？

商湯憑什么？

筆者在對商湯科技這家企業進行詳細研究后發現，其在大模型領域所取得的成績絕非偶然，也非一蹴而就。而是受益其在人工智能領域長期深耕而實現的能力領先與認知領先。

眾所周知，算力、算法與數據是人工智能領域的三個核心要素。商湯科技則憑借長期投入，在這三個領域都實現了深厚積累。公開數據顯示，截至2022年末，商湯研發隊伍高達3466人，占員工總數近70%，全年研發支出接近40億元。

首先在算法方面，商湯從2016年便開始在計算機視覺領域深耕，2017年發力決策智能，2019年涉足NLP語言類項目，在這個過程中積累了人工智能各個細分領域的算法，為大模型的研發打下了很好的算法基礎。并且在2019年還發布了10億參數的視覺大模型，到2022年參數升級到320億，為全球之最。

在算力方面，從2020年開始，商湯便在上海臨港建設了人工智能的算力中心AIDC。這個面積足足有20個足球場大的智算中心，擁有5000個服務器機柜和27000張GPU，規模遠超業界廣為流傳的“萬張GPU的大模型入場券”。

算力的優勢除了體現在GPU卡的數量，還體現在多卡并行下的真實有效利用率。由于在大模型訓練時需要大量的GPU卡，當越來越多的卡連在一起，卡和卡之間的通信、網絡消耗就會越多，相應能夠真正發揮的有效算力就越少。

例如，行業公認1000塊連在一起的卡往往只能發揮60%的算力，剩余的40%在鏈接過程中就被損耗掉了。但商湯卻可以把千卡能效做到90%，耗損控制在10%，這也創造了行業天花板。

在數據方面，除了通用數據與專用數據的積累，商湯科技在整合、處理與使用數據等領域也具有豐富的經驗。

在算力、數據與算法三個核心要素上的積累，讓商湯科技具備了在大模型領域持續進化的基礎能力。而在這些基礎能力之外，商湯科技還擁有另外一個更為重要，但較易被行業忽略的軟實力，就是對AI產業的深刻理解與前瞻判斷。

熟悉人工智能領域的產業人士，多熟知商湯人工智能算力中心5000P的強大算力，但較為忽視它背后的認知價值。從某種意義上講，5000P的總算力并非獨一無二，國內具備5000P規模的智算中心也還有數家，但它們大部分都是化整為零、分散布置，由一個個200P、300P的節點組成。

在傳統的互聯網應用中，這種分散布置并無大礙。但在AI大模型訓練時，這些算力就必須集中在一個物理點，否則網絡就沒法支撐它去做同一個任務。商湯之所以在兩三年前，便將5000P算力放在一起，與長期深耕人工智能產業所形成的差異化認知密不可分。目前，商湯的AI大裝置已能夠以最大4000卡規模集群進行單任務訓練，并可做到七天以上不間斷地穩定訓練。

另外，在2021年中推出“AI大裝置SenseCore”時，為了解決AI的長尾問題，商湯果斷選擇了用“超大算力+大參數模型”來實現AI具備更多通用能力的思路，這在當時是極為前瞻的思路。2022年底，ChatGPT的火爆，最終印證了商湯這種思路的前瞻性。

再以千卡集群90%的利用率為例，其主要得益于商湯科技超前預判市場需求，提前找到一批做高性能計算優化以及網絡調試的細分人才，然后投入大量的時間與資源、一遍遍地調試，一點點積蓄優勢，最終提升了整體利用率。

事實上，不管是大規模布局算力還是在細微處提升多卡利用率，這些事情并不復雜，誰堅持到最后就能形成難以復制的高核心能力。但關鍵難點在于，是否能在關鍵時點確定正確方向。

商湯科技的這種認知優勢一方面得益于創始團隊行業領先的專業基因，另外一方面則是源于長期實踐過程中的積累。在這個過程中，其一直處在中國人工智能產業的最前沿，深入芯片、服務器、基礎軟件、工具軟件、算法生產到應用各環節，形成了對整個AI全流程的理解力，并沉淀了大量的專業認知與工具。

前期正確預判往往要比后期行動更有價值。正是在上述認知領域的領先，最終帶來了商湯科技在能力上的領先，進而帶來在大模型產品上的更優體驗與更快進化。

產業是大模型的最終歸宿

熟悉大模型領域的讀者會敏銳地注意到，最近一段時間中國的大模型產業正在發生著一個重要變化，就是越來越多的企業開始在大模型前面冠上“產業”二字。

在此背后，源于公眾對大模型的研究越來越多，也越來越意識到通用大模型所采用的通用信息存在一些錯誤、謠言與偏見，且專業知識與行業數據積累不足，導致該類模型的數據“噪音”過大，行業針對性與精準度不足，無法創造出深層次的價值。

在產業場景中，專業服務要求高、容錯性低，需要能夠在實際場景中真正解決具體的問題。因此，企業使用的大模型必須可信、可用、可控，而且最好是經過反復與充分測試。

而商湯科技由于之前在人工智能領域產業的探索，其深知產業才是大模型的最終歸宿，“寫寫詩，聊聊天”并不能解決實際問題。所以在大模型領域，商湯一開始便建立了根深蒂固的產業思維。

在2023世界人工智能大會論壇現場，商湯科技CEO徐立便通過簡單地鼠標拖動，將商湯大模型在產業場景中的應用進行了直觀展現，引得觀眾一片贊嘆。在徐立的現場“炫技”背后，是商湯領先的行業理解力與場景落地能力。如今，這些能力正通過商湯大模型融合滲透到金融、醫療、電商、移動終端與產業園區等各個產業賽道。

例如，在金融領域，商湯如影數字人可以助力金融機構智能客服、智慧營銷等工作，并通過大語言模型能力實現投研分析、撰寫等新功能。

在數字內容領域，商湯數字人與多個短視頻、直播頭部平臺達成戰略合作，共建“云+AIGC+短視頻直播”生態。商湯科技數字文娛事業部總經理欒青直言，AIGC讓數字人進入了一個“真正可用的階段”。

目前，商湯的AI數字人已支持構建數字人講解員、數字人主播、數字人醫生、數字人老師等，廣泛部署于購物中心、展館、旅游景區、銀行等行業。

在醫療場景，商湯打造的中文醫療語言大模型“大醫”，可提供導診、問診、健康咨詢、輔助決策等多場景會話服務，未來將支持醫學圖像、文本、結構化數據等多模態分析，并提升醫療語言理解和推理能力。

而在智能汽車領域，商湯大模型的加持更是全方位的：它們正按照由內到外、由淺到深的邏輯展開。例如，在座艙內，商湯通過視聽多模態融合，全方位感知、標記用戶偏好，提供更好的個。擬人化交互的“車艙大腦”還能為用戶帶來集安全、娛樂、教育及效率于一體的智能座艙體驗。

在車艙外，商湯與聯合實驗室首個提出了感知決策一體化的自動駕駛通用大模型UniAD，開創了以全局任務為目標的自動駕駛大模型架構，為自動駕駛技術與產業發展提出了新方向。同時，這個大模型也斬獲了行業最佳論文獎。

而在更外圍的智能交通領域，借助路側視覺感知大模型，瓊宇2.0以及格物2.0構建智能交通孿生與仿真，并利用商量2.0的感知推理和人機交互能力，商湯還打造出車路云協同的交通體系。

在商湯看來，自動駕駛人工智能系統的核心是決策與判斷，而大模型經過反復訓練學習可以無限接近正確決策。而在決策之外，語言大模型還可以輸出中間的邏輯推理過程，這讓未來自動駕駛系統有了可修復性。

上述各個產業的具體應用案例，充分展示了商湯大模型的技術領先性。不過大模型的對外賦能，除了技術領先帶來的用戶體驗，還很重要的是要能夠做到對外服務的成本領先。如果不能以較具競爭力的價格提供服務，也很難獲得客戶的信賴。

商湯科技聯合創始人，大裝置事業部負責人楊帆預測，未來國內平臺型AI公司或只能存活3-5家，成本控制能力是決勝的關鍵要素之一。而商湯科技前瞻布局的AI基礎設施“商湯AI大裝置SenseCore”，實現了算法、算力與平臺的打通，以及軟硬件一體化協同的AI系統工程能力，這為商湯科技低成本，高質量的行業賦能提供了保障，有望讓商湯科技成為大模型領域最具競爭力的角逐者之一。

結語

在2023世界人工智能大會上，徐立表示，商湯科技將“通過‘大模型+大裝置’持續推動AI基礎設施能力的躍進提升，不僅打造通用能力更加強大的基礎模型，也進一步高效融合不同垂直領域的專業知識，構建更懂行業、更具專長的專業大模型，從根本上降低大模型的下游應用成本和門檻，讓大模型的產業價值在千行百業中綻放。”

簡言之，“更懂行業的大模型、更低的成本與門檻、更廣泛的產業賦能”，是徐立為商湯大模型中短期制定的務實方向。隨著產業的變遷，推動AGI（通用人工智能）時代的到來則是長期遠景。

一方面是長期深耕AI產業形成的認知領先，另一方面是在算力、算法與數據等領域長期積累形成的能力領先，二者將支撐商湯科技未來在大模型領域的持續進化。而一個能夠持續進化的大模型，將是助力商湯科技實現中短期戰略方向的最大底氣，也是支撐其實現未來AGI時代長期遠景的重要前提。

【本文為合作媒體授權博望財經轉載，文章版權歸原作者及原出處所有。文章系作者個人觀點，不代表博望財經立場，轉載請聯系原作者及原出處獲得授權。有任何疑問都請聯系（聯系（微信公眾號ID：AppleiTree）。免責聲明：本網站所有文章僅作為資訊傳播使用，既不代表任何觀點導向，也不構成任何投資建議。】

商湯