巖山科技在垂直場景找“?！苯猓瑪y子公司角逐“百模大戰(zhàn)”

獵云網(wǎng)孫媛2023-11-08 09:56 大公司

A股上市公司正闖入垂直行業(yè)大模型。

2023，百模大戰(zhàn)一觸即發(fā)。

各類大模型產(chǎn)品爭相涌現(xiàn)，不僅有阿里百度等大廠帶頭角逐通用大模型，美團創(chuàng)始人王興、光年之外創(chuàng)始人王慧文、智譜AI創(chuàng)始人唐杰、搜狗&百川智能創(chuàng)始人王小川等大佬更是以創(chuàng)業(yè)勢頭猛進。

近期，國產(chǎn)大模型更是迎來了集體突圍。

阿里“通義千問2.0”以參數(shù)規(guī)模達千億級加速追趕GPT-4；成立僅數(shù)月的百川智能半年內(nèi)發(fā)布了7版大模型，中英文表現(xiàn)超過Llama2。昆侖萬維宣布開源百億級大語言模型“天工”系列，在同等規(guī)模模型中展現(xiàn)出最佳效果。

隨著這場從年初打到年尾的“百模大戰(zhàn)”趨于白熱化，更多人開始有了新的疑問：我們真的需要這么多“?！眴幔咳绱烁咄度耄茏屇Ｐ吞峁┓叫兄劣麊?？而接入模型的企業(yè)到底能從“?！敝惺芤娑嗌?？

或許，答案就藏于“?！痹诖怪眻鼍皯玫膶嵅僦?。

前百度工程師二次創(chuàng)業(yè)，給垂直場景應用找“模”解

在垂直場景應用這一練兵場，打造標桿形成行業(yè)示范，成為各路玩家新的突圍方向，巖芯數(shù)智也是其中之一。

在中國科學技術(shù)大學研究生就讀期間，機器學習領(lǐng)域科班出身的劉凡平在微軟完成了畢業(yè)論文的撰寫，并在國內(nèi)外計算機眾多賽事中獲得獎項。后來懷揣著對機器學習濃厚的興趣，他便在百度以工程師的身份從事起了相關(guān)工作。

這期間，他兩次出走創(chuàng)業(yè)。

第一次是奔赴深度學習，第二次便是去年年初對大模型的擁抱。

從事搜索技術(shù)研究的劉凡平，一直認為搜索應該是所搜即所得，而不是所謂的給一堆網(wǎng)頁。在看到這一行業(yè)痛點后，他認為現(xiàn)有技術(shù)足以解決這個問題，也值得其再做一次創(chuàng)業(yè)嘗試。

在擔任百度資深工程師、二三四五（巖山科技前身）算法總監(jiān)時，劉凡平一直深入研究深度學習技術(shù)，自主設計各類模型，并落地應用，作為發(fā)明人申請人工智能技術(shù)相關(guān)專利20 余項。

但是，在以解決業(yè)務實際問題為導向的實踐中，銀行客戶的一句“能用，但不夠好”的反饋讓劉凡平意識到，對于垂直行業(yè)場景來說，通用大模型不算一個足夠好的“?！狈?。

為了深入客戶業(yè)務，劉凡平帶著團隊在接下來的一周直接到客戶辦公室一起辦公。在了解了他們的工作模式，以及他們?nèi)绾螒矛F(xiàn)有系統(tǒng)后，劉凡平發(fā)現(xiàn)，當前行業(yè)尤其是通用的大模型，面臨著算力成本高的挑戰(zhàn)，雖有很強的通用任務能力，卻不足以解決眾多企業(yè)的具體問題。

這就反向要求模型提供方去從融合企業(yè)數(shù)據(jù)及業(yè)務去構(gòu)建超大型的產(chǎn)業(yè)場景，才會使AI大模型落地垂直行業(yè)，發(fā)揮出更大的價值。但是，垂直行業(yè)模型從研發(fā)到落地，耗時耗力，這些“苦活、累活”并不受大多數(shù)大模型廠商所待見。

但這些活卻是劉凡平認為要做好垂直行業(yè)模型這一解決方案的關(guān)鍵，也是大模型應用落地的最后一公里。

“客戶只關(guān)心問題能不能解決和優(yōu)化，是不是通過大模型做到并不重要。很多廠商銷售的是MaaS平臺，但如果不深入具體的某一場景，梳理業(yè)務發(fā)展的需求或問題，就不能給到客戶所要的MaaS平臺背后的產(chǎn)品和服務。在給客戶業(yè)務需求提供解決方案的過程中，大模型只是解決方案中的一環(huán)?！?

在一線充分認識到企業(yè)信息化、數(shù)字化建設的迫切需求，劉凡平快速改進了之前的通用方案，從客戶實際業(yè)務和案例去構(gòu)建產(chǎn)品原型，從原有的AI通用大模型衍生到銀行業(yè)的任務模型，實現(xiàn)了垂直行業(yè)模型的快速落地。

從實踐中檢驗并迭代大模型的能力，在劉凡平看來，并不是單點，而是一個生態(tài)鏈構(gòu)建的過程。

“從事大模型行業(yè)不僅要建構(gòu)大模型，還要提供整套解決方案。雖然這樣一來，在接觸一個新行業(yè)時，對模型提供方來說成本會比較高，但一旦接觸好了，后期成本就會大大降低，客戶也更易接受、更好適用。”

他強調(diào)，科技類的基礎創(chuàng)新和應用的確是一個慢工出細活的過程，只是單純的做Transformer架構(gòu)的復制者沒有意義，行業(yè)大模型的設計核心是圍繞業(yè)務進行數(shù)據(jù)和模型的構(gòu)建，以及應用服務的構(gòu)建。

“從這個角度講，巖芯更多是和客戶作為一個共同體在垂直行業(yè)建模，這是彼此的相輔相成。”

“可控可信”+“高性價比”，成行業(yè)數(shù)智化解法

事實上，雖然現(xiàn)在“百模大戰(zhàn)”打得火熱，但問題也很顯而易見，即不可避免陷入“一本正經(jīng)的胡說八道”的幻覺問題。

劉凡平坦言，Transformer架構(gòu)底層設計邏輯決定了對訓練數(shù)據(jù)量的要求極大，幻覺問題包括訓練的資源消耗已成行業(yè)通病，導致用戶對大多數(shù)模型的輸出結(jié)果產(chǎn)生了“好像能相信，但又不可信”的感受。

“幻覺”其實也是大模型的智能體現(xiàn)，但是對于大模型已學習過的知識，希望能夠按照已學習過的內(nèi)容客觀表達，而為了避免無效的大模型幻覺，讓模型輸出結(jié)果更可控可信，實現(xiàn)大模型助力行業(yè)數(shù)字化和智能化的升級轉(zhuǎn)型，巖芯數(shù)智在數(shù)據(jù)質(zhì)量管理和算法創(chuàng)新上花了大功夫，提出了基于記憶和邏輯的大模型建設思路。

首先在數(shù)據(jù)層面，巖芯數(shù)智的數(shù)據(jù)在保證安全可用的情況下，選擇來自互聯(lián)網(wǎng)公開的數(shù)據(jù)、專業(yè)領(lǐng)域的數(shù)據(jù)，以及其他授權(quán)數(shù)據(jù)。

前面的兩方面數(shù)據(jù)是為打造垂直領(lǐng)域的行業(yè)模型，而企業(yè)客戶所提供的數(shù)據(jù)則用于為了更好優(yōu)化模型，使其輸出結(jié)果更符合目標企業(yè)的需求。

在技術(shù)創(chuàng)新側(cè)，巖芯數(shù)智則是通過自研Transformer架構(gòu)的大模型和非Trasformer架構(gòu)的大模型來根據(jù)客戶實際情況進行調(diào)度，通過對模型的不斷迭代完善模型效率及應用體驗。

從去年開始，巖芯數(shù)智就通過對第二代Transformer架構(gòu)模型的自主改進，大幅提升了模型性能。

在第三次迭代中，巖芯從零開始訓練并建構(gòu)了非Transformer底層架構(gòu)的大模型，即記憶邏輯模型，通過無監(jiān)督學習直接對數(shù)據(jù)學習，再通過微調(diào)的方式得到結(jié)果，強化模型記憶能力，使其在訓練效率、推理效率以及應用效果層面都得到很大的提升，可有效降低幻覺對應用效果的影響。

劉凡平表示，技術(shù)創(chuàng)新及對優(yōu)質(zhì)數(shù)據(jù)的精選二者結(jié)合促成了模型的“可控可信”，在決策時可通過參考內(nèi)容提供并追溯信息源，可準確判定生成內(nèi)容的安全性，可預測輸出結(jié)果的價值并預判非安全行為的發(fā)生，能夠在實現(xiàn)多樣性輸出的同時，保障輸出結(jié)果的相對公平性和包容性。

同時，巖芯數(shù)智的記憶邏輯模型由于大模型成本和訓練效率在服務器比別人少、算力成本可降至30%~40%的情況下，仍能達到較好的效果，從一定成本上使其解決方案更為降本。

“可控可信”+“高性價比”，恰好是行業(yè)所亟需的數(shù)智化解法。

劉凡平依稀記得，在為一家企業(yè)客戶介紹完巖芯垂直大模型后，就要求巖芯“立刻”幫其解決自動化管理數(shù)據(jù)的難題，甚至希望公司能立即派人前往支持。

“這是一種由強烈需求激發(fā)出來的動作。智能化管理數(shù)據(jù)過程不能出任何差錯，智能化程度越高，專業(yè)度也會更高，對模型要求也會更高。得知巖芯數(shù)智可控可信的大模型能夠幫助他解決這一塊問題后，他就希望能趕緊接入?！?

雖然這家企業(yè)也同時溝通了多家大模型提供方，但最后還是選擇了巖芯。據(jù)悉，不到一個月時間，巖芯數(shù)智就針對其業(yè)務提供了基于大模型的自動化數(shù)據(jù)管理方案。

劉凡平透露，通過巖芯的垂直行業(yè)大模型，能夠為企業(yè)降低近約30%的成本投入。

深入業(yè)務打通“最后一公里”，縱向做深、橫向拓寬

據(jù)介紹，巖芯為企業(yè)提供的模型解決方案有兩種。

一種是客戶可以直接接入巖芯的垂直行業(yè)模型，但這就需要企業(yè)有自研能力，包括信息化部門、運維團隊等，門檻相對較高。

另一種則是由巖芯提供一套深入客戶業(yè)務的大模型解決方案，主要針對制造業(yè)等信息化程度較低的傳統(tǒng)行業(yè)，以及對迫切的生產(chǎn)力變革有著極大訴求的中小企業(yè)，需要模型提供方提供更多支持。

相較于前者，后者的深入業(yè)務過程和私有化部署在劉凡平看來，意味著巖芯扛下了“所有累活”，為企業(yè)打通了模型應用落地的最后一公里。

劉凡平坦言，如果僅僅在通用大模型的基礎上，利用行業(yè)數(shù)據(jù)進行微調(diào)，最終的應用效果其實并不足以滿足用戶的實際需求。但如果在通用數(shù)據(jù)的基礎上，再加上行業(yè)的專業(yè)數(shù)據(jù)以及業(yè)務數(shù)量進行預訓練，即通過企業(yè)的私有化數(shù)據(jù)對模型進行預訓練，那就會用更專業(yè)的數(shù)據(jù)產(chǎn)生更專業(yè)的智能涌現(xiàn)現(xiàn)象。

值得注意的是，私有化升級在早期也面臨著數(shù)據(jù)安全問題。

針對此，劉凡平也給出了巖芯數(shù)智的解法。一是客戶可以通過少量數(shù)據(jù)提供，結(jié)合巖芯現(xiàn)有數(shù)據(jù)，在私有云上進行訓練；二是可以基于巖芯建立的垂直行業(yè)大模型，改進算法后在客戶的機器上進行訓練。如此一來，巖芯無需翻閱數(shù)據(jù)，客戶只需將數(shù)據(jù)放在指定目錄下，啟動模型訓練指令，即可在客戶方進行模型訓練，完成一個內(nèi)部的私有化升級。

據(jù)介紹，巖芯大模型通過實現(xiàn)私有化部署，可以將客戶內(nèi)部權(quán)限及模型大腦打通，以實現(xiàn)安全的權(quán)限管理，以提供豐富的企業(yè)應用插件，響應企業(yè)內(nèi)部的多元需求，輔助大模型的落地應用，并且這些插件通用，比如搜索引擎、天氣、股市等插件，或報銷流程、請假插件等，滿足客戶的廣泛需求，把模型的能力賦能到企業(yè)內(nèi)部的流程工具當中，以提升生產(chǎn)效率。

據(jù)悉，從今年6月開始，巖芯數(shù)智的垂直行業(yè)大模型就開始商業(yè)化，并率先應用于對降本增效訴求較為強烈的金融和制造業(yè)，合作了數(shù)家案例。

其中，巖芯數(shù)智與郵儲銀行合作成立了國內(nèi)最早一批銀企聯(lián)動AIGC項目，針對組織架構(gòu)、硬件保障、軟件創(chuàng)新等方面進行了重點部署，著重滿足銀行業(yè)務對內(nèi)容專業(yè)性、嚴謹性、可解釋性、合規(guī)性、數(shù)據(jù)安全性等要求。雙方也將持續(xù)深化技術(shù)探索與產(chǎn)業(yè)投研建設，逐步實現(xiàn)投產(chǎn)落地與產(chǎn)業(yè)升級。

“通過深耕垂類場景，巖芯數(shù)智希望構(gòu)建實現(xiàn) ‘1個MaaS平臺，多種應用場景策略’，為行業(yè)開發(fā)可信賴的、高性能的垂類模型。未來在15-30天內(nèi)即能完成對一個企業(yè)客戶的私域模型部署?！?

角逐百模大戰(zhàn)，一家創(chuàng)企能有多少制勝點？

回歸商業(yè)本質(zhì)，隨著百模大戰(zhàn)開啟、大廠頭部效應顯著，價格戰(zhàn)不可避免，如此來看，給創(chuàng)企留下的盈利空間似乎不多。

以始為終來看，巖芯數(shù)智也做從兩個維度做了準備。

一方面，是“往前多邁一步”的技術(shù)創(chuàng)新。在劉凡平看來，無論是企業(yè)或產(chǎn)品，一定要領(lǐng)先行業(yè)才能收獲更多機會。

“目前國內(nèi)大部分用開源模型進行微調(diào)的產(chǎn)品，其實真正具備自研能力的模型并不多，前者很可能在后面商業(yè)化的浪潮中受到很大的影響，而巖芯大模型具有自主知識產(chǎn)權(quán)，可以對模型進行深度改造及深度的業(yè)務適配，擁有對模型底層的構(gòu)建把控能力?！?

據(jù)悉，巖芯數(shù)智新一代模型已開始布局多模態(tài)的實時人機交互系統(tǒng)，通過多種感知方式完善自主認知及控制能力。

另一方面，構(gòu)建企業(yè)級AI差異化優(yōu)勢的關(guān)鍵，是要根據(jù)客戶的特定需求來定制和調(diào)整技術(shù)，巖芯也會通過服務客戶、融入業(yè)務來構(gòu)建更深的行業(yè)壁壘。

“垂直行業(yè)大模型需要根據(jù)行業(yè)屬性提供場景化服務，而行業(yè)數(shù)據(jù)的累積對于AIGC和大模型具有壁壘價值。在訓練語料方面，除常規(guī)的涵蓋該領(lǐng)域的專業(yè)知識和術(shù)語外，定制的模型還將包含特定領(lǐng)域的實際案例和數(shù)據(jù)、專家的經(jīng)驗和見解等，以適應不同垂直領(lǐng)域特定的語言風格和表達方式?！?

隨著由ChatGPT掀起的大模型浪潮從通用領(lǐng)域席卷垂直領(lǐng)域，政務、公共安全、醫(yī)療、金融、健康、制造業(yè)等領(lǐng)域都在開發(fā)專用垂直細分賽道的大模型產(chǎn)品，加速AI應用的場景化落地進程，A股上市公司也紛紛成為玩家中的主力軍。

譬如巖芯數(shù)智背靠的巖山科技，近年來也全面擁抱人工智能，已在人工智能領(lǐng)域的智能駕駛、類腦智能、AIGC等新興領(lǐng)域進行了布局。巖芯數(shù)智的成立，既代表著老牌互聯(lián)網(wǎng)公司角逐新時代的決心，也意味著這波大模型的廝殺已從上半場的自研走入下半場的卷資源、卷落地的商業(yè)化篇章。

大浪淘沙之下，實踐檢驗真理的時刻或許到了。

【本文為合作媒體授權(quán)博望財經(jīng)轉(zhuǎn)載，文章版權(quán)歸原作者及原出處所有。文章系作者個人觀點，不代表博望財經(jīng)立場，轉(zhuǎn)載請聯(lián)系原作者及原出處獲得授權(quán)。有任何疑問都請聯(lián)系（聯(lián)系（微信公眾號ID：AppleiTree）。免責聲明：本網(wǎng)站所有文章僅作為資訊傳播使用，既不代表任何觀點導向，也不構(gòu)成任何投資建議?！?/div>