百度:今年是文心大模型落地關(guān)鍵年

        獵云網(wǎng)黎曼2022-04-27 17:26 大公司
        大模型的出現(xiàn),大幅度降低了行業(yè)應(yīng)用的門(mén)檻。

        一項(xiàng)新的AI技術(shù)迎來(lái)突破,包括谷歌、微軟、英偉達(dá)、百度和阿里等在內(nèi)的幾乎所有AI頭部企業(yè)都在死磕這項(xiàng)技術(shù)。

        這便是目前世界AI研究領(lǐng)域最熱門(mén)的話題之一:“大模型”。

        AI 技術(shù)發(fā)展到今天,GPT-3等參數(shù)量巨大的模型被人們開(kāi)發(fā)出來(lái),他們?cè)谟?jì)算機(jī)視覺(jué)和自然語(yǔ)言處理等領(lǐng)域取得了前所未有的成就。

        與之相伴而來(lái)的是,隨著技術(shù)與產(chǎn)業(yè)的結(jié)合落地,新的技術(shù)難關(guān)需要被不斷攻克。

        眾所周知,AI 技術(shù)的驅(qū)動(dòng)力主要是依靠數(shù)據(jù)作為養(yǎng)料,當(dāng)AI嵌入各行各業(yè),不同場(chǎng)景的巨量數(shù)據(jù)已呈井噴式爆發(fā),如何減少數(shù)據(jù)標(biāo)注量、如何提高開(kāi)發(fā)效率、降低應(yīng)用成本等問(wèn)題已成為一眾AI企業(yè)正在思考的問(wèn)題。而這也已經(jīng)成為了各大AI企業(yè)搶占技術(shù)高地、并進(jìn)行商業(yè)化的關(guān)鍵命題。


        大模型是人工智能大基礎(chǔ)設(shè)施的重要組成


        “文心大模型”是百度近幾年在花大力氣投入研發(fā)的技術(shù)基礎(chǔ)設(shè)施。

        自2019年開(kāi)始,百度深耕預(yù)訓(xùn)練模型研發(fā),并在該年3月率先發(fā)布中國(guó)首個(gè)正式開(kāi)放的預(yù)訓(xùn)練模型ERNIE1.0。去年12月,百度聯(lián)合鵬城實(shí)驗(yàn)室發(fā)布了鵬城-百度·文心大模型。

        來(lái)源:企業(yè)供圖

        這是全球首個(gè)知識(shí)增強(qiáng)千億大模型,也目前全球最大中文單體模型,參數(shù)規(guī)模達(dá)到2600億。

        “文心大模型在百度AI戰(zhàn)略里的位置,是人工智能大基礎(chǔ)設(shè)施的一部分。大基礎(chǔ)設(shè)施就是硬件到芯片到AI框架、AI大模型,一層層構(gòu)筑起來(lái)的,文心是底座性質(zhì)的?!卑俣燃瘓F(tuán)副總裁吳甜介紹。

        如何理解這個(gè)AI大模型?

        AI大模型,指的其實(shí)是預(yù)訓(xùn)練大模型,是機(jī)器學(xué)習(xí)的一種方式。

        類(lèi)比人的學(xué)習(xí)來(lái)看,人的學(xué)習(xí)可以分成通識(shí)教育和專(zhuān)業(yè)教育兩段。預(yù)訓(xùn)練大模型相當(dāng)于解決機(jī)器學(xué)習(xí)的通識(shí)教育。

        此前,機(jī)器學(xué)習(xí)主要通過(guò)標(biāo)注數(shù)據(jù),告訴算法哪個(gè)數(shù)據(jù)是正負(fù)樣本等進(jìn)行學(xué)習(xí)。由于人工智能落地場(chǎng)景很多,每個(gè)場(chǎng)景都要采數(shù)據(jù)、標(biāo)數(shù)據(jù),因此在標(biāo)注的數(shù)量和質(zhì)量上存在很大的瓶頸。

        為解決以上問(wèn)題,自然語(yǔ)言處理領(lǐng)域迎來(lái)了一個(gè)新的突破:自監(jiān)督學(xué)習(xí)。其指的是不用人為標(biāo)注數(shù)據(jù),機(jī)器可以用一個(gè)方法把知識(shí)和規(guī)律學(xué)出來(lái)。

        比如,在模型訓(xùn)練中,如果我們把“中國(guó)的首都是北京這句話”中的“北京”蓋住,讓模型去猜中國(guó)的首都是哪里,模型可能會(huì)猜一個(gè)城市,再把蓋的地方翻開(kāi),告訴模型是對(duì)了還是錯(cuò)了,模型也就得到了反饋。這就是自監(jiān)督學(xué)習(xí)的其中一種方法。

        通過(guò)設(shè)計(jì)類(lèi)似的學(xué)習(xí)方式,讓模型可以在海量的數(shù)據(jù)當(dāng)中進(jìn)行自監(jiān)督學(xué)習(xí)。這個(gè)機(jī)制的好處就是,它可以把天然存在的大量數(shù)據(jù)利用起來(lái),打破了一定要精標(biāo)數(shù)據(jù)才能學(xué)習(xí)的瓶頸。

        大模型的出現(xiàn),實(shí)際大幅度降低了行業(yè)應(yīng)用的門(mén)檻。

        “大模型不僅可以自己直接商業(yè)化,更有可能作為大的基礎(chǔ)設(shè)施帶來(lái)的更大的價(jià)值空間?!眳翘鸱Q(chēng)。

        來(lái)源:企業(yè)供圖

        百度的文心大模型是如何運(yùn)營(yíng)的?

        百度早已不僅是搜索巨頭,更是一家人工智能公司,文心大模型已經(jīng)在搜索、信息流、小度智能屏、百度地圖等業(yè)務(wù)場(chǎng)景中不斷地去使用、驗(yàn)證、迭代,最終通過(guò)開(kāi)發(fā)出配套的工具和平臺(tái)服務(wù)于不同產(chǎn)業(yè),開(kāi)發(fā)者或者企業(yè)就可以用方便、簡(jiǎn)單的做法,甚至可以不寫(xiě)代碼就使用起來(lái)。

        在落地運(yùn)用方面,除了應(yīng)用于百度內(nèi)部的各類(lèi)產(chǎn)品外,文心大模型還通過(guò)飛槳開(kāi)源開(kāi)放平臺(tái)、百度智能云等賦能到工業(yè)、能源、金融、通信等行業(yè)。當(dāng)前,百度飛槳系列有兩款面向不同人群的平臺(tái),一是零門(mén)檻平臺(tái)EasyDL,二是全功能產(chǎn)業(yè)平臺(tái)BML,都已經(jīng)內(nèi)嵌了文心以及文心相應(yīng)的配套算法。

        在交付形態(tài)上,文心大模型大致上包含三種:第一種是通過(guò)API調(diào)用方式使用。第二種方式是通過(guò)平臺(tái)、套嵌工具等,使用者可以在EasyDL、BML等平臺(tái)上直接使用的。第三種是包含在一些面向場(chǎng)景的產(chǎn)品中,比如智能文檔分析TextMind,還有智能創(chuàng)作平臺(tái)。

        就AI大模型這個(gè)技術(shù)而言,不僅能落地解決當(dāng)前的產(chǎn)業(yè)遇到的難題,在未來(lái)同樣充滿想象空間。

        吳甜暢想道,今天的模型是以學(xué)習(xí)人類(lèi)的經(jīng)驗(yàn)為主的,學(xué)人形成的規(guī)律,加強(qiáng)人類(lèi)建設(shè)的一系列體系。未來(lái)有可能AI可以學(xué)到一些人類(lèi)還沒(méi)有學(xué)到的一些經(jīng)驗(yàn)或者知識(shí),這是未來(lái)有可能發(fā)生的事情。


        今年是文心大模型落地關(guān)鍵年


        在大模型領(lǐng)域角逐的,不僅有百度,國(guó)內(nèi)外科技巨頭如谷歌、微軟、英偉達(dá)、阿里等,都相繼在AI大模型領(lǐng)域展開(kāi)探索,參數(shù)規(guī)模從百億、到千億,甚至是上萬(wàn)億。

        對(duì)于當(dāng)下的大模型競(jìng)賽,吳甜表示,大模型本身還有很多創(chuàng)新空間,現(xiàn)在大家還是在各種不同角度的創(chuàng)新階段,每一家企業(yè)和機(jī)構(gòu)最后會(huì)產(chǎn)生的價(jià)值和作用,因此各自有所側(cè)重。

        百度文心大模型的定位是產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)大模型。吳甜介紹,文心大模型最大的特點(diǎn)是“知識(shí)增強(qiáng)”。

        傳統(tǒng)大模型只從海量的文本中學(xué)習(xí),只能死記硬背文本的規(guī)律,并不能從本質(zhì)上理解世界是怎樣運(yùn)行的,在具體應(yīng)用時(shí),一些涉及邏輯推理和認(rèn)知的任務(wù)表現(xiàn)較差。為彌補(bǔ)這一缺點(diǎn),百度引入了知識(shí)圖譜,通過(guò)“知識(shí)增強(qiáng)”的方法,將數(shù)據(jù)與知識(shí)融合,提升了文心大模型的通用性。

        此外,要理解文心大模型,就需要了解“產(chǎn)業(yè)級(jí)”的定義。吳甜解釋?zhuān)@個(gè)產(chǎn)業(yè)級(jí)主要指兩個(gè)方面:

        一方面,文心的整個(gè)技術(shù)是在實(shí)際的產(chǎn)業(yè)應(yīng)用過(guò)程中打造。首先,它的數(shù)據(jù)來(lái)源是產(chǎn)業(yè)當(dāng)中的數(shù)據(jù),學(xué)習(xí)到大量的知識(shí)規(guī)律,也是在實(shí)際的產(chǎn)業(yè)實(shí)踐當(dāng)中學(xué)習(xí)到的;任務(wù)設(shè)計(jì)上,百度希望把大模型打造成通用的底座模型,類(lèi)比人的通識(shí)教育,希望它學(xué)的盡可能廣泛,打下更好的基礎(chǔ)。

        另一方面,文心大模型在應(yīng)用時(shí)建設(shè)了一系列配套能力,讓行業(yè)更好用。比如怎樣設(shè)計(jì)數(shù)據(jù)的標(biāo)注、建議有多少數(shù)據(jù)、相應(yīng)的遷移學(xué)習(xí)的方法等等。通過(guò)這些配套的工具和平臺(tái),就會(huì)提升真實(shí)應(yīng)用的可行性。

        大模型能夠引起各大企業(yè)的競(jìng)相追逐,戰(zhàn)略眼光更著眼于遠(yuǎn)處。從世界以及國(guó)家層面來(lái)看,產(chǎn)業(yè)智能化升級(jí)早已是大勢(shì)所趨。今年1月,國(guó)家出臺(tái)了十四五數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃,可以看到國(guó)家對(duì)于數(shù)字經(jīng)濟(jì)發(fā)展重視程度也越來(lái)越高。大模型對(duì)于推動(dòng)數(shù)字經(jīng)濟(jì)發(fā)展有著莫大幫助。

        要在產(chǎn)業(yè)中應(yīng)用起來(lái),當(dāng)前大模型還面臨著不小的挑戰(zhàn)。吳甜認(rèn)為,當(dāng)前部分行業(yè)數(shù)字化水平還不高,AI真正跟各行各業(yè)、各種企業(yè)場(chǎng)景結(jié)合的時(shí)候,復(fù)雜度高。場(chǎng)景分散,而且很多場(chǎng)景還比較薄,很多時(shí)候獲取場(chǎng)景數(shù)據(jù)非常困難。

        另外,參數(shù)規(guī)模提升確實(shí)是有更好的效果,但卻不是簡(jiǎn)單的越大越好,更重要的還是模型能力強(qiáng)。

        文心大模型的下一步,是繼續(xù)創(chuàng)新技術(shù)水平,再增強(qiáng)其實(shí)用性。吳甜強(qiáng)調(diào),這并不是以迅速獲得更大的模型為目標(biāo),而是做出一款模型之后,在落地應(yīng)用中檢驗(yàn)效果,并在實(shí)用的過(guò)程當(dāng)中調(diào)整模型設(shè)計(jì)。

        在文心大模型的規(guī)劃上,百度今年還會(huì)有新技術(shù)和模型發(fā)布,包含模型能力和平臺(tái)工具能力的提升。“今年會(huì)是文心大模型產(chǎn)業(yè)落地關(guān)鍵年。 ”

        當(dāng)前,文心大模型通過(guò)飛槳開(kāi)源開(kāi)放平臺(tái)、百度智能云等平臺(tái)落地,個(gè)人、企業(yè)開(kāi)發(fā)者數(shù)量超6萬(wàn),并帶來(lái)顯著的提升效果。如在保險(xiǎn)領(lǐng)域的文本處理效率提升30倍,醫(yī)療領(lǐng)域中的每份病歷的檢查時(shí)間從30分鐘縮短到了秒級(jí)別。

        百度還把百文心大模型能力開(kāi)放給公眾使用,并舉辦了認(rèn)知AI創(chuàng)意賽?!叭斯ぶ悄芎痛竽P鸵嫦蚬婇_(kāi)放,只有門(mén)檻低到了所有人都可方便地用起來(lái),才能真正大規(guī)模爆發(fā)出各種創(chuàng)意?!眳翘鸨硎?。

        【本文為合作媒體授權(quán)博望財(cái)經(jīng)轉(zhuǎn)載,文章版權(quán)歸原作者及原出處所有。文章系作者個(gè)人觀點(diǎn),不代表博望財(cái)經(jīng)立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者及原出處獲得授權(quán)。有任何疑問(wèn)都請(qǐng)聯(lián)系(聯(lián)系(微信公眾號(hào)ID:AppleiTree)。免責(zé)聲明:本網(wǎng)站所有文章僅作為資訊傳播使用,既不代表任何觀點(diǎn)導(dǎo)向,也不構(gòu)成任何投資建議。】

        猜你喜歡

        亚洲精品动漫在线| 亚洲国产精品一区二区第一页免| 精品国产亚洲一区二区在线观看| 亚洲精品理论电影在线观看| 亚洲AV无码一区二区三区在线| 亚洲欧洲日产v特级毛片| 亚洲一区二区三区首页| 亚洲国产精品不卡在线电影| 久久精品国产亚洲AV果冻传媒| 亚洲乱色熟女一区二区三区丝袜| 亚洲人成在线播放网站| 亚洲精品制服丝袜四区| 亚洲欧洲成人精品香蕉网| 亚洲乱码中文字幕久久孕妇黑人| 亚洲欧洲无码AV电影在线观看 | 亚洲AV日韩精品一区二区三区 | 午夜亚洲国产理论片二级港台二级| 日韩亚洲不卡在线视频中文字幕在线观看 | 在线观看亚洲av每日更新| 国产亚洲精品线观看动态图| 亚洲中文字幕久久精品无码喷水| 国产亚洲精品国看不卡| 国产亚洲真人做受在线观看| 久久精品国产亚洲夜色AV网站| 亚洲男人天堂av| 亚洲性无码av在线| 最新亚洲精品国偷自产在线| 亚洲成av人在线观看网站| 国产成人亚洲精品无码AV大片| 亚洲精品国精品久久99热| 综合久久久久久中文字幕亚洲国产国产综合一区首 | 亚洲av午夜国产精品无码中文字| 色窝窝亚洲AV网在线观看| 亚洲国产精品激情在线观看| 久久久久亚洲爆乳少妇无 | 自拍日韩亚洲一区在线| 亚洲av无码一区二区三区四区| 亚洲国产中文字幕在线观看| 夜夜春亚洲嫩草影院| 亚洲精品免费视频| 亚洲欧洲日本在线观看|