騰訊正式發(fā)布向量數(shù)據(jù)庫,用于大模型訓(xùn)練

        獵云網(wǎng)韓文靜2023-07-05 10:55 大公司
        向量數(shù)據(jù)庫主要應(yīng)用于人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等領(lǐng)域。

        今日,騰訊云正式發(fā)布向量數(shù)據(jù)庫Tencent Cloud VectorDB,預(yù)計(jì)8月上線騰訊云官網(wǎng)。

        騰訊介紹道,該數(shù)據(jù)庫能夠被廣泛應(yīng)用于大模型的訓(xùn)練、推理和知識(shí)庫補(bǔ)充等場景,是國內(nèi)首個(gè)從接入層、計(jì)算層、到存儲(chǔ)層提供全生命周期AI化的向量數(shù)據(jù)庫。

        據(jù)了解,該數(shù)據(jù)庫面向大模型訓(xùn)練,可以讓企業(yè)原先花一個(gè)月時(shí)間才能完成的大模型接入,縮短到三天時(shí)間。


        大模型的“黃金搭檔”


        什么是向量數(shù)據(jù)庫?

        向量數(shù)據(jù)庫是一種專門用于存儲(chǔ)、 管理、查詢、檢索向量的數(shù)據(jù)庫,可以把復(fù)雜的非結(jié)構(gòu)化數(shù)據(jù)通過向量化,處理統(tǒng)一成多維空間里的坐標(biāo)值。

        目前,向量數(shù)據(jù)庫主要應(yīng)用于人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等領(lǐng)域。

        具體來看,向量數(shù)據(jù)庫被廣泛地用于大模型訓(xùn)練、推理和知識(shí)庫補(bǔ)充等場景:支撐訓(xùn)練階段海量數(shù)據(jù)的分類、去重和清洗,給大模型的訓(xùn)練降本增效;通過新數(shù)據(jù)的帶入,幫助大模型提升處理新問題的能力,突破預(yù)訓(xùn)練帶來的知識(shí)時(shí)間限制,避免大模型出現(xiàn)幻覺;提供一種私有數(shù)據(jù)連接大模型的方式,解決私有數(shù)據(jù)注入大模型帶來的安全和隱私問題,加速大模型在產(chǎn)業(yè)落地。

        簡而言之,向量數(shù)據(jù)庫可以解決大模型預(yù)訓(xùn)練成本高、沒有“長期記憶”、知識(shí)更新不足、提示詞工程復(fù)雜等問題,突破大模型在時(shí)間和空間上的限制,加速大模型落地行業(yè)場景。

        據(jù)第三方調(diào)研數(shù)據(jù)預(yù)測,全球向量數(shù)據(jù)庫到2030年預(yù)計(jì)將迎來超過500億美元的市場。國內(nèi)也將以每年超過20%的速度在增長。目前全球已有的向量數(shù)據(jù)庫產(chǎn)品主要包括 Pinecone、Milvus、Weaviate、Vespa 、Tencent Cloud VectorDB等。其中,超過一半的向量數(shù)據(jù)庫具有云化部署的能力。


        提供10億級(jí)向量檢索能力


        據(jù)介紹,騰訊云向量數(shù)據(jù)庫最高支持10億級(jí)向量檢索規(guī)模,延遲控制在毫秒級(jí),相比傳統(tǒng)單機(jī)插件式數(shù)據(jù)庫檢索規(guī)模提升10倍,同時(shí)具備百萬級(jí)每秒查詢(QPS)的峰值能力。

        具體而言,騰訊發(fā)布的向量數(shù)據(jù)庫有以下特點(diǎn)。

        一是高性能向量存儲(chǔ)、檢索。騰訊云向量數(shù)據(jù)庫具備高性能的向量存儲(chǔ)和檢索能力,單索引能夠輕松支持10億級(jí)別的向量規(guī)模。在分布式彈性擴(kuò)展的架構(gòu)下,單實(shí)例可支持百萬級(jí)別QPS,AI場景下向量檢索的P99響應(yīng)延遲可控制在20ms以內(nèi),能夠覆蓋絕大多數(shù)AI場景對(duì)向量存儲(chǔ)和檢索的業(yè)務(wù)需求。

        二是可視化數(shù)據(jù)管理。在向量存儲(chǔ)、檢索能力之上,騰訊云向量數(shù)據(jù)庫還提供了可視化的數(shù)據(jù)管理界面,進(jìn)一步降低向量數(shù)據(jù)庫的接入和使用門檻。用戶可以通過控制臺(tái)進(jìn)行數(shù)據(jù)庫、集合層面的數(shù)據(jù)管理,還可以快速執(zhí)行向量檢索等常用操作。此外,騰訊云向量數(shù)據(jù)庫還提供了可視化的數(shù)據(jù)上傳能力,幫助用戶快速構(gòu)建專屬知識(shí)庫。

        三是一站式向量檢索方案。為了進(jìn)一步提升產(chǎn)品的易用性,騰訊云向量數(shù)據(jù)庫會(huì)提供一站式的向量檢索方案,實(shí)現(xiàn)從文本輸入到文本搜索的端到端檢索能力,用戶可以直接上傳.pdf、.txt等原始文本文件,通過平臺(tái)自動(dòng)化地執(zhí)行文本分割、embedding向量化,全托管地完成知識(shí)構(gòu)建和檢索任務(wù)。

        騰訊官方信息稱,使用騰訊云向量數(shù)據(jù)庫后,企業(yè)接入大模型需要花費(fèi)的時(shí)間,能從一個(gè)月降低至三天左右,極大降低企業(yè)的接入成本。

        在具體落地應(yīng)用層面,騰訊方面表示,該向量數(shù)據(jù)庫目前已經(jīng)應(yīng)用在騰訊視頻、QQ瀏覽器、QQ音樂等30多款騰訊內(nèi)部產(chǎn)品之中。

        數(shù)據(jù)顯示,使用騰訊云向量數(shù)據(jù)庫后,QQ音樂人均聽歌時(shí)長提升3.2%、騰訊視頻有效曝光人均時(shí)長提升1.74%、QQ瀏覽器成本降低37.9%。

        騰訊方面表示,在未來“向量數(shù)據(jù)庫+大模型+數(shù)據(jù)”將產(chǎn)生“飛輪效應(yīng)”,共同助力企業(yè)步入AI Native(AI原生)時(shí)代。

        【本文為合作媒體授權(quán)博望財(cái)經(jīng)轉(zhuǎn)載,文章版權(quán)歸原作者及原出處所有。文章系作者個(gè)人觀點(diǎn),不代表博望財(cái)經(jīng)立場,轉(zhuǎn)載請(qǐng)聯(lián)系原作者及原出處獲得授權(quán)。有任何疑問都請(qǐng)聯(lián)系(聯(lián)系(微信公眾號(hào)ID:AppleiTree)。免責(zé)聲明:本網(wǎng)站所有文章僅作為資訊傳播使用,既不代表任何觀點(diǎn)導(dǎo)向,也不構(gòu)成任何投資建議。】

        猜你喜歡

        99ri精品国产亚洲| 久久精品国产精品亚洲| 亚洲精品网站在线观看你懂的| 欧洲 亚洲 国产图片综合| 亚洲一级片免费看| 亚洲国产模特在线播放| 久久久久国产亚洲AV麻豆| 国产亚洲人成在线影院| 久久亚洲国产伦理| 亚洲爆乳AAA无码专区| 精品久久久久久亚洲| 亚洲综合成人婷婷五月网址| 亚洲欧洲日产v特级毛片| 国产亚洲人成A在线V网站| 亚洲中文字幕AV在天堂| 亚洲18在线天美| 亚洲乱码中文字幕综合234| 亚洲欧洲精品久久| 亚洲国产美女精品久久久久| 亚洲人成网站日本片| 亚洲一卡2卡3卡4卡乱码 在线| 亚洲a级成人片在线观看| 久久亚洲精品国产亚洲老地址 | jlzzjlzz亚洲jzjzjz| 自拍日韩亚洲一区在线| 亚洲欧美aⅴ在线资源| 亚洲精品456在线播放| 亚洲一卡2卡3卡4卡国产网站 | 亚洲 暴爽 AV人人爽日日碰| 亚洲粉嫩美白在线| 亚洲av无码专区青青草原| 国产亚洲午夜精品| 国产亚洲人成网站在线观看| 久久精品国产亚洲麻豆| 久久亚洲私人国产精品vA| 33333在线亚洲| 九九精品国产亚洲AV日韩| 亚洲一卡一卡二新区无人区| 亚洲中文无码a∨在线观看| 亚洲一久久久久久久久| 久久亚洲AV成人无码国产电影|