百度文心一言亮相
3月16日,百度自研的大語言模型“文心一言”正式亮相。百度董事長、CEO李彥宏在發布會現場表示,這是全球第一個直接對標ChatGPT甚至GPT-4的產品,盡管初期的使用體驗或許并不完美,百度還是堅持發布,一大原因是考慮到市場的需求。
據百度官方數據,至今已有650家客戶宣布接入文心一言生態。
3月16日起,文心一言即進入邀請測試階段。首批用戶可通過邀請測試碼,在文心一言官網體驗產品,更多用戶可后續陸續加入。
此外,百度智能云即將面向企業客戶開放文心一言API接口調用服務,3月16日起正式開放預約。
在發布會上,李彥宏展示了文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成這5個場景下的表現。
(圖源/百度)
在展示的demo中,文心一言對影視文藝作品、雞兔同籠等問題能夠“對答如流”。李彥宏稱,文心一言大模型的訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及5500億事實的知識圖譜等,這讓文心一言具備較強的中文理解能力。但同時,目前文心一言對英文語種、代碼場景的訓練還不夠多,表現還有待提升。
值得一提的是,輸入文字描述后,文心一言能夠生成圖片、語音、文字三種模態的內容。比較之下,OpenAI最新推出的GPT-4支持輸入圖片和文字,但只能生成文字。
在AI領域有一個“數據飛輪”的概念,也就是說:使用更多數據可以訓練出更好的模型,吸引更多用戶,從而產生更多用戶數據用于訓練,形成良性循環。這也解釋了百度代表的互聯網大廠們涌入AI大模型領域的原因。
不過,就像李彥宏在會上說的:“在AI技術發展的過程中,一大趨勢是從判別式AI向生成式AI發展……無論是哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學習、自然語言處理,需要多年的堅持和積累,沒法速成?!?
如果說ChatGPT、文心一言開啟了一波NLP(自然語言生成)大模型的產業浪潮,那么面向未來的技術深化、商業化落地等種種挑戰,AI企業們要走的路還有很長。
猜你喜歡
百度發布全球首個電商交易MCP、搜索MCP,幫助開發者全面擁抱MCP
百度Create AI開發者大會:李彥宏發布兩大新模型、多款熱門AI應用,幫助開發者全面擁抱MCP