反擊OpenAI,谷歌多模態大模型Gemini上線,碾壓GPT4
當地時間12月6日,谷歌CEO桑達爾·皮查伊官宣 Gemini 1.0 版正式上線。據悉,這是迄今為止規模最大,能力最強的谷歌大模型。
桑達爾·皮查伊在一篇博文中寫道:“這個新模型代表了我們作為一家科技公司所做的最大的科學和工程努力之一,它也是一個多模態基礎模型,可以概括和理解不同類型的信息,包括文本、代碼、音頻、圖像和視頻。”
據悉,Gemini 1.0在谷歌內部籌備了一年之久,以應對當時引起巨大轟動的GPT4。目前,Gemini 1.0包括三種不同套件,分別是Gemini Ultra,、Gemini Pro以及Gemini Nano,不同量級的Gemini,可以觸達到不同范圍,能夠高效地運行在數據中心和移動設備等多類型平臺上。。
其中,Ultra的能力最強,復雜度最高,能夠處理最為困難的多模態任務;Pro能力稍弱,是一個可擴展至多任務的模型;Nano則是一款可以在手機端側運行的模型。
谷歌對 Gemini 模型進行了嚴格的測試,并評估了它們在各種任務中的表現,從表現來看,Gemini被稱為當下能力最強的大模型。據了解,從自然圖像、音頻和視頻理解,到數學推理等任務,Gemini Ultra 在大型語言模型研發被廣泛使用的 32 個學術基準測試集中,在其中 30 個測試集的性能超過當前 SOTA 結果。
此外,Gemini Ultra 在 MMLU(大規模多任務語言理解數據集)中的得分率高達 90.0%,首次超越了人類專家,更是超過了GPT4的86.4%的得分率。
在應用規劃方面,谷歌將在其產品中添加 Gemini,進行全線升級。谷歌的類 ChatGPT 應用 Bard 已經升級到了Gemini Pro版本,實現了更為高級的推理、規劃、理解等能力,同時繼續保持免費。而谷歌預計在明年初將推出Bard Advanced,將使用 Gemini Ultra。
在硬件上,谷歌還將 Gemini 引入了 Pixel。Pixel 8 Pro 將是第一款運行 Gemini Nano 的智能手機。接下來,Gemini 將陸續出現在谷歌其他的產品和服務中。