人工智能“中國速度”!文心大模型3.5已整體超越ChatGPT!
文心一言不僅綜合評分超越ChatGPT,位居全球第一,更在內容生態、數據認知、知識問答三大維度評分超越ChatGPT,且六大維度評分均位列國內大模型榜首。同時,文心一言近20項細分測評指標排名全球第一,遙遙領先其他國產大模型。
報告中,人民數據選取文心一言、訊飛星火、通義千問、ChatGPT等四個大模型進行綜合能力測評,從內容生態、數據認知、言語理解、知識問答、邏輯推理、助力科研六個維度構建測評模型。
文心一言的綜合表現最佳,在社會熱點事件認知、信息來源權威性等維度評分遠超ChatGPT。但包括ChatGPT在內的多個大模型,出現了答非所問或應答問答現象,無法完整理解題意。
文心一言成為唯一超過評分均值的國內大模型,在個人信息安全、敏感數據保護層面領先于其他大模型。
文心一言在文本推理、算數推理能力上的評分均超過其他國內大模型各大模型均能做出準確回答,文心一言的分析最為詳細文心一言在“找規律問題”上能夠迅速發現一般性規律并得出正確答案,而其他國內AI大模型規律識別能力有待提升。
多個公開測評顯示,文心大模型3.5版支持下的文心一言中文能力突出,甚至有超出GPT-4的表現;綜合能力在評測中超過ChatGPT,遙遙領先于其他大模型。全球領先的IT市場研究和咨詢公司IDC最新發布的《AI大模型技術能力評估報告,2023》顯示,百度文心大模型3.5拿下12項指標的7個滿分,得到“綜合評分第一,算法模型第一,行業覆蓋第一”三個絕對第一;在新華網《國內LLM產品測試報告》中,百度文心一言整體領先,得分遠超ChatGPT3.5、訊飛星火和 ChatGLM,充分展現文心大模型的“國家隊”擔當。
模型效果提升50%,訓練速度提升2倍,推理速度提升30倍。
文心大模型頻頻取得“第一”,得益于百度“芯片-框架-模型-應用”四層技術棧優勢、知識增強的核心特色和繁榮的大模型生態三大優勢。百度擁有包含5500億知識的世界上規模最大的知識圖譜、最大的中文搜索引擎以及數據處理技術等,為文心大模型的快速迭代提供了堅實技術支撐。
猜你喜歡
宇樹科技到“杭州六小龍”,這批“90后軍團”給出了未來產業 “逆襲密碼”
從宇樹科技到當前被熱議的“杭州六小龍”,可以一窺當前“新質生產力”的發展趨勢。