人工智能“中國速度”！文心大模型3.5已整體超越ChatGPT！

博望財經博望財經2023-07-24 20:23 大公司

文心大模型頻頻取得“第一”，得益于百度“芯片-框架-模型-應用”四層技術棧優勢、知識增強的核心特色和繁榮的大模型生態三大優勢。

文心一言不僅綜合評分超越ChatGPT，位居全球第一，更在內容生態、數據認知、知識問答三大維度評分超越ChatGPT，且六大維度評分均位列國內大模型榜首。同時，文心一言近20項細分測評指標排名全球第一，遙遙領先其他國產大模型。

報告中，人民數據選取文心一言、訊飛星火、通義千問、ChatGPT等四個大模型進行綜合能力測評，從內容生態、數據認知、言語理解、知識問答、邏輯推理、助力科研六個維度構建測評模型。

文心一言的綜合表現最佳，在社會熱點事件認知、信息來源權威性等維度評分遠超ChatGPT。但包括ChatGPT在內的多個大模型，出現了答非所問或應答問答現象，無法完整理解題意。

文心一言成為唯一超過評分均值的國內大模型，在個人信息安全、敏感數據保護層面領先于其他大模型。

文心一言在文本推理、算數推理能力上的評分均超過其他國內大模型各大模型均能做出準確回答，文心一言的分析最為詳細文心一言在“找規律問題”上能夠迅速發現一般性規律并得出正確答案，而其他國內AI大模型規律識別能力有待提升。

多個公開測評顯示，文心大模型3.5版支持下的文心一言中文能力突出，甚至有超出GPT-4的表現；綜合能力在評測中超過ChatGPT，遙遙領先于其他大模型。全球領先的IT市場研究和咨詢公司IDC最新發布的《AI大模型技術能力評估報告，2023》顯示，百度文心大模型3.5拿下12項指標的7個滿分，得到“綜合評分第一，算法模型第一，行業覆蓋第一”三個絕對第一；在新華網《國內LLM產品測試報告》中，百度文心一言整體領先，得分遠超ChatGPT3.5、訊飛星火和 ChatGLM，充分展現文心大模型的“國家隊”擔當。

模型效果提升50%，訓練速度提升2倍，推理速度提升30倍。

文心大模型頻頻取得“第一”，得益于百度“芯片-框架-模型-應用”四層技術棧優勢、知識增強的核心特色和繁榮的大模型生態三大優勢。百度擁有包含5500億知識的世界上規模最大的知識圖譜、最大的中文搜索引擎以及數據處理技術等，為文心大模型的快速迭代提供了堅實技術支撐。

【本文為合作媒體授權博望財經轉載，文章版權歸原作者及原出處所有。文章系作者個人觀點，不代表博望財經立場，轉載請聯系原作者及原出處獲得授權。有任何疑問都請聯系（聯系（微信公眾號ID：AppleiTree）。免責聲明：本網站所有文章僅作為資訊傳播使用，既不代表任何觀點導向，也不構成任何投資建議。】