OpenAI再次顛覆行業(yè)!GPT4新版本,API降價(jià)2/3,還有AI版Appstore
在OpenAI開發(fā)者日前夕,WiFi公司Meter的天使投資者兼產(chǎn)品負(fù)責(zé)人Nikunj Kothari在X上寫道:“自最初的iPhone時(shí)代以來,從未見過這么多開發(fā)者興奮地談?wù)摷磳⑼瞥龅漠a(chǎn)品。”
毫無疑問,這場OpenAI第一次的開發(fā)者大會(huì)受關(guān)注的程度直指科技春晚蘋果秋季發(fā)布會(huì),說是AI界春晚毫不為過。
大會(huì)剛開始,Sam Altman就列出了一串?dāng)?shù)字,表明OpenAI目前擁有200多萬開發(fā)人員,包括92%以上的財(cái)富500強(qiáng)公司用戶,以及一億周活用戶。這些官方數(shù)字直接證偽了自去年11月發(fā)布以來,ChatGPT的熱度正在逐漸消退的相關(guān)報(bào)道。
在秀完肌肉后,Sam Altman即刻端上了一道足以改變行業(yè)的大餐,以及一封爭奪AI應(yīng)用分發(fā)權(quán)的戰(zhàn)書。
頭盤:GPT4 Turbo
開場就是重頭戲。Sam Altman在簡單講述完GPT版本更新歷史后,就放出了他們最強(qiáng)大模型GPT-4 的Turbo升級(jí)版本。他稱其“更強(qiáng)大,也更便宜”。而且從今天開始,純文本的模型可以通過API預(yù)覽,OpenAI表示計(jì)劃在“未來幾周”內(nèi)全面提供包括多模態(tài)版本的GPT4-Turbo。
GPT4-Turbo的“更強(qiáng)大”體現(xiàn)在它的六大升級(jí)上。包括上下文長度提升,模型控制,更好的知識(shí),新的多模態(tài)能力,模型自定義能力及更低的價(jià)格,更高的使用上限。
對于一般用戶體驗(yàn)來講,上下文長度的增加,更好的知識(shí)和新的多模態(tài)能力是最核心的體驗(yàn)改善。
1)上下文長度升級(jí):這在過往是GPT4的一個(gè)軟肋。它會(huì)決定與模型對話過程中能接收和記住的文本長度。如果上下文長度限制較小,面對比較長的文本或長期的對話,模型就會(huì)經(jīng)常“忘記”最近對話的內(nèi)容,并開始偏離主題。GPT4基礎(chǔ)版本僅提供了8k token(字符)的上下文記憶能力,最近提供的拓展能力也僅僅能達(dá)到32k token,相比于主要競品Anthropic旗下 Claude 2 提供100k token的能力差距明顯。這使得GPT4在做文章總結(jié)等需要長文本輸入的操作時(shí)常常力不從心。但這次GPT-4 Turbo直接提供了一個(gè)128k token的上下文能力擴(kuò)充,是GPT-4擴(kuò)容版本的4倍,一舉提供了已商用大模型中最大的上下文容量,反超Claude 2。更形象的形容一下,128萬個(gè)token約10萬字或300頁書,可供參考的長度約為《呼嘯山莊》、《格列佛游記》和《哈利波特與阿茲卡班的囚徒》的長度。
2)更好的知識(shí)更新:GPT4-Turbo終于把知識(shí)庫更新到了2023年4月,不再讓我們停留在2年前的過去了。最初版本的GPT4的網(wǎng)絡(luò)實(shí)時(shí)信息調(diào)用只能到2021年9月。雖然隨著后續(xù)插件的開放,GPT4也可以獲得最新發(fā)生的事件知識(shí)。但相較于融匯在模型訓(xùn)練里的知識(shí)而言,這類附加信息因?yàn)檎{(diào)用插件耗時(shí)久,缺乏內(nèi)生相關(guān)知識(shí)的原因,效果并不理想。而現(xiàn)在,至少你可以獲得截止到今年四月前的新信息,獲取到很準(zhǔn)確的答案了。
3)新的多模態(tài)能力:主要是指部分用戶已經(jīng)體驗(yàn)到的Dalle3文生圖功能,文本到語音(TTS)即最近被各路展示的語音對話功能,以及整合了這些的GPT4Turbo with Vison多模態(tài)功能,可以識(shí)別圖片和語音輸入并產(chǎn)出對應(yīng)的生成內(nèi)容。這些都不是全新的功能,但他們的API在活動(dòng)當(dāng)日就全部開放給了開發(fā)者,這意味著后續(xù)會(huì)有更多的應(yīng)用,網(wǎng)站能把這些功能整合進(jìn)日常運(yùn)作中。
針對這些多模態(tài)功能的API使用,其定價(jià)也與純文字的Token定價(jià)不同,目前Vison的定價(jià)取決于輸入圖像的大小。例如,將1080×1080像素的圖像傳遞給GPT-4 Turbo需要0.00765美元。Dalle3根據(jù)不同格式和質(zhì)量選項(xiàng),生成每張圖像的起價(jià)為0.04美元。而TTS能力的接入價(jià)格從每輸入1000個(gè)字符0.015美元起。
在宣布多模態(tài)API開放的同時(shí),Sam也提到了Whisper V3將會(huì)在近日發(fā)布,GPT家族的語音識(shí)別能力又可以大幅提升。
對于開發(fā)者和程序員們而言,另外兩個(gè)升級(jí)更加重要。
4)更高的控制性:為實(shí)現(xiàn)對模型產(chǎn)出內(nèi)容更高的控制性,GPT Turbo提供了三個(gè)方面的升級(jí)。
一是函數(shù)調(diào)用更新,在技術(shù)文檔中,OpenAI解釋稱,函數(shù)調(diào)用允許用戶向模型描述應(yīng)用程序或外部API的函數(shù),并讓模型智能地選擇輸出包含參數(shù)的JSON對象來調(diào)用這些函數(shù),以達(dá)到使用外部程序能力的作用。而且過往的函數(shù)調(diào)用,一次交互只能調(diào)用一個(gè)函數(shù),即一個(gè)外部能力。但在GPT4 -Turbo中,一條指令可以平行調(diào)用多個(gè)操作,使得與外部應(yīng)用結(jié)合的復(fù)雜功能實(shí)現(xiàn)變得更容易。
二是改進(jìn)了指令跟隨,現(xiàn)在GPT4 Turbo能更好地理解限制性指令了。在需要仔細(xì)遵循指令的任務(wù)上,例如生成特定格式(例如,“始終以XML響應(yīng)”)表現(xiàn)更佳。它甚至還提供新的“JSON模式”,它確保模型能生成語法正確的JSON對象,不正確的語法則直接被否定掉不執(zhí)行。這在傳輸數(shù)據(jù)的網(wǎng)絡(luò)應(yīng)用程序中很有用。
三是可再現(xiàn)輸出,過往大語言模型經(jīng)常出現(xiàn)的一個(gè)問題是同一個(gè)問題的答案,問上幾次可能都會(huì)結(jié)果不同。為了保持模型的一致性,GPT4-Turbo可以通過種子參數(shù)讓大模型的回應(yīng)變得統(tǒng)一且可重復(fù)。
這一部分的升級(jí)實(shí)際上為后續(xù)GPT-4 Turbo的自定義可能和AI 智能體化( AI Agent)提供了堅(jiān)實(shí)的基礎(chǔ)。只有在調(diào)用外部工具變得更簡單,更穩(wěn)定的前提下,AI才能更好地進(jìn)行使用多工具完成復(fù)雜任務(wù)的工作。而這正是當(dāng)下智能體所需要的。
5)模型自定義能力:在今年8月22日,OpenAI剛剛上線可微調(diào)的GPT3.5 Turbo版本,兩個(gè)月后GPT4的可微調(diào)版本Turbo也來了,這意味著開發(fā)者終于可以在GPT4的基礎(chǔ)上進(jìn)行定制化調(diào)試訓(xùn)練了。但這個(gè)工作似乎并不容易,OpenAI在博客文章中寫道:“初步結(jié)果表明,與GPT-3.5微調(diào)實(shí)現(xiàn)的實(shí)質(zhì)性收益相比,GPT-4微調(diào)需要更多的工作來實(shí)現(xiàn)對基本模型的有意義的改進(jìn)。”
針對這個(gè)困難,OpenAI提供了一個(gè)Plus版本的微調(diào),即自定義模型。針對于那些需要比微調(diào)更多定制的組織(特別適用于擁有超大專有數(shù)據(jù)集的領(lǐng)域——至少有數(shù)十億個(gè)token),OpenAI給出內(nèi)部工程師協(xié)助訓(xùn)練模型,走完全程,從進(jìn)行額外的特定領(lǐng)域的預(yù)訓(xùn)練,到運(yùn)行為特定領(lǐng)域量身定制的自定義RL后訓(xùn)練過程。當(dāng)然,OpenAI表示這個(gè)機(jī)會(huì)不會(huì)太多,而且非常貴。
6)加量降價(jià):最后一個(gè)大升級(jí)就是大降價(jià)。OpenAI表示,GPT-4 Turbo對開發(fā)人員來說運(yùn)行成本更低。與GPT-4上的0.03美元相比,每1000個(gè)代幣(LLM讀取的基本文本或代碼單位)的輸入成本僅為0.01美元。每個(gè)輸出成本為每1000個(gè)令牌0.03美元。總體而言,新版GPT-4-Tubo比原始版本便宜2.75倍。而開放給API的token吞吐量也提升了一整倍。
Sam Altman在開發(fā)者的歡呼聲之后表示,不光價(jià)格降了,同時(shí)GPT4 Turbo的速度也會(huì)大幅提升。今天一過,AI開發(fā)者集體降本增效了。
英偉達(dá)工程師Jim Fan對此表示,OpenAI規(guī)模效應(yīng)帶來的價(jià)格優(yōu)勢太可怕了。
沙拉:納德拉上臺(tái),鞏固聯(lián)盟關(guān)系
上完了頭盤硬菜,Sam Altman邀請微軟CEO納德拉上場站臺(tái)。一番簡單寒暄過后,Sam詢問納德拉:微軟現(xiàn)在如何看待與OpenAI的合作關(guān)系?納德拉笑了大概3秒鐘才回應(yīng):我很愛你們,能和你們合作感覺很夢幻。但講到具體的合作時(shí)候,他更強(qiáng)調(diào)微軟當(dāng)前的首要任務(wù)是要讓Azure更好的支持“包括你們模型在內(nèi)”的大語言模型的訓(xùn)練和基礎(chǔ)設(shè)施建設(shè),讓開發(fā)者能更好的使用到AI帶來的技術(shù)革新。
針對Sam關(guān)于AI的未來會(huì)如何發(fā)展的第二個(gè)問題,納德拉依然是反躬自省。他強(qiáng)調(diào)微軟自認(rèn)為是個(gè)平臺(tái)公司,軟件開發(fā)公司和合作商公司,后續(xù)的目標(biāo)就是要提升算力和服務(wù),支持自己和其他開發(fā)者利用大模型賦能機(jī)構(gòu)和個(gè)人。不愧是公關(guān)大師,一套話術(shù)對兩個(gè)問題。
整個(gè)對話過程略顯尷尬,本來是為了強(qiáng)調(diào)合作關(guān)系的對話溝通卻始終彌漫著一種距離感。而且整段對話的基調(diào)都是OpenAI大步前沖,微軟自甘做個(gè)支持角色,多少有點(diǎn)適得其反。
正餐:GPTs,助手API及應(yīng)用商店
如果說GPT4 Turbo的更新是個(gè)硬菜,它也就是個(gè)較硬的前菜。因?yàn)樗暮芏嗌?jí)都是為GPTs這道主菜做引子。這才是這場發(fā)布會(huì)的主角。
1)GPTs
GPTs不是GPT的任何一個(gè)版本,而是屬于你的定制的GPT,一個(gè)能實(shí)現(xiàn)各種具體目的的智能體。
OpenAI提供了一個(gè)構(gòu)建GPTs的工具,GPT Builder,它包含三個(gè)功能,指令、擴(kuò)展知識(shí)和行動(dòng)。有了這幾個(gè)功能,能完成任務(wù)而非僅僅對話的智能體就可以輕松被構(gòu)建出來。而且通過自然語言就可以完成全流程。
在示范如何構(gòu)建一個(gè)屬于Sam Altman個(gè)人的定制GPT,幫助他為別人提供創(chuàng)業(yè)指導(dǎo)的過程中,這三個(gè)功能都被展現(xiàn)得很明確。
指令部分即一步步下達(dá)指令構(gòu)建GPTs。你說個(gè)GPT的應(yīng)用目標(biāo),GPT Builder會(huì)幫你生成GPT名字,再生成logo(profile picture)。之后GPT Builder會(huì)通過詢問具體限制,相關(guān)資料,逐步完善指令流程,最終完成應(yīng)用構(gòu)建。你根本不用規(guī)劃流程,它會(huì)用問題引導(dǎo)你。這一切都可以用你的母語完成。
如果你對引導(dǎo)的結(jié)果還不滿意,還可以在設(shè)置中直接進(jìn)行調(diào)節(jié)。
通過“知識(shí)擴(kuò)展”部分,用戶可以直接上傳自定義數(shù)據(jù),如DevDay事件時(shí)間表。
用戶還可以選擇是否調(diào)用模型模型能力,使GPT能訪問網(wǎng)頁瀏覽、DALL-E和OpenAI的代碼解釋器工具,用于編寫和執(zhí)行軟件。
最后通過另一個(gè)名為Actions的功能,OpenAI允許GPTs調(diào)用函數(shù),連接到外部服務(wù),即訪問電子郵件、數(shù)據(jù)庫等數(shù)據(jù),以完成復(fù)雜的工作組合。比如在后面的演示中出現(xiàn)的,回答用戶關(guān)于旅游地點(diǎn)信息的詢問時(shí),調(diào)用谷歌地圖或機(jī)票信息。
通過已有的幾個(gè)GPTs,Sam還演示了GPTs具體定制化后會(huì)有什么不同的能力。
如Code.org的編程課教師,就可以多用比喻的手法讓學(xué)習(xí)者更好地理解抽象的編程邏輯。
CanavaGPT可以直接連接到外部的Canava(一個(gè)海報(bào)生成網(wǎng)站),來幫助你根據(jù)需求生成相關(guān)網(wǎng)站。
你所建立或訂閱的所有GPTs都會(huì)在GPT主界面的左邊欄中與ChatGPT并列存在,可見OpenAI對此功能所給予的重視及優(yōu)先級(jí)。
當(dāng)然這優(yōu)先級(jí)是完全合理的。有著最新的模型接口,且將開發(fā)定制化智能體變得如此簡潔的GPTs,對于如AUtoGPT,Langchain之類過往提供基于AI的開發(fā)App的軟件平臺(tái)來講,就是降維打擊。而滿足各種調(diào)用功能的小型插件更是完全沒有了生存價(jià)值。對此,業(yè)內(nèi)早有評(píng)價(jià),稱OpenAI每次發(fā)布產(chǎn)品升級(jí),都會(huì)直接干掉一大批初創(chuàng)公司。
這項(xiàng)GPT創(chuàng)建功能將在晚些提供給付費(fèi)的ChatGPT Plus用戶和OpenAI企業(yè)客戶,他們可以為員工制作僅限內(nèi)部的GPTs。
2)助手API
針對有著更復(fù)雜需求的開發(fā)者或公司,OpenAI還提供了一個(gè)GPT Builder的升級(jí)版本,即助手API。
相較于普通GPT,助理API有更長的上下文能力,還可以利用檢索組件,補(bǔ)充更多外部知識(shí),并在內(nèi)部進(jìn)行檢索,連建庫都不需要,上傳就行。它還支持更強(qiáng)大的函數(shù)調(diào)用,使助手能夠調(diào)用開發(fā)人員定義的編程函數(shù),并將響應(yīng)包含在消息中。
3)應(yīng)用商店
那我們?nèi)绾螒?yīng)用這些已建好的GPT?OpenAI直接給出了一個(gè)GPT商店,它是這些GPT的分發(fā)平臺(tái)。與之前的插件商店不同,GPT應(yīng)用商店的意義更為重大。
從這個(gè)商店的界面看,用戶可以直接訂閱各種GPTs。因此可以把它理解成一個(gè)承載著諸多AI小程序的集合體。而如果它成功地構(gòu)建起了一套應(yīng)用生態(tài)的話,OpenAI也會(huì)變成一個(gè)真正的應(yīng)用平臺(tái),一個(gè)AI時(shí)代的產(chǎn)品分發(fā)入口。而它的封閉性(里面只有基于OpenAI的模型開發(fā)的應(yīng)用),也讓它多少有了些AI時(shí)代App Store的壟斷味道。
但這個(gè)地位并非只有OpenAI覬覦。各個(gè)大廠,包括微軟和蘋果都有自己的基于軟件的應(yīng)用市場。想在這里面再建個(gè)獨(dú)立的小市場,壟斷AI的應(yīng)用紅利,這很難不在后面引發(fā)和現(xiàn)在應(yīng)用分發(fā)巨鱷們的深度沖突。
為了更快地達(dá)到這一目標(biāo),OpenAI也為GPTs應(yīng)用開發(fā)者設(shè)定了完整的分成邏輯。Sam Altman表示,“本月晚些時(shí)候,我們將推出GPT商店,以經(jīng)過驗(yàn)證的建設(shè)者的創(chuàng)作為特色。一旦進(jìn)入商店,GPT就會(huì)變得可搜索,并可能在排行榜上攀升。我們還將重點(diǎn)關(guān)注我們在生產(chǎn)力、教育和“只是為了好玩”等類別中遇到的最有用、最令人愉快的GPT。在接下來的幾個(gè)月里,你還可以根據(jù)有多少人使用你的GPT來賺錢。”
雖然這場AI春晚震撼到了很多人,但還是有一個(gè)人不太為之所動(dòng)。馬斯克在看完發(fā)布會(huì)后發(fā)了條推繼續(xù)支持自家模型Grok,然后就去打暗黑四了。
猜你喜歡
剛剛,Sam Altman 反思來了:OpenAI將朝著超級(jí)智能邁進(jìn)
在 2025 年,可能會(huì)看到首批 AI 智能體“加入勞動(dòng)力市場”。紐約時(shí)報(bào)起訴微軟和OpenAI侵權(quán):擅用大模型,損失數(shù)十億美元
《紐約時(shí)報(bào)》掀起“媒體叫板AI”序幕。