奧特曼深夜發(fā)動(dòng)價(jià)格戰(zhàn)，GPT-4o mini暴跌99%！清華同濟(jì)校友立功，GPT-3.5退役

2024-07-20 08:00:47 來(lái)源：用戶：

相信很多大家對(duì)奧特曼深夜發(fā)動(dòng)價(jià)格戰(zhàn)，GPT-4o mini暴跌99%！清華同濟(jì)校友立功，GPT-3.5退役還不知道吧，今天菲菲就帶你們一起去了解一下~.~！

【新智元導(dǎo)讀】GPT-4o mini深夜忽然上線，OpenAI終于開(kāi)卷小模型!每百萬(wàn)輸入token已達(dá)15美分的超低價(jià)，跟GPT-3相比，兩年內(nèi)模型成本已降低99%。Sam Altman驚呼:通往智能的成本，已變得如此低廉!另外，清華同濟(jì)校友為關(guān)鍵負(fù)責(zé)人。

OpenAI，也開(kāi)始進(jìn)軍小模型了。

就在今天深夜，GPT-3.5退場(chǎng)，全新發(fā)布的GPT-4o mini，更小、性能更強(qiáng)，更重要的是——更便宜!

GPT-3.5，再見(jiàn)!

每百萬(wàn)個(gè)輸入token15美分，每百萬(wàn)個(gè)輸出token60美分，MMLU得分82%，性能超快。

CEO Sam Altman感慨道:通往智能的成本，竟是如此低廉。

是的，如火如荼的大模型價(jià)格戰(zhàn)，OpenAI也入場(chǎng)了。

Altman回顧說(shuō):就在2022年，世界上最好的模型是還是text-davinci-003（GPT-3的版本）。

但如今，與這個(gè)新模型相比，text-davinci-003差得太多太多。甚至，價(jià)格要高出100倍。

相較于GPT-3.5，GPT-4o mini性能更強(qiáng)，價(jià)格還要便宜60%以上，成本直線下降。

大模型的成本，兩年間下降了99%，等再過(guò)幾年呢?簡(jiǎn)直不敢想。

以前，用OpenAI模型構(gòu)建應(yīng)用程序可能會(huì)產(chǎn)生巨額費(fèi)用，沒(méi)有能力對(duì)其修改的開(kāi)發(fā)者，極有可能放棄它，轉(zhuǎn)投更便宜的模型，比如谷歌的Gemini1.5Flash或者Anthropic的Claude3Haiku。

如今OpenAI終于等不住，出手了。

現(xiàn)在，所有人都可以在ChatGPT中用上GPT-4o mini了。

小模型，但對(duì)標(biāo)GPT-4Turbo

GPT-4o mini的知識(shí)更新到去年10月，語(yǔ)言種類和GPT-4o對(duì)齊，上下文窗口為128k。

目前在API中僅支持文本和視覺(jué)模態(tài)，未來(lái)還將擴(kuò)展到視頻和音頻的輸入/輸出。

雖然沒(méi)有披露參數(shù)規(guī)模，但OpenAI的官博文章表示，這是他們目前最經(jīng)濟(jì)、最有成本效益的小模型，微調(diào)功能也將很快上線。

神奇的是，GPT-4o mini在LMSYS排行榜上聊天偏好方面的表現(xiàn)甚至優(yōu)于GPT-4。在總榜上，排名可以和GPT-4Turbo匹敵。

上周模型還沒(méi)發(fā)布，就已經(jīng)有超過(guò)6000名用戶投票給早期版本「upcoming-gpt-mini」，但目前該模型的結(jié)果已經(jīng)被撤下。

LMSYS在推特上宣布，正在重新收集投票，很快就會(huì)發(fā)布正式版模型的成績(jī)。

GPT0-4o mini的發(fā)布，顯然將大幅擴(kuò)展AI應(yīng)用的范圍。

它不僅低成本、低延遲，還支持廣泛的任務(wù)，比如鏈?zhǔn)交虿⑿姓{(diào)用多個(gè)模型的應(yīng)用（調(diào)用多個(gè) API），向模型傳遞大量上下文(完整代碼庫(kù)或?qū)υ挌v史)，或通過(guò)快速、實(shí)時(shí)的文本響應(yīng)與客戶互動(dòng)(支持聊天機(jī)器人)。

并且，由于與GPT-4o共享改進(jìn)的分詞器（tokenizer），它處理起非英語(yǔ)文本會(huì)更加經(jīng)濟(jì)高效。

目前，GPT-4o mini在API中支持文本和視覺(jué)，未來(lái)還將支持多模態(tài)功能，包括文本、圖像、視頻和音頻的輸入和輸出。

聽(tīng)起來(lái)，它像是功能更強(qiáng)大的虛擬助理，比如了解我們的旅行行程并給出建議。

文本、數(shù)學(xué)、編碼、多模態(tài)，效果拔群

在文本智能和多模態(tài)推理方面，GPT-4o mini已經(jīng)超越了GPT-3.5Turbo和其他小模型，GPT-4o支持的語(yǔ)言它也都支持。

長(zhǎng)上下文處理性能上，它比起GPT-3.5Turbo也有所改進(jìn)。

在函數(shù)調(diào)用上，GPT-4o mini同樣表現(xiàn)出色，因此開(kāi)發(fā)者可以更方便地構(gòu)建應(yīng)用。

看一下GPT-4o mini的關(guān)鍵基準(zhǔn)測(cè)試成績(jī)。

推理任務(wù)

文本和視覺(jué)推理任務(wù)上，GPT-4o優(yōu)于其他小模型。

在MMLU上，它的得分為82.0%，而Gemini Flash為77.9%，Claude Haiku為73.8%。

數(shù)學(xué)和編碼能力

在數(shù)學(xué)推理和編碼任務(wù)中，GPT-4o同樣表現(xiàn)出色，優(yōu)于市場(chǎng)上的小模型。

在MGSM上，在MGSM上，GPT-4o mini得分為87.0%，而Gemini Flash為75.5%，Claude Haiku為71.7%。

在HumanEval上，GPT-4o mini得分為87.2%，而Gemini Flash為71.5%，Claude Haiku為75.9%。

多模態(tài)推理

GPT-4o mini在MMMU上也表現(xiàn)強(qiáng)勁，得分為59.4%，而Gemini Flash為56.1%，Claude Haiku為50.2%。

實(shí)測(cè)表明，無(wú)論是從收據(jù)文件中提取結(jié)構(gòu)化數(shù)據(jù)，還是根據(jù)郵件線程生成高質(zhì)量回復(fù)，GPT-4o mini在這類任務(wù)上的表現(xiàn)都明顯比GPT-3.5Turbo更好。

這也印證了業(yè)界一直在討論的觀點(diǎn):模型的大小，并不重要。

性價(jià)比極高

在性價(jià)比方面，Artificial Analysis已經(jīng)為我們整理出了詳細(xì)的分析。

GPT-4o mini的定價(jià)為:輸入每1M token15美分，輸出每1M token60美分。

1M token什么概念?大致相當(dāng)于2500頁(yè)書(shū)。

這個(gè)價(jià)格已經(jīng)卷到了頭部模型的最低檔，僅次于Llama38B。

從下表中可以看到，在目前頭部廠商發(fā)布的所有小模型中，GPT-4o mini超越Gemini1.5Flash、Llama38B、Mistral7B等眾多競(jìng)品，成為性價(jià)比之最。

越靠近左上的模型，性價(jià)比越高

不僅是性價(jià)比最好，GPT-4o mini在輸出的速度和質(zhì)量上也實(shí)現(xiàn)了目前SOTA水平的優(yōu)化權(quán)衡，甚至比GPT-4o更佳。

將質(zhì)量和生成速度分開(kāi)來(lái)看，效果依舊能打。

Artificial Analysis上的質(zhì)量指數(shù)代表Chatbot、MMLU和MT-Bench等基準(zhǔn)的歸一化平均性能。

GPT-4o mini得分為85，和Gemini1.5Flash、Llama370B基本處于同一水平，勝過(guò)Mixtral系列的8×22B和8×7B型號(hào)。

MMLU的得分也基本與質(zhì)量指數(shù)一致，但比較亮眼的是在HumanEval編碼任務(wù)上的評(píng)分。

87.2分的成績(jī)，超過(guò)了谷歌系最強(qiáng)模型Gemini1.5Pro!

推理效率方面，183token/s的生成讓GPT-4o mini成為這個(gè)榜單上的絕對(duì)王者，相比第二名Gemini1.5Flash還要快18token/s。

除了生成速度，目前API的響應(yīng)延遲（TTFT）也算優(yōu)秀，雖然沒(méi)打過(guò)Phi-3、Llama37B等小模型，但差距也不算太大。

在響應(yīng)延遲和token生成速度上，GPT-4o mini都有非常優(yōu)秀的成績(jī)，但需要注意的是，這兩個(gè)指標(biāo)與推理所用的硬件規(guī)格高度相關(guān)，而且模型僅開(kāi)放API，并沒(méi)有第三方進(jìn)行部署后的測(cè)評(píng)。

模型發(fā)布之后，GPT-4o mini能否始終保持這樣的高效率推理，更值得期待。

除了生成質(zhì)量和推理效率，GPT-4o mini在上下文長(zhǎng)度方面算是中規(guī)中矩，畢竟GPT-4o也才128k，沒(méi)法和最長(zhǎng)1M的Gemini系列抗衡。

「真正實(shí)現(xiàn)OpenAI使命」

「我認(rèn)為GPT-4o mini真正實(shí)現(xiàn)了OpenAI的使命——讓人們更廣泛地接觸AI。如果我們希望AI惠及世界每個(gè)角落、每個(gè)行業(yè)、每個(gè)應(yīng)用程序，我們就必須讓AI變得更便宜?！笰PI平臺(tái)產(chǎn)品負(fù)責(zé)人Olivier Godement這樣介紹。

使用Free、Plus、Team套餐的ChatGPT用戶，現(xiàn)在都可以使用GPT-4o mini了，企業(yè)用戶也可以在下周獲得訪問(wèn)權(quán)限。

對(duì)于ChatGPT用戶，GPT-3.5已經(jīng)消失，但開(kāi)發(fā)者仍能通過(guò)API調(diào)用GPT-3.5。

不過(guò)，GPT-3.5也將在某一時(shí)間從API中退役，但具體時(shí)間點(diǎn)還不確定。

對(duì)于渴望低成本構(gòu)建應(yīng)用的開(kāi)發(fā)者來(lái)說(shuō)，GPT-4o mini來(lái)得太及時(shí)了。

金融初創(chuàng)公司Ramp在測(cè)試中，用它構(gòu)建了提取收據(jù)上費(fèi)用的工具，不必費(fèi)力瀏覽文本框，模型就會(huì)自動(dòng)對(duì)所有內(nèi)容排序。

顯然，OpenAI不想再讓開(kāi)發(fā)者流失到更便宜的Claude3Haiku和Gemini1.5Flash。

但是，OpenAI為什么花了這么久?

Godement表示，這涉及到一個(gè)「優(yōu)先考慮」的問(wèn)題。

此前OpenAI專注于GPT-4這樣的大模型，而隨著時(shí)間的推移，OpenAI終于注意到了開(kāi)發(fā)者們渴望對(duì)小模型的愿景，才終于決定投入資源。

OpenAI非常有信心，GPT-4o mini一定會(huì)非常受歡迎。

網(wǎng)友:LLM變小，競(jìng)爭(zhēng)加劇

Sclaing Law要卷，小模型也要卷。

一大早，不僅OpenAI放出了GPT-4o mini，另一邊Mistral聯(lián)手英偉達(dá)推出12B小模型Nemo，性能趕超Gema和Llama-38B。

Karpathy對(duì)此表示，「大模型的參數(shù)規(guī)模競(jìng)爭(zhēng)正在加劇……但方向是相反的」!

HuggingFace創(chuàng)始人表示，「這個(gè)星期是小模型的一周」。

OpenAI研究員Hyung Won Chung表示，「雖然我們比任何人都更喜歡訓(xùn)練大模型，但OpenAI也知道如何訓(xùn)練小模型」。

網(wǎng)友對(duì)當(dāng)前地表最強(qiáng)模型的價(jià)格進(jìn)行了匯總:

作為參考，如果你想對(duì)美國(guó)24小時(shí)內(nèi)所說(shuō)或所聽(tīng)到的每一個(gè)單詞進(jìn)行推理，僅需要花費(fèi)不到20萬(wàn)美元。

不過(guò)，最近比較火的陷阱題——9.11和9.9究竟誰(shuí)大，進(jìn)化后的GPT-4o mini依然失敗了。

幾天前，剛完成進(jìn)化后的AutoGPT，也可以正式支持GPT-4o mini。

Altman本人在評(píng)論區(qū)中，預(yù)告了GPT-4o語(yǔ)音功能Alpha版本將在本月末上線。

當(dāng)然，所有人還是更期待GPT-5上線。

在OpenAI設(shè)想的未來(lái)里，模型將會(huì)被無(wú)縫集成到每一個(gè)應(yīng)用程序和每一個(gè)網(wǎng)站之上。

如今，隨著GPT-4o mini的推出，為開(kāi)發(fā)者更高效、更經(jīng)濟(jì)地構(gòu)建和擴(kuò)展強(qiáng)大的AI應(yīng)用鋪平道路。

可以看到，AI正在變得更容易訪問(wèn)、可靠，并會(huì)融入到所有人的日常體驗(yàn)中。

而OpenAI，會(huì)繼續(xù)引領(lǐng)這一進(jìn)程。

作者介紹

GPT-4o的作者名單，也是長(zhǎng)到讓人印象深刻。

其中，項(xiàng)目負(fù)責(zé)人是Mianna Chen。

Mianna Chen曾在普林斯頓大學(xué)取得了學(xué)士學(xué)位。2020年，她獲得了賓夕法尼亞大學(xué)沃頓商學(xué)院MBA學(xué)位。

入職OpenAI之前，她在2015年加入谷歌任職近3年，中間還跳槽至一家初創(chuàng)Two Sigma，隨后再次入職DeepMind任職1年多產(chǎn)品主管。

其他負(fù)責(zé)人為Jacob Menick，Kevin Lu，Shengjia Zhao，Eric Wallace，Hongyu Ren，Haitang Hu，Nick Stathas，F(xiàn)elipe Petroski Such。

Kevin Lu

Kevin Lu獲得了加州大學(xué)伯克利分校電子工程和計(jì)算機(jī)科學(xué)學(xué)士學(xué)位，曾與Pieter Abbeel和Igor Mordatch合作研究強(qiáng)化學(xué)習(xí)和序列建模。

在校期間，他還擔(dān)任過(guò)助教，在伯克利人工智能研究院擔(dān)任本科研究員。

目前，他已入職OpenAI，成為了一名研究員。

Shengjia Zhao

Shengjia Zhao是斯坦福大學(xué)計(jì)算機(jī)科學(xué)系的博士，本科畢業(yè)于清華大學(xué)。

獲得博士學(xué)位后，Shengjia Zhao直接加入了OpenAI，擔(dān)任技術(shù)研究員，至今已有2年多的時(shí)間。

目前，他主要從事大語(yǔ)言模型的訓(xùn)練和對(duì)齊工作，負(fù)責(zé)ChatGPT的研究。

Haitang Hu

Haitang Hu在霍普金斯約翰大學(xué)取得了計(jì)算機(jī)碩士學(xué)位，此前還在同濟(jì)大學(xué)獲得了計(jì)算機(jī)科學(xué)和技術(shù)學(xué)士學(xué)位。

本科畢業(yè)后，他加入了NS Solution公司，任職3年系統(tǒng)工程師。隨后，進(jìn)入霍普金斯約翰大學(xué)繼續(xù)攻讀。

2016年取得碩士學(xué)位后，Haitang Hu入職谷歌，就職7年工程師。直到23年9月，他正式加入了OpenAI。

參考資料:

https://artificialanalysis.ai/models/gpt-4o-mini

https://x.com/karpathy/status/1814038096218083497

https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/

以上就是關(guān)于【奧特曼深夜發(fā)動(dòng)價(jià)格戰(zhàn)，GPT-4o mini暴跌99%！清華同濟(jì)校友立功，GPT-3.5退役】的相關(guān)內(nèi)容，希望對(duì)大家有幫助！

標(biāo)簽：奧特曼深夜發(fā)動(dòng)價(jià)格戰(zhàn)，GPT-4o mini暴跌99%！清華同濟(jì)校友立功，GPT-3 5退役

　　免責(zé)聲明：本文由用戶上傳，與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考，并不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。如有侵權(quán)請(qǐng)聯(lián)系刪除！

相關(guān)閱讀

最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

奧特曼深夜發(fā)動(dòng)價(jià)格戰(zhàn)，GPT-4o mini暴跌99%！清華同濟(jì)校友立功，GPT-3.5退役

奧特曼深夜發(fā)動(dòng)價(jià)格戰(zhàn)，GPT-4o mini暴跌99%！清華同濟(jì)校友立功，GPT-3.5退役