GPT-4o mini突然上線！該換小模型賽道的OpenAI意欲何為？

2024-07-22 14:30:04 來源：用戶：

相信很多大家對(duì)GPT-4o mini突然上線！該換小模型賽道的OpenAI意欲何為？還不知道吧，今天菲菲就帶你們一起去了解一下~.~！

ChatGPT 正式進(jìn)入了“4”時(shí)代。

7月18日，OpenAI 官宣推出了GPT-3.5Turbo的替代品——GPT-4o mini，至此，ChatGPT的更新迭代又近了一步，來到了4字開頭的時(shí)期。據(jù)了解，即日起，ChatGPT的免費(fèi)用戶，Plus用戶以及Team用戶都能夠使用GPT-4o mini，企業(yè)版客戶也會(huì)在隨后獲得使用GPT-4o mini的權(quán)限。

OpenAI殺入小模型賽道!GPT-4o mini究竟有哪些過人之處?

在各大AI企業(yè)爭(zhēng)相推出產(chǎn)品的當(dāng)下，OpenAI的更新速度并不算太快。很多人都希望蟄伏許久的OpenAI能夠一出手，就干件大事兒，諸如推出一個(gè)在各個(gè)方面都能碾壓上一代產(chǎn)品的GPT-5.0。也正因此，很多人對(duì)于GPT-4o mini的出現(xiàn)感到些許失望。

但需要說明的是，GPT-4.o mini不僅不是一無是處，反而是一個(gè)極具代表性的產(chǎn)品。OpenAI把GPT-4o mini描述為“一個(gè)具有卓越文本智能和多模態(tài)推理能力的小模型”，這就對(duì)其進(jìn)行了精準(zhǔn)定位:小模型賽道上的領(lǐng)先產(chǎn)品。

據(jù)OpenAI介紹，GPT-4o mini目前在LMSYS排行榜上的聊天偏好方面優(yōu)于GPT-4，在文本智能和多模態(tài)推理方面的學(xué)術(shù)基準(zhǔn)測(cè)試中超越了GPT-3.5Turbo和其他小型模型，并且支持的語言范圍與GPT-4o相同。而GPT-4o mini在函數(shù)調(diào)用方面也表現(xiàn)出色，可以使開發(fā)人員構(gòu)建獲取數(shù)據(jù)或使用外部系統(tǒng)采取行動(dòng)的應(yīng)用程序。

此外，與GPT-3.5Turbo相比，GPT-4o mini的長(zhǎng)上下文性能有所提高，已經(jīng)在幾個(gè)關(guān)鍵基準(zhǔn)上進(jìn)行了評(píng)估，即推理任務(wù)，數(shù)學(xué)和編碼能力以及多模態(tài)推力。

在推理任務(wù)方面，GPT-4o mini在涉及文本和視覺的推理任務(wù)上優(yōu)于其他小型模型，在文本智能和推理基準(zhǔn)MMLU上的得分為82.0%，而Gemini Flash為77.9%，Claude Haiku為73.8%;在數(shù)學(xué)和編碼能力方面，GPT-4o mini的表現(xiàn)優(yōu)于市場(chǎng)上之前的小型模型，在測(cè)量數(shù)學(xué)推理的MGSM上，GPT-4o mini得分為87.0%，而Gemini Flash得分為75.5%，Claude Haiku得分為71.7%;在測(cè)量編碼性能的HumanEval上，GPT-4o mini得分為87.2%，而Gemini Flash得分為71.5%，Claude Haiku得分為75.9%;在多模態(tài)推理方面，GPT-4o mini在多模態(tài)推理評(píng)估MMMU中也表現(xiàn)出色，得分為59.4%，而Gemini Flash為56.1%，Claude Haiku為50.2%。

更重要的是，GPT-4o mini還有一項(xiàng)極具競(jìng)爭(zhēng)力的優(yōu)勢(shì):價(jià)格足夠?qū)嵒荨?/p>

OpenAI表示，開發(fā)人員使用GPT-4o mini時(shí)，每100萬個(gè)輸入tokens需支付15美分，每100萬個(gè)輸出tokens需支付60美分。這個(gè)定價(jià)比之前的Frontier型號(hào)便宜了足足一個(gè)數(shù)量級(jí)。即便與自家的上一代產(chǎn)品GPT-3.5Turbo也要便宜60%以上。

GPT-4o用起來究竟如何?一手測(cè)評(píng)結(jié)果:懂得不算多，但速度絕對(duì)快。

當(dāng)然，理論上的優(yōu)勢(shì)說的再多，也不及大家的實(shí)際體驗(yàn)來得重要和直觀。

目前，GPT-4o mini 在 WildBench 測(cè)試上排名第9，優(yōu)于谷歌的Gemini-flash以及 Anthropic的Claude3Haiku?？吹贸鰜?，大家對(duì)于這款新晉產(chǎn)品還是很感興趣的。

有網(wǎng)友在GPT-4o mini開放測(cè)試的第一時(shí)間就趕過去問它了一個(gè)問題:9.11和9.9哪個(gè)大?

很遺憾，GPT-4o mini沒有給出正確的答案，不僅沒有給出正確的答案，還在錯(cuò)誤的路上越走越遠(yuǎn)，一本正經(jīng)地回答9.11大于9.9，因?yàn)?.1大于0.9。

隨后，網(wǎng)友在 Poe（Quora 開發(fā)的應(yīng)用程序，已經(jīng)集成了 GPT-4o mini）中輸入人物傳記電影《Eno》的設(shè)計(jì)封面，讓GPT-4o和GPT-4omini模型進(jìn)行解讀，結(jié)果 mini翻車了。GPT-4o mini 直接表示“自己認(rèn)不出照片上的人”，反而是GPT-4o的回答就比較準(zhǔn)確。

不過，說起響應(yīng)速度，那么GPT-4o mini確實(shí)對(duì)得起OpenAI給予的“faster”標(biāo)簽。與它進(jìn)行對(duì)話，幾乎無需任何等待，輸出速度堪稱快的離譜。

盡管就目前來看，GPT-4o mini回答問題的準(zhǔn)確性還有待提高，但不可否認(rèn)，它目前已經(jīng)是性能最為優(yōu)越的小模型了，完全可以超越GPT-3.5Turbo和其他小模型。據(jù)了解，GPT-4o mini的知識(shí)更新到去年10月，語言種類和GPT-4o對(duì)齊，上下文窗口為128k。

當(dāng)下的GPT-4.o mini在API中僅支持文本和視覺模態(tài)，而在不久的未來，它還將擴(kuò)展到視頻和音頻的輸入及輸出。盡管還沒有任何參數(shù)規(guī)模被披露，但OpenAI的官方直接表示，這是他們目前最經(jīng)濟(jì)，最有成本效益的小模型了，微調(diào)功能也將很快上線。

小模型的出現(xiàn)，才能真正完成OpenAI的使命?

雖然GPT-4o mini是一個(gè)小模型，但相較于大模型，它在性能上并沒有做出太大妥協(xié)。

得益于優(yōu)化的架構(gòu)設(shè)計(jì)和高效的算法，GPT-4o mini 能夠在保留大模型強(qiáng)大性能的基礎(chǔ)上，提供更加輕量級(jí)的解決方案。這使得它在處理文本生成，對(duì)話和翻譯等任務(wù)時(shí)，依然能夠表現(xiàn)出色。

但是問題來了，先前一直在做大模型的OpenAI為什么選擇轉(zhuǎn)頭深耕小模型賽道?

OpenAI API方面的負(fù)責(zé)人Godement表示，這涉及到一個(gè)“優(yōu)先考慮”的問題。此前，OpenAI專注于GPT-4這樣的大模型，而隨著時(shí)間的推移，OpenAI終于注意到了開發(fā)者們渴望對(duì)小模型的愿景，才終于決定投入資源。據(jù)了解，OpenA對(duì)于GPT-4o mini是非常有信心的，認(rèn)為其一定會(huì)非常受歡迎。

事實(shí)的確如此。對(duì)于渴望低成本構(gòu)建應(yīng)用的開發(fā)者來說，GPT-4o mini來得太及時(shí)了。譬如金融初創(chuàng)公司Ramp在測(cè)試中，就用它構(gòu)建了提取收據(jù)上費(fèi)用的工具，不必費(fèi)力瀏覽文本框，模型就會(huì)自動(dòng)對(duì)所有內(nèi)容排序，大大提高了工作效率。

在OpenAI設(shè)想的未來里，模型將會(huì)被無縫集成到每一個(gè)應(yīng)用程序和每一個(gè)網(wǎng)站之上。如今，隨著GPT-4o mini的推出為開發(fā)者更高效、更經(jīng)濟(jì)地構(gòu)建和擴(kuò)展強(qiáng)大的AI應(yīng)用鋪平道路?？梢钥吹?，AI正在變得更容易訪問，可靠，并會(huì)融入到所有人的日常體驗(yàn)中。而OpenAI，則會(huì)繼續(xù)引領(lǐng)這一進(jìn)程。

曾幾何時(shí)，OpenAI也是一心要走大模型之路的，可惜這條路它們走得并不順利。盡管相較于上一波AI公司，OpenAI創(chuàng)造了更大的現(xiàn)金流，但從戰(zhàn)略上說，它并沒有把自己倒騰到一個(gè)合適的位置上。

在這種情況下，一味死磕大模型，很有可能給公司造成毀滅性的打擊，會(huì)導(dǎo)致高昂的人才，訓(xùn)練成本根本找不到落點(diǎn)。更可怕的是，一旦技術(shù)增長(zhǎng)停滯后，它的客戶端注定會(huì)把它踢掉或者在多個(gè)供應(yīng)商之間壓價(jià)。這就會(huì)導(dǎo)致大模型公司變成賺錢費(fèi)勁，花錢很痛快的公司，這是沒法長(zhǎng)久維持的。所以做大模型。不管創(chuàng)造了多少收入，本質(zhì)上還在險(xiǎn)境里面。

如今，OpenAI顯然找到了更適合自己的打開方式。但有一點(diǎn)毋庸置疑，大模型要卷，小模型也要卷，不卷是不可能的。

圖片來源于網(wǎng)絡(luò)

文字資料參考:

公眾號(hào)“新智元”文章《奧特曼深夜發(fā)動(dòng)價(jià)格戰(zhàn)，GPT-4o mini暴跌99%!清華同濟(jì)校友立功，GPT-3.5退役》

https://www.zhihu.com/question/662021096/answer/3567789827

https://baijiahao.baidu.com/s?id=1804991663805668979

以上就是關(guān)于【GPT-4o mini突然上線！該換小模型賽道的OpenAI意欲何為？】的相關(guān)內(nèi)容，希望對(duì)大家有幫助！

標(biāo)簽： GPT-4o mini突然上線！該換小模型賽道的OpenAI意欲何為？

　　免責(zé)聲明：本文由用戶上傳，與本網(wǎng)站立場(chǎng)無關(guān)。財(cái)經(jīng)信息僅供讀者參考，并不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。如有侵權(quán)請(qǐng)聯(lián)系刪除！

分享：

相關(guān)閱讀

董明珠曾喊話雷軍給股民分多少錢！格力：擬分紅超55億

Epic喜+1：動(dòng)作游戲《師父》免費(fèi)領(lǐng) 立省139元

雷軍辟謠只招聘35歲以下員工：僅針對(duì)未來之星項(xiàng)目

普華永道發(fā)布2025年AI預(yù)測(cè)：AI Agents將勞動(dòng)力提升1倍

雷軍回應(yīng)股價(jià)暴跌：年年難過年年過

一天100座！理想汽車第1700座超充站正式建成

《守望先鋒》國(guó)服宣布2月19日回歸：賬號(hào)數(shù)據(jù)完整保留

雷軍建議創(chuàng)業(yè)者要多留點(diǎn)錢給員工：別到山窮水盡才講問題

雷軍新年第一天收到200元紅包自侃年入百萬的開始

雷軍親自展示REDMI Turbo 4！2025年第一款新機(jī)

雷軍：小米未來10年建至少20座世界頂級(jí)工廠

雷軍辟謠只招聘35歲以下員工：只有招聘未來之星時(shí)才有年齡限制

雷軍回應(yīng)100億造車：沒有好到“封神” 不要神話我

雷軍表態(tài)：一心做好小米汽車大家可以在“許愿池”尋找商機(jī)

雷軍：中國(guó)汽車產(chǎn)業(yè)應(yīng)少些歪門邪道不要發(fā)黑稿、背后捅刀子

小米SU7選配色都是7000元為什么璀璨洋紅卻需要9000元

最新文章

空調(diào)外機(jī)聲音大是什么問題

【空調(diào)外機(jī)聲音大是什么問題】空調(diào)在使用過程中，如果發(fā)現(xiàn)外機(jī)發(fā)出異常的噪音，可能會(huì)讓人感到困擾?？照{(diào)外機(jī)...瀏覽全文>>

空調(diào)外機(jī)聲音大如何解決

【空調(diào)外機(jī)聲音大如何解決】空調(diào)在使用過程中，外機(jī)發(fā)出較大的噪音是很多用戶遇到的常見問題。這不僅影響居住...瀏覽全文>>

空調(diào)外機(jī)清洗方法是什么

【空調(diào)外機(jī)清洗方法是什么】空調(diào)外機(jī)是空調(diào)系統(tǒng)中非常重要的組成部分，它的清潔程度直接影響到空調(diào)的制冷效果...瀏覽全文>>

空調(diào)突然不制冷的原因

【空調(diào)突然不制冷的原因】當(dāng)家中的空調(diào)突然不再制冷時(shí)，不僅影響使用體驗(yàn)，還可能帶來一定的安全隱患。了解空...瀏覽全文>>

空調(diào)銅管什么作用

【空調(diào)銅管什么作用】空調(diào)在現(xiàn)代生活中扮演著越來越重要的角色，尤其是在夏季高溫時(shí)，它為我們提供了舒適的室...瀏覽全文>>

空調(diào)銅管結(jié)霜怎么回事

【空調(diào)銅管結(jié)霜怎么回事】空調(diào)在使用過程中，有時(shí)會(huì)出現(xiàn)銅管結(jié)霜的現(xiàn)象，這不僅影響制冷效果，還可能對(duì)設(shè)備造...瀏覽全文>>

空調(diào)銅管結(jié)霜是什么原因

【空調(diào)銅管結(jié)霜是什么原因】當(dāng)空調(diào)運(yùn)行時(shí)，如果發(fā)現(xiàn)室內(nèi)機(jī)的銅管出現(xiàn)結(jié)霜現(xiàn)象，這不僅影響制冷效果，還可能對(duì)...瀏覽全文>>

空谷幽蘭是什么意思

【空谷幽蘭是什么意思】“空谷幽蘭”是一個(gè)富有詩意的成語，常用來形容在偏僻、冷清的地方生長(zhǎng)的蘭花。它不僅...瀏覽全文>>

空格怎么打出來

【空格怎么打出來】在日常使用電腦或手機(jī)輸入文字時(shí)，經(jīng)常會(huì)遇到需要輸入“空格”的情況。雖然看似簡(jiǎn)單，但很...瀏覽全文>>

空格怎么打

【空格怎么打】在日常使用電腦或手機(jī)時(shí)，很多人會(huì)遇到“空格怎么打”的問題。其實(shí)，“空格”是一個(gè)非?；A(chǔ)的...瀏覽全文>>

大家愛看

空調(diào)銅管什么作用

空格怎么打

空格鍵是指的哪一個(gè)

可微與可導(dǎo)的關(guān)系

科技感十足的公司名稱公司起名

考研難考嗎

康復(fù)醫(yī)院是做什么的

康復(fù)學(xué)專業(yè)考研學(xué)校

開通國(guó)際漫游多少錢一個(gè)月

開通電信Volte功能免費(fèi)嗎

頻道推薦

空調(diào)銅管結(jié)霜是什么原因

空格名字怎么打

可微與可導(dǎo)之間的聯(lián)系是什么

科技工業(yè)是什么

科技發(fā)展給生活帶來的好處

考研歧視最嚴(yán)重的高校

康復(fù)理療師證書哪里頒發(fā)

康復(fù)考研最好的學(xué)校有哪些

卡姐新歌wap原版歌詞介紹

卡機(jī)嘛韓語的意思

站長(zhǎng)推薦

空調(diào)突然不制冷的原因

空格怎么打出來

空城舊夢(mèng)是情侶網(wǎng)名嗎

可吸收線是什么顏色

可微與可導(dǎo)之間有什么聯(lián)系

康復(fù)是什么意思

康復(fù)評(píng)定包括哪5個(gè)方面

開通QQ十周年黃鉆是不是可以永久使用十周年黃鉆標(biāo)志

卡路里和焦耳怎么換算

卡樂購(gòu)是什么意思

卡拉瓦喬代表作

巨鱷的電影有什么

巨大的英語是什么

禁閉島的結(jié)局真相

靳東個(gè)人資料

靳東的妹妹為什么叫高露

金枝玉葉繁殖方法

金針菜和黃花菜是一種嗎

金吉鳥健身私教一般多少

戒指戴什么手指好

關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 免責(zé)聲明|

Copyright ? 2007-2025 www.gaipa.cn All Right Reserved. 版權(quán)所有新訊網(wǎng) 工信部網(wǎng)站備案編號(hào)：閩ICP備20009419號(hào)-52

感谢您访问我们的网站，您可能还对以下资源感兴趣：
最新亚洲人成无码网站

最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

GPT-4o mini突然上線！該換小模型賽道的OpenAI意欲何為？

GPT-4o mini突然上線！該換小模型賽道的OpenAI意欲何為？