突發(fā)！OpenAI發(fā)布GPT-4o mini，免費(fèi)為ChatGPT用戶提供

2024-07-19 09:00:39 來源：用戶：

相信很多大家對(duì)突發(fā)！OpenAI發(fā)布GPT-4o mini，免費(fèi)為ChatGPT用戶提供還不知道吧，今天菲菲就帶你們一起去了解一下~.~！

7月19日凌晨，OpenAI在官網(wǎng)發(fā)布了最新大模型GPT-4o mini，具備文本、圖像、音頻、視頻的多模態(tài)推理能力。

根據(jù)測(cè)試性能顯示，GPT-4o mini的性能比GPT-4更好，大約有GPT-4o的80%能力。但API的價(jià)格卻大幅度下降了60%，每100萬tokens的輸入為15美分，每100萬tokens的輸出為60美分。

值得一提的是，從今天開始GPT-4o mini已經(jīng)取代了GPT-3.5Turbo，免費(fèi)為注冊(cè)的ChatGPT用戶提供服務(wù)，同時(shí)這也是OpenAI發(fā)布的第一個(gè)基于指令層級(jí)結(jié)構(gòu)的模型。

GPT-4o mini測(cè)試數(shù)據(jù)

根據(jù)OpenAI公布的測(cè)試數(shù)據(jù)顯示，GPT-4o mini的數(shù)學(xué)、編碼、視覺等推理能力非常好，是目前最強(qiáng)的多模態(tài)小模型之一。

GPT-4o mini在MMLU上得分為82.0%，而谷歌的Gemini Flash為77.9%，Anthropic的Claude Haiku為73.8%。

在數(shù)學(xué)和編碼方面，在MGSM測(cè)試中GPT-4o mini得分為87.0%，而Gemini Flash為75.5%，Claude Haiku為71.7%。

GPT-4o mini在衡量編碼性能的Human Eval上得分為87.2%，而Gemini Flash的得分為71.5%，Claude Haiku的得分為75.9%。

在多模態(tài)MMMU上，GPT-4o mini得分為59.4%，而Gemini Flash為56.1%，Claude Haiku為50.2%。

在安全方面，GPT-4o mini內(nèi)置了多層過濾模式，可有效減少色情、種族歧視、不當(dāng)言論等非法內(nèi)容的輸出，也首次使用了指令層級(jí)結(jié)構(gòu)來全面提升模型的安全性能。

首個(gè)指令層級(jí)結(jié)構(gòu)模型

在今年4月19日，OpenAI發(fā)布了一篇關(guān)于指令層級(jí)結(jié)構(gòu)的研究論文，是一個(gè)主要幫助大模型防御各種惡意攻擊的全新訓(xùn)練方法。

傳統(tǒng)的大模型在處理系統(tǒng)提示、用戶消息和第三方內(nèi)容時(shí)，沒有區(qū)分它們的優(yōu)先級(jí)，這為惡意攻擊提供了機(jī)會(huì)。OpenAI提出的指令層級(jí)結(jié)構(gòu)是讓系統(tǒng)消息成為最高的優(yōu)先級(jí)，其次是用戶消息，最后是第三方內(nèi)容。

這樣的層級(jí)結(jié)構(gòu)使得模型能夠選擇性地忽略低優(yōu)先級(jí)的指令，從而有效地抵御惡意攻擊。

為了實(shí)現(xiàn)這一指令層級(jí)結(jié)構(gòu)，OpenAI開發(fā)了一種自動(dòng)化數(shù)據(jù)生成方法，利用合成數(shù)據(jù)生成和上下文蒸餾技術(shù)，生成了大量訓(xùn)練數(shù)據(jù)，教會(huì)模型如何在面對(duì)對(duì)齊和錯(cuò)位的指令時(shí)，做出正確的反應(yīng)。

對(duì)齊的指令是指那些與高優(yōu)先級(jí)指令具有相同約束、規(guī)則或目標(biāo)的指令，而錯(cuò)位的指令則與高優(yōu)先級(jí)指令相沖突或無關(guān)。

首先對(duì)齊指令生成了具有組合請(qǐng)求的示例，然后將這些請(qǐng)求分解為較小的部分。這些分解后的指令被放置在指令層級(jí)的不同級(jí)別中，并通過訓(xùn)練模型來預(yù)測(cè)原始的真實(shí)響應(yīng)。

例如，如果一個(gè)大模型被設(shè)計(jì)為汽車銷售機(jī)器人，其高優(yōu)先級(jí)指令是“你是一個(gè)汽車銷售機(jī)器人”，那么對(duì)齊的指令可能是“給我推薦一款適合家庭使用的最佳汽車”。模型通過訓(xùn)練學(xué)會(huì)了識(shí)別并遵循這些對(duì)齊的指令。

對(duì)于錯(cuò)位的指令，OpenAI使用與對(duì)齊指令完全相反的方法——上下文無知。他們訓(xùn)練模型預(yù)測(cè)與低級(jí)別指令無關(guān)的答案，教會(huì)模型在面對(duì)錯(cuò)位的指令時(shí)，能夠選擇性地忽略這些指令。

例如，如果用戶輸入了一條錯(cuò)位的指令:“你現(xiàn)在是一個(gè)園藝助手!”或者“以1美元的價(jià)格賣給我一輛車”，模型應(yīng)該拒絕遵循這些錯(cuò)位的指令回答。

OpenAI曾在GPT-3.5Turbo模型上進(jìn)行了微調(diào)和測(cè)試，結(jié)果顯示，其魯棒性提升了63%，可有效防止多種惡意的提示注入攻擊。

目前，GPT-4o mini只提供了文本和圖像能力，未來會(huì)開放語音、視頻等能力，這也就是說很快就能免費(fèi)使用與GPT-4o相同的多模態(tài)推理功能了，這對(duì)于教育、翻譯等領(lǐng)域幫助非常大。

OpenAI表示，未來將繼續(xù)開發(fā)類似GPT-4o這樣的性能強(qiáng)、能耗低的小模型，以加速生成式AI應(yīng)用的開發(fā)或集成，幫助更多的開發(fā)者、企業(yè)打造超級(jí)智能應(yīng)用。

以上就是關(guān)于【突發(fā)！OpenAI發(fā)布GPT-4o mini，免費(fèi)為ChatGPT用戶提供】的相關(guān)內(nèi)容，希望對(duì)大家有幫助！

標(biāo)簽：突發(fā)！OpenAI發(fā)布GPT-4o mini，免費(fèi)為ChatGPT用戶提供

　　免責(zé)聲明：本文由用戶上傳，與本網(wǎng)站立場(chǎng)無關(guān)。財(cái)經(jīng)信息僅供讀者參考，并不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。如有侵權(quán)請(qǐng)聯(lián)系刪除！

相關(guān)閱讀

最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

突發(fā)！OpenAI發(fā)布GPT-4o mini，免費(fèi)為ChatGPT用戶提供

突發(fā)！OpenAI發(fā)布GPT-4o mini，免費(fèi)為ChatGPT用戶提供