GPT-4o mini實力霸榜,限時2個月微調不花錢,每天200萬訓練token免費薅
相信很多大家對GPT-4o mini實力霸榜,限時2個月微調不花錢,每天200萬訓練token免費薅還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
Llama3.1405B巨獸開源的同時,OpenAI又搶了一波風頭。從現(xiàn)在起,每天200萬訓練token免費微調模型,截止到9月23日。
Llama3.1開源的同一天,OpenAI也open了一回。
收到郵件的開發(fā)者們激動地奔走相告,這么大的羊毛一定要趕快薅。
另一邊,GPT-4o mini在大模型競技場LMSYS排名也出來了。
總榜單中,GPT-4o mini與GPT-4o并列第一。
Altman本尊激動地表示,我從未對任何一次評估如此興奮過,GPT-4o mini與GPT-4o性能如此接近,而價格僅有其1/20!
同時,他表示,GPT-4o mini的微調現(xiàn)在上線了。
OpenAI能把如此強大的模型,放出來讓大家免費用,實在是出人意料。
網友一度以為,這可能是最高級的釣魚郵件。
每天200萬token,GPT-4o mini免費微調
郵件中,OpenAI宣布現(xiàn)正式推出GPT-4o mini微調功能,為的是讓最新小模型在特定用例上,表現(xiàn)更加出色。
7月23日-9月23日期間,開發(fā)者們每天可以免費使用200萬訓練token。
超過的部分,將會按3美元百萬token收費。
到了2個月免費使用截止后,微調訓練也將按照3美元百萬token收費。
此外,OpenAI在郵件中給出了,每個人值得從GPT-3.5Turbo切換到GPT-4o mini的原因:
- 更實惠:GPT-4o mini的輸入Token費用比GPT-3.5Turbo低90%,輸出Tokens費用低80%。即使在免費期結束后,GPT-4o mini的訓練成本也比GPT-3.5Turbo低一半。
- 更長的上下文:GPT-4o mini的訓練上下文長度為65k Token,是GPT-3.5Turbo的4倍,推理上下文長度為128k Token,是GPT-3.5Turbo的8倍。
- 更聰明且更有能力:GPT-4o mini比GPT-3.5Turbo更聰明,并且支持視覺功能(盡管目前微調僅限于文本)。
最后,郵件中還提到,GPT-4o mini微調功能將向企業(yè)客戶,以及Tier4和Tier5開發(fā)者開放,未來將逐漸擴大訪問權限,擴展至所有級別的用戶。
想要動手操作的小伙伴們,OpenAI已經放出了微調指南,可參見:
https://platform.openai.com/docs/guides/fine-tuning/fine-tuning-examples
一部分網友對此并不看好,他們正在保存我們的數(shù)據(jù),來訓練和改進AI模型。
「又名,把你的私人數(shù)據(jù)給我,我會收你很少的錢」。
網友用例
拿到資格的網友,已經迫不及待上手測試了。
開發(fā)者使用《經濟學人》風格的頭條數(shù)據(jù)集,對gpt-4o mini進行了微調。
然后,他比較了gpt-4o、gpt-4o min原始模型和微調后的模型在生成頭條方面的表現(xiàn)。
小模型霸榜,堪比GPT-4o
GPT-4o mini發(fā)布一周后,在大模型排行榜中的成績終于出來了。
共收到了4K+用戶投票,GPT-4o mini小模型直接攀升至榜首,與GPT-4o并列第一。
最最重要的是,便宜20倍!
這對于眾多開發(fā)者來說,是個好消息,能夠以更低的成本,搭建更強大的應用。
在數(shù)學細分領域中,GPT-4o mini的性能有所下降,排在第9。
此外,在hard prompt評測中,GPT-4o mini依舊保持了穩(wěn)健的性能,實力僅次于GPT-4o、Claude3.5Sonnet。
在編碼領域,GPT-4o mini同樣展現(xiàn)出強大的能力。
關于GPT-4o mini在Arena中排名如此高的原因,很多人提出了疑問。
官方對此解釋是:
- Chatbot Arena根據(jù)不同領域的人類偏好進行評估。鼓勵大家不僅關注總排行榜,還要查看各個類別的排名(如數(shù)學、編碼等)。
- Arena評估是實時進行的。鼓勵大家在Arena中親自對比模型,實時驗證自己的假設。
- 透明性是我們的核心價值;所有代碼和分析都是開源的(https://github.com/lm-sys/FastChat)。我們定期發(fā)布20%的數(shù)據(jù),保留其余數(shù)據(jù)以避免過擬合,維護基準測試的完整性。
- 我們將根據(jù)政策發(fā)布隨機的20% GPT-4o mini對戰(zhàn)數(shù)據(jù),大家可以親自查看答案。
不過,另有網友認為,gpt-4o-mini的勝利是一個實質性的證據(jù),證明了普通人并不那么聰明。
而且,這是歷史上首次,AI變得足夠聰明可以愚弄我們。有點瘋狂,也有點具有歷史意義。
參考資料:
https://x.com/moyix/status/1815840634013639086
https://x.com/HamelHusain/status/1815848198927434019
https://x.com/sama/status/1815877987696533897
https://x.com/0xSMW/status/1815869241205350641
以上就是關于【GPT-4o mini實力霸榜,限時2個月微調不花錢,每天200萬訓練token免費薅】的相關內容,希望對大家有幫助!
免責聲明:本文由用戶上傳,與本網站立場無關。財經信息僅供讀者參考,并不構成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權請聯(lián)系刪除!
-
奔馳GLE作為豪華SUV市場中的佼佼者,憑借其卓越的性能、豪華的內飾以及寬敞的空間,吸引了眾多消費者的關注。...瀏覽全文>>
-
在2025年,安徽阜陽地區(qū)的帕薩特新能源汽車市場表現(xiàn)非?;钴S。作為一款備受關注的新能源車型,帕薩特新能源憑...瀏覽全文>>
-
近日,滁州地區(qū)的大眾汽車經銷商傳來好消息:備受矚目的2025款T-ROC探歌正式上市,并且以極具競爭力的價格吸引...瀏覽全文>>
-
在選擇一款新能源汽車時,了解其價格和配置是非常重要的一步。安徽淮南地區(qū)的長安啟源E07作為2024款的新車型,...瀏覽全文>>
-
阜陽長安啟源A05作為長安汽車旗下的全新車型,自推出以來便憑借其獨特的設計風格和豐富的配置吸引了眾多消費者...瀏覽全文>>
-
阜陽長安啟源A07作為一款備受矚目的新能源車型,以其豪華配置和親民的價格在市場上引起了廣泛關注。這款車型不...瀏覽全文>>
-
安徽淮南威然2024款價格及配置詳解隨著汽車市場的不斷更新?lián)Q代,上汽大眾旗下的MPV車型——威然(Viloran)憑...瀏覽全文>>
-
QQ多米新車報價2025款,買車省錢秘籍隨著汽車市場的不斷發(fā)展,消費者在選購車輛時不僅關注車型的性能和配置,...瀏覽全文>>
-
滁州途觀X 2024款最新價格及買車省錢秘籍隨著汽車市場的不斷發(fā)展,大眾途觀X作為一款兼具時尚與性能的中型SUV...瀏覽全文>>
-
隨著汽車市場的不斷發(fā)展,大眾蔚攬以其優(yōu)雅的設計和卓越的性能贏得了眾多消費者的青睞。作為一款兼具實用性和...瀏覽全文>>
- Nvidia DLSS 4 有望將游戲性能提高 8 倍
- 人工智能在預測自身免疫性疾病進展方面顯示出良好的前景
- 心理物理實驗揭示皮膚水分感知是如何改變的
- 科茨沃爾德公司慶祝圣誕節(jié)圓滿成功
- 南法納姆學校被評為薩里郡表現(xiàn)最好的小學
- 約克區(qū)九所小學將削減招生人數(shù)
- 松下新款電動汽車電池為 Lucid Gravity 帶來 450 英里續(xù)航里程
- 泰國旅游呈現(xiàn)新趨勢
- 研究人員找到在細胞水平上餓死前列腺癌腫瘤的新方法
- 領先的人工智能聊天機器人在測試中表現(xiàn)出類似癡呆癥的認知能力下降
- 龐大的 Project Zomboid build 42 終于可以玩了
- Steam Replay 回歸向您展示 2024 年您玩得最多的 PC 游戲
- Jollyes 推出強化的人才支持和招聘措施
- Karen Millen 與 Simon Harrison 共同推出全新高級珠寶系列
- 奇瑞風云A8L電動轎車刷新續(xù)航里程世界紀錄
- 虛擬藝術家將別克 Cascada 帶回 2026 款車型
- OnePlus 宣布推出新計劃解決綠線問題
- OnePlus Watch 3 將擁有更大的電池和更薄的機身
- 研究人員發(fā)現(xiàn)可變剪接與自身免疫性疾病遺傳之間的細胞類型特異性聯(lián)系
- 科學家確定腦細胞類型是排尿的主要控制者