OpenAI全新發(fā)布o(jì)1模型 - 我們正式邁入了下一個(gè)時(shí)代。
相信很多大家對(duì)OpenAI全新發(fā)布o(jì)1模型 - 我們正式邁入了下一個(gè)時(shí)代。還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
大半夜的,OpenAI抽象了整整快半年的新模型。
在沒(méi)有任何預(yù)告下,正式登場(chǎng)。
正式版名稱不叫草莓,草莓只是內(nèi)部的一個(gè)代號(hào)。他們的正式名字,叫:
為什么取名叫o1,OpenAI是這么說(shuō)的:
For complex reasoning tasks this is a significant advancement and represents a new level of AI capability. Given this, we are resetting the counter back to1and naming this series OpenAI o1.
翻譯過(guò)來(lái)是:
對(duì)于復(fù)雜推理任務(wù)來(lái)說(shuō),這是一個(gè)重要的進(jìn)展,代表了人工智能能力的新水平。鑒于此,我們將計(jì)數(shù)器重置為1,并將這一系列命名為 OpenAI o1。
這次模型的強(qiáng)悍,甚至讓OpenAI不惜推掉了過(guò)去GPT系列的命名,重新起了一個(gè)o系列。
炸了,真的炸了。
我現(xiàn)在,頭皮發(fā)麻,真的,這次OpenAI o1發(fā)布,也標(biāo)志著,AI行業(yè),正式進(jìn)入了一個(gè)全新的紀(jì)元。
“我們通往AGI的路上,已經(jīng)沒(méi)有任何阻礙。”
在邏輯和推理能力上,我直接先放圖,你們就知道,這玩意有多離譜。
AIME2024,一個(gè)高水平的數(shù)學(xué)競(jìng)賽,GPT4o準(zhǔn)確率為13.4%,而這次的o1預(yù)覽版,是56.7%,還未發(fā)布的o1正式版,是83.3%。
代碼競(jìng)賽,GPT4o準(zhǔn)確率為11.0%,o1預(yù)覽版為62%,o1正式版,是89%。
而最牛逼的博士級(jí)科學(xué)問(wèn)題 (GPQA Diamond),GPT4o是56.1,人類專家水平是69.7,o1達(dá)到了恐怖的78%。
我讓Claude翻譯了一下o1的圖,丑是丑了點(diǎn),但是能看的懂每項(xiàng)數(shù)據(jù)意思就行。
什么叫全面碾壓,這就是。
特別是在測(cè)試測(cè)試化學(xué)、物理和生物學(xué)專業(yè)知識(shí)的基準(zhǔn)GPQA-diamond上,o1的表現(xiàn)全面超過(guò)了人類博士專家,這也是有史以來(lái),第一個(gè)獲得此成就的模型。
而整個(gè)模型之所以達(dá)到如此成就,基石就是Self-play RL,不知道這個(gè)的可以去看我前兩天的預(yù)測(cè)文章:新模型草莓到底是個(gè)啥?
通過(guò)Self-play RL,o1學(xué)會(huì)了磨練其思維鏈并完善所使用的策略。它學(xué)會(huì)了識(shí)別和糾正自己的錯(cuò)誤。
它也學(xué)會(huì)了將復(fù)雜的步驟分解為更簡(jiǎn)單的步驟。
而且當(dāng)當(dāng)前的方法不起作用時(shí),它也學(xué)會(huì)了嘗試不同的方法。
他學(xué)會(huì)的這些,就是我們?nèi)祟?,最核心的思考方?慢思考。
諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主丹尼爾·卡尼曼有一本著作,名叫:《思考,快與慢》。
非常詳細(xì)的闡述了人類的兩種思考方式。
第一種是快思考(系統(tǒng)1),特點(diǎn)是快速、自動(dòng)、直覺(jué)性、無(wú)意識(shí),舉幾個(gè)例子:
看到一個(gè)笑臉就知道對(duì)方心情很好。
1+1=2這樣簡(jiǎn)單的計(jì)算。
開(kāi)車時(shí)遇到危險(xiǎn)情況立即踩剎車。
這些就是快思考,也就是傳統(tǒng)的大模型,死記硬背后學(xué)得的快速反應(yīng)的能力。
第二種是慢思考(系統(tǒng)2),特點(diǎn)是緩慢、需要努力、邏輯性、有意識(shí),舉幾個(gè)例子:
解決一道復(fù)雜的數(shù)學(xué)題
填寫稅務(wù)申報(bào)表
權(quán)衡利弊后做出重要決定
這就是慢思考,我們?nèi)祟愔詮?qiáng)大的核心,也是AI要通往下一步AGI路上的基石。
而現(xiàn)在,o1終于踏出了堅(jiān)實(shí)的一步,擁有了人類慢思考的特質(zhì),在回答前,會(huì)反復(fù)的思考、拆解、理解、推理,然后給出最終答案。
說(shuō)實(shí)話,這些增強(qiáng)的推理能力在處理科學(xué)、編碼、數(shù)學(xué)及類似領(lǐng)域的復(fù)雜問(wèn)題時(shí)絕對(duì)極度有用。
例如o1可以被醫(yī)療研究人員用來(lái)注釋細(xì)胞測(cè)序數(shù)據(jù),被物理學(xué)家用來(lái)生成量子光學(xué)所需的復(fù)雜數(shù)學(xué)公式,以及被各個(gè)領(lǐng)域的開(kāi)發(fā)人員用來(lái)構(gòu)建和執(zhí)行多步驟工作流,等等等等。
o1也絕對(duì)是全新一代的數(shù)據(jù)飛輪,如果答案正確,整個(gè)邏輯鏈就會(huì)變成一個(gè)包含正負(fù)獎(jiǎng)勵(lì)的訓(xùn)練示例的小型數(shù)據(jù)集。
以O(shè)penAI的用戶級(jí)別,未來(lái)的進(jìn)化速度,只會(huì)更恐怖。
寫到這,我忽然嘆了口氣,我覺(jué)得我跟一年以后的o1比起來(lái),可能就是個(gè)純廢物了,真的。。。
目前,o1模型已經(jīng)逐步向所有ChatGPT Plus和 Team用戶開(kāi)放,未來(lái)會(huì)考慮對(duì)免費(fèi)用戶開(kāi)放。
分為兩個(gè)模型,o1預(yù)覽版和o1mini,o1-mini就是更快更小更便宜,推理啥的都不錯(cuò),極度適合數(shù)學(xué)和代碼,就是世界知識(shí)會(huì)差很多,適用于需要推理但不需要廣泛世界知識(shí)的場(chǎng)景。
o1預(yù)覽版每周30條,o1-mini每周50條。
雪崩,甚至不是按以前的3小時(shí)來(lái)限制的,是每周30條,也能從側(cè)面看出來(lái),o1這個(gè)模型,有多貴了。
對(duì)于開(kāi)發(fā)者來(lái)說(shuō),只對(duì)已經(jīng)付過(guò)1000美刀的等級(jí)5開(kāi)發(fā)者開(kāi)放,每分鐘限制20次。
都挺少的。
而且在功能上閹割挺大,但是畢竟早期,理解。
API的價(jià)格上,o1預(yù)覽版每百萬(wàn)輸入15美元,每百萬(wàn)輸出60美元,這個(gè)推理成本...
o1-mini會(huì)便宜一些,每百萬(wàn)輸入3美元,每百萬(wàn)輸出12美元。
輸出成本都是推理成本的4倍,對(duì)比一下GPT4o,分別是5美元和15美元。
o1-mini還是勉強(qiáng)有一些經(jīng)濟(jì)效應(yīng)的,不過(guò)還是開(kāi)始,后面等著OpenAI打骨折。
既然說(shuō)o1已經(jīng)對(duì)Plus用戶開(kāi)放,我就直接去我的號(hào)上看了眼,還不錯(cuò),拿到了。
那自然,第一時(shí)間試一試。
目前不支持曾經(jīng)的所有功能,也就是沒(méi)有圖片理解、圖片生成、代碼解釋器、網(wǎng)頁(yè)搜索等等,只有一個(gè)可以對(duì)話的裸模型。
我先是一個(gè)曾經(jīng)很致命的問(wèn)題:
“農(nóng)夫需要把狼、羊和白菜都帶過(guò)河,但每次只能帶一樣物品,而且狼和羊不能單獨(dú)相處,羊和白菜也不能單獨(dú)相處,問(wèn)農(nóng)夫該如何過(guò)河。”
思考了6秒時(shí)間,給了我一個(gè)很完美的回答。
還有之前一個(gè)坑遍所有大模型的調(diào)休問(wèn)題:
“這是中國(guó)2024年9月9日(星期一)開(kāi)始到10月13日的放假調(diào)休安排:上6休3上3休2上5休1上2休7再上5休1。
請(qǐng)你告訴我除了我本來(lái)該休的周末,我因?yàn)榉偶俣嘈菹⒘藥滋?”
在o1思考了整整30秒以后,給出了一天不差的極度精準(zhǔn)的答案。
無(wú)敵,真的無(wú)敵。
再來(lái)一個(gè)更難的,就是曾經(jīng)姜萍那個(gè)比賽的奧數(shù)題:
別問(wèn)我題目什么意思,我看不懂,我是廢物,這題曾經(jīng)屠殺所有的大模型,這次,我們讓o1也來(lái)試一下看看。
在o1思考了整整1分多鐘之后,他給出了答案。
...
全...對(duì)...
我裂開(kāi)了。
目前我自己試下來(lái),感覺(jué)Prompt,未來(lái)可能也要重新摸索,在GPT為代表的快思考大模型時(shí)代,我們有很多所謂的一步一步思考之類的玩意,現(xiàn)在全都無(wú)效了,對(duì)o1甚至還有負(fù)效果。
OpenAI給出的最佳寫法是:
保持提示簡(jiǎn)單直接:模型擅長(zhǎng)理解和響應(yīng)簡(jiǎn)短、清晰的指令,而不需要大量的指導(dǎo)。
避免思路鏈提示:由于這些模型在內(nèi)部進(jìn)行推理,因此不需要提示它們“逐步思考”或“解釋你的推理”。
使用分隔符來(lái)提高清晰度:使用三重引號(hào)、XML 標(biāo)簽或章節(jié)標(biāo)題等分隔符來(lái)清楚地指示輸入的不同部分,幫助模型適當(dāng)?shù)亟忉尣煌牟糠帧?/p>
限制檢索增強(qiáng)生成 (RAG) 中的附加上下文:提供附加上下文或文檔時(shí),僅包含最相關(guān)的信息,以防止模型過(guò)度復(fù)雜化其響應(yīng)。
最后,我想說(shuō)一下這個(gè)思考的時(shí)長(zhǎng)。
現(xiàn)在o1是思考了一分鐘,但是,如果是真正的AGI,說(shuō)實(shí)話,思考的越慢可能會(huì)越刺激。
當(dāng)他真的,可以去做證明數(shù)學(xué)定理,去做癌癥藥物研發(fā),去做天體研究呢?
每一次的思考,可以達(dá)到幾小時(shí)、幾天、甚至幾周呢?
最后的結(jié)果,可能會(huì)讓所有人震驚的難以置信。
現(xiàn)在,沒(méi)有人能想象到,那時(shí)候的AI,會(huì)是一個(gè)什么樣的存在。
而o1的未來(lái),在我看到,也絕對(duì)不止是一個(gè)普普通通的ChatGPT。
而是我們前往下個(gè)時(shí)代,最偉大的基石。
“我們通往AGI的路上,已經(jīng)沒(méi)有任何阻礙。”
現(xiàn)在,我毫不猶豫的堅(jiān)信著這句話。
星光熠熠的下一個(gè)時(shí)代。
在今天。
正式到來(lái)了。
以上,既然看到這里了,如果覺(jué)得不錯(cuò),隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧,如果想第一時(shí)間收到推送,也可以給我個(gè)星標(biāo)?~謝謝你看我的文章,我們,下次再見(jiàn)。
>/ 作者:卡茲克
以上就是關(guān)于【OpenAI全新發(fā)布o(jì)1模型 - 我們正式邁入了下一個(gè)時(shí)代?!康南嚓P(guān)內(nèi)容,希望對(duì)大家有幫助!
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!
- 董明珠曾喊話雷軍給股民分多少錢!格力:擬分紅超55億
- Epic喜+1:動(dòng)作游戲《師父》免費(fèi)領(lǐng) 立省139元
- 雷軍辟謠只招聘35歲以下員工:僅針對(duì)未來(lái)之星項(xiàng)目
- 普華永道發(fā)布2025年AI預(yù)測(cè):AI Agents將勞動(dòng)力提升1倍
- 雷軍回應(yīng)股價(jià)暴跌:年年難過(guò)年年過(guò)
- 一天100座!理想汽車第1700座超充站正式建成
- 《守望先鋒》國(guó)服宣布2月19日回歸:賬號(hào)數(shù)據(jù)完整保留
- 雷軍建議創(chuàng)業(yè)者要多留點(diǎn)錢給員工:別到山窮水盡才講問(wèn)題
- 雷軍新年第一天收到200元紅包 自侃年入百萬(wàn)的開(kāi)始
- 雷軍親自展示REDMI Turbo 4!2025年第一款新機(jī)
- 雷軍:小米未來(lái)10年建至少20座世界頂級(jí)工廠
- 雷軍辟謠只招聘35歲以下員工:只有招聘未來(lái)之星時(shí)才有年齡限制
- 雷軍回應(yīng)100億造車:沒(méi)有好到“封神” 不要神話我
- 雷軍表態(tài):一心做好小米汽車 大家可以在“許愿池”尋找商機(jī)
- 雷軍:中國(guó)汽車產(chǎn)業(yè)應(yīng)少些歪門邪道 不要發(fā)黑稿、背后捅刀子
- 小米SU7選配色都是7000元 為什么璀璨洋紅卻需要9000元
-
奔馳GLE作為豪華SUV市場(chǎng)中的佼佼者,憑借其卓越的性能、豪華的內(nèi)飾以及寬敞的空間,吸引了眾多消費(fèi)者的關(guān)注。...瀏覽全文>>
-
在2025年,安徽阜陽(yáng)地區(qū)的帕薩特新能源汽車市場(chǎng)表現(xiàn)非常活躍。作為一款備受關(guān)注的新能源車型,帕薩特新能源憑...瀏覽全文>>
-
近日,滁州地區(qū)的大眾汽車經(jīng)銷商傳來(lái)好消息:備受矚目的2025款T-ROC探歌正式上市,并且以極具競(jìng)爭(zhēng)力的價(jià)格吸引...瀏覽全文>>
-
在選擇一款新能源汽車時(shí),了解其價(jià)格和配置是非常重要的一步。安徽淮南地區(qū)的長(zhǎng)安啟源E07作為2024款的新車型,...瀏覽全文>>
-
阜陽(yáng)長(zhǎng)安啟源A05作為長(zhǎng)安汽車旗下的全新車型,自推出以來(lái)便憑借其獨(dú)特的設(shè)計(jì)風(fēng)格和豐富的配置吸引了眾多消費(fèi)者...瀏覽全文>>
-
阜陽(yáng)長(zhǎng)安啟源A07作為一款備受矚目的新能源車型,以其豪華配置和親民的價(jià)格在市場(chǎng)上引起了廣泛關(guān)注。這款車型不...瀏覽全文>>
-
安徽淮南威然2024款價(jià)格及配置詳解隨著汽車市場(chǎng)的不斷更新?lián)Q代,上汽大眾旗下的MPV車型——威然(Viloran)憑...瀏覽全文>>
-
QQ多米新車報(bào)價(jià)2025款,買車省錢秘籍隨著汽車市場(chǎng)的不斷發(fā)展,消費(fèi)者在選購(gòu)車輛時(shí)不僅關(guān)注車型的性能和配置,...瀏覽全文>>
-
滁州途觀X 2024款最新價(jià)格及買車省錢秘籍隨著汽車市場(chǎng)的不斷發(fā)展,大眾途觀X作為一款兼具時(shí)尚與性能的中型SUV...瀏覽全文>>
-
隨著汽車市場(chǎng)的不斷發(fā)展,大眾蔚攬以其優(yōu)雅的設(shè)計(jì)和卓越的性能贏得了眾多消費(fèi)者的青睞。作為一款兼具實(shí)用性和...瀏覽全文>>
- Alienware 在 2025 年 CES 上展示了一些超凡脫俗的技術(shù)
- Wickes 任命首席零售和分銷官
- 分析師稱GTA 6或?qū)?shù)立行業(yè)新標(biāo)準(zhǔn)
- 索尼和本田在拉斯維加斯推出售價(jià) 89,900 美元的 Afeela 1
- 日本 11 月游客人數(shù)創(chuàng)月度新高
- 神經(jīng)認(rèn)知測(cè)試在 3 歲兒童白血病治療期間可行
- 牛津郡小學(xué)支持圣誕毛衣日
- S?strene Grene 投資歐洲物流中心
- 有人已經(jīng)在電視上直播 BNMC 打造的 1967 年福特野馬 Restomod
- 潛在的分子療法可以逆轉(zhuǎn)小鼠的胎盤發(fā)育問(wèn)題
- 奔馳GLE預(yù)約試駕,新手必看的詳細(xì)流程
- 滁州T-ROC探歌 2025新款價(jià)格,最低售價(jià)15.89萬(wàn)起,趕緊行動(dòng)
- 安徽淮南威然最新價(jià)格2024款,各配置車型售價(jià)全知曉
- 滁州途觀X最新價(jià)格2024款,買車省錢秘籍
- 淮南長(zhǎng)安啟源Q05 2025新款價(jià)格,最低售價(jià)9.69萬(wàn)起,入手正當(dāng)時(shí)
- 安徽淮南探影多少錢 2023款落地價(jià),各配置車型售價(jià)一目了然
- 淮南途觀X價(jià)格大揭秘,買車前必看
- 安徽淮南長(zhǎng)安獵手K50新款價(jià)格2025款多少錢?買車攻略一網(wǎng)打盡
- 滁州ID.4 X新款價(jià)格2025款多少錢?買車攻略一網(wǎng)打盡
- QQ多米落地價(jià),購(gòu)車前必看的費(fèi)用明細(xì)
- Nvidia DLSS 4 有望將游戲性能提高 8 倍
- 人工智能在預(yù)測(cè)自身免疫性疾病進(jìn)展方面顯示出良好的前景
- 心理物理實(shí)驗(yàn)揭示皮膚水分感知是如何改變的
- 科茨沃爾德公司慶祝圣誕節(jié)圓滿成功
- 南法納姆學(xué)校被評(píng)為薩里郡表現(xiàn)最好的小學(xué)
- 約克區(qū)九所小學(xué)將削減招生人數(shù)
- 松下新款電動(dòng)汽車電池為 Lucid Gravity 帶來(lái) 450 英里續(xù)航里程
- 泰國(guó)旅游呈現(xiàn)新趨勢(shì)
- 研究人員找到在細(xì)胞水平上餓死前列腺癌腫瘤的新方法
- 領(lǐng)先的人工智能聊天機(jī)器人在測(cè)試中表現(xiàn)出類似癡呆癥的認(rèn)知能力下降
- 龐大的 Project Zomboid build 42 終于可以玩了
- Steam Replay 回歸向您展示 2024 年您玩得最多的 PC 游戲
- Jollyes 推出強(qiáng)化的人才支持和招聘措施
- Karen Millen 與 Simon Harrison 共同推出全新高級(jí)珠寶系列
- 奇瑞風(fēng)云A8L電動(dòng)轎車刷新續(xù)航里程世界紀(jì)錄
- 虛擬藝術(shù)家將別克 Cascada 帶回 2026 款車型
- OnePlus 宣布推出新計(jì)劃解決綠線問(wèn)題
- OnePlus Watch 3 將擁有更大的電池和更薄的機(jī)身
- 研究人員發(fā)現(xiàn)可變剪接與自身免疫性疾病遺傳之間的細(xì)胞類型特異性聯(lián)系
- 科學(xué)家確定腦細(xì)胞類型是排尿的主要控制者