GPT-5降臨,代號(hào)獵戶座?OpenAI疑用草莓訓(xùn)練,數(shù)學(xué)推理暴漲超越所有模型
相信很多大家對(duì)GPT-5降臨,代號(hào)獵戶座?OpenAI疑用草莓訓(xùn)練,數(shù)學(xué)推理暴漲超越所有模型還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
OpenAI的下一代旗艦大語(yǔ)言模型,要來(lái)了?
據(jù)悉,新模型代號(hào)Orion(獵戶座),就是能超越GPT-4的下一代模型。
而獵戶座的預(yù)訓(xùn)練數(shù)據(jù),正是由草莓模型生成的。
而草莓模型驅(qū)動(dòng)的聊天機(jī)器人,很可能就會(huì)在今年秋天上線!
關(guān)于OpenAI的草莓,外媒The Information最近又挖到了新的細(xì)節(jié)。
根據(jù)The Information的信息,網(wǎng)友推測(cè):「GPT-4+草莓」會(huì)在秋季推出,之后上線的繼任者「獵戶座」可能就是GPT-5。
由于大概率要避開11月,因此,獵戶座的發(fā)布時(shí)間要么在之前要么是在12月。
甚至,AI大V、Hallid.ai聯(lián)創(chuàng)「indigo」提出了一個(gè)大膽的猜測(cè):獵戶座或許不是GPT-5,而是GPT-6。
AI大V「Chubby」表示附議。
最后,Chubby激動(dòng)地表示:所有人都覺(jué)得AI的發(fā)展正在放緩?并不是。在大公司,廚房里的東西正在沸騰!
網(wǎng)友們紛紛表示:「我們正在見(jiàn)證一種超越我們自己思想的誕生」。
打開Q*之門,一切模型憑此迭代。
有人擔(dān)心,如果GPT-5控制整個(gè)互聯(lián)網(wǎng),人類會(huì)從此迷失。
所以,獵戶座到底是GPT-5還是GPT-6呢?網(wǎng)友們各持己見(jiàn)。
但有人猜測(cè),我們目前還沒(méi)有足夠的算力來(lái)達(dá)到GPT-5,更不用說(shuō)GPT-6了。
透?jìng)€(gè)底,讓美國(guó)政府安心
此前,關(guān)于草莓的傳聞早已滿天飛。
今年夏天,Sam Altman的團(tuán)隊(duì)已經(jīng)向美國(guó)國(guó)家安全官員展示了這項(xiàng)技術(shù)。
在安全問(wèn)題日益敏感的情況下,OpenAI的做法也算給大家打了個(gè)樣。
如果政府官員覺(jué)得這項(xiàng)AI不安全怎么辦?那就給他們展示一下。
這次演示,就是OpenAI讓政策制定者覺(jué)得更透明的努力的一部分。畢竟,如果他們感覺(jué)到受到這項(xiàng)技術(shù)的威脅了,很可能就會(huì)給公司帶來(lái)麻煩。
現(xiàn)在,OpenAI的安全團(tuán)隊(duì)已經(jīng)出走,憤怒的前員工在網(wǎng)上大肆爆料,這種時(shí)候,對(duì)政府官員更加透明的做法,就顯得尤為重要。
The Information表示,這次演示還可能另有目的:跟政府隊(duì)員就如何保護(hù)技術(shù)進(jìn)行對(duì)話,以防止美國(guó)的AI技術(shù)被他國(guó)竊取。
說(shuō)不定,還可以借此機(jī)會(huì)攻擊Meta一波,因?yàn)樗麄兊腁I是開放權(quán)重的,其他國(guó)家想要獲取,是非常容易的事。
總之,未來(lái)幾年內(nèi),AI開發(fā)者應(yīng)該會(huì)經(jīng)常出現(xiàn)在舊金山和華盛頓之間的航線上了,因?yàn)樗麄儠r(shí)不時(shí)就需要跟政府官員來(lái)往一下。
草莓:數(shù)學(xué)提升,能解字謎
一個(gè)月前路透社曾報(bào)道,OpenAI內(nèi)部測(cè)試了一種AI,在MATH基準(zhǔn)上得分超過(guò)了90%。
據(jù)猜測(cè),這個(gè)模型很可能就是草莓。
如今的傳言是,今年秋天OpenAI研究者會(huì)推出代號(hào)為草莓的新AI(也就是之前的Q*),或許會(huì)聊天到ChatGPT之類的聊天機(jī)器人中。
它能做到目前的聊天機(jī)器人無(wú)法做到的很多事情,比如解決未曾遇到的數(shù)學(xué)問(wèn)題,還能解決編程難題。
在獲得額外「思考」時(shí)間后,草莓模型還可以回答更主觀的問(wèn)題,比如產(chǎn)品的營(yíng)銷策略。
據(jù)悉,在語(yǔ)言任務(wù)上,草莓表現(xiàn)出了強(qiáng)大的能力。比如OpenAI的一位員工曾向同事演示了草莓成功解決《紐約時(shí)報(bào)》的Connections——復(fù)雜的文字謎題。
OpenAI在LLM和會(huì)話AI領(lǐng)域的領(lǐng)先地位,一直在遭受沖擊,因此OpenAI只能對(duì)外不時(shí)放出點(diǎn)草莓的消息,提升一下自己的存在感。
另外,據(jù)說(shuō)草莓的技術(shù)已經(jīng)顯示出了智能體的能力。
草莓模型似乎能夠自主瀏覽網(wǎng)絡(luò),像人類研究人員一樣,獨(dú)立上網(wǎng)、進(jìn)行深度研究。
它不僅能生成答案,還能規(guī)劃、執(zhí)行一系列復(fù)雜任務(wù),還能收集信息。
與之類似的,還有斯坦福的Quiet-STaR。
就像人類會(huì)在說(shuō)話或?qū)懽髑皶?huì)停下來(lái)思考自己的想法一樣,Quiet-STaR可以訓(xùn)練LLM去生成在復(fù)雜推理問(wèn)題中采取步驟的內(nèi)部「思考」,從而做出更好的決策。
論文地址:https://arxiv.org/abs/2403.09629
眼下,OpenAI的業(yè)務(wù)正以驚人的速度增長(zhǎng):跟去年相比,今年它向企業(yè)銷售LLM和ChatGPT訂閱的收入大約增加了三倍,達(dá)到了每月2.83億美元,盡管公司每月的虧損可能高于此。
目前,OpenAI的私人估值為860億美元。
Sam Altman還希望為公司籌集更多資金,找到減少損失的方法。
自2019年以來(lái),OpenAI已經(jīng)從微軟籌集了約130億美元,與這家企業(yè)軟件巨頭的協(xié)議,會(huì)持續(xù)到2030年。
合作條款可能會(huì)發(fā)生變化,包括OpenAI向微軟支付租用云服務(wù)器以開發(fā)AI的方式。
云服務(wù)器,是OpenAI最大的成本。
OpenAI的新希望:Orion(獵戶座)
但說(shuō)到底,OpenAI的前景終究還是依賴正在開發(fā)的新旗艦——Orion。
有人能解釋一下為什么OpenAI、谷歌和亞馬遜一直用希臘神話來(lái)命名他們的模型嗎?
去年初推出后,GPT-4已經(jīng)被各家趕超得差不多了,現(xiàn)在GPT-4級(jí)的模型,可以說(shuō)是各家人手一個(gè)。
有人猜,OpenAI可能會(huì)推出一個(gè)比原始草莓模型更小、更簡(jiǎn)化的模型,也就是蒸餾版。
這個(gè)版本被寄望于提升GPT-4和ChatGPT性能,目的是保持和更大模型相同的性能水平,而且更易于操作,成本更低。
另外,還有知情人士透露,OpenAI還在用更大的草莓版本,為Orion的訓(xùn)練生成數(shù)據(jù)。
這種人工合成數(shù)據(jù),意味著草莓能幫助OpenAI克服獲取高質(zhì)量數(shù)據(jù)的限制,從而可以從現(xiàn)實(shí)世界數(shù)據(jù)(比如從互聯(lián)網(wǎng)獲取的文本或圖像)中訓(xùn)練新模型。
研究人員表示,使用草莓可以幫助Orion減少幻覺(jué)的產(chǎn)生。
這是因?yàn)椋珹I模型是從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)的,所以它們看到的復(fù)雜推理的正確示例越多,就越好。
對(duì)此,智能體初創(chuàng)公司Minion AI的CEO兼GitHub C o p i l o t前首席架構(gòu)師Alex Graveley給予了高度厚望。
「想象一個(gè)沒(méi)有幻覺(jué)的模型,一個(gè)你問(wèn)它邏輯難題、它第一次就答對(duì)了的模型?!?/p>
「訓(xùn)練數(shù)據(jù)中存在較少的歧義,因此它的猜測(cè)更少?!?/p>
The Information猜測(cè),草莓改進(jìn)的推理能力,可能會(huì)整合到ChatGPT中。這些答案可能會(huì)更準(zhǔn)確,但也可能更慢。
因此,草莓可能并不適合需要即時(shí)即時(shí)響應(yīng)的應(yīng)用。而在GitHub中修復(fù)非關(guān)鍵編碼錯(cuò)誤,則是理想的選擇。
或許,以后的ChatGPT用戶,可以根據(jù)請(qǐng)求的時(shí)間敏感性來(lái)切換草莓模型。
Sam Altman在五月的一次活動(dòng)中曾表示:「我們感覺(jué),為下一個(gè)模型準(zhǔn)備的數(shù)據(jù)已經(jīng)足夠」。
這個(gè)模型,很可能指的是就Orion。Altman表示:「我們進(jìn)行了各種實(shí)驗(yàn),包括生成合成數(shù)據(jù)?!?/p>
解決復(fù)雜數(shù)學(xué)問(wèn)題:有前景的應(yīng)用
如果說(shuō)目前AI最有前景的應(yīng)用,那解決復(fù)雜數(shù)學(xué)問(wèn)題,必然是其中一個(gè)了。
畢竟,現(xiàn)有的AI在數(shù)學(xué)密集的領(lǐng)域如航空航天和結(jié)構(gòu)工程中,表現(xiàn)實(shí)在不佳。
各種LLM在回答數(shù)學(xué)問(wèn)題時(shí),往往會(huì)給出各種讓人啼笑皆非的答案。
而且,數(shù)學(xué)推理能力的提升還能幫助AI模型更好地推理會(huì)話查詢,比如用戶的服務(wù)請(qǐng)求。
谷歌和一些初創(chuàng)公司,也在這方面發(fā)力。
上個(gè)月,谷歌DeepMind開發(fā)的AI,已經(jīng)能在國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽中擊敗大多數(shù)人類參賽者。
OpenAI的另一大競(jìng)爭(zhēng)對(duì)手Anthropic祭出的最新模型,也能編寫更復(fù)雜的軟件代碼,還能回答有關(guān)圖表和圖形的問(wèn)題,這些都要?dú)w功于它推理能力的改進(jìn)。
還有一些初創(chuàng)公司為了提高模型的推理能力,采用了一種廉價(jià)的技巧,將問(wèn)題分解為更小的步驟,盡管這些方法速度慢且成本高昂。
無(wú)論Strawberry是否會(huì)作為產(chǎn)品推出,人們對(duì)Orion的期望都不會(huì)低了,因?yàn)镺penAI會(huì)力求繼續(xù)保持領(lǐng)先地位,同時(shí)還要保證顯著的的收入增長(zhǎng)。
OpenAI的領(lǐng)先者優(yōu)勢(shì),已經(jīng)不明顯了。
雖然在5月宣布了「Her」的版本,但谷歌卻搶先推出了AI驅(qū)動(dòng)的語(yǔ)音助手,后者也足夠靈活,還能處理用戶的打斷,和突然變化的話題。
而Lmsys Chatbot Arena等大模型排行榜上,谷歌、xAI、Anthropic和Meta的模型也都在趕上OpenAI的步伐。
Ilya看到了什么?
值得一提的是,「草莓之父」,其實(shí)就是已經(jīng)離職了的OpenAI的首席科學(xué)家Ilya Sutskever。
幾年前,Ilya啟動(dòng)了一個(gè)項(xiàng)目,在研究過(guò)程中,誕生了草莓。
而在Ilya離職之前,OpenAI的研究人員Jakub Pachocki和Szymon Sidor,就已經(jīng)在Ilya的工作基礎(chǔ)上開發(fā)了一個(gè)新的數(shù)學(xué)求解模型Q*,這讓不少關(guān)注AI安全的研究人員感到擔(dān)憂。
另外,在去年Q*的前期準(zhǔn)備中,OpenAI研究人員開發(fā)了一種被稱為「測(cè)試時(shí)計(jì)算」的概念變體,目的是提升LLM的問(wèn)題解決能力。
這樣,LLM就會(huì)花更多時(shí)間考慮被要求執(zhí)行的命令,或問(wèn)題的各個(gè)部分。
當(dāng)時(shí),Ilya發(fā)表了一篇與這項(xiàng)工作相關(guān)的博客。
博客地址:https://openai.com/index/improving-mathematical-reasoning-with-process-supervision/
在博客中,模型解決了數(shù)個(gè)有難度的數(shù)學(xué)問(wèn)題。
比如在這道有挑戰(zhàn)性的三角函數(shù)題中,需要連續(xù)應(yīng)用幾個(gè)并不明顯的等式。
在這道題,GPT-4成功執(zhí)行了一系列復(fù)雜的多項(xiàng)式分解。
步驟5中使用的Sophie-Germain恒等式是重要的一步,可以被認(rèn)為極有洞察力。
在這道題的步驟7和8中,GPT-4開始執(zhí)行猜測(cè)和檢查。
這也是模型可能產(chǎn)生幻覺(jué)的常見(jiàn)情況,LLM會(huì)聲稱某個(gè)特定的猜測(cè)是成功的,但實(shí)際上并不成功。
在這種情況下,獎(jiǎng)勵(lì)模型會(huì)驗(yàn)證每個(gè)步驟,并確定思路是否正確。
在最后這道題中,模型成功地應(yīng)用了多個(gè)三角恒等式,來(lái)簡(jiǎn)化了表達(dá)式。
或許,我們能從中窺見(jiàn)草莓和Orion的端倪。
參考資料:
https://www.theinformation.com/articles/openai-races-to-launch-strawberry-reasoning-ai-to-boost-chatbot-business?rc=epv9gi
https://www.theinformation.com/articles/openai-shows-strawberry-ai-to-the-feds-and-uses-it-to-develop-orion?rc=epv9gi
以上就是關(guān)于【GPT-5降臨,代號(hào)獵戶座?OpenAI疑用草莓訓(xùn)練,數(shù)學(xué)推理暴漲超越所有模型】的相關(guān)內(nèi)容,希望對(duì)大家有幫助!
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!
- 董明珠曾喊話雷軍給股民分多少錢!格力:擬分紅超55億
- Epic喜+1:動(dòng)作游戲《師父》免費(fèi)領(lǐng) 立省139元
- 雷軍辟謠只招聘35歲以下員工:僅針對(duì)未來(lái)之星項(xiàng)目
- 普華永道發(fā)布2025年AI預(yù)測(cè):AI Agents將勞動(dòng)力提升1倍
- 雷軍回應(yīng)股價(jià)暴跌:年年難過(guò)年年過(guò)
- 一天100座!理想汽車第1700座超充站正式建成
- 《守望先鋒》國(guó)服宣布2月19日回歸:賬號(hào)數(shù)據(jù)完整保留
- 雷軍建議創(chuàng)業(yè)者要多留點(diǎn)錢給員工:別到山窮水盡才講問(wèn)題
-
奔馳GLE作為豪華SUV市場(chǎng)中的佼佼者,憑借其卓越的性能、豪華的內(nèi)飾以及寬敞的空間,吸引了眾多消費(fèi)者的關(guān)注。...瀏覽全文>>
-
在2025年,安徽阜陽(yáng)地區(qū)的帕薩特新能源汽車市場(chǎng)表現(xiàn)非常活躍。作為一款備受關(guān)注的新能源車型,帕薩特新能源憑...瀏覽全文>>
-
近日,滁州地區(qū)的大眾汽車經(jīng)銷商傳來(lái)好消息:備受矚目的2025款T-ROC探歌正式上市,并且以極具競(jìng)爭(zhēng)力的價(jià)格吸引...瀏覽全文>>
-
在選擇一款新能源汽車時(shí),了解其價(jià)格和配置是非常重要的一步。安徽淮南地區(qū)的長(zhǎng)安啟源E07作為2024款的新車型,...瀏覽全文>>
-
阜陽(yáng)長(zhǎng)安啟源A05作為長(zhǎng)安汽車旗下的全新車型,自推出以來(lái)便憑借其獨(dú)特的設(shè)計(jì)風(fēng)格和豐富的配置吸引了眾多消費(fèi)者...瀏覽全文>>
-
阜陽(yáng)長(zhǎng)安啟源A07作為一款備受矚目的新能源車型,以其豪華配置和親民的價(jià)格在市場(chǎng)上引起了廣泛關(guān)注。這款車型不...瀏覽全文>>
-
安徽淮南威然2024款價(jià)格及配置詳解隨著汽車市場(chǎng)的不斷更新?lián)Q代,上汽大眾旗下的MPV車型——威然(Viloran)憑...瀏覽全文>>
-
QQ多米新車報(bào)價(jià)2025款,買車省錢秘籍隨著汽車市場(chǎng)的不斷發(fā)展,消費(fèi)者在選購(gòu)車輛時(shí)不僅關(guān)注車型的性能和配置,...瀏覽全文>>
-
滁州途觀X 2024款最新價(jià)格及買車省錢秘籍隨著汽車市場(chǎng)的不斷發(fā)展,大眾途觀X作為一款兼具時(shí)尚與性能的中型SUV...瀏覽全文>>
-
隨著汽車市場(chǎng)的不斷發(fā)展,大眾蔚攬以其優(yōu)雅的設(shè)計(jì)和卓越的性能贏得了眾多消費(fèi)者的青睞。作為一款兼具實(shí)用性和...瀏覽全文>>
- Alienware 在 2025 年 CES 上展示了一些超凡脫俗的技術(shù)
- Wickes 任命首席零售和分銷官
- 分析師稱GTA 6或?qū)淞⑿袠I(yè)新標(biāo)準(zhǔn)
- 索尼和本田在拉斯維加斯推出售價(jià) 89,900 美元的 Afeela 1
- 日本 11 月游客人數(shù)創(chuàng)月度新高
- 神經(jīng)認(rèn)知測(cè)試在 3 歲兒童白血病治療期間可行
- 牛津郡小學(xué)支持圣誕毛衣日
- S?strene Grene 投資歐洲物流中心
- 有人已經(jīng)在電視上直播 BNMC 打造的 1967 年福特野馬 Restomod
- 潛在的分子療法可以逆轉(zhuǎn)小鼠的胎盤發(fā)育問(wèn)題
- 奔馳GLE預(yù)約試駕,新手必看的詳細(xì)流程
- 滁州T-ROC探歌 2025新款價(jià)格,最低售價(jià)15.89萬(wàn)起,趕緊行動(dòng)
- 安徽淮南威然最新價(jià)格2024款,各配置車型售價(jià)全知曉
- 滁州途觀X最新價(jià)格2024款,買車省錢秘籍
- 淮南長(zhǎng)安啟源Q05 2025新款價(jià)格,最低售價(jià)9.69萬(wàn)起,入手正當(dāng)時(shí)
- 安徽淮南探影多少錢 2023款落地價(jià),各配置車型售價(jià)一目了然
- 淮南途觀X價(jià)格大揭秘,買車前必看
- 安徽淮南長(zhǎng)安獵手K50新款價(jià)格2025款多少錢?買車攻略一網(wǎng)打盡
- 滁州ID.4 X新款價(jià)格2025款多少錢?買車攻略一網(wǎng)打盡
- QQ多米落地價(jià),購(gòu)車前必看的費(fèi)用明細(xì)
- Nvidia DLSS 4 有望將游戲性能提高 8 倍
- 人工智能在預(yù)測(cè)自身免疫性疾病進(jìn)展方面顯示出良好的前景
- 心理物理實(shí)驗(yàn)揭示皮膚水分感知是如何改變的
- 科茨沃爾德公司慶祝圣誕節(jié)圓滿成功
- 南法納姆學(xué)校被評(píng)為薩里郡表現(xiàn)最好的小學(xué)
- 約克區(qū)九所小學(xué)將削減招生人數(shù)
- 松下新款電動(dòng)汽車電池為 Lucid Gravity 帶來(lái) 450 英里續(xù)航里程
- 泰國(guó)旅游呈現(xiàn)新趨勢(shì)
- 研究人員找到在細(xì)胞水平上餓死前列腺癌腫瘤的新方法
- 領(lǐng)先的人工智能聊天機(jī)器人在測(cè)試中表現(xiàn)出類似癡呆癥的認(rèn)知能力下降
- 龐大的 Project Zomboid build 42 終于可以玩了
- Steam Replay 回歸向您展示 2024 年您玩得最多的 PC 游戲
- Jollyes 推出強(qiáng)化的人才支持和招聘措施
- Karen Millen 與 Simon Harrison 共同推出全新高級(jí)珠寶系列
- 奇瑞風(fēng)云A8L電動(dòng)轎車刷新續(xù)航里程世界紀(jì)錄
- 虛擬藝術(shù)家將別克 Cascada 帶回 2026 款車型
- OnePlus 宣布推出新計(jì)劃解決綠線問(wèn)題
- OnePlus Watch 3 將擁有更大的電池和更薄的機(jī)身
- 研究人員發(fā)現(xiàn)可變剪接與自身免疫性疾病遺傳之間的細(xì)胞類型特異性聯(lián)系
- 科學(xué)家確定腦細(xì)胞類型是排尿的主要控制者