Meta 發(fā)布可以檢查其他 AI 模型工作的 AI 模型
相信很多大家對(duì)Meta 發(fā)布可以檢查其他 AI 模型工作的 AI 模型還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
10 月 20 日消息:Facebook 母公司 Meta 當(dāng)?shù)貢r(shí)間周五正式發(fā)布了一批來(lái)自其研究部門(mén)的新 AI 模型,其中包括一個(gè)名為「自學(xué)評(píng)估器」(Self-Taught Evaluator)的模型,這可能為減少人類(lèi)在 AI 開(kāi)發(fā)過(guò)程中的參與度提供了一條新路徑。
此次發(fā)布緊隨 Meta 在 8 月份一篇論文中介紹該工具之后,該論文詳細(xì)說(shuō)明了如何依賴(lài)與 OpenAI 最近發(fā)布的 o1 模型中使用的「思維鏈」技術(shù),來(lái)讓模型對(duì)其輸出進(jìn)行可靠判斷。
這一技術(shù)通過(guò)將復(fù)雜問(wèn)題拆解為更小的邏輯步驟,顯著提高了在科學(xué)、編程和數(shù)學(xué)等領(lǐng)域解決難題的準(zhǔn)確性。
Meta 的研究人員完全使用 AI 生成的數(shù)據(jù)來(lái)訓(xùn)練這個(gè)評(píng)估器模型,完全消除了人工輸入的需求。
使用 AI 可靠地評(píng)估 AI 的能力展示了未來(lái)實(shí)現(xiàn)自主 AI 智能體的可能路徑。該項(xiàng)目的兩位 Meta 研究人員向路透社表示,這種 AI 智能體能夠從自身錯(cuò)誤中學(xué)習(xí)。
AI 領(lǐng)域的許多人設(shè)想,這類(lèi)智能體可以作為高度智能的數(shù)字助手,能夠在無(wú)需人類(lèi)干預(yù)的情況下執(zhí)行廣泛的任務(wù)。
自我改進(jìn)的 AI 模型有望取代當(dāng)前常用的昂貴且低效的基于人類(lèi)反饋的強(qiáng)化學(xué)習(xí)(RLHF)過(guò)程,這種方法要求具有專(zhuān)業(yè)知識(shí)的人類(lèi)標(biāo)注員來(lái)標(biāo)記數(shù)據(jù)并驗(yàn)證復(fù)雜數(shù)學(xué)和寫(xiě)作問(wèn)題的答案是否正確。
「我們希望,隨著 AI 的發(fā)展,它能越來(lái)越好地檢查自己的工作,從而超越普通人的表現(xiàn),」該項(xiàng)目研究員之一 Jason Weston 說(shuō)道。
他說(shuō):「自我學(xué)習(xí)并能自我評(píng)估是實(shí)現(xiàn)這種超越人類(lèi)水平 AI 的關(guān)鍵?!?/p>
包括谷歌和 Anthropic 在內(nèi)的其他公司也發(fā)布了關(guān)于 RLAIF(基于 AI 反饋的強(qiáng)化學(xué)習(xí))概念的研究。但與 Meta 不同的是,這些公司通常不公開(kāi)發(fā)布其模型供公眾使用。
Meta 在周五發(fā)布的其他 AI 工具還包括對(duì)公司圖像識(shí)別模型 Segment Anything 的更新、一種加快大語(yǔ)言模型(LLM)響應(yīng)生成時(shí)間的工具,以及可用于發(fā)現(xiàn)新型無(wú)機(jī)材料的數(shù)據(jù)集。
以上就是關(guān)于【Meta 發(fā)布可以檢查其他 AI 模型工作的 AI 模型】的相關(guān)內(nèi)容,希望對(duì)大家有幫助!
免責(zé)聲明:本文由用戶(hù)上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!
- 董明珠曾喊話(huà)雷軍給股民分多少錢(qián)!格力:擬分紅超55億
- Epic喜+1:動(dòng)作游戲《師父》免費(fèi)領(lǐng) 立省139元
- 雷軍辟謠只招聘35歲以下員工:僅針對(duì)未來(lái)之星項(xiàng)目
- 普華永道發(fā)布2025年AI預(yù)測(cè):AI Agents將勞動(dòng)力提升1倍
- 雷軍回應(yīng)股價(jià)暴跌:年年難過(guò)年年過(guò)
- 一天100座!理想汽車(chē)第1700座超充站正式建成
- 《守望先鋒》國(guó)服宣布2月19日回歸:賬號(hào)數(shù)據(jù)完整保留
- 雷軍建議創(chuàng)業(yè)者要多留點(diǎn)錢(qián)給員工:別到山窮水盡才講問(wèn)題
- 雷軍新年第一天收到200元紅包 自侃年入百萬(wàn)的開(kāi)始
- 雷軍親自展示REDMI Turbo 4!2025年第一款新機(jī)
- 雷軍:小米未來(lái)10年建至少20座世界頂級(jí)工廠(chǎng)
- 雷軍辟謠只招聘35歲以下員工:只有招聘未來(lái)之星時(shí)才有年齡限制
- 雷軍回應(yīng)100億造車(chē):沒(méi)有好到“封神” 不要神話(huà)我
- 雷軍表態(tài):一心做好小米汽車(chē) 大家可以在“許愿池”尋找商機(jī)
- 雷軍:中國(guó)汽車(chē)產(chǎn)業(yè)應(yīng)少些歪門(mén)邪道 不要發(fā)黑稿、背后捅刀子
- 小米SU7選配色都是7000元 為什么璀璨洋紅卻需要9000元
-
【孔子的成就簡(jiǎn)單點(diǎn)】孔子(公元前551年-公元前479年),名丘,字仲尼,是中國(guó)古代著名的思想家、教育家、政...瀏覽全文>>
-
【孔子的成就】孔子(公元前551年-公元前479年),名丘,字仲尼,是中國(guó)古代著名的思想家、教育家、政治家,...瀏覽全文>>
-
【空調(diào)外機(jī)聲音大是什么問(wèn)題】空調(diào)在使用過(guò)程中,如果發(fā)現(xiàn)外機(jī)發(fā)出異常的噪音,可能會(huì)讓人感到困擾。空調(diào)外機(jī)...瀏覽全文>>
-
【空調(diào)外機(jī)聲音大如何解決】空調(diào)在使用過(guò)程中,外機(jī)發(fā)出較大的噪音是很多用戶(hù)遇到的常見(jiàn)問(wèn)題。這不僅影響居住...瀏覽全文>>
-
【空調(diào)外機(jī)清洗方法是什么】空調(diào)外機(jī)是空調(diào)系統(tǒng)中非常重要的組成部分,它的清潔程度直接影響到空調(diào)的制冷效果...瀏覽全文>>
-
【空調(diào)突然不制冷的原因】當(dāng)家中的空調(diào)突然不再制冷時(shí),不僅影響使用體驗(yàn),還可能帶來(lái)一定的安全隱患。了解空...瀏覽全文>>
-
【空調(diào)銅管什么作用】空調(diào)在現(xiàn)代生活中扮演著越來(lái)越重要的角色,尤其是在夏季高溫時(shí),它為我們提供了舒適的室...瀏覽全文>>
-
【空調(diào)銅管結(jié)霜怎么回事】空調(diào)在使用過(guò)程中,有時(shí)會(huì)出現(xiàn)銅管結(jié)霜的現(xiàn)象,這不僅影響制冷效果,還可能對(duì)設(shè)備造...瀏覽全文>>
-
【空調(diào)銅管結(jié)霜是什么原因】當(dāng)空調(diào)運(yùn)行時(shí),如果發(fā)現(xiàn)室內(nèi)機(jī)的銅管出現(xiàn)結(jié)霜現(xiàn)象,這不僅影響制冷效果,還可能對(duì)...瀏覽全文>>
-
【空谷幽蘭是什么意思】“空谷幽蘭”是一個(gè)富有詩(shī)意的成語(yǔ),常用來(lái)形容在偏僻、冷清的地方生長(zhǎng)的蘭花。它不僅...瀏覽全文>>
- 空調(diào)突然不制冷的原因
- 空格怎么打出來(lái)
- 空城舊夢(mèng)是情侶網(wǎng)名嗎
- 可吸收線(xiàn)是什么顏色
- 可微與可導(dǎo)之間有什么聯(lián)系
- 康復(fù)是什么意思
- 康復(fù)評(píng)定包括哪5個(gè)方面
- 開(kāi)通QQ十周年黃鉆是不是可以永久使用十周年黃鉆標(biāo)志
- 卡路里和焦耳怎么換算
- 卡樂(lè)購(gòu)是什么意思
- 卡拉瓦喬代表作
- 巨鱷的電影有什么
- 巨大的英語(yǔ)是什么
- 禁閉島的結(jié)局真相
- 靳東個(gè)人資料
- 靳東的妹妹為什么叫高露
- 金枝玉葉繁殖方法
- 金針菜和黃花菜是一種嗎
- 金吉鳥(niǎo)健身私教一般多少
- 戒指戴什么手指好