Meta 發(fā)布可以檢查其他 AI 模型工作的 AI 模型

2024-10-20 11:00:01 來(lái)源：用戶(hù)：

相信很多大家對(duì)Meta 發(fā)布可以檢查其他 AI 模型工作的 AI 模型還不知道吧，今天菲菲就帶你們一起去了解一下~.~！

10 月 20 日消息:Facebook 母公司 Meta 當(dāng)?shù)貢r(shí)間周五正式發(fā)布了一批來(lái)自其研究部門(mén)的新 AI 模型，其中包括一個(gè)名為「自學(xué)評(píng)估器」（Self-Taught Evaluator）的模型，這可能為減少人類(lèi)在 AI 開(kāi)發(fā)過(guò)程中的參與度提供了一條新路徑。

此次發(fā)布緊隨 Meta 在 8 月份一篇論文中介紹該工具之后，該論文詳細(xì)說(shuō)明了如何依賴(lài)與 OpenAI 最近發(fā)布的 o1 模型中使用的「思維鏈」技術(shù)，來(lái)讓模型對(duì)其輸出進(jìn)行可靠判斷。

這一技術(shù)通過(guò)將復(fù)雜問(wèn)題拆解為更小的邏輯步驟，顯著提高了在科學(xué)、編程和數(shù)學(xué)等領(lǐng)域解決難題的準(zhǔn)確性。

Meta 的研究人員完全使用 AI 生成的數(shù)據(jù)來(lái)訓(xùn)練這個(gè)評(píng)估器模型，完全消除了人工輸入的需求。

使用 AI 可靠地評(píng)估 AI 的能力展示了未來(lái)實(shí)現(xiàn)自主 AI 智能體的可能路徑。該項(xiàng)目的兩位 Meta 研究人員向路透社表示，這種 AI 智能體能夠從自身錯(cuò)誤中學(xué)習(xí)。

AI 領(lǐng)域的許多人設(shè)想，這類(lèi)智能體可以作為高度智能的數(shù)字助手，能夠在無(wú)需人類(lèi)干預(yù)的情況下執(zhí)行廣泛的任務(wù)。

自我改進(jìn)的 AI 模型有望取代當(dāng)前常用的昂貴且低效的基于人類(lèi)反饋的強(qiáng)化學(xué)習(xí)（RLHF）過(guò)程，這種方法要求具有專(zhuān)業(yè)知識(shí)的人類(lèi)標(biāo)注員來(lái)標(biāo)記數(shù)據(jù)并驗(yàn)證復(fù)雜數(shù)學(xué)和寫(xiě)作問(wèn)題的答案是否正確。

「我們希望，隨著 AI 的發(fā)展，它能越來(lái)越好地檢查自己的工作，從而超越普通人的表現(xiàn)，」該項(xiàng)目研究員之一 Jason Weston 說(shuō)道。

他說(shuō)：「自我學(xué)習(xí)并能自我評(píng)估是實(shí)現(xiàn)這種超越人類(lèi)水平 AI 的關(guān)鍵?！?/p>

包括谷歌和 Anthropic 在內(nèi)的其他公司也發(fā)布了關(guān)于 RLAIF（基于 AI 反饋的強(qiáng)化學(xué)習(xí)）概念的研究。但與 Meta 不同的是，這些公司通常不公開(kāi)發(fā)布其模型供公眾使用。

Meta 在周五發(fā)布的其他 AI 工具還包括對(duì)公司圖像識(shí)別模型 Segment Anything 的更新、一種加快大語(yǔ)言模型（LLM）響應(yīng)生成時(shí)間的工具，以及可用于發(fā)現(xiàn)新型無(wú)機(jī)材料的數(shù)據(jù)集。

以上就是關(guān)于【Meta 發(fā)布可以檢查其他 AI 模型工作的 AI 模型】的相關(guān)內(nèi)容，希望對(duì)大家有幫助！

　　免責(zé)聲明：本文由用戶(hù)上傳，與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考，并不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。如有侵權(quán)請(qǐng)聯(lián)系刪除！

相關(guān)閱讀

最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

Meta 發(fā)布可以檢查其他 AI 模型工作的 AI 模型