最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

首頁 >> 今日更新 >

Meta 發(fā)布可以檢查其他 AI 模型工作的 AI 模型

2024-10-20 11:00:01 來源: 用戶: 

相信很多大家對Meta 發(fā)布可以檢查其他 AI 模型工作的 AI 模型還不知道吧,今天菲菲就帶你們一起去了解一下~.~!

10 月 20 日消息:Facebook 母公司 Meta 當?shù)貢r間周五正式發(fā)布了一批來自其研究部門的新 AI 模型,其中包括一個名為「自學(xué)評估器」(Self-Taught Evaluator)的模型,這可能為減少人類在 AI 開發(fā)過程中的參與度提供了一條新路徑。

此次發(fā)布緊隨 Meta 在 8 月份一篇論文中介紹該工具之后,該論文詳細說明了如何依賴與 OpenAI 最近發(fā)布的 o1 模型中使用的「思維鏈」技術(shù),來讓模型對其輸出進行可靠判斷。

這一技術(shù)通過將復(fù)雜問題拆解為更小的邏輯步驟,顯著提高了在科學(xué)、編程和數(shù)學(xué)等領(lǐng)域解決難題的準確性。

Meta 的研究人員完全使用 AI 生成的數(shù)據(jù)來訓(xùn)練這個評估器模型,完全消除了人工輸入的需求。

使用 AI 可靠地評估 AI 的能力展示了未來實現(xiàn)自主 AI 智能體的可能路徑。該項目的兩位 Meta 研究人員向路透社表示,這種 AI 智能體能夠從自身錯誤中學(xué)習(xí)。

AI 領(lǐng)域的許多人設(shè)想,這類智能體可以作為高度智能的數(shù)字助手,能夠在無需人類干預(yù)的情況下執(zhí)行廣泛的任務(wù)。

自我改進的 AI 模型有望取代當前常用的昂貴且低效的基于人類反饋的強化學(xué)習(xí)(RLHF)過程,這種方法要求具有專業(yè)知識的人類標注員來標記數(shù)據(jù)并驗證復(fù)雜數(shù)學(xué)和寫作問題的答案是否正確。

「我們希望,隨著 AI 的發(fā)展,它能越來越好地檢查自己的工作,從而超越普通人的表現(xiàn),」該項目研究員之一 Jason Weston 說道。

他說:「自我學(xué)習(xí)并能自我評估是實現(xiàn)這種超越人類水平 AI 的關(guān)鍵。」

包括谷歌和 Anthropic 在內(nèi)的其他公司也發(fā)布了關(guān)于 RLAIF(基于 AI 反饋的強化學(xué)習(xí))概念的研究。但與 Meta 不同的是,這些公司通常不公開發(fā)布其模型供公眾使用。

Meta 在周五發(fā)布的其他 AI 工具還包括對公司圖像識別模型 Segment Anything 的更新、一種加快大語言模型(LLM)響應(yīng)生成時間的工具,以及可用于發(fā)現(xiàn)新型無機材料的數(shù)據(jù)集。

以上就是關(guān)于【Meta 發(fā)布可以檢查其他 AI 模型工作的 AI 模型】的相關(guān)內(nèi)容,希望對大家有幫助!

  免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權(quán)請聯(lián)系刪除!

 
分享:
最新文章