最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

首頁(yè) >> 精選經(jīng)驗(yàn) >

一個(gè)可以提高家庭助理社交智能的框架

2023-02-01 17:54:31 來源: 用戶: 

現(xiàn)有的人工智能代理和機(jī)器人只有在被明確指示時(shí)才幫助人類。換句話說,他們不會(huì)直觀地確定在特定時(shí)刻如何提供幫助,而是等待人類告訴他們需要什么幫助。

麻省理工學(xué)院(MIT)的研究人員最近開發(fā)了NOPA(神經(jīng)引導(dǎo)的在線概率援助),這是一個(gè)框架,可以讓人工代理自主確定如何在不同時(shí)間最好地幫助人類用戶。該框架在arXiv上預(yù)先發(fā)表的一篇論文中介紹,并計(jì)劃在ICRA 2023上發(fā)表,可以使機(jī)器人和家庭助理的開發(fā)更具響應(yīng)性和社交智能性。

“我們有興趣研究可以幫助人類在模擬家庭環(huán)境中完成任務(wù)的代理,以便最終這些代理可以成為幫助人們?cè)诩抑械臋C(jī)器人,”進(jìn)行這項(xiàng)研究的研究人員之一Xavier Puig告訴Tech Xplore。“為了實(shí)現(xiàn)這一目標(biāo),一個(gè)大問題是如何向這些代理指定我們希望他們幫助我們完成的任務(wù)。一種選擇是通過語(yǔ)言描述或演示來指定此任務(wù),但這需要人類用戶進(jìn)行額外的工作。

普伊格和他的同事最近工作的過度目標(biāo)是構(gòu)建人工智能驅(qū)動(dòng)的代理,可以同時(shí)推斷人類用戶試圖解決的任務(wù)并適當(dāng)?shù)貛椭麄?。他們將這個(gè)問題稱為“在線觀察和幫助”。

可靠地解決這個(gè)問題可能很困難。造成這種情況的主要原因是,如果機(jī)器人過早開始幫助人類,它可能無法認(rèn)識(shí)到人類總體上想要實(shí)現(xiàn)的目標(biāo),因此它對(duì)任務(wù)的貢獻(xiàn)可能會(huì)適得其反。

“例如,如果人類用戶在廚房里,機(jī)器人可能會(huì)試圖幫助他們將餐具存放在櫥柜中,而人類想要擺桌子,”普伊格解釋說。“但是,如果代理人等待太久才能了解人類的意圖是什么,那么他們可能為時(shí)已晚。在上面概述的情況下,我們的框架將允許機(jī)器人代理通過遞上盤子來幫助人類,無論這些盤子是做什么用的。

從本質(zhì)上講,研究人員創(chuàng)建的框架不是預(yù)測(cè)人類用戶試圖解決的單個(gè)目標(biāo),而是允許代理預(yù)測(cè)一系列目標(biāo)。這反過來又允許機(jī)器人或人工智能助手以符合這些目標(biāo)的方式提供幫助,而無需等待太長(zhǎng)時(shí)間。

“像Alexa這樣的普通家庭助理只有在被要求時(shí)才會(huì)提供幫助,”進(jìn)行這項(xiàng)研究的另一位研究員舒天民告訴Tech Xplore。“然而,人類可以以更復(fù)雜的方式互相幫助。例如,當(dāng)你看到你的伴侶帶著沉重的袋子從雜貨店回家時(shí),你可以直接幫助他們拿這些袋子。如果你等到你的伴侶要求你幫忙,那么你的伴侶可能不會(huì)高興。

大約二十年前,馬克斯·普朗克進(jìn)化人類學(xué)研究所的研究人員表明,人類幫助有需要的人的天生傾向很早就發(fā)展起來了。在一系列實(shí)驗(yàn)中,年僅18個(gè)月大的孩子可以準(zhǔn)確地推斷出他人的簡(jiǎn)單意圖,并幫助他們實(shí)現(xiàn)目標(biāo)。

利用他們的框架,Puig,Shu和他們的同事希望為家庭助理配備這些相同的“幫助能力”,使他們能夠通過觀察它們來自動(dòng)推斷人類試圖做什么,然后以適當(dāng)?shù)姆绞讲扇⌒袆?dòng)。這樣,人類將不再需要不斷地向機(jī)器人發(fā)出指令,而可以簡(jiǎn)單地專注于手頭的任務(wù)。

“NOPA是一種同時(shí)推斷人類目標(biāo)并幫助他們實(shí)現(xiàn)這些目標(biāo)的方法,”Puig和Shu解釋說。“為了推斷目標(biāo),我們首先使用一個(gè)神經(jīng)網(wǎng)絡(luò),根據(jù)人類所做的事情提出多個(gè)目標(biāo)。然后,我們使用一種稱為逆向規(guī)劃的推理方法來評(píng)估這些目標(biāo)。這個(gè)想法是,對(duì)于每個(gè)目標(biāo),我們可以想象人類為實(shí)現(xiàn)該目標(biāo)而采取的理性行動(dòng)是什么;如果想象的行動(dòng)與觀察到的行動(dòng)不一致,我們拒絕該目標(biāo)提案。

從本質(zhì)上講,NOPA框架不斷維護(hù)一組人類可能試圖解決的可能目標(biāo),隨著新的人類行為的觀察,不斷更新這一集。在不同的時(shí)間點(diǎn),幫助計(jì)劃者會(huì)搜索一個(gè)共同的子目標(biāo),這將是解決所有當(dāng)前可能目標(biāo)集的一步。最后,它尋找有助于實(shí)現(xiàn)這一次級(jí)目標(biāo)的具體行動(dòng)。

“例如,目標(biāo)可能是把蘋果放在冰箱里,或者把蘋果放在桌子上,”普伊格和舒說。“我們的人工智能助手不會(huì)隨機(jī)猜測(cè)目標(biāo)位置并在那里放蘋果,而是會(huì)撿起蘋果并將它們交付給人類。通過這種方式,我們可以避免因幫助實(shí)現(xiàn)錯(cuò)誤的目標(biāo)而破壞環(huán)境,同時(shí)仍然為人類節(jié)省時(shí)間和精力。

到目前為止,Puig,Shu和他們的同事在模擬環(huán)境中評(píng)估了他們的框架。雖然他們期望它允許代理在目標(biāo)不明確的情況下幫助人類用戶,但他們沒有預(yù)料到他們?cè)谀M中觀察到的一些有趣的行為。

“首先,我們發(fā)現(xiàn)代理商能夠糾正他們的行為,以盡量減少對(duì)房屋的干擾,”普伊格解釋說。“例如,如果他們挑選了一個(gè)物體,后來發(fā)現(xiàn)該物體與任務(wù)無關(guān),他們會(huì)將物體放回原來的地方以保持房屋整潔。其次,當(dāng)不確定目標(biāo)時(shí),智能體會(huì)選擇通常有用的行動(dòng),而不管人類的目標(biāo)如何,例如將盤子交給人類,而不是承諾將其帶到桌子或儲(chǔ)物柜中。

在模擬中,Puig,Shu及其同事創(chuàng)建的框架取得了非常有希望的結(jié)果。即使團(tuán)隊(duì)最初調(diào)整了輔助代理以協(xié)助代表人類用戶的模型(以節(jié)省實(shí)際測(cè)試的時(shí)間和成本),也發(fā)現(xiàn)代理在與真實(shí)人類交互時(shí)實(shí)現(xiàn)了類似的性能。

未來,NOPA框架可以幫助提高現(xiàn)有和新開發(fā)的家庭助理的能力。此外,它可能會(huì)激發(fā)創(chuàng)建類似的方法,以創(chuàng)建更直觀和社會(huì)協(xié)調(diào)的AI。

“到目前為止,我們只在具體模擬中評(píng)估了該方法,”Shu補(bǔ)充道。“我們現(xiàn)在想將這種方法應(yīng)用于真實(shí)家庭中的真實(shí)機(jī)器人。此外,我們希望將口頭交流納入框架,以便AI助手可以更好地幫助人類。

  免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!

 
分享:
最新文章