一個(gè)可以提高家庭助理社交智能的框架

2023-02-01 17:54:31 來源：用戶：

現(xiàn)有的人工智能代理和機(jī)器人只有在被明確指示時(shí)才幫助人類。換句話說，他們不會(huì)直觀地確定在特定時(shí)刻如何提供幫助，而是等待人類告訴他們需要什么幫助。

麻省理工學(xué)院(MIT)的研究人員最近開發(fā)了NOPA(神經(jīng)引導(dǎo)的在線概率援助)，這是一個(gè)框架，可以讓人工代理自主確定如何在不同時(shí)間最好地幫助人類用戶。該框架在arXiv上預(yù)先發(fā)表的一篇論文中介紹，并計(jì)劃在ICRA 2023上發(fā)表，可以使機(jī)器人和家庭助理的開發(fā)更具響應(yīng)性和社交智能性。

“我們有興趣研究可以幫助人類在模擬家庭環(huán)境中完成任務(wù)的代理，以便最終這些代理可以成為幫助人們?cè)诩抑械臋C(jī)器人，”進(jìn)行這項(xiàng)研究的研究人員之一Xavier Puig告訴Tech Xplore。“為了實(shí)現(xiàn)這一目標(biāo)，一個(gè)大問題是如何向這些代理指定我們希望他們幫助我們完成的任務(wù)。一種選擇是通過語(yǔ)言描述或演示來指定此任務(wù)，但這需要人類用戶進(jìn)行額外的工作。

普伊格和他的同事最近工作的過度目標(biāo)是構(gòu)建人工智能驅(qū)動(dòng)的代理，可以同時(shí)推斷人類用戶試圖解決的任務(wù)并適當(dāng)?shù)貛椭麄?。他們將這個(gè)問題稱為“在線觀察和幫助”。

可靠地解決這個(gè)問題可能很困難。造成這種情況的主要原因是，如果機(jī)器人過早開始幫助人類，它可能無法認(rèn)識(shí)到人類總體上想要實(shí)現(xiàn)的目標(biāo)，因此它對(duì)任務(wù)的貢獻(xiàn)可能會(huì)適得其反。

“例如，如果人類用戶在廚房里，機(jī)器人可能會(huì)試圖幫助他們將餐具存放在櫥柜中，而人類想要擺桌子，”普伊格解釋說。“但是，如果代理人等待太久才能了解人類的意圖是什么，那么他們可能為時(shí)已晚。在上面概述的情況下，我們的框架將允許機(jī)器人代理通過遞上盤子來幫助人類，無論這些盤子是做什么用的。

從本質(zhì)上講，研究人員創(chuàng)建的框架不是預(yù)測(cè)人類用戶試圖解決的單個(gè)目標(biāo)，而是允許代理預(yù)測(cè)一系列目標(biāo)。這反過來又允許機(jī)器人或人工智能助手以符合這些目標(biāo)的方式提供幫助，而無需等待太長(zhǎng)時(shí)間。

“像Alexa這樣的普通家庭助理只有在被要求時(shí)才會(huì)提供幫助，”進(jìn)行這項(xiàng)研究的另一位研究員舒天民告訴Tech Xplore。“然而，人類可以以更復(fù)雜的方式互相幫助。例如，當(dāng)你看到你的伴侶帶著沉重的袋子從雜貨店回家時(shí)，你可以直接幫助他們拿這些袋子。如果你等到你的伴侶要求你幫忙，那么你的伴侶可能不會(huì)高興。

大約二十年前，馬克斯·普朗克進(jìn)化人類學(xué)研究所的研究人員表明，人類幫助有需要的人的天生傾向很早就發(fā)展起來了。在一系列實(shí)驗(yàn)中，年僅18個(gè)月大的孩子可以準(zhǔn)確地推斷出他人的簡(jiǎn)單意圖，并幫助他們實(shí)現(xiàn)目標(biāo)。

利用他們的框架，Puig，Shu和他們的同事希望為家庭助理配備這些相同的“幫助能力”，使他們能夠通過觀察它們來自動(dòng)推斷人類試圖做什么，然后以適當(dāng)?shù)姆绞讲扇⌒袆?dòng)。這樣，人類將不再需要不斷地向機(jī)器人發(fā)出指令，而可以簡(jiǎn)單地專注于手頭的任務(wù)。

“NOPA是一種同時(shí)推斷人類目標(biāo)并幫助他們實(shí)現(xiàn)這些目標(biāo)的方法，”Puig和Shu解釋說。“為了推斷目標(biāo)，我們首先使用一個(gè)神經(jīng)網(wǎng)絡(luò)，根據(jù)人類所做的事情提出多個(gè)目標(biāo)。然后，我們使用一種稱為逆向規(guī)劃的推理方法來評(píng)估這些目標(biāo)。這個(gè)想法是，對(duì)于每個(gè)目標(biāo)，我們可以想象人類為實(shí)現(xiàn)該目標(biāo)而采取的理性行動(dòng)是什么;如果想象的行動(dòng)與觀察到的行動(dòng)不一致，我們拒絕該目標(biāo)提案。

從本質(zhì)上講，NOPA框架不斷維護(hù)一組人類可能試圖解決的可能目標(biāo)，隨著新的人類行為的觀察，不斷更新這一集。在不同的時(shí)間點(diǎn)，幫助計(jì)劃者會(huì)搜索一個(gè)共同的子目標(biāo)，這將是解決所有當(dāng)前可能目標(biāo)集的一步。最后，它尋找有助于實(shí)現(xiàn)這一次級(jí)目標(biāo)的具體行動(dòng)。

“例如，目標(biāo)可能是把蘋果放在冰箱里，或者把蘋果放在桌子上，”普伊格和舒說。“我們的人工智能助手不會(huì)隨機(jī)猜測(cè)目標(biāo)位置并在那里放蘋果，而是會(huì)撿起蘋果并將它們交付給人類。通過這種方式，我們可以避免因幫助實(shí)現(xiàn)錯(cuò)誤的目標(biāo)而破壞環(huán)境，同時(shí)仍然為人類節(jié)省時(shí)間和精力。

到目前為止，Puig，Shu和他們的同事在模擬環(huán)境中評(píng)估了他們的框架。雖然他們期望它允許代理在目標(biāo)不明確的情況下幫助人類用戶，但他們沒有預(yù)料到他們?cè)谀M中觀察到的一些有趣的行為。

“首先，我們發(fā)現(xiàn)代理商能夠糾正他們的行為，以盡量減少對(duì)房屋的干擾，”普伊格解釋說。“例如，如果他們挑選了一個(gè)物體，后來發(fā)現(xiàn)該物體與任務(wù)無關(guān)，他們會(huì)將物體放回原來的地方以保持房屋整潔。其次，當(dāng)不確定目標(biāo)時(shí)，智能體會(huì)選擇通常有用的行動(dòng)，而不管人類的目標(biāo)如何，例如將盤子交給人類，而不是承諾將其帶到桌子或儲(chǔ)物柜中。

在模擬中，Puig，Shu及其同事創(chuàng)建的框架取得了非常有希望的結(jié)果。即使團(tuán)隊(duì)最初調(diào)整了輔助代理以協(xié)助代表人類用戶的模型(以節(jié)省實(shí)際測(cè)試的時(shí)間和成本)，也發(fā)現(xiàn)代理在與真實(shí)人類交互時(shí)實(shí)現(xiàn)了類似的性能。

未來，NOPA框架可以幫助提高現(xiàn)有和新開發(fā)的家庭助理的能力。此外，它可能會(huì)激發(fā)創(chuàng)建類似的方法，以創(chuàng)建更直觀和社會(huì)協(xié)調(diào)的AI。

“到目前為止，我們只在具體模擬中評(píng)估了該方法，”Shu補(bǔ)充道。“我們現(xiàn)在想將這種方法應(yīng)用于真實(shí)家庭中的真實(shí)機(jī)器人。此外，我們希望將口頭交流納入框架，以便AI助手可以更好地幫助人類。

　　免責(zé)聲明：本文由用戶上傳，與本網(wǎng)站立場(chǎng)無關(guān)。財(cái)經(jīng)信息僅供讀者參考，并不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。如有侵權(quán)請(qǐng)聯(lián)系刪除！

相關(guān)閱讀

最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

一個(gè)可以提高家庭助理社交智能的框架