最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

首頁 >> 今日更新 >

英特爾團隊提出L-MAGIC新技術 通過結合語言模型讓圖像擴散模型生成高質量360度場景

2024-06-11 14:30:22 來源: 用戶: 

相信很多大家對英特爾團隊提出L-MAGIC新技術 通過結合語言模型讓圖像擴散模型生成高質量360度場景還不知道吧,今天菲菲就帶你們一起去了解一下~.~!

站長之家(ChinaZ.com)6月11日 消息:在CVPR2024上,美國英特爾研究院的蔡志鵬博士及其團隊提出了一種名為L-MAGIC(Language Model Assisted Generation of Images with Coherence)的新技術。這項技術通過結合語言模型和圖像擴散模型,實現(xiàn)了高質量、多模態(tài)、零樣本泛化的360度場景生成。

核心特點:

結合語言模型和擴散模型:L-MAGIC利用自然圖像連接不同模態(tài)的輸入,并通過條件擴散模型如ControlNet從各種模態(tài)輸入生成自然圖像。

迭代變形和填充:在獲得自然圖像后,L-MAGIC通過迭代變形(warping)和填充(inpainting)生成360度場景的多個視角,使用基于擴散的圖像填充模型(如Stable Diffusion v2)生成缺失像素。

語言模型控制:L-MAGIC使用語言模型自動控制擴散模型,根據(jù)每個視角需要生成的場景內(nèi)容,有效保持語言及擴散模型的泛化性。

多樣化場景生成:L-MAGIC能夠生成多樣化的全局場景結構,無需微調(diào),從而實現(xiàn)多樣化場景的高質量生成。

多模態(tài)輸入:除了自然圖像,L-MAGIC還能接受文字、手繪草圖、深度圖等多種模態(tài)的輸入。

實驗結果表明:

L-MAGIC在圖像到360度場景生成及文字到360度場景生成任務中均達到了SOTA(State of the Art)。

能夠生成具有多樣化360度場景結構的全景圖,并且能夠平滑地完成360度閉環(huán)。

除了文字和自然圖像,L-MAGIC還能夠使用ControlNet接受多樣化的輸入,如深度圖、設計草圖等。

技術應用:

L-MAGIC還能夠利用深度估計模型生成場景的沉浸式視頻和三維點云,為場景理解和可視化提供了更多可能性。

項目主頁:https://zhipengcai.github.io/MMPano/

以上就是關于【英特爾團隊提出L-MAGIC新技術 通過結合語言模型讓圖像擴散模型生成高質量360度場景】的相關內(nèi)容,希望對大家有幫助!

  免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關。財經(jīng)信息僅供讀者參考,并不構成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權請聯(lián)系刪除!

 
分享:
最新文章
  • 【空谷幽蘭是什么意思】“空谷幽蘭”是一個富有詩意的成語,常用來形容在偏僻、冷清的地方生長的蘭花。它不僅...瀏覽全文>>
  • 【空格怎么打出來】在日常使用電腦或手機輸入文字時,經(jīng)常會遇到需要輸入“空格”的情況。雖然看似簡單,但很...瀏覽全文>>
  • 【空格怎么打】在日常使用電腦或手機時,很多人會遇到“空格怎么打”的問題。其實,“空格”是一個非?;A的...瀏覽全文>>
  • 【空格名字怎么打】在日常使用電腦或手機時,很多人會遇到“空格名字怎么打”的問題。尤其是在輸入法設置、文...瀏覽全文>>
  • 【空格鍵是指的哪一個】在日常使用電腦或手機的過程中,我們經(jīng)常接觸到各種按鍵,其中“空格鍵”是一個非?;?..瀏覽全文>>
  • 【空擋是什么意思】“空擋”是一個在多個領域中常見的術語,尤其在汽車駕駛、機械操作以及一些比喻性表達中使...瀏覽全文>>
  • 【空城舊夢是情侶網(wǎng)名嗎】“空城舊夢”這個詞語,聽起來充滿了詩意和情感色彩。它常被用于表達一種孤獨、懷念...瀏覽全文>>
  • 【可吸收線是什么顏色】在醫(yī)學領域,尤其是外科手術中,可吸收線是一種常見的縫合材料。它主要用于縫合傷口,...瀏覽全文>>
  • 【可為是什么意思】“可為”一詞源自中文,常用于表達“可以做”、“值得做”或“有作為”的含義。在不同語境...瀏覽全文>>
  • 【可微與可導之間有什么聯(lián)系】在微積分的學習過程中,“可導”和“可微”是兩個經(jīng)常被提到的概念,它們看似相...瀏覽全文>>