讓魯迅說繞口令、赫本玩嘻哈,又一視頻模型火了,斯坦福華人博士創(chuàng)立
相信很多大家對讓魯迅說繞口令、赫本玩嘻哈,又一視頻模型火了,斯坦福華人博士創(chuàng)立還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
AI視頻領域卷瘋了。
Luma引發(fā)的狂歡還沒結束,AI視頻圈又來了個挑戰(zhàn)者——
斯坦福大學團隊出品的Proteus。
據(jù)介紹,Proteus 是一款低延遲基礎模型,可以生成高度真實且富有表現(xiàn)力的人物形象。
例如,讓世界名畫中的主角——蒙娜麗莎或者帶珍珠耳環(huán)的女孩——肆無忌憚地大笑,面部表情自然流暢
讓奧黛麗·赫本一改往日淑女形象,玩起嘻哈說唱
還讓《哈利·波特》中的斯內普教授唱《Despacito》
Proteus剛發(fā)布,一眾大佬發(fā)來「賀信」:
AI科學家賈揚清稱贊,實時人工智能頭像質量出奇得好。
英偉達科學家Jim Fan則表示,這一項目令人印象深刻。
早期投資人Brian Zhan發(fā)文稱,現(xiàn)有AI視頻工具,比如Runway和Pika,最大的問題就是會產(chǎn)生幻覺,尤其是在生成含有人類的視頻時。而Apparate Labs通過解決時間連貫性和對象恒定性等問題,使AI視頻生成步入下一個階段。
離譜!魯迅說起了繞口令
Proteus是新一代的基礎模型,用于人類的實時表情生成。
要知道,目前即便是最先進和最強大的生成模型,也無法完全實現(xiàn)人類表情的實時生成。
現(xiàn)有的模型運行速度緩慢,無法提供對生成人物的復雜面部表情和身體動作的直觀控制,而且它們在逼真度和表現(xiàn)力方面仍有所欠缺。
而Proteus采用了最先進的transformer 架構的潛在擴散模型,其創(chuàng)新性的潛在空間設計確保了實時的高效率,并且隨著架構和算法的持續(xù)優(yōu)化,Proteus能夠實現(xiàn)每秒100幀以上(100+ FPS)的視頻流。
換句話說,只需一張簡單的照片,Proteus不僅能夠模仿人類的笑聲、說唱、歌唱、眨眼、微笑和對話,還能執(zhí)行更多生動的表情和動作。
比如說,一向嚴肅的魯迅說起了繞口令
或者讓居里夫人清唱《Le Festin》
抑或是給科學家們開個圓桌會議
據(jù)Proteus研發(fā)團隊介紹,他們期望Proteus可以成為一個聲音可控的視覺化身,為人工智能對話實體提供一個直觀的交互界面,同時能夠與眾多多模態(tài)大語言模型無縫兼容,為各種不同的應用場景提供定制化服務。
對此,不少網(wǎng)友腦洞大開——
「只需要用愛因斯坦的數(shù)據(jù)對大語言模型進行微調,再配上他生動的面部表情,就能讓偉大的愛因斯坦化身教學助手,來親自教授物理課,青少年再也不用愁學不好科學了。」
還有網(wǎng)友表示,我愛死它了,今年絕對是AI視頻之年。
起底背后團隊
這款被大佬力捧、小而美的模型, 背后是個怎樣的團隊?
據(jù)官網(wǎng)介紹,這是由斯坦福大學的Apparate Labs研發(fā)出來的。
目前該團隊僅6人,從名字和照片來看,有3人為華人。
首席執(zhí)行官兼聯(lián)合創(chuàng)始人沈博魁(William Shen)博士就讀于斯坦福大學計算機科學系,由知名教授Silvio Savarese和Leonidas J. Guibas共同指導。
他的研究涵蓋人工智能多個領域,包括計算機視覺、機器人學、圖形學、生成模型和具身智能。其論文多次獲獎,例如在IEEE-CVPR獲得了最佳論文獎,還在RSS上入圍了最佳學生論文獎的決賽。
此前,他還以GPA4.0的優(yōu)異成績獲得斯坦福大學計算機科學學士學位。
首席技術官兼聯(lián)合創(chuàng)始人Connor Lin也是個學霸。
他本碩就讀于卡內基·梅隆大學,師從Keenan Crane教授。2020年前往斯坦福大學攻讀計算機博士。目前他是一名四年級在讀博士生,由Leonidas Guibas和Gordon Wetzstein兩位教授共同指導。
Connor Lin的研究聚焦于3D先驗知識和神經(jīng)表示,用于3D重建、生成和編輯,曾獲得David Cheriton斯坦福研究生獎學金的支持。
在攻讀博士期間,他在谷歌研究、英偉達研究和Adobe研究實習。此前,還在谷歌擔任軟件工程師,負責Pixel手機的人像模式開發(fā)。
此外,這小哥興趣廣泛,喜歡旅行和體育,喜歡烹飪、羽毛球、游泳、桌游和音樂,還是泰勒·斯威夫特的鐵桿粉絲
和Connor Lin一樣,首席科學家Linqi (Alex) Zhou也是斯坦福大學的一名博士生,由Stefano Ermon教授指導。
此前,Linqi Zhou在加州大學洛杉磯分校獲得了計算機科學和應用數(shù)學的學士學位,由Song-Chun Zhu教授和Ying-Nian Wu教授指導。
他主要在計算機視覺和機器學習領域進行研究,并致力于構建能夠以結構化和概率性方式理解世界的模型。
參考鏈接:
https://apparate.ai/stream.html
以上就是關于【讓魯迅說繞口令、赫本玩嘻哈,又一視頻模型火了,斯坦福華人博士創(chuàng)立】的相關內容,希望對大家有幫助!
免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關。財經(jīng)信息僅供讀者參考,并不構成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權請聯(lián)系刪除!
-
奔馳GLE作為豪華SUV市場中的佼佼者,憑借其卓越的性能、豪華的內飾以及寬敞的空間,吸引了眾多消費者的關注。...瀏覽全文>>
-
在2025年,安徽阜陽地區(qū)的帕薩特新能源汽車市場表現(xiàn)非常活躍。作為一款備受關注的新能源車型,帕薩特新能源憑...瀏覽全文>>
-
近日,滁州地區(qū)的大眾汽車經(jīng)銷商傳來好消息:備受矚目的2025款T-ROC探歌正式上市,并且以極具競爭力的價格吸引...瀏覽全文>>
-
在選擇一款新能源汽車時,了解其價格和配置是非常重要的一步。安徽淮南地區(qū)的長安啟源E07作為2024款的新車型,...瀏覽全文>>
-
阜陽長安啟源A05作為長安汽車旗下的全新車型,自推出以來便憑借其獨特的設計風格和豐富的配置吸引了眾多消費者...瀏覽全文>>
-
阜陽長安啟源A07作為一款備受矚目的新能源車型,以其豪華配置和親民的價格在市場上引起了廣泛關注。這款車型不...瀏覽全文>>
-
安徽淮南威然2024款價格及配置詳解隨著汽車市場的不斷更新?lián)Q代,上汽大眾旗下的MPV車型——威然(Viloran)憑...瀏覽全文>>
-
QQ多米新車報價2025款,買車省錢秘籍隨著汽車市場的不斷發(fā)展,消費者在選購車輛時不僅關注車型的性能和配置,...瀏覽全文>>
-
滁州途觀X 2024款最新價格及買車省錢秘籍隨著汽車市場的不斷發(fā)展,大眾途觀X作為一款兼具時尚與性能的中型SUV...瀏覽全文>>
-
隨著汽車市場的不斷發(fā)展,大眾蔚攬以其優(yōu)雅的設計和卓越的性能贏得了眾多消費者的青睞。作為一款兼具實用性和...瀏覽全文>>
- Nvidia DLSS 4 有望將游戲性能提高 8 倍
- 人工智能在預測自身免疫性疾病進展方面顯示出良好的前景
- 心理物理實驗揭示皮膚水分感知是如何改變的
- 科茨沃爾德公司慶祝圣誕節(jié)圓滿成功
- 南法納姆學校被評為薩里郡表現(xiàn)最好的小學
- 約克區(qū)九所小學將削減招生人數(shù)
- 松下新款電動汽車電池為 Lucid Gravity 帶來 450 英里續(xù)航里程
- 泰國旅游呈現(xiàn)新趨勢
- 研究人員找到在細胞水平上餓死前列腺癌腫瘤的新方法
- 領先的人工智能聊天機器人在測試中表現(xiàn)出類似癡呆癥的認知能力下降
- 龐大的 Project Zomboid build 42 終于可以玩了
- Steam Replay 回歸向您展示 2024 年您玩得最多的 PC 游戲
- Jollyes 推出強化的人才支持和招聘措施
- Karen Millen 與 Simon Harrison 共同推出全新高級珠寶系列
- 奇瑞風云A8L電動轎車刷新續(xù)航里程世界紀錄
- 虛擬藝術家將別克 Cascada 帶回 2026 款車型
- OnePlus 宣布推出新計劃解決綠線問題
- OnePlus Watch 3 將擁有更大的電池和更薄的機身
- 研究人員發(fā)現(xiàn)可變剪接與自身免疫性疾病遺傳之間的細胞類型特異性聯(lián)系
- 科學家確定腦細胞類型是排尿的主要控制者