套殼丑聞讓斯坦福AI Lab主任怒了！抄襲團(tuán)隊(duì)2人甩鍋1人失蹤、前科經(jīng)歷被扒，網(wǎng)友：重新認(rèn)識(shí)中國(guó)開(kāi)源模型

2024-06-04 14:00:05 來(lái)源：用戶(hù)：

相信很多大家對(duì)套殼丑聞讓斯坦福AI Lab主任怒了！抄襲團(tuán)隊(duì)2人甩鍋1人失蹤、前科經(jīng)歷被扒，網(wǎng)友：重新認(rèn)識(shí)中國(guó)開(kāi)源模型還不知道吧，今天菲菲就帶你們一起去了解一下~.~！

斯坦福團(tuán)隊(duì)抄襲清華系大模型事件后續(xù)來(lái)了——

Llama3-V團(tuán)隊(duì)承認(rèn)抄襲，其中兩位來(lái)自斯坦福的本科生還跟另一位作者切割了。

最新致歉推文，由Siddharth Sharma（悉達(dá)多）和Aksh Garg(阿克什)發(fā)出。

不在其中、來(lái)自南加利福尼亞大學(xué)的Mustafa Aljadery（簡(jiǎn)稱(chēng)老穆）被指是主要過(guò)錯(cuò)方，并且自昨天起人就失蹤了:

被指跑路的老穆本人，X主頁(yè)目前已經(jīng)開(kāi)啟保護(hù)鎖定狀態(tài)，申請(qǐng)才能關(guān)注:

整體來(lái)看，這條致歉推文和昨天那條發(fā)出后又急忙刪掉的推文內(nèi)容大差不差，主要是突出了道歉和進(jìn)一步甩鍋。

畢竟連斯坦福人工智能實(shí)驗(yàn)室主任Christopher Manning都下場(chǎng)開(kāi)噴:

他認(rèn)為團(tuán)隊(duì)在事發(fā)后避重就輕，用“架構(gòu)相似”、“MiniCPM比我們更快實(shí)現(xiàn)”的借口推脫，拒不承認(rèn)是抄襲。

但全新道歉聲明，并沒(méi)有止住網(wǎng)友們的質(zhì)疑。并且最新爆料還指出，這幾位老哥根本就是抄襲慣犯，之前寫(xiě)的教材也是一整個(gè)大抄特抄。

而原作者團(tuán)隊(duì)面壁智能這邊，除CEO李大海昨天回應(yīng)“也是一種受到國(guó)際團(tuán)隊(duì)認(rèn)可的方式”外，首席科學(xué)家劉知遠(yuǎn)也已在知乎出面“親自答”:

新的證據(jù)

還是先來(lái)簡(jiǎn)單回顧一下這個(gè)大瓜。

一句話(huà)總結(jié)就是，有網(wǎng)友發(fā)現(xiàn)，最近在開(kāi)源社區(qū)大火的斯坦福團(tuán)隊(duì)多模態(tài)大模型Llama3-V，架構(gòu)和代碼與國(guó)產(chǎn)MiniCPM-Llama3-V2.5幾乎一毛一樣，并列舉了諸多證據(jù)直指Llama3-V抄襲。

隨著事件逐漸發(fā)酵，斯坦福AI團(tuán)隊(duì)刪庫(kù)跑路，面壁智能團(tuán)隊(duì)也就此事展開(kāi)了調(diào)查。

面壁智能首席科學(xué)家、清華大學(xué)長(zhǎng)聘副教授劉知遠(yuǎn)給出的判斷Llama3-V是MiniCPM-Llama3-V2.5套殼的一大理由，正是對(duì)于清華簡(jiǎn)的識(shí)別能力。

這是MiniCPM-Llama3-V2.5的“彩蛋”能力，是他們用了從清華簡(jiǎn)逐字掃描并標(biāo)注的數(shù)據(jù)集訓(xùn)練的，并未公開(kāi)。而Llama3-V的表現(xiàn)和MiniCPM-Llama3-V2.5一模一樣，不僅做對(duì)的題一樣，出錯(cuò)的地方都一樣。

今天，在第一波證據(jù)的基礎(chǔ)之上，又有其他網(wǎng)友扒出了新線(xiàn)索。

有人研究后發(fā)現(xiàn)，Llama3-V幾乎每一層的權(quán)重差值都符合均值為0、標(biāo)準(zhǔn)差為1.4e-3的高斯分布。

于是推測(cè)，Llama3-V只是直接在MiniCPM的權(quán)重上添加了低方差噪聲。

除此之外，那個(gè)跑路的大兄弟老穆還被曝之前寫(xiě)了本關(guān)于“計(jì)算機(jī)網(wǎng)絡(luò)設(shè)計(jì)”的書(shū)，也是抄的。

從書(shū)中隨便抽出一章，用抄襲檢測(cè)器檢測(cè)一下就是一堆紅點(diǎn):

以及，這本書(shū)的作者欄里，據(jù)網(wǎng)友爆料也有悉達(dá)多的名字。

也有網(wǎng)友認(rèn)為抄書(shū)這事兒是不是真的還有待考究。不過(guò)，現(xiàn)在這本書(shū)也404了。

說(shuō)回這次的抄襲，悉達(dá)多和阿克什的致歉聲明中也有提到他們之所以和穆哥一起宣傳這個(gè)項(xiàng)目，最初也是被這個(gè)多模態(tài)模型驚艷到了，特別喜歡穆哥所描述的基于Idefics、SigLip和UHD的架構(gòu)擴(kuò)展。

但實(shí)際上網(wǎng)友一早扒出Llama3-V在空間模式等很多方面的具體實(shí)現(xiàn)都和LLaVA-UHD不同，卻跟MiniCPM-Llama3-V2.5出奇一致。

根據(jù)MiniCPM-Llama3-V2.5主頁(yè)介紹，MiniCPM-Llama3-V2.5是面壁智能MiniCPM-V系列的最新開(kāi)源模型，基于SigLip-400M和Llama3-8B-Instruct構(gòu)建，總共8B參數(shù)。

從性能上講，MiniCPM-Llama3-V2.5在OpenCompass上取得了65.1的平均分，性能超過(guò)如GPT-4V-1106、Gemini Pro、Claude3、Qwen-VL-Max等專(zhuān)有模型，且顯著超越其他基于Llama3的多模態(tài)語(yǔ)言模型。

此外，MiniCPM-Llama3-V2.5的OCR能力也很強(qiáng)，在OCRBench上得分700+，超越GPT-4o、GPT-4V-0409、Qwen-VL-Max和Gemini Pro。

基于最新的RLAIF-V方法，MiniCPM-Llama3-V2.5在Object HalBench上的幻覺(jué)率為10.3%，也低于GPT-4V-1106的13.6%。

“中國(guó)大模型被忽視了”

盡管甩鍋甩得飛快，但網(wǎng)友們很快又從阿克什和悉達(dá)多童鞋的道歉聲明里發(fā)現(xiàn)了華點(diǎn):

合著你倆啥也沒(méi)干，幫著搞搞推廣就算項(xiàng)目作者啦?

還有網(wǎng)友挑起了一個(gè)更關(guān)鍵的話(huà)題，進(jìn)一步引發(fā)熱議——

開(kāi)源社區(qū)是否忽視了來(lái)自中國(guó)的大模型成果?

谷歌DeepMind研究員、ViT作者Lucas Beyer就提到，Llama3-V是抄的，但成本低于500美元，效果卻能直追Gemini、GPT-4的開(kāi)源模型確實(shí)存在:

抱抱臉平臺(tái)和社區(qū)負(fù)責(zé)人Omar Sanseviero說(shuō)的更加直接:

對(duì)此，不少網(wǎng)友表示贊同，“他們推出了目前最好的開(kāi)源VLM”。

從更客觀的大模型競(jìng)技場(chǎng)的角度看，此言不虛。

在模型一對(duì)一PK的視覺(jué)大模型競(jìng)技場(chǎng)中，來(lái)自零一萬(wàn)物的Yi-VL-Plus排名第五，超過(guò)了谷歌的Gemini Pro Vision。智譜AI和清華合作的CogVLM也躋身前十。

此外，DeepSeek、通義千問(wèn)和這次遭到抄襲的MiniCPM系列多模態(tài)模型，也都有不錯(cuò)的表現(xiàn)。

在更受到廣泛認(rèn)可的LMSYS Chatbot Arena Leaderboard競(jìng)技場(chǎng)榜單中，來(lái)自中國(guó)的大模型也同樣在不斷刷新“最強(qiáng)開(kāi)源”的新紀(jì)錄。

正如劉知遠(yuǎn)老師所說(shuō):

此瓜甚巨，吃瓜者眾，或許更重要的是，一些成見(jiàn)正在破壁。你覺(jué)得呢?

MiniCPM原論文

https://arxiv.org/abs/2404.06395

參考鏈接:

[1]https://x.com/AkshGarg03/status/1797682238961914370

[2]https://x.com/siddrrsh/status/1797682242145464814

[3]https://x.com/teortaxesTex/status/1797712605286645846

[4]https://x.com/chrmanning/status/1797664513367630101

[5]https://x.com/RylanSchaeffer/status/1797690302167417322

[6]https://x.com/giffmana/status/1797603355919028547

[7]https://x.com/RylanSchaeffer/status/1797690302167417322

[8]https://x.com/osanseviero/status/1797635895610540076

[9]https://huggingface.co/spaces/WildVision/vision-arena

以上就是關(guān)于【套殼丑聞讓斯坦福AI Lab主任怒了！抄襲團(tuán)隊(duì)2人甩鍋1人失蹤、前科經(jīng)歷被扒，網(wǎng)友：重新認(rèn)識(shí)中國(guó)開(kāi)源模型】的相關(guān)內(nèi)容，希望對(duì)大家有幫助！

標(biāo)簽：套殼丑聞讓斯坦福AI Lab主任怒了！抄襲團(tuán)隊(duì)2人甩鍋1人失蹤、前科經(jīng)歷被扒，網(wǎng)友：重新認(rèn)識(shí)中國(guó)開(kāi)源模型

　　免責(zé)聲明：本文由用戶(hù)上傳，與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考，并不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。如有侵權(quán)請(qǐng)聯(lián)系刪除！

分享：

相關(guān)閱讀

董明珠曾喊話(huà)雷軍給股民分多少錢(qián)！格力：擬分紅超55億

Epic喜+1：動(dòng)作游戲《師父》免費(fèi)領(lǐng) 立省139元

雷軍辟謠只招聘35歲以下員工：僅針對(duì)未來(lái)之星項(xiàng)目

普華永道發(fā)布2025年AI預(yù)測(cè)：AI Agents將勞動(dòng)力提升1倍

雷軍回應(yīng)股價(jià)暴跌：年年難過(guò)年年過(guò)

一天100座！理想汽車(chē)第1700座超充站正式建成

《守望先鋒》國(guó)服宣布2月19日回歸：賬號(hào)數(shù)據(jù)完整保留

雷軍建議創(chuàng)業(yè)者要多留點(diǎn)錢(qián)給員工：別到山窮水盡才講問(wèn)題

雷軍新年第一天收到200元紅包自侃年入百萬(wàn)的開(kāi)始

雷軍親自展示REDMI Turbo 4！2025年第一款新機(jī)

雷軍：小米未來(lái)10年建至少20座世界頂級(jí)工廠

雷軍辟謠只招聘35歲以下員工：只有招聘未來(lái)之星時(shí)才有年齡限制

雷軍回應(yīng)100億造車(chē)：沒(méi)有好到“封神” 不要神話(huà)我

雷軍表態(tài)：一心做好小米汽車(chē) 大家可以在“許愿池”尋找商機(jī)

雷軍：中國(guó)汽車(chē)產(chǎn)業(yè)應(yīng)少些歪門(mén)邪道不要發(fā)黑稿、背后捅刀子

小米SU7選配色都是7000元為什么璀璨洋紅卻需要9000元

最新文章

空谷幽蘭是什么意思

【空谷幽蘭是什么意思】“空谷幽蘭”是一個(gè)富有詩(shī)意的成語(yǔ)，常用來(lái)形容在偏僻、冷清的地方生長(zhǎng)的蘭花。它不僅...瀏覽全文>>

空格怎么打出來(lái)

【空格怎么打出來(lái)】在日常使用電腦或手機(jī)輸入文字時(shí)，經(jīng)常會(huì)遇到需要輸入“空格”的情況。雖然看似簡(jiǎn)單，但很...瀏覽全文>>

空格怎么打

【空格怎么打】在日常使用電腦或手機(jī)時(shí)，很多人會(huì)遇到“空格怎么打”的問(wèn)題。其實(shí)，“空格”是一個(gè)非常基礎(chǔ)的...瀏覽全文>>

空格名字怎么打

【空格名字怎么打】在日常使用電腦或手機(jī)時(shí)，很多人會(huì)遇到“空格名字怎么打”的問(wèn)題。尤其是在輸入法設(shè)置、文...瀏覽全文>>

空格鍵是指的哪一個(gè)

【空格鍵是指的哪一個(gè)】在日常使用電腦或手機(jī)的過(guò)程中，我們經(jīng)常接觸到各種按鍵，其中“空格鍵”是一個(gè)非常基...瀏覽全文>>

空擋是什么意思

【空擋是什么意思】“空擋”是一個(gè)在多個(gè)領(lǐng)域中常見(jiàn)的術(shù)語(yǔ)，尤其在汽車(chē)駕駛、機(jī)械操作以及一些比喻性表達(dá)中使...瀏覽全文>>

空城舊夢(mèng)是情侶網(wǎng)名嗎

【空城舊夢(mèng)是情侶網(wǎng)名嗎】“空城舊夢(mèng)”這個(gè)詞語(yǔ)，聽(tīng)起來(lái)充滿(mǎn)了詩(shī)意和情感色彩。它常被用于表達(dá)一種孤獨(dú)、懷念...瀏覽全文>>

可吸收線(xiàn)是什么顏色

【可吸收線(xiàn)是什么顏色】在醫(yī)學(xué)領(lǐng)域，尤其是外科手術(shù)中，可吸收線(xiàn)是一種常見(jiàn)的縫合材料。它主要用于縫合傷口，...瀏覽全文>>

可為是什么意思

【可為是什么意思】“可為”一詞源自中文，常用于表達(dá)“可以做”、“值得做”或“有作為”的含義。在不同語(yǔ)境...瀏覽全文>>

可微與可導(dǎo)之間有什么聯(lián)系

【可微與可導(dǎo)之間有什么聯(lián)系】在微積分的學(xué)習(xí)過(guò)程中，“可導(dǎo)”和“可微”是兩個(gè)經(jīng)常被提到的概念，它們看似相...瀏覽全文>>

大家愛(ài)看

空格怎么打

空格鍵是指的哪一個(gè)

可微與可導(dǎo)的關(guān)系

科技感十足的公司名稱(chēng)公司起名

考研難考嗎

康復(fù)醫(yī)院是做什么的

康復(fù)學(xué)專(zhuān)業(yè)考研學(xué)校

開(kāi)通國(guó)際漫游多少錢(qián)一個(gè)月

開(kāi)通電信Volte功能免費(fèi)嗎

開(kāi)通QQ會(huì)員

頻道推薦

空格名字怎么打

可微與可導(dǎo)之間的聯(lián)系是什么

科技工業(yè)是什么

科技發(fā)展給生活帶來(lái)的好處

考研歧視最嚴(yán)重的高校

康復(fù)理療師證書(shū)哪里頒發(fā)

康復(fù)考研最好的學(xué)校有哪些

卡姐新歌wap原版歌詞介紹

卡機(jī)嘛韓語(yǔ)的意思

絕地求生最欠揍的英文名字是什么

站長(zhǎng)推薦

空格怎么打出來(lái)

空城舊夢(mèng)是情侶網(wǎng)名嗎

可吸收線(xiàn)是什么顏色

可微與可導(dǎo)之間有什么聯(lián)系

康復(fù)是什么意思

康復(fù)評(píng)定包括哪5個(gè)方面

開(kāi)通QQ十周年黃鉆是不是可以永久使用十周年黃鉆標(biāo)志

卡路里和焦耳怎么換算

卡樂(lè)購(gòu)是什么意思

卡拉瓦喬代表作

巨鱷的電影有什么

巨大的英語(yǔ)是什么

禁閉島的結(jié)局真相

靳東個(gè)人資料

靳東的妹妹為什么叫高露

金枝玉葉繁殖方法

金針菜和黃花菜是一種嗎

金吉鳥(niǎo)健身私教一般多少

戒指戴什么手指好

酵素粉的作用與功效

關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 免責(zé)聲明|

Copyright ? 2007-2025 www.gaipa.cn All Right Reserved. 版權(quán)所有新訊網(wǎng) 工信部網(wǎng)站備案編號(hào)：閩ICP備20009419號(hào)-52

感谢您访问我们的网站，您可能还对以下资源感兴趣：
最新亚洲人成无码网站

最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

套殼丑聞讓斯坦福AI Lab主任怒了！抄襲團(tuán)隊(duì)2人甩鍋1人失蹤、前科經(jīng)歷被扒，網(wǎng)友：重新認(rèn)識(shí)中國(guó)開(kāi)源模型

套殼丑聞讓斯坦福AI Lab主任怒了！抄襲團(tuán)隊(duì)2人甩鍋1人失蹤、前科經(jīng)歷被扒，網(wǎng)友：重新認(rèn)識(shí)中國(guó)開(kāi)源模型