套殼丑聞讓斯坦福AI Lab主任怒了!抄襲團(tuán)隊(duì)2人甩鍋1人失蹤、前科經(jīng)歷被扒,網(wǎng)友:重新認(rèn)識(shí)中國(guó)開(kāi)源模型
相信很多大家對(duì)套殼丑聞讓斯坦福AI Lab主任怒了!抄襲團(tuán)隊(duì)2人甩鍋1人失蹤、前科經(jīng)歷被扒,網(wǎng)友:重新認(rèn)識(shí)中國(guó)開(kāi)源模型還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
斯坦福團(tuán)隊(duì)抄襲清華系大模型事件后續(xù)來(lái)了——
Llama3-V團(tuán)隊(duì)承認(rèn)抄襲,其中兩位來(lái)自斯坦福的本科生還跟另一位作者切割了。
最新致歉推文,由Siddharth Sharma(悉達(dá)多)和Aksh Garg(阿克什)發(fā)出。
不在其中、來(lái)自南加利福尼亞大學(xué)的Mustafa Aljadery(簡(jiǎn)稱(chēng)老穆)被指是主要過(guò)錯(cuò)方,并且自昨天起人就失蹤了:
被指跑路的老穆本人,X主頁(yè)目前已經(jīng)開(kāi)啟保護(hù)鎖定狀態(tài),申請(qǐng)才能關(guān)注:
整體來(lái)看,這條致歉推文和昨天那條發(fā)出后又急忙刪掉的推文內(nèi)容大差不差,主要是突出了道歉和進(jìn)一步甩鍋。
畢竟連斯坦福人工智能實(shí)驗(yàn)室主任Christopher Manning都下場(chǎng)開(kāi)噴:
他認(rèn)為團(tuán)隊(duì)在事發(fā)后避重就輕,用“架構(gòu)相似”、“MiniCPM比我們更快實(shí)現(xiàn)”的借口推脫,拒不承認(rèn)是抄襲。
但全新道歉聲明,并沒(méi)有止住網(wǎng)友們的質(zhì)疑。并且最新爆料還指出,這幾位老哥根本就是抄襲慣犯,之前寫(xiě)的教材也是一整個(gè)大抄特抄。
而原作者團(tuán)隊(duì)面壁智能這邊,除CEO李大海昨天回應(yīng)“也是一種受到國(guó)際團(tuán)隊(duì)認(rèn)可的方式”外,首席科學(xué)家劉知遠(yuǎn)也已在知乎出面“親自答”:
新的證據(jù)
還是先來(lái)簡(jiǎn)單回顧一下這個(gè)大瓜。
一句話(huà)總結(jié)就是,有網(wǎng)友發(fā)現(xiàn),最近在開(kāi)源社區(qū)大火的斯坦福團(tuán)隊(duì)多模態(tài)大模型Llama3-V,架構(gòu)和代碼與國(guó)產(chǎn)MiniCPM-Llama3-V2.5幾乎一毛一樣,并列舉了諸多證據(jù)直指Llama3-V抄襲。
隨著事件逐漸發(fā)酵,斯坦福AI團(tuán)隊(duì)刪庫(kù)跑路,面壁智能團(tuán)隊(duì)也就此事展開(kāi)了調(diào)查。
面壁智能首席科學(xué)家、清華大學(xué)長(zhǎng)聘副教授劉知遠(yuǎn)給出的判斷Llama3-V是MiniCPM-Llama3-V2.5套殼的一大理由,正是對(duì)于清華簡(jiǎn)的識(shí)別能力。
這是MiniCPM-Llama3-V2.5的“彩蛋”能力,是他們用了從清華簡(jiǎn)逐字掃描并標(biāo)注的數(shù)據(jù)集訓(xùn)練的,并未公開(kāi)。而Llama3-V的表現(xiàn)和MiniCPM-Llama3-V2.5一模一樣,不僅做對(duì)的題一樣,出錯(cuò)的地方都一樣。
今天,在第一波證據(jù)的基礎(chǔ)之上,又有其他網(wǎng)友扒出了新線(xiàn)索。
有人研究后發(fā)現(xiàn),Llama3-V幾乎每一層的權(quán)重差值都符合均值為0、標(biāo)準(zhǔn)差為1.4e-3的高斯分布。
于是推測(cè),Llama3-V只是直接在MiniCPM的權(quán)重上添加了低方差噪聲。
除此之外,那個(gè)跑路的大兄弟老穆還被曝之前寫(xiě)了本關(guān)于“計(jì)算機(jī)網(wǎng)絡(luò)設(shè)計(jì)”的書(shū),也是抄的。
從書(shū)中隨便抽出一章,用抄襲檢測(cè)器檢測(cè)一下就是一堆紅點(diǎn):
以及,這本書(shū)的作者欄里,據(jù)網(wǎng)友爆料也有悉達(dá)多的名字。
也有網(wǎng)友認(rèn)為抄書(shū)這事兒是不是真的還有待考究。不過(guò),現(xiàn)在這本書(shū)也404了。
說(shuō)回這次的抄襲,悉達(dá)多和阿克什的致歉聲明中也有提到他們之所以和穆哥一起宣傳這個(gè)項(xiàng)目,最初也是被這個(gè)多模態(tài)模型驚艷到了,特別喜歡穆哥所描述的基于Idefics、SigLip和UHD的架構(gòu)擴(kuò)展。
但實(shí)際上網(wǎng)友一早扒出Llama3-V在空間模式等很多方面的具體實(shí)現(xiàn)都和LLaVA-UHD不同,卻跟MiniCPM-Llama3-V2.5出奇一致。
根據(jù)MiniCPM-Llama3-V2.5主頁(yè)介紹,MiniCPM-Llama3-V2.5是面壁智能MiniCPM-V系列的最新開(kāi)源模型,基于SigLip-400M和Llama3-8B-Instruct構(gòu)建,總共8B參數(shù)。
從性能上講,MiniCPM-Llama3-V2.5在OpenCompass上取得了65.1的平均分,性能超過(guò)如GPT-4V-1106、Gemini Pro、Claude3、Qwen-VL-Max等專(zhuān)有模型,且顯著超越其他基于Llama3的多模態(tài)語(yǔ)言模型。
此外,MiniCPM-Llama3-V2.5的OCR能力也很強(qiáng),在OCRBench上得分700+,超越GPT-4o、GPT-4V-0409、Qwen-VL-Max和Gemini Pro。
基于最新的RLAIF-V方法,MiniCPM-Llama3-V2.5在Object HalBench上的幻覺(jué)率為10.3%,也低于GPT-4V-1106的13.6%。
“中國(guó)大模型被忽視了”
盡管甩鍋甩得飛快,但網(wǎng)友們很快又從阿克什和悉達(dá)多童鞋的道歉聲明里發(fā)現(xiàn)了華點(diǎn):
合著你倆啥也沒(méi)干,幫著搞搞推廣就算項(xiàng)目作者啦?
還有網(wǎng)友挑起了一個(gè)更關(guān)鍵的話(huà)題,進(jìn)一步引發(fā)熱議——
開(kāi)源社區(qū)是否忽視了來(lái)自中國(guó)的大模型成果?
谷歌DeepMind研究員、ViT作者Lucas Beyer就提到,Llama3-V是抄的,但成本低于500美元,效果卻能直追Gemini、GPT-4的開(kāi)源模型確實(shí)存在:
抱抱臉平臺(tái)和社區(qū)負(fù)責(zé)人Omar Sanseviero說(shuō)的更加直接:
對(duì)此,不少網(wǎng)友表示贊同,“他們推出了目前最好的開(kāi)源VLM”。
從更客觀的大模型競(jìng)技場(chǎng)的角度看,此言不虛。
在模型一對(duì)一PK的視覺(jué)大模型競(jìng)技場(chǎng)中,來(lái)自零一萬(wàn)物的Yi-VL-Plus排名第五,超過(guò)了谷歌的Gemini Pro Vision。智譜AI和清華合作的CogVLM也躋身前十。
此外,DeepSeek、通義千問(wèn)和這次遭到抄襲的MiniCPM系列多模態(tài)模型,也都有不錯(cuò)的表現(xiàn)。
在更受到廣泛認(rèn)可的LMSYS Chatbot Arena Leaderboard競(jìng)技場(chǎng)榜單中,來(lái)自中國(guó)的大模型也同樣在不斷刷新“最強(qiáng)開(kāi)源”的新紀(jì)錄。
正如劉知遠(yuǎn)老師所說(shuō):
此瓜甚巨,吃瓜者眾,或許更重要的是,一些成見(jiàn)正在破壁。你覺(jué)得呢?
MiniCPM原論文
https://arxiv.org/abs/2404.06395
參考鏈接:
[1]https://x.com/AkshGarg03/status/1797682238961914370
[2]https://x.com/siddrrsh/status/1797682242145464814
[3]https://x.com/teortaxesTex/status/1797712605286645846
[4]https://x.com/chrmanning/status/1797664513367630101
[5]https://x.com/RylanSchaeffer/status/1797690302167417322
[6]https://x.com/giffmana/status/1797603355919028547
[7]https://x.com/RylanSchaeffer/status/1797690302167417322
[8]https://x.com/osanseviero/status/1797635895610540076
[9]https://huggingface.co/spaces/WildVision/vision-arena
以上就是關(guān)于【套殼丑聞讓斯坦福AI Lab主任怒了!抄襲團(tuán)隊(duì)2人甩鍋1人失蹤、前科經(jīng)歷被扒,網(wǎng)友:重新認(rèn)識(shí)中國(guó)開(kāi)源模型】的相關(guān)內(nèi)容,希望對(duì)大家有幫助!
免責(zé)聲明:本文由用戶(hù)上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!
- 董明珠曾喊話(huà)雷軍給股民分多少錢(qián)!格力:擬分紅超55億
- Epic喜+1:動(dòng)作游戲《師父》免費(fèi)領(lǐng) 立省139元
- 雷軍辟謠只招聘35歲以下員工:僅針對(duì)未來(lái)之星項(xiàng)目
- 普華永道發(fā)布2025年AI預(yù)測(cè):AI Agents將勞動(dòng)力提升1倍
- 雷軍回應(yīng)股價(jià)暴跌:年年難過(guò)年年過(guò)
- 一天100座!理想汽車(chē)第1700座超充站正式建成
- 《守望先鋒》國(guó)服宣布2月19日回歸:賬號(hào)數(shù)據(jù)完整保留
- 雷軍建議創(chuàng)業(yè)者要多留點(diǎn)錢(qián)給員工:別到山窮水盡才講問(wèn)題
- 雷軍新年第一天收到200元紅包 自侃年入百萬(wàn)的開(kāi)始
- 雷軍親自展示REDMI Turbo 4!2025年第一款新機(jī)
- 雷軍:小米未來(lái)10年建至少20座世界頂級(jí)工廠
- 雷軍辟謠只招聘35歲以下員工:只有招聘未來(lái)之星時(shí)才有年齡限制
- 雷軍回應(yīng)100億造車(chē):沒(méi)有好到“封神” 不要神話(huà)我
- 雷軍表態(tài):一心做好小米汽車(chē) 大家可以在“許愿池”尋找商機(jī)
- 雷軍:中國(guó)汽車(chē)產(chǎn)業(yè)應(yīng)少些歪門(mén)邪道 不要發(fā)黑稿、背后捅刀子
- 小米SU7選配色都是7000元 為什么璀璨洋紅卻需要9000元
-
【空谷幽蘭是什么意思】“空谷幽蘭”是一個(gè)富有詩(shī)意的成語(yǔ),常用來(lái)形容在偏僻、冷清的地方生長(zhǎng)的蘭花。它不僅...瀏覽全文>>
-
【空格怎么打出來(lái)】在日常使用電腦或手機(jī)輸入文字時(shí),經(jīng)常會(huì)遇到需要輸入“空格”的情況。雖然看似簡(jiǎn)單,但很...瀏覽全文>>
-
【空格怎么打】在日常使用電腦或手機(jī)時(shí),很多人會(huì)遇到“空格怎么打”的問(wèn)題。其實(shí),“空格”是一個(gè)非常基礎(chǔ)的...瀏覽全文>>
-
【空格名字怎么打】在日常使用電腦或手機(jī)時(shí),很多人會(huì)遇到“空格名字怎么打”的問(wèn)題。尤其是在輸入法設(shè)置、文...瀏覽全文>>
-
【空格鍵是指的哪一個(gè)】在日常使用電腦或手機(jī)的過(guò)程中,我們經(jīng)常接觸到各種按鍵,其中“空格鍵”是一個(gè)非常基...瀏覽全文>>
-
【空擋是什么意思】“空擋”是一個(gè)在多個(gè)領(lǐng)域中常見(jiàn)的術(shù)語(yǔ),尤其在汽車(chē)駕駛、機(jī)械操作以及一些比喻性表達(dá)中使...瀏覽全文>>
-
【空城舊夢(mèng)是情侶網(wǎng)名嗎】“空城舊夢(mèng)”這個(gè)詞語(yǔ),聽(tīng)起來(lái)充滿(mǎn)了詩(shī)意和情感色彩。它常被用于表達(dá)一種孤獨(dú)、懷念...瀏覽全文>>
-
【可吸收線(xiàn)是什么顏色】在醫(yī)學(xué)領(lǐng)域,尤其是外科手術(shù)中,可吸收線(xiàn)是一種常見(jiàn)的縫合材料。它主要用于縫合傷口,...瀏覽全文>>
-
【可為是什么意思】“可為”一詞源自中文,常用于表達(dá)“可以做”、“值得做”或“有作為”的含義。在不同語(yǔ)境...瀏覽全文>>
-
【可微與可導(dǎo)之間有什么聯(lián)系】在微積分的學(xué)習(xí)過(guò)程中,“可導(dǎo)”和“可微”是兩個(gè)經(jīng)常被提到的概念,它們看似相...瀏覽全文>>
- 空格怎么打出來(lái)
- 空城舊夢(mèng)是情侶網(wǎng)名嗎
- 可吸收線(xiàn)是什么顏色
- 可微與可導(dǎo)之間有什么聯(lián)系
- 康復(fù)是什么意思
- 康復(fù)評(píng)定包括哪5個(gè)方面
- 開(kāi)通QQ十周年黃鉆是不是可以永久使用十周年黃鉆標(biāo)志
- 卡路里和焦耳怎么換算
- 卡樂(lè)購(gòu)是什么意思
- 卡拉瓦喬代表作
- 巨鱷的電影有什么
- 巨大的英語(yǔ)是什么
- 禁閉島的結(jié)局真相
- 靳東個(gè)人資料
- 靳東的妹妹為什么叫高露
- 金枝玉葉繁殖方法
- 金針菜和黃花菜是一種嗎
- 金吉鳥(niǎo)健身私教一般多少
- 戒指戴什么手指好
- 酵素粉的作用與功效