開發(fā)者火冒三丈炮轟GenAI:垃圾語料太多,模型正在變得越來越笨
相信很多大家對開發(fā)者火冒三丈炮轟GenAI:垃圾語料太多,模型正在變得越來越笨還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
【新智元導(dǎo)讀】人工智能是否早已達到頂峰,正在變得越來越愚蠢?
生成式AI(GenAI),尤其是以O(shè)penAI的ChatGPT為代表,人們發(fā)現(xiàn),這些大模型在一年多后的性能表現(xiàn)遠不及剛發(fā)布時那樣令人驚艷了。
AI似乎正在變得越來越笨。
這種聲音逐漸出現(xiàn)在各個社交網(wǎng)絡(luò)的平臺上,并有許多擁躉。
在OpenAI開發(fā)者論壇上,有用戶發(fā)帖表示:自從去年最新版本的GPT發(fā)布后,模型的準確性就顯著下降了。
同樣的,一位ChatGPT的用戶在今年6月寫道,「經(jīng)歷了這么多的AI炒作之后,這些模型如今的表現(xiàn)讓我非常失望?!?/p>
Steven Vaughan-Nichols是一位自由撰稿人和技術(shù)分析師,在多家科技媒體中擔任高級特約編輯。他擁有自己的個人博客,在X上擁有數(shù)萬名訂閱者。
今年8月下旬,史蒂文在《Computerworld》的一篇言辭激烈的評論文章《I’ve got the genAI blues》中表示:
所有主要的公眾可訪問的AI模型,像ChatGPT和Claude這樣的品牌旗艦產(chǎn)品——其性能都不如以前的版本。
文章地址:https://www.computerworld.com/article/3488589/ive-got-the-genai-blues.html
他在文章中寫道,「這些由AI生成的結(jié)果常常令人惱火。它們有許多荒謬的錯誤,更糟糕的是,這些錯誤的出現(xiàn)總是反反復(fù)復(fù),沒完沒了?!?/p>
「如果只是答案平庸但相對準確,我還可以想辦法應(yīng)對。但它生成的內(nèi)容讓我無能為力。」
以下是這篇評論文章的內(nèi)容。
I’ve got the genAI blues
ChatGPT之類的工具遠沒有你想象的那么好,而且隨著時間的推移,它們的表現(xiàn)越來越糟。
我也希望生成式AI真的有用,但事實并非如此。我一直在不斷嘗試使用各種AI——如ChatGPT、Meta AI以及Gemini等。
這些模型在你不太了解相關(guān)領(lǐng)域的情況時,看起來似乎是有用的,它們生成的回答也很合理。
但只要你仔細考察一番,就會發(fā)現(xiàn)這些答案是錯誤的。
如果你對內(nèi)容的需求僅在高中水平,模型生成的答案還算過得去。但當你需要深入挖掘或研究某個主題時,那就另當別論了。
以我日常的工作內(nèi)容為例,在Linux和開源軟件等主題上,我比一般的大語言模型(LLM)了解得更深入。
在我使用生成式AI對這些主題進行研究時,AI能給出的回答乍一眼看上去可能不錯,但你越深入的去討論一些細節(jié)時,它能給出的信息就越貧乏。
這些由AI生成的結(jié)果常常令人惱火。它們有許多荒謬的錯誤,更糟糕的是,這些錯誤的出現(xiàn)總是反反復(fù)復(fù),沒完沒了。
如果只是答案平庸但相對準確,我還可以想辦法應(yīng)對。但它生成的內(nèi)容讓我無能為力。
這并非僅是我一個人的看法。
《商業(yè)周刊》報道,許多GPT-4的用戶發(fā)現(xiàn)它變得越來越「懶」和「愚蠢」。
其他人也對此表示認同。
正如最近在Reddit上的用戶所說的那樣,「現(xiàn)在ChatGPT3和4的效果遠不如我一年前訂閱專業(yè)版時那么有效和有幫助?!?/p>
在我看來,即使是最好的生成式AI聊天機器人Perplexity也在走下坡路。
以前我喜歡Perplexity的一個原因是它會為其觀點提供來源。在我把它看作是一個超級增強的搜索引擎時,這個功能很有用。
然而,最近它的表現(xiàn)也越來越不穩(wěn)定,我再也無法指望它能夠準確地給出它是在哪里找到、并重新整合出的這些信息。
為什么會這樣?
雖然我并不是AI開發(fā)者,但我密切關(guān)注這個領(lǐng)域很久了。
以下是我看到的導(dǎo)致模型開始失效至少兩個主要原因:
首先是用于創(chuàng)建主要大語言模型的內(nèi)容質(zhì)量問題。
許多模型的訓(xùn)練集中包含了來自諸如Twitter、Reddit以及4Chan等「優(yōu)質(zhì)」網(wǎng)站的數(shù)據(jù)。
正如谷歌在今年早些時候發(fā)布的AI概述所顯示的那樣,采用這些數(shù)據(jù)集對AI進行訓(xùn)練的結(jié)果可能會非常糟糕。
《麻省理工科技評論》同樣指出,現(xiàn)在的AI會生成一些質(zhì)量極差的答案。
如建議用戶「往披薩上加膠水」或「每天至少吃一塊小石頭」,以及「前美國總統(tǒng)安德魯·約翰遜在1947年至2012年間獲得了大學(xué)學(xué)位,盡管他于1875年去世。」
這類回答都是些無傷大雅的蠢例子,但如果你需要一個正確答案,那就完全是另一回事了。
以一位律師為例,他的法律文件中包含了由AI虛構(gòu)的案例信息,法官們發(fā)現(xiàn)這一事實后并不會被逗笑。
如果你只是想用生成式AI閑聊(這似乎是ChatGPT最流行的用途之一),那么準確性可能對你并不重要。
但對于我,以及所有希望將AI用于商業(yè)的人來說,正確答案才是最重要的。
隨著生成式AI巨頭繼續(xù)尋找更多數(shù)據(jù),這個問題只會變得更糟。
來自Epoch AI的一項研究發(fā)現(xiàn),我們最早將在2026年耗盡高質(zhì)量數(shù)據(jù)。
這就引出了第二個問題。
如今,生成式AI生成的內(nèi)容正在取代專家級人類內(nèi)容。
結(jié)果不僅僅是劣質(zhì)數(shù)據(jù)排擠了優(yōu)質(zhì)數(shù)據(jù),情況還要更為糟糕:
《自然(Nature)》的最近的一篇論文發(fā)現(xiàn),「不加區(qū)分地從其他模型生成的數(shù)據(jù)中學(xué)習(xí)會導(dǎo)致‘模型崩潰’。這是一種退化過程,隨著時間的推移,即使分布沒有隨時間變化,模型也會忘記真正的底層數(shù)據(jù)分布?!?/p>
我愿將其稱為「垃圾進,垃圾出(Garbage In, Garbage Out)」。
但由于我看不到公司會停止使用生成式AI以更低的成本來生成文檔,因此未來充斥在互聯(lián)網(wǎng)中的內(nèi)容質(zhì)量只會繼續(xù)下降。
不管你信不信,就質(zhì)量而言,我們可能已經(jīng)處于人工智能的頂峰。
這難道不是一個可怕的想法嗎?
當然,我不是一個極端的AI反對者。
基于專用大語言模型的特定用途的生成式AI聊天機器人,在作為排查程序故障或發(fā)現(xiàn)潛在癌癥的工具時,已經(jīng)非常有用。
其他的一些用途中,如在線游戲中由AI驅(qū)動的非玩家角色,將提高游戲體驗,而像ElliQ這樣的AI朋友可以幫助很多孤獨的人。
但作為大多數(shù)公司熱衷的替代知識型員工的方式,還是算了吧。
除了CEO——他們倒是可以被AI聊天機器人取代。
我懷疑很多人不會注意到AI CEO與人類CEO的區(qū)別——除了它會為公司節(jié)省一大筆錢。
生成式AI的未來
這不應(yīng)該是事情發(fā)展的方向。
通常來說,新的版本軟件應(yīng)該比它們所取代的版本更好。
但由于生成式AI需要通過大量數(shù)據(jù)進行訓(xùn)練,而隨著人類世界的高質(zhì)量內(nèi)容日益枯竭、互聯(lián)網(wǎng)越來越多地充斥著AI生成的劣質(zhì)內(nèi)容,模型未來的性能表現(xiàn)將會成為一個越來越嚴重的問題。
當然,我們也有可能會重新發(fā)現(xiàn)由人類完成的那些極其珍貴且不可替代的工作的價值。
但最好也別對此抱有太大的希望。
參考資料:
https://futurism.com/the-byte/ai-dumber
以上就是關(guān)于【開發(fā)者火冒三丈炮轟GenAI:垃圾語料太多,模型正在變得越來越笨】的相關(guān)內(nèi)容,希望對大家有幫助!
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險自擔。 如有侵權(quán)請聯(lián)系刪除!
-
奔馳GLE作為豪華SUV市場中的佼佼者,憑借其卓越的性能、豪華的內(nèi)飾以及寬敞的空間,吸引了眾多消費者的關(guān)注。...瀏覽全文>>
-
在2025年,安徽阜陽地區(qū)的帕薩特新能源汽車市場表現(xiàn)非常活躍。作為一款備受關(guān)注的新能源車型,帕薩特新能源憑...瀏覽全文>>
-
近日,滁州地區(qū)的大眾汽車經(jīng)銷商傳來好消息:備受矚目的2025款T-ROC探歌正式上市,并且以極具競爭力的價格吸引...瀏覽全文>>
-
在選擇一款新能源汽車時,了解其價格和配置是非常重要的一步。安徽淮南地區(qū)的長安啟源E07作為2024款的新車型,...瀏覽全文>>
-
阜陽長安啟源A05作為長安汽車旗下的全新車型,自推出以來便憑借其獨特的設(shè)計風(fēng)格和豐富的配置吸引了眾多消費者...瀏覽全文>>
-
阜陽長安啟源A07作為一款備受矚目的新能源車型,以其豪華配置和親民的價格在市場上引起了廣泛關(guān)注。這款車型不...瀏覽全文>>
-
安徽淮南威然2024款價格及配置詳解隨著汽車市場的不斷更新?lián)Q代,上汽大眾旗下的MPV車型——威然(Viloran)憑...瀏覽全文>>
-
QQ多米新車報價2025款,買車省錢秘籍隨著汽車市場的不斷發(fā)展,消費者在選購車輛時不僅關(guān)注車型的性能和配置,...瀏覽全文>>
-
滁州途觀X 2024款最新價格及買車省錢秘籍隨著汽車市場的不斷發(fā)展,大眾途觀X作為一款兼具時尚與性能的中型SUV...瀏覽全文>>
-
隨著汽車市場的不斷發(fā)展,大眾蔚攬以其優(yōu)雅的設(shè)計和卓越的性能贏得了眾多消費者的青睞。作為一款兼具實用性和...瀏覽全文>>
- Alienware 在 2025 年 CES 上展示了一些超凡脫俗的技術(shù)
- Wickes 任命首席零售和分銷官
- 分析師稱GTA 6或?qū)淞⑿袠I(yè)新標準
- 索尼和本田在拉斯維加斯推出售價 89,900 美元的 Afeela 1
- 日本 11 月游客人數(shù)創(chuàng)月度新高
- 神經(jīng)認知測試在 3 歲兒童白血病治療期間可行
- 牛津郡小學(xué)支持圣誕毛衣日
- S?strene Grene 投資歐洲物流中心
- 有人已經(jīng)在電視上直播 BNMC 打造的 1967 年福特野馬 Restomod
- 潛在的分子療法可以逆轉(zhuǎn)小鼠的胎盤發(fā)育問題
- Nvidia DLSS 4 有望將游戲性能提高 8 倍
- 人工智能在預(yù)測自身免疫性疾病進展方面顯示出良好的前景
- 心理物理實驗揭示皮膚水分感知是如何改變的
- 科茨沃爾德公司慶祝圣誕節(jié)圓滿成功
- 南法納姆學(xué)校被評為薩里郡表現(xiàn)最好的小學(xué)
- 約克區(qū)九所小學(xué)將削減招生人數(shù)
- 松下新款電動汽車電池為 Lucid Gravity 帶來 450 英里續(xù)航里程
- 泰國旅游呈現(xiàn)新趨勢
- 研究人員找到在細胞水平上餓死前列腺癌腫瘤的新方法
- 領(lǐng)先的人工智能聊天機器人在測試中表現(xiàn)出類似癡呆癥的認知能力下降
- 龐大的 Project Zomboid build 42 終于可以玩了
- Steam Replay 回歸向您展示 2024 年您玩得最多的 PC 游戲
- Jollyes 推出強化的人才支持和招聘措施
- Karen Millen 與 Simon Harrison 共同推出全新高級珠寶系列
- 奇瑞風(fēng)云A8L電動轎車刷新續(xù)航里程世界紀錄
- 虛擬藝術(shù)家將別克 Cascada 帶回 2026 款車型
- OnePlus 宣布推出新計劃解決綠線問題
- OnePlus Watch 3 將擁有更大的電池和更薄的機身
- 研究人員發(fā)現(xiàn)可變剪接與自身免疫性疾病遺傳之間的細胞類型特異性聯(lián)系
- 科學(xué)家確定腦細胞類型是排尿的主要控制者