Nvidia 和 Mistral AI 的超精確小語言模型適用于筆記本電腦和 PC

2024-08-24 14:00:08 來源：用戶：

相信很多大家對(duì)Nvidia 和 Mistral AI 的超精確小語言模型適用于筆記本電腦和 PC還不知道吧，今天菲菲就帶你們一起去了解一下~.~！

8月24日消息:Nvidia 和 Mistral AI 發(fā)布了一款新型的小型語言模型，據(jù)稱該模型在小體積下依然具有「最先進(jìn)」的準(zhǔn)確性。該模型名為 Mistral-NemMo-Minitron 8B，是 NeMo 12B 的迷你版本，參數(shù)量從 120 億縮減到了 80 億。

據(jù) Nvidia 深度學(xué)習(xí)研究副總裁 Bryan Catanzaro 在博客文章中介紹，這款 80 億參數(shù)的小型語言模型通過兩種不同的 AI 優(yōu)化方法實(shí)現(xiàn)了規(guī)?？s減。開發(fā)團(tuán)隊(duì)使用了結(jié)合剪枝和蒸餾的技術(shù)?！讣糁νㄟ^去除對(duì)準(zhǔn)確性貢獻(xiàn)最小的模型權(quán)重來縮小神經(jīng)網(wǎng)絡(luò)的規(guī)模。蒸餾過程中，團(tuán)隊(duì)在一個(gè)較小的數(shù)據(jù)集上重新訓(xùn)練了這個(gè)經(jīng)過剪枝的模型，從而大幅提高了因剪枝導(dǎo)致的準(zhǔn)確性下降?！?/p>

這些優(yōu)化使得開發(fā)人員能夠在「原始數(shù)據(jù)集的一小部分」上訓(xùn)練優(yōu)化后的語言模型，從而在計(jì)算成本上節(jié)省高達(dá) 40 倍。通常情況下，AI 模型需要在模型規(guī)模和準(zhǔn)確性之間進(jìn)行權(quán)衡，但通過 Nvidia 和 Mistral AI 的新剪枝和蒸餾技術(shù)，語言模型可以同時(shí)兼顧這兩者。

配備了這些增強(qiáng)功能的 Mistral-NeMo-Minitron 8B 據(jù)稱在九項(xiàng)同類規(guī)模的語言驅(qū)動(dòng) AI 基準(zhǔn)測(cè)試中表現(xiàn)出色。所節(jié)省的計(jì)算資源足以讓筆記本電腦和工作站 PC 本地運(yùn)行 Minitron 8B，使其比云服務(wù)更快且更安全。

Nvidia 圍繞消費(fèi)者級(jí)計(jì)算硬件設(shè)計(jì)了 Minitron 8B。該語言模型被封裝為 Nvidia NIM 微服務(wù)，并針對(duì)低延遲進(jìn)行了優(yōu)化，以提高響應(yīng)速度。Nvidia 通過其定制模型服務(wù) AI Foundry，將 Minitron 8B 調(diào)整為能夠在低配置設(shè)備（如智能手機(jī)）上運(yùn)行。盡管性能和準(zhǔn)確性可能略有下降，但 Nvidia 表示該模型仍然是高準(zhǔn)確性的語言模型，并且只需極少的訓(xùn)練數(shù)據(jù)和計(jì)算資源。

剪枝和蒸餾技術(shù)似乎是人工智能性能優(yōu)化的下一前沿。理論上，開發(fā)者可以將這些優(yōu)化技術(shù)應(yīng)用于所有現(xiàn)有的語言模型，從而顯著提升整體性能，包括那些只能由 AI 加速服務(wù)器群組運(yùn)行的大型語言模型。

以上就是關(guān)于【Nvidia 和 Mistral AI 的超精確小語言模型適用于筆記本電腦和 PC】的相關(guān)內(nèi)容，希望對(duì)大家有幫助！

標(biāo)簽： Nvidia 和 Mistral AI 的超精確小語言模型適用于筆記本電腦和 PC

　　免責(zé)聲明：本文由用戶上傳，與本網(wǎng)站立場(chǎng)無關(guān)。財(cái)經(jīng)信息僅供讀者參考，并不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。如有侵權(quán)請(qǐng)聯(lián)系刪除！

相關(guān)閱讀

最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

Nvidia 和 Mistral AI 的超精確小語言模型適用于筆記本電腦和 PC