比OpenAI的Whisper快50%，最新開源語音模型

2024-08-04 09:00:36 來源：用戶：

相信很多大家對比OpenAI的Whisper快50%，最新開源語音模型還不知道吧，今天菲菲就帶你們一起去了解一下~.~！

生成式AI初創(chuàng)公司aiOla在官網(wǎng)開源了最新語音模型Whisper-Medusa，推理效率比OpenAI開源的Whisper快50%。

aiOla在Whisper的架構(gòu)之上進(jìn)行了修改采用了“多頭注意力”機(jī)制的并行計算方法，允許模型在每個推理步驟中預(yù)測多個token，同時不會損失性能和識別準(zhǔn)確率。

開源地址:https://github.com/aiola-lab/whisper-medusa

huggingface:https://huggingface.co/aiola/whisper-medusa-v1

傳統(tǒng)的Transformer架構(gòu)在生成序列時，是遵循逐個token的順序預(yù)測過程。這意味著在生成新序列時，模型每次只能預(yù)測下一個token，然后將這個預(yù)測的token加入到序列中，再基于更新后的序列預(yù)測下一個token。

這雖然能夠確保生成序列的連貫性和上下文相關(guān)性，但也有一個非常明顯的缺陷——極大限制了模型的推理效率。

此外，由于每次只能處理一個 token ，模型難以捕捉到數(shù)據(jù)中的長程依賴關(guān)系，可能會忽略一些重要的全局信息，從而影響模型的整體性能和準(zhǔn)確性。

而Whisper-Medusa使用了10頭的多注意力機(jī)制，能各自獨(dú)立地計算注意力分布并行地處理輸入，然后將各自的輸出通過拼接的方式組合起來，形成一個多維度的向量。

隨后向量被送入全連接層進(jìn)行進(jìn)一步的處理，以生成最終的token預(yù)測。這種并行的數(shù)據(jù)處理方式不僅加快了模型的推理效率，還增加了模型的表達(dá)能力，因?yàn)槊總€注意力頭都可以專注于序列的不同子集，捕捉到更豐富的上下文信息。

為了使多頭注意力機(jī)制在Whisper-Medusa模型中更高效地運(yùn)行，aiOla采用了弱監(jiān)督的方法，在訓(xùn)練過程中凍結(jié)了原Whisper模型的主要組件，使用該模型生成的音頻轉(zhuǎn)錄作為偽標(biāo)簽來訓(xùn)練額外的token預(yù)測模塊。

使得模型即便沒有大量手動人工標(biāo)注數(shù)據(jù)的情況下，依然能夠?qū)W習(xí)到有效的語音識別模式。

此外在訓(xùn)練過程中，Whisper-Medusa的損失函數(shù)需要同時考慮預(yù)測的準(zhǔn)確性和效率。一方面，模型需要確保預(yù)測的token序列與實(shí)際轉(zhuǎn)錄盡可能一致;

另一方面，通過多頭注意力機(jī)制的并行預(yù)測，模型被鼓勵在保證精度的前提下，盡可能地加快預(yù)測效率。

aiOla使用了學(xué)習(xí)率調(diào)度、梯度裁剪、正則化等多種方法，確保模型在訓(xùn)練過程中能夠穩(wěn)定收斂，同時避免過擬合性。

業(yè)務(wù)場景方面， Whisper-Medusa能理解100多種語言，用戶可以開發(fā)音頻轉(zhuǎn)錄、識別等多種應(yīng)用，適用于翻譯、金融、旅游、物流、倉儲等行業(yè)。

aiOla表示，未來會將Whisper-Medusa的多注意力機(jī)制擴(kuò)展至20個頭，其推理效率將再次獲得大幅度提升。

以上就是關(guān)于【比OpenAI的Whisper快50%，最新開源語音模型】的相關(guān)內(nèi)容，希望對大家有幫助！

標(biāo)簽：比OpenAI的Whisper快50%，最新開源語音模型

　　免責(zé)聲明：本文由用戶上傳，與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考，并不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險自擔(dān)。如有侵權(quán)請聯(lián)系刪除！

分享：

相關(guān)閱讀

董明珠曾喊話雷軍給股民分多少錢！格力：擬分紅超55億

Epic喜+1：動作游戲《師父》免費(fèi)領(lǐng) 立省139元

雷軍辟謠只招聘35歲以下員工：僅針對未來之星項(xiàng)目

普華永道發(fā)布2025年AI預(yù)測：AI Agents將勞動力提升1倍

雷軍回應(yīng)股價暴跌：年年難過年年過

一天100座！理想汽車第1700座超充站正式建成

《守望先鋒》國服宣布2月19日回歸：賬號數(shù)據(jù)完整保留

雷軍建議創(chuàng)業(yè)者要多留點(diǎn)錢給員工：別到山窮水盡才講問題

雷軍新年第一天收到200元紅包自侃年入百萬的開始

雷軍親自展示REDMI Turbo 4！2025年第一款新機(jī)

雷軍：小米未來10年建至少20座世界頂級工廠

雷軍辟謠只招聘35歲以下員工：只有招聘未來之星時才有年齡限制

雷軍回應(yīng)100億造車：沒有好到“封神” 不要神話我

雷軍表態(tài)：一心做好小米汽車大家可以在“許愿池”尋找商機(jī)

雷軍：中國汽車產(chǎn)業(yè)應(yīng)少些歪門邪道不要發(fā)黑稿、背后捅刀子

小米SU7選配色都是7000元為什么璀璨洋紅卻需要9000元

最新文章

奔馳GLE預(yù)約試駕，新手必看的詳細(xì)流程

奔馳GLE作為豪華SUV市場中的佼佼者，憑借其卓越的性能、豪華的內(nèi)飾以及寬敞的空間，吸引了眾多消費(fèi)者的關(guān)注。...瀏覽全文>>

安徽阜陽帕薩特新能源新車報價2025款走勢，市場優(yōu)惠力度持續(xù)加大

在2025年，安徽阜陽地區(qū)的帕薩特新能源汽車市場表現(xiàn)非?；钴S。作為一款備受關(guān)注的新能源車型，帕薩特新能源憑...瀏覽全文>>

滁州T-ROC探歌 2025新款價格，最低售價15.89萬起，趕緊行動

近日，滁州地區(qū)的大眾汽車經(jīng)銷商傳來好消息：備受矚目的2025款T-ROC探歌正式上市，并且以極具競爭力的價格吸引...瀏覽全文>>

安徽淮南長安啟源E07多少錢 2024款落地價，買車前的全方位指南

在選擇一款新能源汽車時，了解其價格和配置是非常重要的一步。安徽淮南地區(qū)的長安啟源E07作為2024款的新車型，...瀏覽全文>>

阜陽長安啟源A05最新價格2025款，配置升級，值不值得買？

阜陽長安啟源A05作為長安汽車旗下的全新車型，自推出以來便憑借其獨(dú)特的設(shè)計風(fēng)格和豐富的配置吸引了眾多消費(fèi)者...瀏覽全文>>

阜陽長安啟源A07價格，豪華配置超值價來襲

阜陽長安啟源A07作為一款備受矚目的新能源車型，以其豪華配置和親民的價格在市場上引起了廣泛關(guān)注。這款車型不...瀏覽全文>>

安徽淮南威然最新價格2024款，各配置車型售價全知曉

安徽淮南威然2024款價格及配置詳解隨著汽車市場的不斷更新?lián)Q代，上汽大眾旗下的MPV車型——威然（Viloran）憑...瀏覽全文>>

QQ多米新車報價2025款，買車省錢秘籍

QQ多米新車報價2025款，買車省錢秘籍隨著汽車市場的不斷發(fā)展，消費(fèi)者在選購車輛時不僅關(guān)注車型的性能和配置，...瀏覽全文>>

滁州途觀X最新價格2024款，買車省錢秘籍

滁州途觀X 2024款最新價格及買車省錢秘籍隨著汽車市場的不斷發(fā)展，大眾途觀X作為一款兼具時尚與性能的中型SUV...瀏覽全文>>

滁州蔚攬 2022新款價格，豪華配置超值價來襲

隨著汽車市場的不斷發(fā)展，大眾蔚攬以其優(yōu)雅的設(shè)計和卓越的性能贏得了眾多消費(fèi)者的青睞。作為一款兼具實(shí)用性和...瀏覽全文>>

大家愛看

Alienware 在 2025 年 CES 上展示了一些超凡脫俗的技術(shù)

Wickes 任命首席零售和分銷官

分析師稱GTA 6或?qū)淞⑿袠I(yè)新標(biāo)準(zhǔn)

索尼和本田在拉斯維加斯推出售價 89,900 美元的 Afeela 1

日本 11 月游客人數(shù)創(chuàng)月度新高

神經(jīng)認(rèn)知測試在 3 歲兒童白血病治療期間可行

牛津郡小學(xué)支持圣誕毛衣日

S?strene Grene 投資歐洲物流中心

有人已經(jīng)在電視上直播 BNMC 打造的 1967 年福特野馬 Restomod

潛在的分子療法可以逆轉(zhuǎn)小鼠的胎盤發(fā)育問題

頻道推薦

奔馳GLE預(yù)約試駕，新手必看的詳細(xì)流程

滁州T-ROC探歌 2025新款價格，最低售價15.89萬起，趕緊行動

安徽淮南威然最新價格2024款，各配置車型售價全知曉

滁州途觀X最新價格2024款，買車省錢秘籍

淮南長安啟源Q05 2025新款價格，最低售價9.69萬起，入手正當(dāng)時

安徽淮南探影多少錢 2023款落地價，各配置車型售價一目了然

淮南途觀X價格大揭秘，買車前必看

安徽淮南長安獵手K50新款價格2025款多少錢？買車攻略一網(wǎng)打盡

滁州ID.4 X新款價格2025款多少錢？買車攻略一網(wǎng)打盡

QQ多米落地價，購車前必看的費(fèi)用明細(xì)

站長推薦

Nvidia DLSS 4 有望將游戲性能提高 8 倍

人工智能在預(yù)測自身免疫性疾病進(jìn)展方面顯示出良好的前景

心理物理實(shí)驗(yàn)揭示皮膚水分感知是如何改變的

科茨沃爾德公司慶祝圣誕節(jié)圓滿成功

南法納姆學(xué)校被評為薩里郡表現(xiàn)最好的小學(xué)

約克區(qū)九所小學(xué)將削減招生人數(shù)

松下新款電動汽車電池為 Lucid Gravity 帶來 450 英里續(xù)航里程

泰國旅游呈現(xiàn)新趨勢

研究人員找到在細(xì)胞水平上餓死前列腺癌腫瘤的新方法

領(lǐng)先的人工智能聊天機(jī)器人在測試中表現(xiàn)出類似癡呆癥的認(rèn)知能力下降

龐大的 Project Zomboid build 42 終于可以玩了

Steam Replay 回歸向您展示 2024 年您玩得最多的 PC 游戲

Jollyes 推出強(qiáng)化的人才支持和招聘措施

Karen Millen 與 Simon Harrison 共同推出全新高級珠寶系列

奇瑞風(fēng)云A8L電動轎車刷新續(xù)航里程世界紀(jì)錄

虛擬藝術(shù)家將別克 Cascada 帶回 2026 款車型

OnePlus 宣布推出新計劃解決綠線問題

OnePlus Watch 3 將擁有更大的電池和更薄的機(jī)身

研究人員發(fā)現(xiàn)可變剪接與自身免疫性疾病遺傳之間的細(xì)胞類型特異性聯(lián)系

科學(xué)家確定腦細(xì)胞類型是排尿的主要控制者

關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 免責(zé)聲明|

Copyright ? 2007-2025 www.gaipa.cn All Right Reserved. 版權(quán)所有新訊網(wǎng) 工信部網(wǎng)站備案編號：閩ICP備20009419號-52

感谢您访问我们的网站，您可能还对以下资源感兴趣：
最新亚洲人成无码网站

<abbr id="6sy5u"></abbr>

最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

比OpenAI的Whisper快50%，最新開源語音模型