最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

首頁 >> 今日更新 >

開源音頻模型Stable Audio Open,文本生成47秒高清音效

2024-06-06 09:00:32 來源: 用戶: 

相信很多大家對開源音頻模型Stable Audio Open,文本生成47秒高清音效還不知道吧,今天菲菲就帶你們一起去了解一下~.~!

6月6日,著名開源大模型平臺Stability.ai在官網(wǎng)宣布,開源最新文生音頻模型Stable Audio Open。

用戶通過文本就能生成最多47秒,鋼琴、笛子、鼓點、模擬人聲等不同類型的44.1kHz音效。

值得一提的是,Stable Audio Open支持數(shù)據(jù)微調,歌手、音樂人可以讓其生成基于自己的音樂數(shù)據(jù),例如,架子鼓手可以根據(jù)自己的鼓點來進行微調。

開源地址:https://huggingface.co/stabilityai/stable-audio-open-1.0

在線demo:https://huggingface.co/spaces/artificialguybr/Stable-Audio-Open-Zero

根據(jù)Stability.ai介紹,Stable Audio Open使用了486,492個錄音訓練數(shù)據(jù),其中472,618個來自Freesound,13874個來自免費音樂檔案館,并且所有音頻文件均根據(jù) CC0、CC BY或CC Sampling+獲得了商業(yè)許可。

就是說通過Stable Audio Open生成的音效無需擔心商業(yè)化問題,不會受到法律方面的追究。

「AIGC開放社區(qū)」根據(jù)其提供的在線demo體驗了一下,在文本語義理解、生成音效等方面還是相當優(yōu)秀。

需要注意的是,目前只支持英文提示詞,其他任何語言都不行,即便你使用了識別效果也是相當?shù)牟睢?/p>

在生成的過程中,用戶可以對時間、擴散步數(shù)和CFG進行詳細控制,以達到更好的效果。例如,一首非常舒適抒情的鋼琴曲。

此外,Stable Audio Open目前只能用于學術研究,還無法商業(yè)化。

以上就是關于【開源音頻模型Stable Audio Open,文本生成47秒高清音效】的相關內容,希望對大家有幫助!

  免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關。財經(jīng)信息僅供讀者參考,并不構成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權請聯(lián)系刪除!

 
分享:
最新文章