阿里魔搭社區(qū)開源推理引擎 DashInfer
相信很多大家對阿里魔搭社區(qū)開源推理引擎 DashInfer還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
站長之家(ChinaZ.com)5月24日 消息:ModelScope 推出了預(yù)訓(xùn)練大語言模型(LLM)推理引擎 DashInfer,支持 C++ 和 Python 語言接口,可在多種 CPU 架構(gòu)上高效推理大模型。
DashInfer 采用 C++ Runtime 編寫,支持連續(xù)批處理和多 NUMA 推理,能充分利用服務(wù)器級 CPU 的算力,為推理14B 及以下的 LLM 模型提供更多硬件選擇。該引擎已開源,提供輕量級架構(gòu),高精度實現(xiàn),優(yōu)化的計算 Kernel,以及行業(yè)標(biāo)準(zhǔn) LLM 推理技術(shù)。DashInfer 支持主流 LLM 開源模型和 PTQ 量化技術(shù)。
此外,引擎還提供多語言 API 接口,支持多種硬件和數(shù)據(jù)類型,包括 x86CPU 和 ARMv9CPU,以及 FP32、BF16、InstantQuant 等數(shù)據(jù)類型。關(guān)于模型支持,DashInfer 可以加載和序列化模型,執(zhí)行推理過程,并采用 DLPack 格式的 tensor 與外部框架交互。在單 NUMA 架構(gòu)下,推理引擎使用多線程和線程池進行調(diào)度;而在多 NUMA 架構(gòu)下,引擎采用多進程 client-server 架構(gòu),實現(xiàn) tensor parallel 的模型推理。
性能測試結(jié)果表明,DashInfer 在 ARM 和 x86CPU 上具有良好的推理性能,能夠有效提升大模型推理效率。
代碼開源地址:
https://github.com/modelscope/dash-infer
推理體驗地址:
https://www.modelscope.cn/studios/modelscope/DashInfer-Demo
以上就是關(guān)于【阿里魔搭社區(qū)開源推理引擎 DashInfer】的相關(guān)內(nèi)容,希望對大家有幫助!
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險自擔(dān)。 如有侵權(quán)請聯(lián)系刪除!
-
【空谷幽蘭是什么意思】“空谷幽蘭”是一個富有詩意的成語,常用來形容在偏僻、冷清的地方生長的蘭花。它不僅...瀏覽全文>>
-
【空格怎么打出來】在日常使用電腦或手機輸入文字時,經(jīng)常會遇到需要輸入“空格”的情況。雖然看似簡單,但很...瀏覽全文>>
-
【空格怎么打】在日常使用電腦或手機時,很多人會遇到“空格怎么打”的問題。其實,“空格”是一個非?;A(chǔ)的...瀏覽全文>>
-
【空格名字怎么打】在日常使用電腦或手機時,很多人會遇到“空格名字怎么打”的問題。尤其是在輸入法設(shè)置、文...瀏覽全文>>
-
【空格鍵是指的哪一個】在日常使用電腦或手機的過程中,我們經(jīng)常接觸到各種按鍵,其中“空格鍵”是一個非?;?..瀏覽全文>>
-
【空擋是什么意思】“空擋”是一個在多個領(lǐng)域中常見的術(shù)語,尤其在汽車駕駛、機械操作以及一些比喻性表達中使...瀏覽全文>>
-
【空城舊夢是情侶網(wǎng)名嗎】“空城舊夢”這個詞語,聽起來充滿了詩意和情感色彩。它常被用于表達一種孤獨、懷念...瀏覽全文>>
-
【可吸收線是什么顏色】在醫(yī)學(xué)領(lǐng)域,尤其是外科手術(shù)中,可吸收線是一種常見的縫合材料。它主要用于縫合傷口,...瀏覽全文>>
-
【可為是什么意思】“可為”一詞源自中文,常用于表達“可以做”、“值得做”或“有作為”的含義。在不同語境...瀏覽全文>>
-
【可微與可導(dǎo)之間有什么聯(lián)系】在微積分的學(xué)習(xí)過程中,“可導(dǎo)”和“可微”是兩個經(jīng)常被提到的概念,它們看似相...瀏覽全文>>