最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

首頁 >> 今日更新 >

阿里魔搭社區(qū)開源推理引擎 DashInfer

2024-05-24 09:00:30 來源: 用戶: 

相信很多大家對阿里魔搭社區(qū)開源推理引擎 DashInfer還不知道吧,今天菲菲就帶你們一起去了解一下~.~!

站長之家(ChinaZ.com)5月24日 消息:ModelScope 推出了預訓練大語言模型(LLM)推理引擎 DashInfer,支持 C++ 和 Python 語言接口,可在多種 CPU 架構(gòu)上高效推理大模型。

DashInfer 采用 C++ Runtime 編寫,支持連續(xù)批處理和多 NUMA 推理,能充分利用服務器級 CPU 的算力,為推理14B 及以下的 LLM 模型提供更多硬件選擇。該引擎已開源,提供輕量級架構(gòu),高精度實現(xiàn),優(yōu)化的計算 Kernel,以及行業(yè)標準 LLM 推理技術。DashInfer 支持主流 LLM 開源模型和 PTQ 量化技術。

此外,引擎還提供多語言 API 接口,支持多種硬件和數(shù)據(jù)類型,包括 x86CPU 和 ARMv9CPU,以及 FP32、BF16、InstantQuant 等數(shù)據(jù)類型。關于模型支持,DashInfer 可以加載和序列化模型,執(zhí)行推理過程,并采用 DLPack 格式的 tensor 與外部框架交互。在單 NUMA 架構(gòu)下,推理引擎使用多線程和線程池進行調(diào)度;而在多 NUMA 架構(gòu)下,引擎采用多進程 client-server 架構(gòu),實現(xiàn) tensor parallel 的模型推理。

性能測試結(jié)果表明,DashInfer 在 ARM 和 x86CPU 上具有良好的推理性能,能夠有效提升大模型推理效率。

代碼開源地址:

https://github.com/modelscope/dash-infer

推理體驗地址:

https://www.modelscope.cn/studios/modelscope/DashInfer-Demo

以上就是關于【阿里魔搭社區(qū)開源推理引擎 DashInfer】的相關內(nèi)容,希望對大家有幫助!

  免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關。財經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權(quán)請聯(lián)系刪除!

 
分享:
最新文章