國產(chǎn)大模型新高度！訊飛星火4.0發(fā)布：整體超越GPT-4 Turbo，8個(gè)國際權(quán)威測(cè)試集測(cè)評(píng)第一

2024-06-28 09:00:45 來源：用戶：

相信很多大家對(duì)國產(chǎn)大模型新高度！訊飛星火4.0發(fā)布：整體超越GPT-4 Turbo，8個(gè)國際權(quán)威測(cè)試集測(cè)評(píng)第一還不知道吧，今天菲菲就帶你們一起去了解一下~.~！

國內(nèi)大模型的能力，又來到了一個(gè)新高度!

6月27日，科大訊飛正式對(duì)外發(fā)布訊飛星火大模型V4.0，以及在醫(yī)療、教育、商業(yè)等多個(gè)領(lǐng)域的人工智能應(yīng)用。

隨著新版本的發(fā)布，訊飛星火V4.0七大核心能力全面升級(jí)，在8個(gè)國際主流測(cè)試集中排名第一，整體超越GPT-4Turbo，領(lǐng)先國內(nèi)大模型。

劉慶峰稱，當(dāng)前，星火APP下載量已經(jīng)達(dá)到了1.31億，涌現(xiàn)出一批用戶喜愛的應(yīng)用助手。在星火大模型的加持下，部分場(chǎng)景下的智能硬件銷量同比增長70%+，月均使用時(shí)次數(shù)超過4000萬。

另外，星火V4.0大模型是基于全國首個(gè)國產(chǎn)萬卡算力集群「飛星一號(hào)」訓(xùn)練而成，意味著完全自主可控。

整體超越GPT-4Turbo

七大底層核心能力再次升級(jí)

今年1月底，星火大模型 V3.5在語言理解、數(shù)學(xué)能力方面超過了GPT-4Turbo，但代碼、多模態(tài)等其他能力依然與后者存在一些差距。

如今，5個(gè)月過去了，星火大模型V4.0再次進(jìn)化，不僅在文本生成、語言理解、知識(shí)問答、邏輯推理和數(shù)學(xué)五大能力方面完成了對(duì)GPT-4Turbo的整體超越，并進(jìn)一步縮小了在代碼、多模態(tài)能力方面的差距，尤其是多模態(tài)能力達(dá)到了后者97%的水平。

不僅如此，在國內(nèi)外涵蓋理解 &推理、綜合考試、數(shù)學(xué)&科學(xué)以及代碼任務(wù)的12項(xiàng)中英文主流測(cè)試集中，星火大模型V4.0在8項(xiàng)測(cè)試集中排名第一。

在主流測(cè)試集之外，最近新鮮出爐的中高考題目更能檢驗(yàn)大語言模型的綜合成色。

在這一領(lǐng)域的考核中，星火大模型V4.0的表現(xiàn)尤為出色。以2024北京中考為例，星火大模型V4.0取得了主客觀題得分率的雙雙第一，可以說是合格甚至中等水平的考生了。

除了底座七大核心能力的全面提升，此次星火大模型 V4.0在指令跟隨、文本、多模態(tài)、推理能力等多個(gè)方面還進(jìn)行了針對(duì)性的性能優(yōu)化和功能創(chuàng)新。

首先，星火大模型V4.0加強(qiáng)了復(fù)雜指令跟隨和長文本處理能力，并業(yè)界首發(fā)一項(xiàng)新功能——長文本內(nèi)容溯源。

具體來講，在長文檔要素抽取、長文檔總結(jié)摘要、長文檔問答和長文檔文本生成等任務(wù)中，星火大模型 V4.0的整體表現(xiàn)與GPT-4Turbo相當(dāng)。同時(shí)，內(nèi)容溯源功能又進(jìn)一步減少了長文檔知識(shí)問答任務(wù)中的幻覺，使得答案的準(zhǔn)確率更高。

在多模態(tài)方面，星火圖文識(shí)別能力持續(xù)升級(jí)，尤其在科研、金融、醫(yī)療、司法和辦公等專業(yè)領(lǐng)域的圖文識(shí)別能力獲得極大提升，超越了OpenAI上個(gè)月發(fā)布的最新旗艦?zāi)Ｐ?GPT-4o。這意味著星火大模型V4.0未來在這些垂直應(yīng)用領(lǐng)域會(huì)有更大的應(yīng)用潛力。

星火大模型V4.0在面向教育復(fù)雜場(chǎng)景的圖文識(shí)別任務(wù)中也更加游刃有余，在印刷體和手寫體的復(fù)雜公式識(shí)別中均顯著超越了GPT-4o。

同樣地，在基于邏輯關(guān)系的多模理解方面，星火大模型V4.0可以給出較以往邏輯更嚴(yán)謹(jǐn)、思路更清晰的回答。

最后，星火大模型V4.0能夠搞定更加復(fù)雜的邏輯推理、空間推理問題。

以空間推理為例，“Bob在客廳里。他拿著一個(gè)杯子走到廚房。他把球放進(jìn)杯子里，然后拿著杯子走到臥室。他把杯子倒過來，然后走到花園。他把杯子放在花園里，然后走到車庫。問題:球在什么地方?”訊飛星火可以基于空間和常識(shí)推斷出球在臥室的地面上，這些能力的進(jìn)步對(duì)于以后的具身智能、家庭機(jī)器人都具有意義。

可以說，一系列底層核心能力的升級(jí)，秀出了國產(chǎn)大語言模型全面超越國外競(jìng)品的實(shí)力，并為基于大模型的應(yīng)用落地打下了堅(jiān)實(shí)的能力基礎(chǔ)。

星火語音大模型發(fā)布74個(gè)語種方言“自由對(duì)話”

破解強(qiáng)干擾場(chǎng)景下語音識(shí)別難題

語音能力一直是科大訊飛的絕對(duì)優(yōu)勢(shì)。6月24日，科大訊飛憑借“多語種智能語音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”項(xiàng)目榮獲2023年度國家科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng)。

早在2024年1月30日，訊飛在星火大模型V3.5更新中，就已首次對(duì)外發(fā)布星火語音大模型，首批37個(gè)主流語種語音識(shí)別效果超過OpenAI Whisper V3。在星火V4.0的發(fā)布會(huì)上，科大訊飛宣布其語音模型能力再次重磅升級(jí)，除了37個(gè)主流語種，還增加對(duì)37種方言的識(shí)別。用戶可以實(shí)現(xiàn)37個(gè)語種+37個(gè)方言共74種語言免切-自由交流。

現(xiàn)場(chǎng)，演示人直接用上海話、粵語、合肥話、四川方言、日語以及法語等語言直接跟大模型溝通，大模型都能在快速準(zhǔn)確識(shí)別出來。

另外，訊飛還重點(diǎn)展示了其超復(fù)雜場(chǎng)景語音轉(zhuǎn)寫的能力。三位人員現(xiàn)場(chǎng)實(shí)測(cè)了在噪音場(chǎng)景下，同時(shí)混疊著說話，正常人耳已難以聽清，只見訊飛星火的多模態(tài)能力不但實(shí)現(xiàn)了三人重疊語音的角色分離，還能實(shí)時(shí)轉(zhuǎn)寫出每個(gè)人說的話。

憑借智能語音的升級(jí)，訊飛進(jìn)一步在汽車場(chǎng)景深耕。劉慶峰還展示了升級(jí)后的星火智能座艙。

醫(yī)療大模型「訊飛曉醫(yī)」

每個(gè)人的AI健康助手

由于醫(yī)學(xué)場(chǎng)景的特殊性，專業(yè)性極高、容錯(cuò)率極低，面向C端的健康知識(shí)問答一直是一個(gè)難點(diǎn)。

去年10月，訊飛曾經(jīng)在星火V3的發(fā)布中簡(jiǎn)單介紹過自己醫(yī)療大模型應(yīng)用「訊飛曉醫(yī)」以及面向B端的應(yīng)用「智醫(yī)助理」，「訊飛曉醫(yī)」面向C端開放，可以提供體檢報(bào)告分析等功能，「智醫(yī)助理」可以提供預(yù)問診等能力。

這次星火V4.0發(fā)布，訊飛針對(duì)醫(yī)療大模型和應(yīng)用做了進(jìn)一步升級(jí)介紹?，F(xiàn)場(chǎng)劉慶峰分享的數(shù)據(jù)顯示，在海量知識(shí)問答、復(fù)雜語言理解、專業(yè)文書生成、診斷治療推薦、多輪交互以及多模態(tài)交互等方面，訊飛星火醫(yī)療核心能力全面超過GPT-4Turbo和GPT-4o。

在應(yīng)用端，自發(fā)布后，面向醫(yī)生端的「智醫(yī)助理」實(shí)現(xiàn)了輔助診斷8.2億次，147萬次修正診斷，幫助發(fā)現(xiàn)7267萬不合理處方數(shù)。

面向個(gè)人端的App「訊飛曉醫(yī)」則可以為普通用戶免費(fèi)提供病歷、體檢報(bào)告、檢查報(bào)告的解讀，也可以對(duì)醫(yī)藥知識(shí)進(jìn)行對(duì)話。通過集合各類健康信息，App可以為用戶個(gè)人提供一個(gè)個(gè)人數(shù)字健康空間，記錄疾病史、用藥史以及生活習(xí)慣等，可以在看病前幫助用戶分析病癥原因，用藥時(shí)為用戶提供個(gè)性判斷、藥物禁忌、檢查后提供變化情況分析以及記錄等。

現(xiàn)場(chǎng)演示的:掃碼上傳病歷單和體檢報(bào)告單，分析和解讀。

發(fā)布智能批閱機(jī)教育大模型再次升級(jí)

訊飛星火V4.0對(duì)教育大模型進(jìn)行升級(jí)，并對(duì)外發(fā)布星火智能批閱機(jī)以及進(jìn)一步升級(jí)訊飛AI學(xué)習(xí)機(jī)兩款硬件。

智能批閱機(jī)面向老師群體，將試卷放到批閱機(jī)上，批閱機(jī)可以實(shí)現(xiàn)自動(dòng)掃描、在原卷子上進(jìn)行打印批改，并且掃描后的數(shù)據(jù)自動(dòng)上傳，生成學(xué)生個(gè)性的學(xué)情分析以及班級(jí)共性分析，還可以據(jù)此給學(xué)生布置個(gè)性作業(yè)。較人工批改，智能批閱機(jī)在閱卷場(chǎng)景上效率從90分鐘/班提升到5分鐘/班。

此外，訊飛還繼續(xù)升級(jí)了教育硬件「AI學(xué)習(xí)機(jī)」。利用升級(jí)后的「AI學(xué)習(xí)機(jī)」，用戶只需要拍攝試卷、選擇試題，AI就會(huì)幫助用戶答疑輔導(dǎo)，進(jìn)行智能對(duì)話式講解。

推出「?jìng)€(gè)人空間」

打造懂你的AI助手

「智能體」的火爆已經(jīng)成為2024年應(yīng)用爆發(fā)的重要跡象。

自O(shè)penAI先后推出GPTs以及GPT Store以來，人們可以基于大模型量身打造自己的AI智能助理。很多人都對(duì)它們的到來抱有極大期待，認(rèn)為會(huì)迎來AI的「iPhone時(shí)刻」。其他廠商也隨之跟進(jìn)推出類似的AI智能體服務(wù)，比如微軟推出了自己的C opilot GPTs服務(wù)。

然而，事情的發(fā)展不盡如人意，GPTs很快陷入了瓶頸。幾天前，微軟宣布砍掉了維持僅3個(gè)月的C opilot GPTs服務(wù)。細(xì)究原因，GPTs很大程度上在應(yīng)用場(chǎng)景和商業(yè)落地方面沒有跟上來，后續(xù)也就失去了進(jìn)一步發(fā)展的動(dòng)力。

因此，近半年來，國內(nèi)頭部大模型廠商都在智能體上快速發(fā)力，并在應(yīng)用層面下足了功夫。

本次訊飛星火V4.0版本同樣重點(diǎn)推出了「智能體」方面的更新。在訊飛星火Desk以及星火App中，「智能體」已經(jīng)成為和Chatbot同樣的一級(jí)入口。點(diǎn)開「智能體中心」，訊飛的智能體商店覆蓋了生產(chǎn)力工具、學(xué)習(xí)、編程、營銷等多個(gè)領(lǐng)域的智能體。

根據(jù)發(fā)布會(huì)披露的信息，目前，星火APP/Desk將首批上線14個(gè)智能體，面向特定場(chǎng)景打造專屬助手。

用戶既可以在這里選擇自己的AI英語老師，也可以選擇一個(gè)定制好的AI律師來幫自己擬一份合同，還可以隨意挑選擅長Python、C++等語言的AI程序員來幫自己實(shí)現(xiàn)編程。

比如，捏一個(gè)嚴(yán)格的「雅思老師」。點(diǎn)擊智能體創(chuàng)建后，用一句話概括我們需要的「雅思老師」——需要幫我制定三個(gè)月的學(xué)習(xí)計(jì)劃，覆蓋聽說讀寫，并且針對(duì)每個(gè)部分教學(xué)。

點(diǎn)擊生成后，后臺(tái)會(huì)根據(jù)需求自動(dòng)拓展這個(gè)智能體的其他方面，同時(shí)你可以隨時(shí)進(jìn)行調(diào)試。

調(diào)試完成后，就可以向「AI雅思老師」學(xué)習(xí)了。

不過，與GPT Store相比，科大訊飛將「智能體」功能看成是實(shí)現(xiàn)用戶個(gè)性化的一部分。用戶可以根據(jù)自身需要去選擇和定義自己需要的智能助手。

而在實(shí)現(xiàn)「?jìng)€(gè)性化」上，訊飛星火V4.0還對(duì)外發(fā)布發(fā)布“個(gè)人空間”，為用戶提供專屬私域知識(shí)庫，通過上傳個(gè)人文檔，讓大模型進(jìn)行更精確的知識(shí)問答和內(nèi)容生成;并且通過人設(shè)標(biāo)簽、日程管理、信息訂閱、創(chuàng)建發(fā)音人，為用戶提供更加個(gè)性化和趣味化的服務(wù)。

用戶可以在個(gè)人空間持續(xù)上傳自己的資料文件，AI會(huì)根據(jù)所上傳的資料進(jìn)行問答，并且提供內(nèi)容溯源，在提高個(gè)性化的基礎(chǔ)上減少模型幻覺。

通過讓用戶更高程度的定義「Chatbot」，從個(gè)人知識(shí)增強(qiáng)、到選擇人設(shè)標(biāo)簽、創(chuàng)建發(fā)音人，再到開放智能體定義，科大訊飛將大模型「Chatbot」的數(shù)據(jù)、工作流以及表現(xiàn)形式各方面都實(shí)現(xiàn)了定義自主化。

個(gè)性化大模型到了一個(gè)新階段，星火大模型V4.0將「每個(gè)人的個(gè)性化智能助手」這件事從「?jìng)€(gè)性化」和「智能」兩方面都向前邁進(jìn)一步。

寫在最后

在2024大模型落地元年，要想一直保持領(lǐng)先地位，搶先并全方位布局至為關(guān)鍵。

數(shù)天前，科大訊飛《多語種智能語音關(guān)鍵技術(shù)及產(chǎn)業(yè)化》項(xiàng)目獲國家科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng)。這也許就是對(duì)科大訊飛多年來AI技術(shù)成就的肯定之一。要知道，這是深度學(xué)習(xí)革命以來，過去十年人工智能領(lǐng)域首個(gè)國家科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng)。

可以說，從1月底的V3.5到今天的V4.0，訊飛星火大模型不僅在底層能力方面走得更穩(wěn)，更在應(yīng)用落地上開足了馬力。

一方面在不斷提升底層核心語言能力，持續(xù)趕超全球頂級(jí)大模型，并打磨升級(jí)自身優(yōu)勢(shì)模型能力比如語音能力;另一方面在應(yīng)用和商業(yè)化方面投入更多精力，從現(xiàn)實(shí)場(chǎng)景需求出發(fā)進(jìn)行全面布局，通過打造垂類大模型、私人定制智能體以及端側(cè)智能硬件等多種方式，加速大模型在B端和C端的落地，讓更多企業(yè)、普通用戶切身體驗(yàn)到大模型帶來的價(jià)值。

以上就是關(guān)于【國產(chǎn)大模型新高度！訊飛星火4.0發(fā)布：整體超越GPT-4 Turbo，8個(gè)國際權(quán)威測(cè)試集測(cè)評(píng)第一】的相關(guān)內(nèi)容，希望對(duì)大家有幫助！

標(biāo)簽：國產(chǎn)大模型新高度！訊飛星火4 0發(fā)布：整體超越GPT-4 Turbo，8個(gè)國際權(quán)威測(cè)試集測(cè)評(píng)第一

　　免責(zé)聲明：本文由用戶上傳，與本網(wǎng)站立場(chǎng)無關(guān)。財(cái)經(jīng)信息僅供讀者參考，并不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。如有侵權(quán)請(qǐng)聯(lián)系刪除！

相關(guān)閱讀

最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

國產(chǎn)大模型新高度！訊飛星火4.0發(fā)布：整體超越GPT-4 Turbo，8個(gè)國際權(quán)威測(cè)試集測(cè)評(píng)第一

國產(chǎn)大模型新高度！訊飛星火4.0發(fā)布：整體超越GPT-4 Turbo，8個(gè)國際權(quán)威測(cè)試集測(cè)評(píng)第一