最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

首頁 >> 今日更新 >

國產(chǎn)大模型新高度!訊飛星火4.0發(fā)布:整體超越GPT-4 Turbo,8個國際權威測試集測評第一

2024-06-28 09:00:45 來源: 用戶: 

相信很多大家對國產(chǎn)大模型新高度!訊飛星火4.0發(fā)布:整體超越GPT-4 Turbo,8個國際權威測試集測評第一還不知道吧,今天菲菲就帶你們一起去了解一下~.~!

國內大模型的能力,又來到了一個新高度!

6月27日,科大訊飛正式對外發(fā)布訊飛星火大模型V4.0,以及在醫(yī)療、教育、商業(yè)等多個領域的人工智能應用。

隨著新版本的發(fā)布,訊飛星火V4.0七大核心能力全面升級,在8個國際主流測試集中排名第一,整體超越GPT-4Turbo,領先國內大模型。

劉慶峰稱,當前,星火APP下載量已經(jīng)達到了1.31億,涌現(xiàn)出一批用戶喜愛的應用助手。在星火大模型的加持下,部分場景下的智能硬件銷量同比增長70%+,月均使用時次數(shù)超過4000萬。

另外,星火V4.0大模型是基于全國首個國產(chǎn)萬卡算力集群「飛星一號」訓練而成,意味著完全自主可控。

整體超越GPT-4Turbo

七大底層核心能力再次升級

今年1月底,星火大模型 V3.5在語言理解、數(shù)學能力方面超過了GPT-4Turbo,但代碼、多模態(tài)等其他能力依然與后者存在一些差距。

如今,5個月過去了,星火大模型V4.0再次進化,不僅在文本生成、語言理解、知識問答、邏輯推理和數(shù)學五大能力方面完成了對GPT-4Turbo的整體超越,并進一步縮小了在代碼、多模態(tài)能力方面的差距,尤其是多模態(tài)能力達到了后者97%的水平。

不僅如此,在國內外涵蓋理解 &推理、綜合考試、數(shù)學&科學以及代碼任務的12項中英文主流測試集中,星火大模型V4.0在8項測試集中排名第一。

在主流測試集之外,最近新鮮出爐的中高考題目更能檢驗大語言模型的綜合成色。

在這一領域的考核中,星火大模型V4.0的表現(xiàn)尤為出色。以2024北京中考為例,星火大模型V4.0取得了主客觀題得分率的雙雙第一,可以說是合格甚至中等水平的考生了。

除了底座七大核心能力的全面提升,此次星火大模型 V4.0在指令跟隨、文本、多模態(tài)、推理能力等多個方面還進行了針對性的性能優(yōu)化和功能創(chuàng)新。

首先,星火大模型V4.0加強了復雜指令跟隨和長文本處理能力,并業(yè)界首發(fā)一項新功能——長文本內容溯源。

具體來講,在長文檔要素抽取、長文檔總結摘要、長文檔問答和長文檔文本生成等任務中,星火大模型 V4.0的整體表現(xiàn)與GPT-4Turbo相當。同時,內容溯源功能又進一步減少了長文檔知識問答任務中的幻覺,使得答案的準確率更高。

在多模態(tài)方面,星火圖文識別能力持續(xù)升級,尤其在科研、金融、醫(yī)療、司法和辦公等專業(yè)領域的圖文識別能力獲得極大提升,超越了OpenAI上個月發(fā)布的最新旗艦模型 GPT-4o。這意味著星火大模型V4.0未來在這些垂直應用領域會有更大的應用潛力。

星火大模型V4.0在面向教育復雜場景的圖文識別任務中也更加游刃有余,在印刷體和手寫體的復雜公式識別中均顯著超越了GPT-4o。

同樣地,在基于邏輯關系的多模理解方面,星火大模型V4.0可以給出較以往邏輯更嚴謹、思路更清晰的回答。

最后,星火大模型V4.0能夠搞定更加復雜的邏輯推理、空間推理問題。

以空間推理為例,“Bob在客廳里。他拿著一個杯子走到廚房。他把球放進杯子里,然后拿著杯子走到臥室。他把杯子倒過來,然后走到花園。他把杯子放在花園里,然后走到車庫。問題:球在什么地方?”訊飛星火可以基于空間和常識推斷出球在臥室的地面上,這些能力的進步對于以后的具身智能、家庭機器人都具有意義。

可以說,一系列底層核心能力的升級,秀出了國產(chǎn)大語言模型全面超越國外競品的實力,并為基于大模型的應用落地打下了堅實的能力基礎。

星火語音大模型發(fā)布74個語種方言“自由對話”

破解強干擾場景下語音識別難題

語音能力一直是科大訊飛的絕對優(yōu)勢。6月24日,科大訊飛憑借“多語種智能語音關鍵技術及產(chǎn)業(yè)化”項目榮獲2023年度國家科學技術進步獎一等獎。

早在2024年1月30日,訊飛在星火大模型V3.5更新中,就已首次對外發(fā)布星火語音大模型,首批37個主流語種語音識別效果超過OpenAI Whisper V3。在星火V4.0的發(fā)布會上,科大訊飛宣布其語音模型能力再次重磅升級,除了37個主流語種,還增加對37種方言的識別。用戶可以實現(xiàn)37個語種+37個方言共74種語言免切-自由交流。

現(xiàn)場,演示人直接用上海話、粵語、合肥話、四川方言、日語以及法語等語言直接跟大模型溝通,大模型都能在快速準確識別出來。

另外,訊飛還重點展示了其超復雜場景語音轉寫的能力。三位人員現(xiàn)場實測了在噪音場景下,同時混疊著說話,正常人耳已難以聽清,只見訊飛星火的多模態(tài)能力不但實現(xiàn)了三人重疊語音的角色分離,還能實時轉寫出每個人說的話。

憑借智能語音的升級,訊飛進一步在汽車場景深耕。劉慶峰還展示了升級后的星火智能座艙。

醫(yī)療大模型「訊飛曉醫(yī)」

每個人的AI健康助手

由于醫(yī)學場景的特殊性,專業(yè)性極高、容錯率極低,面向C端的健康知識問答一直是一個難點。

去年10月,訊飛曾經(jīng)在星火V3的發(fā)布中簡單介紹過自己醫(yī)療大模型應用「訊飛曉醫(yī)」以及面向B端的應用「智醫(yī)助理」,「訊飛曉醫(yī)」面向C端開放,可以提供體檢報告分析等功能,「智醫(yī)助理」可以提供預問診等能力。

這次星火V4.0發(fā)布,訊飛針對醫(yī)療大模型和應用做了進一步升級介紹?,F(xiàn)場劉慶峰分享的數(shù)據(jù)顯示,在海量知識問答、復雜語言理解、專業(yè)文書生成、診斷治療推薦、多輪交互以及多模態(tài)交互等方面,訊飛星火醫(yī)療核心能力全面超過GPT-4Turbo和GPT-4o。

在應用端,自發(fā)布后,面向醫(yī)生端的「智醫(yī)助理」實現(xiàn)了輔助診斷8.2億次,147萬次修正診斷,幫助發(fā)現(xiàn)7267萬不合理處方數(shù)。

面向個人端的App「訊飛曉醫(yī)」則可以為普通用戶免費提供病歷、體檢報告、檢查報告的解讀,也可以對醫(yī)藥知識進行對話。通過集合各類健康信息,App可以為用戶個人提供一個個人數(shù)字健康空間,記錄疾病史、用藥史以及生活習慣等,可以在看病前幫助用戶分析病癥原因,用藥時為用戶提供個性判斷、藥物禁忌、檢查后提供變化情況分析以及記錄等。

現(xiàn)場演示的:掃碼上傳病歷單和體檢報告單,分析和解讀。

發(fā)布智能批閱機教育大模型再次升級

訊飛星火V4.0對教育大模型進行升級,并對外發(fā)布星火智能批閱機以及進一步升級訊飛AI學習機兩款硬件。

智能批閱機面向老師群體,將試卷放到批閱機上,批閱機可以實現(xiàn)自動掃描、在原卷子上進行打印批改,并且掃描后的數(shù)據(jù)自動上傳,生成學生個性的學情分析以及班級共性分析,還可以據(jù)此給學生布置個性作業(yè)。較人工批改,智能批閱機在閱卷場景上效率從90分鐘/班提升到5分鐘/班。

此外,訊飛還繼續(xù)升級了教育硬件「AI學習機」。利用升級后的「AI學習機」,用戶只需要拍攝試卷、選擇試題,AI就會幫助用戶答疑輔導,進行智能對話式講解。

推出「個人空間」

打造懂你的AI助手

「智能體」的火爆已經(jīng)成為2024年應用爆發(fā)的重要跡象。

自OpenAI先后推出GPTs以及GPT Store以來,人們可以基于大模型量身打造自己的AI智能助理。很多人都對它們的到來抱有極大期待,認為會迎來AI的「iPhone時刻」。其他廠商也隨之跟進推出類似的AI智能體服務,比如微軟推出了自己的C opilot GPTs服務。

然而,事情的發(fā)展不盡如人意,GPTs很快陷入了瓶頸。幾天前,微軟宣布砍掉了維持僅3個月的C opilot GPTs服務。細究原因,GPTs很大程度上在應用場景和商業(yè)落地方面沒有跟上來,后續(xù)也就失去了進一步發(fā)展的動力。

因此,近半年來,國內頭部大模型廠商都在智能體上快速發(fā)力,并在應用層面下足了功夫。

本次訊飛星火V4.0版本同樣重點推出了「智能體」方面的更新。在訊飛星火Desk以及星火App中,「智能體」已經(jīng)成為和Chatbot同樣的一級入口。點開「智能體中心」,訊飛的智能體商店覆蓋了生產(chǎn)力工具、學習、編程、營銷等多個領域的智能體。

根據(jù)發(fā)布會披露的信息,目前,星火APP/Desk將首批上線14個智能體,面向特定場景打造專屬助手。

用戶既可以在這里選擇自己的AI英語老師,也可以選擇一個定制好的AI律師來幫自己擬一份合同,還可以隨意挑選擅長Python、C++等語言的AI程序員來幫自己實現(xiàn)編程。

比如,捏一個嚴格的「雅思老師」。點擊智能體創(chuàng)建后,用一句話概括我們需要的「雅思老師」——需要幫我制定三個月的學習計劃,覆蓋聽說讀寫,并且針對每個部分教學。

點擊生成后,后臺會根據(jù)需求自動拓展這個智能體的其他方面,同時你可以隨時進行調試。

調試完成后,就可以向「AI雅思老師」學習了。

不過,與GPT Store相比,科大訊飛將「智能體」功能看成是實現(xiàn)用戶個性化的一部分。用戶可以根據(jù)自身需要去選擇和定義自己需要的智能助手。

而在實現(xiàn)「個性化」上,訊飛星火V4.0還對外發(fā)布發(fā)布“個人空間”,為用戶提供專屬私域知識庫,通過上傳個人文檔,讓大模型進行更精確的知識問答和內容生成;并且通過人設標簽、日程管理、信息訂閱、創(chuàng)建發(fā)音人,為用戶提供更加個性化和趣味化的服務。

用戶可以在個人空間持續(xù)上傳自己的資料文件,AI會根據(jù)所上傳的資料進行問答,并且提供內容溯源,在提高個性化的基礎上減少模型幻覺。

通過讓用戶更高程度的定義「Chatbot」,從個人知識增強、到選擇人設標簽、創(chuàng)建發(fā)音人,再到開放智能體定義,科大訊飛將大模型「Chatbot」的數(shù)據(jù)、工作流以及表現(xiàn)形式各方面都實現(xiàn)了定義自主化。

個性化大模型到了一個新階段,星火大模型V4.0將「每個人的個性化智能助手」這件事從「個性化」和「智能」兩方面都向前邁進一步。

寫在最后

在2024大模型落地元年,要想一直保持領先地位,搶先并全方位布局至為關鍵。

數(shù)天前,科大訊飛《多語種智能語音關鍵技術及產(chǎn)業(yè)化》項目獲國家科學技術進步獎一等獎。這也許就是對科大訊飛多年來AI技術成就的肯定之一。要知道,這是深度學習革命以來,過去十年人工智能領域首個國家科學技術進步獎一等獎。

可以說,從1月底的V3.5到今天的V4.0,訊飛星火大模型不僅在底層能力方面走得更穩(wěn),更在應用落地上開足了馬力。

一方面在不斷提升底層核心語言能力,持續(xù)趕超全球頂級大模型,并打磨升級自身優(yōu)勢模型能力比如語音能力;另一方面在應用和商業(yè)化方面投入更多精力,從現(xiàn)實場景需求出發(fā)進行全面布局,通過打造垂類大模型、私人定制智能體以及端側智能硬件等多種方式,加速大模型在B端和C端的落地,讓更多企業(yè)、普通用戶切身體驗到大模型帶來的價值。

以上就是關于【國產(chǎn)大模型新高度!訊飛星火4.0發(fā)布:整體超越GPT-4 Turbo,8個國際權威測試集測評第一】的相關內容,希望對大家有幫助!

  免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關。財經(jīng)信息僅供讀者參考,并不構成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權請聯(lián)系刪除!

 
分享:
最新文章