新SOTA來(lái)了:國(guó)產(chǎn)9B模型多項(xiàng)得分超4o-mini,中國(guó)出海電商已經(jīng)用上了
相信很多大家對(duì)新SOTA來(lái)了:國(guó)產(chǎn)9B模型多項(xiàng)得分超4o-mini,中國(guó)出海電商已經(jīng)用上了還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
阿里開(kāi)源,又拿第一了。
這次是在多模態(tài)領(lǐng)域:
就在剛剛,阿里國(guó)際AI團(tuán)隊(duì)開(kāi)源多模態(tài)大模型Ovis1.6。在多模態(tài)權(quán)威綜合評(píng)測(cè)基準(zhǔn)OpenCompass上,Ovis1.6-Gemma2-9B版本綜合得分超越Qwen2VL-7B、InternVL2-26B和MiniCPM-V-2.6等主流開(kāi)源模型,在300億以下參數(shù)開(kāi)源模型中位居第一。
在數(shù)學(xué)推理和視覺(jué)理解等多項(xiàng)任務(wù)中,得分甚至超過(guò)了閉源的GPT-4o-mini。
具體來(lái)說(shuō),Ovis1.6能勝任視覺(jué)感知推理、數(shù)學(xué)和科學(xué)、生活場(chǎng)景等多種多模態(tài)任務(wù)。
拿大家伙兒都很關(guān)注的數(shù)理能力舉個(gè)例子,Ovis1.6的表現(xiàn)是醬嬸的:
媽媽再也不用擔(dān)心我學(xué)不明白大學(xué)數(shù)學(xué)。
用來(lái)輔助讀讀論文:
分析財(cái)報(bào),效果也相當(dāng)不錯(cuò)。
還能當(dāng)場(chǎng)看圖教你做一道經(jīng)典的炸魚(yú)薯?xiàng)l(手動(dòng)狗頭)。
值得一提的是,阿里國(guó)際的Ovis系列多模態(tài)大模型,遵循的是Apache2.0開(kāi)源協(xié)議。也就是說(shuō),協(xié)議很寬松,商用很友好。
從結(jié)構(gòu)上對(duì)齊視覺(jué)和文本嵌入
話不多說(shuō),我們照例來(lái)拆解一下Ovis這個(gè)新科第一背后的技術(shù)細(xì)節(jié)。
根據(jù)OpenCompass評(píng)測(cè)基準(zhǔn),Ovis1.6-Gemma2-9B超過(guò)了Qwen2-VL-7B、MiniCPM-V-2.6等一眾相同參數(shù)量級(jí)的知名多模態(tài)模型。
在數(shù)學(xué)等推理任務(wù)中,甚至有媲美70B參數(shù)模型的表現(xiàn)。
Ovis1.6的幻覺(jué)現(xiàn)象和錯(cuò)誤率也低于同級(jí)別模型,展現(xiàn)了更高的文本質(zhì)量和準(zhǔn)確率。
如何做到?阿里國(guó)際AI團(tuán)隊(duì)的核心思路是:從結(jié)構(gòu)上對(duì)齊視覺(jué)和文本嵌入。
當(dāng)前,多數(shù)開(kāi)源多模態(tài)大語(yǔ)言模型(MLLM)并非從頭訓(xùn)練整個(gè)模型,而是通過(guò)像多層感知機(jī)(MLP)這樣的連接器,將預(yù)訓(xùn)練的大語(yǔ)言模型(LLM)和視覺(jué)Transformer集成起來(lái),給LLM裝上“眼睛”。
這樣一來(lái),就導(dǎo)致了一個(gè)問(wèn)題:MLLM的文本和視覺(jué)模塊采用不同的嵌入策略,使得視覺(jué)和文本信息沒(méi)辦法無(wú)縫融合,限制了模型性能的進(jìn)一步提升。
針對(duì)這個(gè)問(wèn)題,Ovis采用了視覺(jué)tokenizer+視覺(jué)嵌入表+大語(yǔ)言模型的架構(gòu)。
Ovis借鑒了大語(yǔ)言模型中的文本嵌入策略,引入了可學(xué)習(xí)的視覺(jué)嵌入表,將連續(xù)的視覺(jué)特征先轉(zhuǎn)換為概率化的視覺(jué)token,再經(jīng)由視覺(jué)嵌入表多次索引加權(quán)得到結(jié)構(gòu)化的視覺(jué)嵌入。
文本方面,Ovis沿用當(dāng)前大語(yǔ)言模型的處理方式,文本tokenizer將輸入文本轉(zhuǎn)化為one-hot token,并根據(jù)文本嵌入表查找到每個(gè)文本token對(duì)應(yīng)的嵌入向量。
最后,Ovis將所有視覺(jué)嵌入向量與文本嵌入向量拼接起來(lái),經(jīng)由Transformer處理,完成多模態(tài)任務(wù)。
此次開(kāi)源的Ovis1.6,相較于前代Ovis1.5,還在架構(gòu)、數(shù)據(jù)、訓(xùn)練策略等方面做出了進(jìn)一步優(yōu)化。
架構(gòu)方面,采用動(dòng)態(tài)子圖方案,能靈活應(yīng)對(duì)不同分辨率圖像特征,提升了模型處理復(fù)雜視覺(jué)任務(wù)的能力。
數(shù)據(jù)方面,Ovis1.6在訓(xùn)練中涵蓋了多種類型的數(shù)據(jù)集,包括Caption、OCR、Table、Chart、Math等,確保模型在廣泛的應(yīng)用場(chǎng)景中都有出色表現(xiàn)。
訓(xùn)練策略方面,采用DPO等方案持續(xù)優(yōu)化模型性能,增強(qiáng)了模型在生成文本和理解復(fù)雜指令方面的能力,使得模型在復(fù)雜任務(wù)上的表現(xiàn)進(jìn)一步提升。
消融實(shí)驗(yàn)的結(jié)果還顯示,在訓(xùn)練數(shù)據(jù)、模型參數(shù)、LLM和視覺(jué)底座都保持相同的情況下,與基于MLP連接器的多模態(tài)大模型架構(gòu)相比,Ovis性能整體提升了8.8%。
量子位還了解到,作為一項(xiàng)基礎(chǔ)研究,Ovis目前已經(jīng)被廣泛應(yīng)用到了阿里國(guó)際的實(shí)際業(yè)務(wù)中。
AI能力變革出海電商
正如大家所知,阿里國(guó)際是一家AI驅(qū)動(dòng)的、擁有多個(gè)全球知名電商的公司。
而事實(shí)上,出海電商這個(gè)場(chǎng)景,早已第一批被AIGC“滲透”。
原因很直接:做出海生意,往往面臨海外市場(chǎng)復(fù)雜、成本和競(jìng)爭(zhēng)壓力大、跨境人才短缺等等共性問(wèn)題,而多模態(tài)大模型這樣的AIGC技術(shù),恰恰能在這些問(wèn)題上,提供適配的降本增效方案。
舉個(gè)例子,在跨境電商領(lǐng)域,退貨退款一直是影響用戶體驗(yàn)的重要因素。
傳統(tǒng)方案是人工進(jìn)行退款退貨的審核和判責(zé)。這不僅需要大量審核人力和較久的審核時(shí)間,還會(huì)因?yàn)槿斯ぶ饔^的評(píng)判標(biāo)準(zhǔn)不一,導(dǎo)致判罰的不穩(wěn)定性較高。多數(shù)平臺(tái)為了保證用戶體驗(yàn),傾向于給消費(fèi)者更多的傾斜,但這也傷害了部分商家和平臺(tái)的權(quán)益。
現(xiàn)在,基于Ovis,阿里國(guó)際融合過(guò)去積累的大量電商知識(shí),上線了智能退款系統(tǒng)。
相比于人工,Ovis針對(duì)用戶提供的退貨退款圖文和視頻詳情,可以提供秒級(jí)的審核服務(wù),且具有高度穩(wěn)定的一致性。這就在保證消費(fèi)者和商家公平權(quán)益的同時(shí),實(shí)現(xiàn)了快速低成本的退貨退款方案。
另外,在商品屬性提取、生成賣(mài)點(diǎn)等場(chǎng)景中,Ovis也已落地應(yīng)用。
阿里國(guó)際AI團(tuán)隊(duì),正是在如此預(yù)判下成立試跑的。而就在成立這一年多時(shí)間里,阿里國(guó)際已經(jīng)實(shí)現(xiàn)AI能力在跨境電商領(lǐng)域的規(guī)?;瘧?yīng)用:
AI發(fā)布商品達(dá)到百萬(wàn)規(guī)模,并且通過(guò)AI優(yōu)化,這些產(chǎn)品在海外的搜索量提升了37%。
AI能力覆蓋營(yíng)銷、客戶服務(wù)、商品發(fā)布、設(shè)計(jì)、合規(guī)等40+應(yīng)用場(chǎng)景,服務(wù)全球50萬(wàn)商家。
阿里國(guó)際AI能力日均超5千萬(wàn)次調(diào)用,規(guī)模每?jī)稍路?/p>
……
Ovis之外,阿里國(guó)際還構(gòu)建了多語(yǔ)言增強(qiáng)大模型Marco,電商版多模態(tài)大模型MarcoVL,提供的MaaS服務(wù)包括:
多語(yǔ)言文本生成技術(shù):為商品詳情描述適配當(dāng)?shù)卣Z(yǔ)言,讓AI為商品介紹改寫(xiě)優(yōu)化多語(yǔ)言標(biāo)題,突破語(yǔ)言和文化壁壘。
AI圖片處理,比如一鍵生成多張?zhí)摂M試衣效果。
以及智能消除、智能摳圖等圖像設(shè)計(jì)類能力。
可以說(shuō),從創(chuàng)立店鋪到市場(chǎng)營(yíng)銷,再到售前售后,在出海電商的各個(gè)環(huán)節(jié),阿里國(guó)際都已提供相應(yīng)的AI技術(shù)予以輔助——
潛移默化中,AI已經(jīng)完全改變商家的工作方式和生產(chǎn)效率。
△店鋪設(shè)計(jì)來(lái)自AI大模型之所以能在各行各業(yè)掀起驚濤駭浪,核心原因就是對(duì)生產(chǎn)力的解放和降本增效。
在這一波變革之中,對(duì)于阿里國(guó)際這樣的平臺(tái)而言,AI技術(shù)能力再次成為最受關(guān)注的核心競(jìng)爭(zhēng)力。
而借助平臺(tái)之力,出海電商商家已經(jīng)開(kāi)始第一批享受擁抱AI的紅利。
對(duì)于廣大開(kāi)發(fā)者而言,來(lái)自于實(shí)干家們的開(kāi)源貢獻(xiàn),亦是福音。
Ovis1.6開(kāi)源地址和Demo:
arXiv:https://arxiv.org/abs/2405.20797
Github:https://github.com/AIDC-AI/Ovis
Huggingface:https://huggingface.co/AIDC-AI/Ovis1.6-Gemma2-9B
Demo:https://huggingface.co/spaces/AIDC-AI/Ovis1.6-Gemma2-9B
以上就是關(guān)于【新SOTA來(lái)了:國(guó)產(chǎn)9B模型多項(xiàng)得分超4o-mini,中國(guó)出海電商已經(jīng)用上了】的相關(guān)內(nèi)容,希望對(duì)大家有幫助!
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!
- 董明珠曾喊話雷軍給股民分多少錢(qián)!格力:擬分紅超55億
- Epic喜+1:動(dòng)作游戲《師父》免費(fèi)領(lǐng) 立省139元
- 雷軍辟謠只招聘35歲以下員工:僅針對(duì)未來(lái)之星項(xiàng)目
- 普華永道發(fā)布2025年AI預(yù)測(cè):AI Agents將勞動(dòng)力提升1倍
- 雷軍回應(yīng)股價(jià)暴跌:年年難過(guò)年年過(guò)
- 一天100座!理想汽車第1700座超充站正式建成
- 《守望先鋒》國(guó)服宣布2月19日回歸:賬號(hào)數(shù)據(jù)完整保留
- 雷軍建議創(chuàng)業(yè)者要多留點(diǎn)錢(qián)給員工:別到山窮水盡才講問(wèn)題
- 雷軍新年第一天收到200元紅包 自侃年入百萬(wàn)的開(kāi)始
- 雷軍親自展示REDMI Turbo 4!2025年第一款新機(jī)
- 雷軍:小米未來(lái)10年建至少20座世界頂級(jí)工廠
- 雷軍辟謠只招聘35歲以下員工:只有招聘未來(lái)之星時(shí)才有年齡限制
- 雷軍回應(yīng)100億造車:沒(méi)有好到“封神” 不要神話我
- 雷軍表態(tài):一心做好小米汽車 大家可以在“許愿池”尋找商機(jī)
- 雷軍:中國(guó)汽車產(chǎn)業(yè)應(yīng)少些歪門(mén)邪道 不要發(fā)黑稿、背后捅刀子
- 小米SU7選配色都是7000元 為什么璀璨洋紅卻需要9000元
-
奔馳GLE作為豪華SUV市場(chǎng)中的佼佼者,憑借其卓越的性能、豪華的內(nèi)飾以及寬敞的空間,吸引了眾多消費(fèi)者的關(guān)注。...瀏覽全文>>
-
在2025年,安徽阜陽(yáng)地區(qū)的帕薩特新能源汽車市場(chǎng)表現(xiàn)非?;钴S。作為一款備受關(guān)注的新能源車型,帕薩特新能源憑...瀏覽全文>>
-
近日,滁州地區(qū)的大眾汽車經(jīng)銷商傳來(lái)好消息:備受矚目的2025款T-ROC探歌正式上市,并且以極具競(jìng)爭(zhēng)力的價(jià)格吸引...瀏覽全文>>
-
在選擇一款新能源汽車時(shí),了解其價(jià)格和配置是非常重要的一步。安徽淮南地區(qū)的長(zhǎng)安啟源E07作為2024款的新車型,...瀏覽全文>>
-
阜陽(yáng)長(zhǎng)安啟源A05作為長(zhǎng)安汽車旗下的全新車型,自推出以來(lái)便憑借其獨(dú)特的設(shè)計(jì)風(fēng)格和豐富的配置吸引了眾多消費(fèi)者...瀏覽全文>>
-
阜陽(yáng)長(zhǎng)安啟源A07作為一款備受矚目的新能源車型,以其豪華配置和親民的價(jià)格在市場(chǎng)上引起了廣泛關(guān)注。這款車型不...瀏覽全文>>
-
安徽淮南威然2024款價(jià)格及配置詳解隨著汽車市場(chǎng)的不斷更新?lián)Q代,上汽大眾旗下的MPV車型——威然(Viloran)憑...瀏覽全文>>
-
QQ多米新車報(bào)價(jià)2025款,買(mǎi)車省錢(qián)秘籍隨著汽車市場(chǎng)的不斷發(fā)展,消費(fèi)者在選購(gòu)車輛時(shí)不僅關(guān)注車型的性能和配置,...瀏覽全文>>
-
滁州途觀X 2024款最新價(jià)格及買(mǎi)車省錢(qián)秘籍隨著汽車市場(chǎng)的不斷發(fā)展,大眾途觀X作為一款兼具時(shí)尚與性能的中型SUV...瀏覽全文>>
-
隨著汽車市場(chǎng)的不斷發(fā)展,大眾蔚攬以其優(yōu)雅的設(shè)計(jì)和卓越的性能贏得了眾多消費(fèi)者的青睞。作為一款兼具實(shí)用性和...瀏覽全文>>
- Alienware 在 2025 年 CES 上展示了一些超凡脫俗的技術(shù)
- Wickes 任命首席零售和分銷官
- 分析師稱GTA 6或?qū)?shù)立行業(yè)新標(biāo)準(zhǔn)
- 索尼和本田在拉斯維加斯推出售價(jià) 89,900 美元的 Afeela 1
- 日本 11 月游客人數(shù)創(chuàng)月度新高
- 神經(jīng)認(rèn)知測(cè)試在 3 歲兒童白血病治療期間可行
- 牛津郡小學(xué)支持圣誕毛衣日
- S?strene Grene 投資歐洲物流中心
- 有人已經(jīng)在電視上直播 BNMC 打造的 1967 年福特野馬 Restomod
- 潛在的分子療法可以逆轉(zhuǎn)小鼠的胎盤(pán)發(fā)育問(wèn)題
- 奔馳GLE預(yù)約試駕,新手必看的詳細(xì)流程
- 滁州T-ROC探歌 2025新款價(jià)格,最低售價(jià)15.89萬(wàn)起,趕緊行動(dòng)
- 安徽淮南威然最新價(jià)格2024款,各配置車型售價(jià)全知曉
- 滁州途觀X最新價(jià)格2024款,買(mǎi)車省錢(qián)秘籍
- 淮南長(zhǎng)安啟源Q05 2025新款價(jià)格,最低售價(jià)9.69萬(wàn)起,入手正當(dāng)時(shí)
- 安徽淮南探影多少錢(qián) 2023款落地價(jià),各配置車型售價(jià)一目了然
- 淮南途觀X價(jià)格大揭秘,買(mǎi)車前必看
- 安徽淮南長(zhǎng)安獵手K50新款價(jià)格2025款多少錢(qián)?買(mǎi)車攻略一網(wǎng)打盡
- 滁州ID.4 X新款價(jià)格2025款多少錢(qián)?買(mǎi)車攻略一網(wǎng)打盡
- QQ多米落地價(jià),購(gòu)車前必看的費(fèi)用明細(xì)
- Nvidia DLSS 4 有望將游戲性能提高 8 倍
- 人工智能在預(yù)測(cè)自身免疫性疾病進(jìn)展方面顯示出良好的前景
- 心理物理實(shí)驗(yàn)揭示皮膚水分感知是如何改變的
- 科茨沃爾德公司慶祝圣誕節(jié)圓滿成功
- 南法納姆學(xué)校被評(píng)為薩里郡表現(xiàn)最好的小學(xué)
- 約克區(qū)九所小學(xué)將削減招生人數(shù)
- 松下新款電動(dòng)汽車電池為 Lucid Gravity 帶來(lái) 450 英里續(xù)航里程
- 泰國(guó)旅游呈現(xiàn)新趨勢(shì)
- 研究人員找到在細(xì)胞水平上餓死前列腺癌腫瘤的新方法
- 領(lǐng)先的人工智能聊天機(jī)器人在測(cè)試中表現(xiàn)出類似癡呆癥的認(rèn)知能力下降
- 龐大的 Project Zomboid build 42 終于可以玩了
- Steam Replay 回歸向您展示 2024 年您玩得最多的 PC 游戲
- Jollyes 推出強(qiáng)化的人才支持和招聘措施
- Karen Millen 與 Simon Harrison 共同推出全新高級(jí)珠寶系列
- 奇瑞風(fēng)云A8L電動(dòng)轎車刷新續(xù)航里程世界紀(jì)錄
- 虛擬藝術(shù)家將別克 Cascada 帶回 2026 款車型
- OnePlus 宣布推出新計(jì)劃解決綠線問(wèn)題
- OnePlus Watch 3 將擁有更大的電池和更薄的機(jī)身
- 研究人員發(fā)現(xiàn)可變剪接與自身免疫性疾病遺傳之間的細(xì)胞類型特異性聯(lián)系
- 科學(xué)家確定腦細(xì)胞類型是排尿的主要控制者