一個(gè)提問(wèn)高下立見(jiàn)?國(guó)產(chǎn)AI大模型沖上扣子廣場(chǎng)PK
相信很多大家對(duì)一個(gè)提問(wèn)高下立見(jiàn)?國(guó)產(chǎn)AI大模型沖上扣子廣場(chǎng)PK還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
以“國(guó)產(chǎn)GPTs”出名的扣子,做出了GPT沒(méi)有的功能。
6月12日,字節(jié)跳動(dòng)旗下的AI應(yīng)用開(kāi)發(fā)平臺(tái)“扣子”(Coze國(guó)內(nèi)版)悄悄上線了新功能“模型廣場(chǎng)”。
扣子是AI應(yīng)用開(kāi)發(fā)平臺(tái),無(wú)論用戶是否有編程基礎(chǔ),都可以在扣子上快速搭建基于大模型的各種聊天機(jī)器人(AI Bot),并一鍵發(fā)布到飛書(shū)、微信等各個(gè)社交平臺(tái)。
而新上線的模型廣場(chǎng),可以讓兩個(gè)大語(yǔ)言模型實(shí)時(shí)PK,一決勝負(fù),幫助用戶挑選出最適合自己的大語(yǔ)言模型。
據(jù)了解,扣子目前已經(jīng)接入了包括豆包、通義千問(wèn)、MiniMax、Moonshot、百川智能、智譜等多個(gè)國(guó)內(nèi)大語(yǔ)言模型。換言之,這是國(guó)內(nèi)多家知名大模型廠商與字節(jié)的強(qiáng)強(qiáng)聯(lián)動(dòng)。
哪款大模型最適合自己的AI應(yīng)用?創(chuàng)作者們?cè)诖蛟霢I Bot時(shí)該選哪個(gè)模型?自定義主題Bot的魅力在哪?“頭號(hào)AI玩家”第一時(shí)間上手進(jìn)行了一番實(shí)測(cè)。
超低門檻搭建Bot,讓大模型匿名PK國(guó)內(nèi)大模型到底哪家更厲害,遇到問(wèn)題時(shí)該選擇哪個(gè)AI解決,扣子模型廣場(chǎng)提供的就是快速測(cè)試的方法。
具體來(lái)說(shuō),模型廣場(chǎng)采用了指定Bot對(duì)戰(zhàn)、隨機(jī)Bot對(duì)戰(zhàn)以及純模型對(duì)戰(zhàn)模式,任一模式下,系統(tǒng)都會(huì)先匹配兩款匿名大模型,隨后用戶進(jìn)行提問(wèn),模型實(shí)時(shí)生成答案進(jìn)行PK。
根據(jù)模型的回答質(zhì)量,我們可以投票選出表現(xiàn)較好的模型,孰強(qiáng)孰弱一目了然。
任意模型完成回答后,用戶可以參與投票
先從最基礎(chǔ)的模型能力評(píng)測(cè)入手,如果我需要搭建一個(gè)“友好語(yǔ)氣轉(zhuǎn)換器(陰陽(yáng)版)”,哪個(gè)大語(yǔ)言模型的回復(fù)既禮貌但不冒犯?
現(xiàn)在直接讓模型“打一架”,就可以評(píng)估大模型在面對(duì)細(xì)分需求時(shí)的表現(xiàn)差異。
我們?cè)诳圩幽P蛷V場(chǎng)點(diǎn)擊“純模型對(duì)戰(zhàn)”,進(jìn)入對(duì)決頁(yè)面,兩款匿名模型已經(jīng)在后臺(tái)準(zhǔn)備就緒了。
隨后,我輸入了需要?jiǎng)?chuàng)建的AI Bot角色設(shè)定,并一鍵發(fā)送給兩個(gè)身份未知的大語(yǔ)言模型,內(nèi)容如下:
兩款匿名大模型實(shí)時(shí)響應(yīng)提問(wèn),其中,最先給出回答的大模型B只花了4.9秒。
任意一個(gè)模型回答完后,就可以基于內(nèi)容質(zhì)量、回復(fù)時(shí)間等要素,來(lái)判斷哪個(gè)模型表現(xiàn)更好。
實(shí)際測(cè)試中,綜合響應(yīng)時(shí)長(zhǎng)以及內(nèi)容“陰陽(yáng)怪氣”的程度,我把這一票投給了大模型A。投票完成后,模型廣場(chǎng)會(huì)顯示剛才參與競(jìng)賽的兩位模型選手,比如被我選中獲勝的模型A實(shí)際上是豆包。點(diǎn)擊展開(kāi),還能獲得更多模型參數(shù)。
投票完成頁(yè)面
當(dāng)然,也可以選擇重開(kāi)一輪。比如由于我還想了解其他模型會(huì)如何“陰陽(yáng)怪氣”,就點(diǎn)了“重開(kāi)一輪”,很快,系統(tǒng)重新匹配了兩個(gè)新模型進(jìn)行對(duì)戰(zhàn)。
通過(guò)多輪評(píng)估對(duì)比,我們發(fā)現(xiàn)在“友好語(yǔ)氣轉(zhuǎn)換器”這一機(jī)器人創(chuàng)建需求中,豆包和Moonshot給出的結(jié)果不相上下,豆包回答簡(jiǎn)單毒舌,Moonshot配合表情之后,把“暗諷”拿捏到位。
那么,考慮到我希望聊天機(jī)器人在對(duì)話時(shí)帶上emoji,所以會(huì)更青睞活潑一點(diǎn)的Moonshot。
需要說(shuō)明的是,這里的投票完全是依據(jù)個(gè)人主觀喜好,所以與其說(shuō)哪家模型更強(qiáng),不如說(shuō)哪家更適合。
目前,市面上也有較權(quán)威的評(píng)測(cè),像LMSYS的模型競(jìng)技場(chǎng),也是讓全球用戶可以自由評(píng)測(cè)大模型的能力,選出優(yōu)勝模型??圩拥哪P蛷V場(chǎng)也有相同的功能。
對(duì)于開(kāi)發(fā)者來(lái)說(shuō),如何選擇更優(yōu)的底層模型打造AI Bot是十分值得關(guān)心的問(wèn)題。畢竟在大模型行業(yè),基礎(chǔ)模型的能力幾乎決定著AI Bot能多大程度發(fā)揮作用。
但很多人在創(chuàng)建AI Bot時(shí),其實(shí)無(wú)法看懂復(fù)雜的榜單數(shù)據(jù),甚至不夸張地說(shuō),國(guó)產(chǎn)AI大模型各個(gè)當(dāng)過(guò)第一?,F(xiàn)在,“純模型”之間可以進(jìn)行對(duì)戰(zhàn),以文本生成的硬實(shí)力PK,這樣的優(yōu)勢(shì)在于方便小白用戶自行選擇模型。
除此之外,也可以在模型競(jìng)技場(chǎng)中選擇感興趣的Bot開(kāi)啟模型對(duì)戰(zhàn)。和GPTs商店類似,入圍模型廣場(chǎng)的AI Bot是官方精選推薦的。
比如,我選擇了“奇遇旅行家”Bot來(lái)制定一個(gè)出行計(jì)劃,同樣能將“我要從上海出發(fā)到阿勒泰,請(qǐng)幫我找到便宜的機(jī)票,并制定一份出行規(guī)劃”這個(gè)問(wèn)題,一鍵發(fā)給兩個(gè)模型。
不到15秒的時(shí)間,匿名模型先后給出了兩個(gè)完全不同的方案,對(duì)于出行需要Plan B的我來(lái)說(shuō),的確大大縮短了規(guī)劃時(shí)間。
換言之,對(duì)于普通用戶而言,同一個(gè)問(wèn)題可以同時(shí)投喂給兩個(gè)大語(yǔ)言模型,短時(shí)間內(nèi)可以獲得更多回復(fù),一定程度上可以提高獲取信息的效率。此外,也可以在一個(gè)平臺(tái)掌握各大模型的最新能力,扣子實(shí)現(xiàn)了模型Bot的聚合。
驗(yàn)證模型再疊技能,AI還能怎么玩需要說(shuō)明的是,模型廣場(chǎng)評(píng)估的只是大模型本身在文本生成等方面的能力,不受編排、工作流等配置的影響和限制。
所以,如果想要打造出一個(gè)能力出眾的Bot,還需要進(jìn)一步給AI附加一些額外能力。
比如,讓Genmoji Bot調(diào)用表情包插件,或是創(chuàng)作完整的工作流,和大語(yǔ)言模型結(jié)合完成更多復(fù)雜功能。
在扣子Bot商店,有不少網(wǎng)友通過(guò)AI Bot實(shí)現(xiàn)自己的創(chuàng)意。AI最大的魅力,大概就在于你壓根沒(méi)想到這些東西能這么用。
6月12日,扣子還和Intel聯(lián)合推出了“Coze AI Factory”主題Bot征集活動(dòng),包括圖文創(chuàng)作、實(shí)用工具、互動(dòng)創(chuàng)意等不同賽道。
https://www.coze.cn/docs/guides/coze_ai_factory
網(wǎng)友們靠調(diào)用插件、增加工作流,調(diào)教了形形色色的角色,整了不少花活,比如“單人劇本殺”“本命粽子”“Emoji翻譯器”等等。
這些有意思的Bot也會(huì)吸引更多開(kāi)發(fā)者上手一試,從中尋找創(chuàng)建靈感。
比如可以在Bot商店選擇感興趣的Bot,查看相應(yīng)的提示詞,甚至在個(gè)人空間里復(fù)刻一個(gè)相似的,替換成更心儀的大語(yǔ)言模型。
我們體驗(yàn)下來(lái)也發(fā)現(xiàn),如此一來(lái),零基礎(chǔ)就可以開(kāi)發(fā)一款契合自己的AI Bot。借助模型廣場(chǎng),還能在創(chuàng)建AI Bot時(shí)選擇更偏好的大模型。這樣一來(lái),人人都可以靈活地配置生成不同的Bot,還能低成本實(shí)現(xiàn)突如其來(lái)的創(chuàng)意。
字節(jié)AI新王牌,想做大模型風(fēng)向標(biāo)?隨著大模型技術(shù)不斷發(fā)展,國(guó)內(nèi)大廠幾乎都瞄準(zhǔn)了構(gòu)建AI原生應(yīng)用平臺(tái),類GPTs的產(chǎn)品遠(yuǎn)不止扣子。此前百度上線了文心一言智能體平臺(tái),阿里云布局推出百煉大模型平臺(tái)。前不久,騰訊一站式智能體制作平臺(tái)“元器”也公開(kāi)灰度測(cè)試。
不少觀點(diǎn)認(rèn)為,具有專業(yè)能力的智能體,能夠撬動(dòng)大模型商業(yè)化。但如何在其中脫穎而出,做出差異化競(jìng)爭(zhēng)是大模型廠商們共同面對(duì)的問(wèn)題。
目前看來(lái),挖掘大模型技術(shù)上的潛力,匯聚開(kāi)發(fā)者甚至非開(kāi)發(fā)者,扣子靠模型競(jìng)技場(chǎng)已經(jīng)邁出了第一步。
模型競(jìng)技場(chǎng),意味著字節(jié)聯(lián)動(dòng)阿里、百川智能和月之暗面等,讓用戶能夠快速基于多種大模型創(chuàng)建應(yīng)用。扣子的底層也不再局限于自研的豆包大模型,逐漸走向開(kāi)放,吸引更多開(kāi)發(fā)者。
圖片來(lái)源:扣子微信公眾平臺(tái)
對(duì)于大廠來(lái)說(shuō),開(kāi)發(fā)者生態(tài)就像是“蓄水池”,繁榮的生態(tài)和穩(wěn)固的底層技術(shù)向來(lái)相輔相成,規(guī)?;拈_(kāi)發(fā)者聚合效應(yīng)能進(jìn)一步提升大模型能力。
繼此前推出9個(gè)豆包大模型全家桶,打響大模型價(jià)格戰(zhàn)后,字節(jié)正在圍繞AI尋找應(yīng)用落地場(chǎng)景,以觸達(dá)更多用戶。
以扣子、豆包等為基礎(chǔ),字節(jié)似乎正嘗試搭建起一個(gè)能夠吸引開(kāi)發(fā)者與用戶、覆蓋各領(lǐng)域的AI應(yīng)用生態(tài),進(jìn)一步對(duì)B端業(yè)務(wù)發(fā)起攻勢(shì)。
火山引擎總裁譚待此前接受采訪時(shí)表示,應(yīng)用生態(tài)的構(gòu)建不是一天兩天就能形成的,反而是一堆人的群體智慧??圩颖仨氁獦?gòu)建低代碼生態(tài),能夠讓很多人用低門檻做更多事情,才能形成AI時(shí)代的創(chuàng)新。
這或許也在暗示,扣子選擇上線模型廣場(chǎng)的原因,是鼓勵(lì)更多大模型進(jìn)行合作,收集真實(shí)的應(yīng)用場(chǎng)景數(shù)據(jù),為優(yōu)化模型提供參考。
正如很多業(yè)內(nèi)人士提到的,AI的價(jià)值應(yīng)該體現(xiàn)在它如何幫助人們解決問(wèn)題、提高效率上,而不僅僅是技術(shù)層面的“最強(qiáng)”。
以上就是關(guān)于【一個(gè)提問(wèn)高下立見(jiàn)?國(guó)產(chǎn)AI大模型沖上扣子廣場(chǎng)PK】的相關(guān)內(nèi)容,希望對(duì)大家有幫助!
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!
- 董明珠曾喊話雷軍給股民分多少錢!格力:擬分紅超55億
- Epic喜+1:動(dòng)作游戲《師父》免費(fèi)領(lǐng) 立省139元
- 雷軍辟謠只招聘35歲以下員工:僅針對(duì)未來(lái)之星項(xiàng)目
- 普華永道發(fā)布2025年AI預(yù)測(cè):AI Agents將勞動(dòng)力提升1倍
- 雷軍回應(yīng)股價(jià)暴跌:年年難過(guò)年年過(guò)
- 一天100座!理想汽車第1700座超充站正式建成
- 《守望先鋒》國(guó)服宣布2月19日回歸:賬號(hào)數(shù)據(jù)完整保留
- 雷軍建議創(chuàng)業(yè)者要多留點(diǎn)錢給員工:別到山窮水盡才講問(wèn)題
- 雷軍新年第一天收到200元紅包 自侃年入百萬(wàn)的開(kāi)始
- 雷軍親自展示REDMI Turbo 4!2025年第一款新機(jī)
- 雷軍:小米未來(lái)10年建至少20座世界頂級(jí)工廠
- 雷軍辟謠只招聘35歲以下員工:只有招聘未來(lái)之星時(shí)才有年齡限制
- 雷軍回應(yīng)100億造車:沒(méi)有好到“封神” 不要神話我
- 雷軍表態(tài):一心做好小米汽車 大家可以在“許愿池”尋找商機(jī)
- 雷軍:中國(guó)汽車產(chǎn)業(yè)應(yīng)少些歪門邪道 不要發(fā)黑稿、背后捅刀子
- 小米SU7選配色都是7000元 為什么璀璨洋紅卻需要9000元
-
奔馳GLE作為豪華SUV市場(chǎng)中的佼佼者,憑借其卓越的性能、豪華的內(nèi)飾以及寬敞的空間,吸引了眾多消費(fèi)者的關(guān)注。...瀏覽全文>>
-
在2025年,安徽阜陽(yáng)地區(qū)的帕薩特新能源汽車市場(chǎng)表現(xiàn)非?;钴S。作為一款備受關(guān)注的新能源車型,帕薩特新能源憑...瀏覽全文>>
-
近日,滁州地區(qū)的大眾汽車經(jīng)銷商傳來(lái)好消息:備受矚目的2025款T-ROC探歌正式上市,并且以極具競(jìng)爭(zhēng)力的價(jià)格吸引...瀏覽全文>>
-
在選擇一款新能源汽車時(shí),了解其價(jià)格和配置是非常重要的一步。安徽淮南地區(qū)的長(zhǎng)安啟源E07作為2024款的新車型,...瀏覽全文>>
-
阜陽(yáng)長(zhǎng)安啟源A05作為長(zhǎng)安汽車旗下的全新車型,自推出以來(lái)便憑借其獨(dú)特的設(shè)計(jì)風(fēng)格和豐富的配置吸引了眾多消費(fèi)者...瀏覽全文>>
-
阜陽(yáng)長(zhǎng)安啟源A07作為一款備受矚目的新能源車型,以其豪華配置和親民的價(jià)格在市場(chǎng)上引起了廣泛關(guān)注。這款車型不...瀏覽全文>>
-
安徽淮南威然2024款價(jià)格及配置詳解隨著汽車市場(chǎng)的不斷更新?lián)Q代,上汽大眾旗下的MPV車型——威然(Viloran)憑...瀏覽全文>>
-
QQ多米新車報(bào)價(jià)2025款,買車省錢秘籍隨著汽車市場(chǎng)的不斷發(fā)展,消費(fèi)者在選購(gòu)車輛時(shí)不僅關(guān)注車型的性能和配置,...瀏覽全文>>
-
滁州途觀X 2024款最新價(jià)格及買車省錢秘籍隨著汽車市場(chǎng)的不斷發(fā)展,大眾途觀X作為一款兼具時(shí)尚與性能的中型SUV...瀏覽全文>>
-
隨著汽車市場(chǎng)的不斷發(fā)展,大眾蔚攬以其優(yōu)雅的設(shè)計(jì)和卓越的性能贏得了眾多消費(fèi)者的青睞。作為一款兼具實(shí)用性和...瀏覽全文>>
- Alienware 在 2025 年 CES 上展示了一些超凡脫俗的技術(shù)
- Wickes 任命首席零售和分銷官
- 分析師稱GTA 6或?qū)?shù)立行業(yè)新標(biāo)準(zhǔn)
- 索尼和本田在拉斯維加斯推出售價(jià) 89,900 美元的 Afeela 1
- 日本 11 月游客人數(shù)創(chuàng)月度新高
- 神經(jīng)認(rèn)知測(cè)試在 3 歲兒童白血病治療期間可行
- 牛津郡小學(xué)支持圣誕毛衣日
- S?strene Grene 投資歐洲物流中心
- 有人已經(jīng)在電視上直播 BNMC 打造的 1967 年福特野馬 Restomod
- 潛在的分子療法可以逆轉(zhuǎn)小鼠的胎盤(pán)發(fā)育問(wèn)題
- 奔馳GLE預(yù)約試駕,新手必看的詳細(xì)流程
- 滁州T-ROC探歌 2025新款價(jià)格,最低售價(jià)15.89萬(wàn)起,趕緊行動(dòng)
- 安徽淮南威然最新價(jià)格2024款,各配置車型售價(jià)全知曉
- 滁州途觀X最新價(jià)格2024款,買車省錢秘籍
- 淮南長(zhǎng)安啟源Q05 2025新款價(jià)格,最低售價(jià)9.69萬(wàn)起,入手正當(dāng)時(shí)
- 安徽淮南探影多少錢 2023款落地價(jià),各配置車型售價(jià)一目了然
- 淮南途觀X價(jià)格大揭秘,買車前必看
- 安徽淮南長(zhǎng)安獵手K50新款價(jià)格2025款多少錢?買車攻略一網(wǎng)打盡
- 滁州ID.4 X新款價(jià)格2025款多少錢?買車攻略一網(wǎng)打盡
- QQ多米落地價(jià),購(gòu)車前必看的費(fèi)用明細(xì)
- Nvidia DLSS 4 有望將游戲性能提高 8 倍
- 人工智能在預(yù)測(cè)自身免疫性疾病進(jìn)展方面顯示出良好的前景
- 心理物理實(shí)驗(yàn)揭示皮膚水分感知是如何改變的
- 科茨沃爾德公司慶祝圣誕節(jié)圓滿成功
- 南法納姆學(xué)校被評(píng)為薩里郡表現(xiàn)最好的小學(xué)
- 約克區(qū)九所小學(xué)將削減招生人數(shù)
- 松下新款電動(dòng)汽車電池為 Lucid Gravity 帶來(lái) 450 英里續(xù)航里程
- 泰國(guó)旅游呈現(xiàn)新趨勢(shì)
- 研究人員找到在細(xì)胞水平上餓死前列腺癌腫瘤的新方法
- 領(lǐng)先的人工智能聊天機(jī)器人在測(cè)試中表現(xiàn)出類似癡呆癥的認(rèn)知能力下降
- 龐大的 Project Zomboid build 42 終于可以玩了
- Steam Replay 回歸向您展示 2024 年您玩得最多的 PC 游戲
- Jollyes 推出強(qiáng)化的人才支持和招聘措施
- Karen Millen 與 Simon Harrison 共同推出全新高級(jí)珠寶系列
- 奇瑞風(fēng)云A8L電動(dòng)轎車刷新續(xù)航里程世界紀(jì)錄
- 虛擬藝術(shù)家將別克 Cascada 帶回 2026 款車型
- OnePlus 宣布推出新計(jì)劃解決綠線問(wèn)題
- OnePlus Watch 3 將擁有更大的電池和更薄的機(jī)身
- 研究人員發(fā)現(xiàn)可變剪接與自身免疫性疾病遺傳之間的細(xì)胞類型特異性聯(lián)系
- 科學(xué)家確定腦細(xì)胞類型是排尿的主要控制者