一個(gè)提問(wèn)高下立見(jiàn)？國(guó)產(chǎn)AI大模型沖上扣子廣場(chǎng)PK

2024-06-14 15:30:06 來(lái)源：用戶：

相信很多大家對(duì)一個(gè)提問(wèn)高下立見(jiàn)？國(guó)產(chǎn)AI大模型沖上扣子廣場(chǎng)PK還不知道吧，今天菲菲就帶你們一起去了解一下~.~！

以“國(guó)產(chǎn)GPTs”出名的扣子，做出了GPT沒(méi)有的功能。

6月12日，字節(jié)跳動(dòng)旗下的AI應(yīng)用開(kāi)發(fā)平臺(tái)“扣子”（Coze國(guó)內(nèi)版）悄悄上線了新功能“模型廣場(chǎng)”。

扣子是AI應(yīng)用開(kāi)發(fā)平臺(tái)，無(wú)論用戶是否有編程基礎(chǔ)，都可以在扣子上快速搭建基于大模型的各種聊天機(jī)器人（AI Bot），并一鍵發(fā)布到飛書(shū)、微信等各個(gè)社交平臺(tái)。

而新上線的模型廣場(chǎng)，可以讓兩個(gè)大語(yǔ)言模型實(shí)時(shí)PK，一決勝負(fù)，幫助用戶挑選出最適合自己的大語(yǔ)言模型。

據(jù)了解，扣子目前已經(jīng)接入了包括豆包、通義千問(wèn)、MiniMax、Moonshot、百川智能、智譜等多個(gè)國(guó)內(nèi)大語(yǔ)言模型。換言之，這是國(guó)內(nèi)多家知名大模型廠商與字節(jié)的強(qiáng)強(qiáng)聯(lián)動(dòng)。

哪款大模型最適合自己的AI應(yīng)用?創(chuàng)作者們?cè)诖蛟霢I Bot時(shí)該選哪個(gè)模型?自定義主題Bot的魅力在哪?“頭號(hào)AI玩家”第一時(shí)間上手進(jìn)行了一番實(shí)測(cè)。

超低門檻搭建Bot，讓大模型匿名PK

國(guó)內(nèi)大模型到底哪家更厲害，遇到問(wèn)題時(shí)該選擇哪個(gè)AI解決，扣子模型廣場(chǎng)提供的就是快速測(cè)試的方法。

具體來(lái)說(shuō)，模型廣場(chǎng)采用了指定Bot對(duì)戰(zhàn)、隨機(jī)Bot對(duì)戰(zhàn)以及純模型對(duì)戰(zhàn)模式，任一模式下，系統(tǒng)都會(huì)先匹配兩款匿名大模型，隨后用戶進(jìn)行提問(wèn)，模型實(shí)時(shí)生成答案進(jìn)行PK。

根據(jù)模型的回答質(zhì)量，我們可以投票選出表現(xiàn)較好的模型，孰強(qiáng)孰弱一目了然。

任意模型完成回答后，用戶可以參與投票

先從最基礎(chǔ)的模型能力評(píng)測(cè)入手，如果我需要搭建一個(gè)“友好語(yǔ)氣轉(zhuǎn)換器（陰陽(yáng)版）”，哪個(gè)大語(yǔ)言模型的回復(fù)既禮貌但不冒犯?

現(xiàn)在直接讓模型“打一架”，就可以評(píng)估大模型在面對(duì)細(xì)分需求時(shí)的表現(xiàn)差異。

我們?cè)诳圩幽Ｐ蛷V場(chǎng)點(diǎn)擊“純模型對(duì)戰(zhàn)”，進(jìn)入對(duì)決頁(yè)面，兩款匿名模型已經(jīng)在后臺(tái)準(zhǔn)備就緒了。

隨后，我輸入了需要?jiǎng)?chuàng)建的AI Bot角色設(shè)定，并一鍵發(fā)送給兩個(gè)身份未知的大語(yǔ)言模型，內(nèi)容如下:

兩款匿名大模型實(shí)時(shí)響應(yīng)提問(wèn)，其中，最先給出回答的大模型B只花了4.9秒。

任意一個(gè)模型回答完后，就可以基于內(nèi)容質(zhì)量、回復(fù)時(shí)間等要素，來(lái)判斷哪個(gè)模型表現(xiàn)更好。

實(shí)際測(cè)試中，綜合響應(yīng)時(shí)長(zhǎng)以及內(nèi)容“陰陽(yáng)怪氣”的程度，我把這一票投給了大模型A。投票完成后，模型廣場(chǎng)會(huì)顯示剛才參與競(jìng)賽的兩位模型選手，比如被我選中獲勝的模型A實(shí)際上是豆包。點(diǎn)擊展開(kāi)，還能獲得更多模型參數(shù)。

投票完成頁(yè)面

當(dāng)然，也可以選擇重開(kāi)一輪。比如由于我還想了解其他模型會(huì)如何“陰陽(yáng)怪氣”，就點(diǎn)了“重開(kāi)一輪”，很快，系統(tǒng)重新匹配了兩個(gè)新模型進(jìn)行對(duì)戰(zhàn)。

通過(guò)多輪評(píng)估對(duì)比，我們發(fā)現(xiàn)在“友好語(yǔ)氣轉(zhuǎn)換器”這一機(jī)器人創(chuàng)建需求中，豆包和Moonshot給出的結(jié)果不相上下，豆包回答簡(jiǎn)單毒舌，Moonshot配合表情之后，把“暗諷”拿捏到位。

那么，考慮到我希望聊天機(jī)器人在對(duì)話時(shí)帶上emoji，所以會(huì)更青睞活潑一點(diǎn)的Moonshot。

需要說(shuō)明的是，這里的投票完全是依據(jù)個(gè)人主觀喜好，所以與其說(shuō)哪家模型更強(qiáng)，不如說(shuō)哪家更適合。

目前，市面上也有較權(quán)威的評(píng)測(cè)，像LMSYS的模型競(jìng)技場(chǎng)，也是讓全球用戶可以自由評(píng)測(cè)大模型的能力，選出優(yōu)勝模型?？圩拥哪Ｐ蛷V場(chǎng)也有相同的功能。

對(duì)于開(kāi)發(fā)者來(lái)說(shuō)，如何選擇更優(yōu)的底層模型打造AI Bot是十分值得關(guān)心的問(wèn)題。畢竟在大模型行業(yè)，基礎(chǔ)模型的能力幾乎決定著AI Bot能多大程度發(fā)揮作用。

但很多人在創(chuàng)建AI Bot時(shí)，其實(shí)無(wú)法看懂復(fù)雜的榜單數(shù)據(jù)，甚至不夸張地說(shuō)，國(guó)產(chǎn)AI大模型各個(gè)當(dāng)過(guò)第一?，F(xiàn)在，“純模型”之間可以進(jìn)行對(duì)戰(zhàn)，以文本生成的硬實(shí)力PK，這樣的優(yōu)勢(shì)在于方便小白用戶自行選擇模型。

除此之外，也可以在模型競(jìng)技場(chǎng)中選擇感興趣的Bot開(kāi)啟模型對(duì)戰(zhàn)。和GPTs商店類似，入圍模型廣場(chǎng)的AI Bot是官方精選推薦的。

比如，我選擇了“奇遇旅行家”Bot來(lái)制定一個(gè)出行計(jì)劃，同樣能將“我要從上海出發(fā)到阿勒泰，請(qǐng)幫我找到便宜的機(jī)票，并制定一份出行規(guī)劃”這個(gè)問(wèn)題，一鍵發(fā)給兩個(gè)模型。

不到15秒的時(shí)間，匿名模型先后給出了兩個(gè)完全不同的方案，對(duì)于出行需要Plan B的我來(lái)說(shuō)，的確大大縮短了規(guī)劃時(shí)間。

換言之，對(duì)于普通用戶而言，同一個(gè)問(wèn)題可以同時(shí)投喂給兩個(gè)大語(yǔ)言模型，短時(shí)間內(nèi)可以獲得更多回復(fù)，一定程度上可以提高獲取信息的效率。此外，也可以在一個(gè)平臺(tái)掌握各大模型的最新能力，扣子實(shí)現(xiàn)了模型Bot的聚合。

驗(yàn)證模型再疊技能，AI還能怎么玩

需要說(shuō)明的是，模型廣場(chǎng)評(píng)估的只是大模型本身在文本生成等方面的能力，不受編排、工作流等配置的影響和限制。

所以，如果想要打造出一個(gè)能力出眾的Bot，還需要進(jìn)一步給AI附加一些額外能力。

比如，讓Genmoji Bot調(diào)用表情包插件，或是創(chuàng)作完整的工作流，和大語(yǔ)言模型結(jié)合完成更多復(fù)雜功能。

在扣子Bot商店，有不少網(wǎng)友通過(guò)AI Bot實(shí)現(xiàn)自己的創(chuàng)意。AI最大的魅力，大概就在于你壓根沒(méi)想到這些東西能這么用。

6月12日，扣子還和Intel聯(lián)合推出了“Coze AI Factory”主題Bot征集活動(dòng)，包括圖文創(chuàng)作、實(shí)用工具、互動(dòng)創(chuàng)意等不同賽道。

https://www.coze.cn/docs/guides/coze_ai_factory

網(wǎng)友們靠調(diào)用插件、增加工作流，調(diào)教了形形色色的角色，整了不少花活，比如“單人劇本殺”“本命粽子”“Emoji翻譯器”等等。

這些有意思的Bot也會(huì)吸引更多開(kāi)發(fā)者上手一試，從中尋找創(chuàng)建靈感。

比如可以在Bot商店選擇感興趣的Bot，查看相應(yīng)的提示詞，甚至在個(gè)人空間里復(fù)刻一個(gè)相似的，替換成更心儀的大語(yǔ)言模型。

我們體驗(yàn)下來(lái)也發(fā)現(xiàn)，如此一來(lái)，零基礎(chǔ)就可以開(kāi)發(fā)一款契合自己的AI Bot。借助模型廣場(chǎng)，還能在創(chuàng)建AI Bot時(shí)選擇更偏好的大模型。這樣一來(lái)，人人都可以靈活地配置生成不同的Bot，還能低成本實(shí)現(xiàn)突如其來(lái)的創(chuàng)意。

字節(jié)AI新王牌，想做大模型風(fēng)向標(biāo)?

隨著大模型技術(shù)不斷發(fā)展，國(guó)內(nèi)大廠幾乎都瞄準(zhǔn)了構(gòu)建AI原生應(yīng)用平臺(tái)，類GPTs的產(chǎn)品遠(yuǎn)不止扣子。此前百度上線了文心一言智能體平臺(tái)，阿里云布局推出百煉大模型平臺(tái)。前不久，騰訊一站式智能體制作平臺(tái)“元器”也公開(kāi)灰度測(cè)試。

不少觀點(diǎn)認(rèn)為，具有專業(yè)能力的智能體，能夠撬動(dòng)大模型商業(yè)化。但如何在其中脫穎而出，做出差異化競(jìng)爭(zhēng)是大模型廠商們共同面對(duì)的問(wèn)題。

目前看來(lái)，挖掘大模型技術(shù)上的潛力，匯聚開(kāi)發(fā)者甚至非開(kāi)發(fā)者，扣子靠模型競(jìng)技場(chǎng)已經(jīng)邁出了第一步。

模型競(jìng)技場(chǎng)，意味著字節(jié)聯(lián)動(dòng)阿里、百川智能和月之暗面等，讓用戶能夠快速基于多種大模型創(chuàng)建應(yīng)用。扣子的底層也不再局限于自研的豆包大模型，逐漸走向開(kāi)放，吸引更多開(kāi)發(fā)者。

圖片來(lái)源:扣子微信公眾平臺(tái)

對(duì)于大廠來(lái)說(shuō)，開(kāi)發(fā)者生態(tài)就像是“蓄水池”，繁榮的生態(tài)和穩(wěn)固的底層技術(shù)向來(lái)相輔相成，規(guī)?；拈_(kāi)發(fā)者聚合效應(yīng)能進(jìn)一步提升大模型能力。

繼此前推出9個(gè)豆包大模型全家桶，打響大模型價(jià)格戰(zhàn)后，字節(jié)正在圍繞AI尋找應(yīng)用落地場(chǎng)景，以觸達(dá)更多用戶。

以扣子、豆包等為基礎(chǔ)，字節(jié)似乎正嘗試搭建起一個(gè)能夠吸引開(kāi)發(fā)者與用戶、覆蓋各領(lǐng)域的AI應(yīng)用生態(tài)，進(jìn)一步對(duì)B端業(yè)務(wù)發(fā)起攻勢(shì)。

火山引擎總裁譚待此前接受采訪時(shí)表示，應(yīng)用生態(tài)的構(gòu)建不是一天兩天就能形成的，反而是一堆人的群體智慧?？圩颖仨氁獦?gòu)建低代碼生態(tài)，能夠讓很多人用低門檻做更多事情，才能形成AI時(shí)代的創(chuàng)新。

這或許也在暗示，扣子選擇上線模型廣場(chǎng)的原因，是鼓勵(lì)更多大模型進(jìn)行合作，收集真實(shí)的應(yīng)用場(chǎng)景數(shù)據(jù)，為優(yōu)化模型提供參考。

正如很多業(yè)內(nèi)人士提到的，AI的價(jià)值應(yīng)該體現(xiàn)在它如何幫助人們解決問(wèn)題、提高效率上，而不僅僅是技術(shù)層面的“最強(qiáng)”。

以上就是關(guān)于【一個(gè)提問(wèn)高下立見(jiàn)？國(guó)產(chǎn)AI大模型沖上扣子廣場(chǎng)PK】的相關(guān)內(nèi)容，希望對(duì)大家有幫助！

標(biāo)簽：一個(gè)提問(wèn)高下立見(jiàn)？國(guó)產(chǎn)AI大模型沖上扣子廣場(chǎng)PK

　　免責(zé)聲明：本文由用戶上傳，與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考，并不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。如有侵權(quán)請(qǐng)聯(lián)系刪除！

相關(guān)閱讀

最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

一個(gè)提問(wèn)高下立見(jiàn)？國(guó)產(chǎn)AI大模型沖上扣子廣場(chǎng)PK

一個(gè)提問(wèn)高下立見(jiàn)？國(guó)產(chǎn)AI大模型沖上扣子廣場(chǎng)PK