【環(huán)球網(wǎng)科技綜合報(bào)道】近日,浪潮“源1.0”大模型登頂中文語(yǔ)言能力理解和生成評(píng)測(cè)基準(zhǔn)CUGE總榜榜首,并獲得語(yǔ)言理解(篇章級(jí))、語(yǔ)言生成、對(duì)話(huà)交互、多語(yǔ)言、數(shù)學(xué)推理等5項(xiàng)評(píng)測(cè)最佳成績(jī)。這是繼源1.0攬獲權(quán)威中文語(yǔ)言評(píng)測(cè)基準(zhǔn)CLUE榜單的零樣本學(xué)習(xí)和小樣本學(xué)習(xí)兩類(lèi)總榜冠軍后,再次在評(píng)測(cè)中展現(xiàn)強(qiáng)大實(shí)力。
據(jù)悉,CUGE(Chinese Language Understanding and Generation Evaluation)智源指數(shù)是由清華大學(xué)、北京大學(xué)、北京智源研究院等高校機(jī)構(gòu)共同建立的中文機(jī)器語(yǔ)言能力評(píng)測(cè)基準(zhǔn),該基準(zhǔn)針對(duì)當(dāng)前自然語(yǔ)言處理和人工智能發(fā)展新范式,面向具有“通用語(yǔ)言能力”的預(yù)訓(xùn)練模型,全面系統(tǒng)、多層次、多維度地評(píng)測(cè)大模型能力。
在語(yǔ)言理解(篇章級(jí))評(píng)測(cè)中,源1.0僅用時(shí)11分鐘,便完成數(shù)千篇閱讀理解回答4000多個(gè)問(wèn)題,以86.9高分的成績(jī)位居榜首,展現(xiàn)出頂尖的語(yǔ)言理解能力。在語(yǔ)言生成評(píng)測(cè)中,源1.0僅用時(shí)70秒,就完成近800條摘要內(nèi)容的生成,登頂該項(xiàng)榜單。在多語(yǔ)言機(jī)器翻譯評(píng)測(cè)中,基于源1.0大模型蒸餾出來(lái)的翻譯模型在完成近4000千對(duì)中英文互譯后,登頂榜首,領(lǐng)先第二名15%。在對(duì)話(huà)交互評(píng)測(cè)中,基于源1.0大模型蒸餾出來(lái)的對(duì)話(huà)模型回答了電影、音樂(lè)、旅行3個(gè)領(lǐng)域共近萬(wàn)個(gè)主題對(duì)話(huà),成績(jī)位居榜首,領(lǐng)先第二名成績(jī)30%,展現(xiàn)了極強(qiáng)的智能對(duì)話(huà)能力。
當(dāng)前,智能對(duì)話(huà)普遍存在內(nèi)容乏味、主題不連貫等問(wèn)題,往往幾輪對(duì)話(huà)后,回答便空洞重復(fù),大大降低用戶(hù)體驗(yàn)。知識(shí)驅(qū)動(dòng)的對(duì)話(huà)模型直接連接到廣泛的知識(shí)庫(kù),大大增加對(duì)話(huà)內(nèi)容的豐富度,在一定知識(shí)背景下也不會(huì)偏題,更趨向于人類(lèi)之間的交談。不久前,源開(kāi)發(fā)者社區(qū)的一位開(kāi)發(fā)者基于源的對(duì)話(huà)模型創(chuàng)建了一位能與人類(lèi)玩劇本殺的AI虛擬玩家,一位人類(lèi)玩家與AI虛擬玩家聊天到深夜凌晨仍興趣盎然。以知識(shí)驅(qū)動(dòng)的對(duì)話(huà)模型,可廣泛應(yīng)用于各類(lèi)虛擬人、智能助手、智能客服等場(chǎng)景,并極大提升對(duì)話(huà)的智能水平和用戶(hù)體驗(yàn)。
目前,浪潮“源1.0”已經(jīng)將模型API、高質(zhì)量數(shù)據(jù)集、模型訓(xùn)練代碼、推理代碼和應(yīng)用代碼等等工具和能力開(kāi)源開(kāi)放,超過(guò)300家行業(yè)用戶(hù)和開(kāi)發(fā)者,通過(guò)“源1.0”提供的數(shù)據(jù)和API顯著提升了金融、互聯(lián)網(wǎng)、醫(yī)療和自動(dòng)駕駛等行業(yè)應(yīng)用的精度。浪潮源1.0將持續(xù)助力行業(yè)用戶(hù)和開(kāi)發(fā)者,攜手推動(dòng)技術(shù)創(chuàng)新、場(chǎng)景融合、應(yīng)用開(kāi)發(fā),共同促進(jìn)大模型的健康發(fā)展與產(chǎn)業(yè)落地,加速AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化發(fā)展。
免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買(mǎi)賣(mài)依據(jù)。