百川智能發(fā)布超千億大模型Baichuan3,中文評(píng)測(cè)超GPT-4

飛象網(wǎng)訊 1月29日午間消息,百川智能宣布發(fā)布超千億參數(shù)的大語言模型Baichuan 3。在 CMMLU、GAOKAO 和 AGI-Eval 等評(píng)測(cè)中,Baichuan 3 號(hào)稱在中文任務(wù)上超越了 GPT-4。

據(jù)介紹,百川智能在 Baichuan 3 訓(xùn)練過程中提出了“動(dòng)態(tài)數(shù)據(jù)選擇”、“重要度保持”以及“異步 CheckPoint 存儲(chǔ)”等多種技術(shù)手段及方案,穩(wěn)定訓(xùn)練時(shí)間達(dá)到一個(gè)月以上,故障恢復(fù)時(shí)間不超過 10 分鐘。

百川智能官方表示,Baichuan 3 還突破“迭代式強(qiáng)化學(xué)習(xí)”技術(shù),進(jìn)一步提升了語義理解和生成能力,在詩詞創(chuàng)作的格式、韻律、表意等方面進(jìn)行了提升,對(duì)于宋詞這種格式多變,結(jié)構(gòu)深細(xì)、韻律豐富的高難度文體,生成的內(nèi)容亦能工整對(duì)仗、韻腳和諧,讓每個(gè)人都能創(chuàng)作出詠物、寄思的五言律詩、七言絕句,寫下的言志、抒情的“沁園春”、“定風(fēng)波”。

據(jù)介紹,面向醫(yī)療行業(yè),百川智能在模型預(yù)訓(xùn)練階段構(gòu)建了超過千億Token的醫(yī)療數(shù)據(jù)集,該數(shù)據(jù)集涵蓋了從理論到實(shí)際操作,從基礎(chǔ)理論到臨床應(yīng)用等各個(gè)方面的醫(yī)學(xué)知識(shí),確保了模型在醫(yī)療領(lǐng)域的專業(yè)度和知識(shí)深度。在對(duì)邏輯推理能力及專業(yè)性要求極高的MCMLE、MedExam等權(quán)威醫(yī)療評(píng)測(cè)上的中文效果同樣超過了GPT-4。


微信掃描分享本文到朋友圈
掃碼關(guān)注5G通信官方公眾號(hào),免費(fèi)領(lǐng)取以下5G精品資料
  • 1、回復(fù)“YD5GAI”免費(fèi)領(lǐng)取《中國移動(dòng):5G網(wǎng)絡(luò)AI應(yīng)用典型場(chǎng)景技術(shù)解決方案白皮書
  • 2、回復(fù)“5G6G”免費(fèi)領(lǐng)取《5G_6G毫米波測(cè)試技術(shù)白皮書-2022_03-21
  • 3、回復(fù)“YD6G”免費(fèi)領(lǐng)取《中國移動(dòng):6G至簡(jiǎn)無線接入網(wǎng)白皮書
  • 4、回復(fù)“LTBPS”免費(fèi)領(lǐng)取《《中國聯(lián)通5G終端白皮書》
  • 5、回復(fù)“ZGDX”免費(fèi)領(lǐng)取《中國電信5GNTN技術(shù)白皮書
  • 6、回復(fù)“TXSB”免費(fèi)領(lǐng)取《通信設(shè)備安裝工程施工工藝圖解
  • 7、回復(fù)“YDSL”免費(fèi)領(lǐng)取《中國移動(dòng)算力并網(wǎng)白皮書
  • 8、回復(fù)“5GX3”免費(fèi)領(lǐng)取《R1623501-g605G的系統(tǒng)架構(gòu)1
  • 本周熱點(diǎn)本月熱點(diǎn)

     

      最熱通信招聘

      最新招聘信息