中國電信發(fā)布全球首個單體稠密萬億參數(shù)語義模型Tele-FLM-1T

中國電信人工智能研究院(TeleAI)和智源研究院聯(lián)合發(fā)布全球首個單體稠密萬億參數(shù)語義模型 Tele-FLM-1T,該模型與百億級的 52B 版本,千億級的 102B 版本共同構(gòu)成 Tele-FLM 系列模型。

TeleAI 和智源研究院基于模型生長和損失預(yù)測等技術(shù),Tele-FLM 系列模型僅使用了業(yè)界普通訓(xùn)練方案 9% 的算力資源,基于 112 臺 A800 服務(wù)器,用 4 個月完成 3 個模型總計 2.3T tokens 的訓(xùn)練。模型訓(xùn)練全程做到了零調(diào)整零重試,算力能效高且模型收斂性和穩(wěn)定性好,Tele-FLM-1T 版本即將開源。

目前,TeleFLM 系列模型已經(jīng)全面開源了 52B 版本,核心技術(shù) (生長技術(shù)、最優(yōu)超參預(yù)測)、訓(xùn)練細節(jié) (loss 曲線、最優(yōu)超參、數(shù)據(jù)配比和 Grad Norm 等) 均開源,開源模型下載量過萬,積累超 40 萬用戶。

此外,中國電信在某市民生訴求場景項目上,通過引入 TeleChat-52B 模型能力,整體應(yīng)用效果提升 40%,達到行業(yè)領(lǐng)先水平。

附 Tele-FLM-52B 版本開源地址:https://huggingface.co/CofeAI/Tele-FLM

Tele-FLM-Chat 試用 (純模型單輪對話版) 地址:https://modelscope.cn/studios/FLM/ChatFLM

window.articleid=1265784;
微信掃描分享本文到朋友圈
掃碼關(guān)注5G通信官方公眾號,免費領(lǐng)取以下5G精品資料
  • 1、回復(fù)“YD5GAI”免費領(lǐng)取《中國移動:5G網(wǎng)絡(luò)AI應(yīng)用典型場景技術(shù)解決方案白皮書
  • 2、回復(fù)“5G6G”免費領(lǐng)取《5G_6G毫米波測試技術(shù)白皮書-2022_03-21
  • 3、回復(fù)“YD6G”免費領(lǐng)取《中國移動:6G至簡無線接入網(wǎng)白皮書
  • 4、回復(fù)“LTBPS”免費領(lǐng)取《《中國聯(lián)通5G終端白皮書》
  • 5、回復(fù)“ZGDX”免費領(lǐng)取《中國電信5GNTN技術(shù)白皮書
  • 6、回復(fù)“TXSB”免費領(lǐng)取《通信設(shè)備安裝工程施工工藝圖解
  • 7、回復(fù)“YDSL”免費領(lǐng)取《中國移動算力并網(wǎng)白皮書
  • 8、回復(fù)“5GX3”免費領(lǐng)取《R1623501-g605G的系統(tǒng)架構(gòu)1
  • 本周熱點本月熱點

     

      最熱通信招聘

      最新招聘信息