1月10日,中國電信星辰語義大模型TeleChat-7B版本宣布開源,并開放1T高質(zhì)量清洗數(shù)據(jù)集。星辰語義大模型已與昇騰AI基礎軟硬件完成適配,并開源了適配后的代碼。此外,中國電信還將在1月20日開源12B版本模型,擁抱更多開發(fā)者共建開源大模型生態(tài)。
星辰語義大模型是由中電信人工智能科技有限公司研發(fā)訓練的大語言模型,采用1.5萬億 Tokens中英文高質(zhì)量語料進行訓練。星辰語義大模型在業(yè)界首次提出緩解多輪幻覺的解決方案,通過關鍵信息注意力增強、知識圖譜強化、多輪知識強化、知識溯源能力四大技術,將AI大模型的幻覺率降低了40%,這有助于大模型變得更有“人味”,真正理解問題語境,告別風馬牛不相及的答案。
目前,星辰語義大模型正在與千行百業(yè)的信息化解決方案進行融合,滿足多樣場景需求。在中國電信內(nèi)部,星辰語義大模型賦能行文寫作、代碼編程、網(wǎng)絡故障分析以及經(jīng)營分析等場景,以行文寫作為例,其平均生成字數(shù)超過1500字,有效采納率達到85.7%;在對外企事業(yè)單位客戶的業(yè)務中,星辰語義大模型賦能企業(yè)經(jīng)營分析、政務公開咨詢、民生訴求接待等場景,其業(yè)務覆蓋率達到95%,多輪理解準確率達到90%。
早在2023年11月,中國電信就在2023數(shù)字科技生態(tài)大會上發(fā)布了千億參數(shù)“星辰語義大模型”,并公布了后續(xù)的開源開放的時間表。本次TeleChat-7B版本開源了對話模型TeleChat-7B-bot,以及其huggingface格式的權重文件。此外,還開源了7B模型的int8和int4量化版本。
在模型開發(fā)上,星辰語義大模型已與昇騰AI基礎軟硬件完成適配:支持Atlas 300I pro推理卡,具備int8量化能力,精度與性能表現(xiàn)均與業(yè)界第一梯隊持平;支持Atlas訓練服務器,用戶可使用昇思MindSpore和PyTorch框架進行模型訓練和推理,兩個框架下模型精度與性能均有不俗表現(xiàn)。
除了星辰語義大模型,目前已有50+業(yè)界主流大模型基于昇騰訓練迭代,9家伙伴攜手昇騰發(fā)布了大模型訓推一體機,昇騰以開放易用的平臺使能千模百態(tài),為大模型創(chuàng)新注入動能。
本次星辰語義大模型TeleChat-7B版本開源,夯實了中國電信構建開放生態(tài)的重要一環(huán),降低了大模型開發(fā)門檻,未來,中國電信將進一步攜手昇騰AI等合作伙伴推動中國大模型在千行百業(yè)落地,加速人工智能產(chǎn)業(yè)發(fā)展。
可訪問開源倉了解詳情:
Gitee地址:
https://gitee.com/Tele-AI/tele-chat
Github地址:
https://github.com/Tele-AI/Telechat