中興通訊32B星云大模型:汲取DeepSeek訓練精髓,開啟“低成本×高性能”AI推理新時代

中興通訊推出的 32B 星云大模型在性能和成本方面都取得了顯著突破,為企業(yè)快速落地 AI 技術(shù)提供了理想選擇。在性能方面,32B 星云大模型在多項權(quán)威基準測試中表現(xiàn)出色,全面領(lǐng)先其他模型。其卓越的推理能力在數(shù)學推理、代碼生成和數(shù)學競賽等方面得到了充分體現(xiàn),樹立了行業(yè)新標桿。在成本方面,32B 星云大模型通過架構(gòu)優(yōu)化與動態(tài)稀疏化技術(shù),大幅降低了 AI 推理的部署成本。與參數(shù)規(guī)模高達 671B 的 DeepSeek-R1 相比,32B 星云大模型的部署成本降低了高達 90%,這使得企業(yè)可以通過單卡部署實現(xiàn)高效的 AI 應(yīng)用,大大降低了入門門檻。中興通訊在追求“高性能 × 低成本”AI 推理模型的道路上,憑借多項核心技術(shù)創(chuàng)新,為 32B 星云大模型注入了澎湃動能。其中,蒸餾+拒絕采樣技術(shù)通過篩選最優(yōu)答案和減少訓練數(shù)據(jù)量,降低了訓練成本,同時提高了數(shù)學和代碼生成的表現(xiàn)。強化學習 Self-Improvement 技術(shù)通過回溯修正、驗證增強、子目標分解和逆向推導等方法論,結(jié)合 LCPO 強化學習,持續(xù)優(yōu)化推理鏈,減少無效回答,提高了 AI 推理的精準度和效率。負載均衡集群+動態(tài)訓練技術(shù)通過高效分布式集群和動態(tài)訓練機制,同時提升了訓練效率與模型能力。三維評估體系則通過“價值觀安全+推理能力+通用智能”三大維度的綜合評估體系,確保了 32B 星云大模型推理輸出的可信性、準確性與多樣性。32B 星云大模型的發(fā)布,標志著中興通訊在 AI 推理模型研發(fā)領(lǐng)域的領(lǐng)先地位。未來,中興通訊將繼續(xù)深化 AI 核心技術(shù)的研發(fā),不斷拓展技術(shù)邊界,將 AI 能力推廣至更多行業(yè)和場景,為企業(yè)和社會帶來更大的價值。


微信掃描分享本文到朋友圈
掃碼關(guān)注5G通信官方公眾號,免費領(lǐng)取以下5G精品資料

本周熱點本月熱點

 

  最熱通信招聘

業(yè)界最新資訊


  最新招聘信息