國產GPU力挺!摩爾線程宣布支持阿里Qwen3全系模型

日前,阿里巴巴發(fā)布并開源新一代通義千問模型 Qwen3,參數(shù)量僅為 DeepSeek-R1 的 1/3,成本大幅下降,性能則全面超越 DeepSeek-R1、OpenAI-o1 等全球頂尖模型,登頂全球最強開源模型。

Qwen3 發(fā)布當天,摩爾線程宣布,其率先完成了 Qwen3 全系列模型在全功能 GPU 上的高效支持。摩爾線程表示,這一成果充分驗證了 MUSA 架構和全功能 GPU 的技術成熟度與可靠性。

目前,主流推理引擎均可基于摩爾線程 MUSA 平臺運行 Qwen3 系列模型。摩爾線程稱,MUSA 平臺能夠作為 vLLM、Ollama、GPU Stack 等各類主流開源推理引擎的后端,為 Qwen3 系列模型的高效運行提供強大動力。

例如,QWen3-235B-A22B(Qwen3 系列最大參數(shù)量模型),基于 vLLM-MUSA 引擎在摩爾線程全功能 GPU 上穩(wěn)定運行。

據了解,此次開源的兩款 MoE 模型是 Qwen3-235B-A22B 和 Qwen3-30B-A3B;同時還包括六個 Dense 模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。


微信掃描分享本文到朋友圈
掃碼關注5G通信官方公眾號,免費領取以下5G精品資料

本周熱點本月熱點

 

  最熱通信招聘

  最新招聘信息