2025年3月6日,阿里云团队正式发布并开源了全新推理模型“通义千问QwQ-32B”。值得注意的是,在模型发布后的短短2小时内,摩尔线程就完成了对该模型的支持,实现了Day0级支持。 摩尔线程官方表示,此次支持基于大语言模型高速推理框架vLLM以及MT Transformer推理引擎,部署的QwQ-32B在实际运行中展现出了卓越的推理性能与稳定性,充分印证了MUSA架构和全功能GPU在生态兼容与快速支持方面的显著优势。 夸娥工场体验地址:https://playground.mthreads.com QwQ-32B体验地址:https://playground.mthreads.com:12019 通义千问QwQ-32B是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1模型媲美,尽管参数量仅为后者的约1/20,但表现十分亮眼,展现了高效能与低资源占用的优势。 |
原创栏目
IT百科
网友评论
聚超值•精选