当前位置:首页 > Deepseek应用场景 > 正文内容

比肩 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1

2周前 (04-11)Deepseek应用场景71

近日,硅基流动创始人袁进辉在华为云生态大会上宣布,硅基流动联合华为云基于 CloudMatrix 384超节点昇腾云服务和高性能推理框架 SiliconLLM,用大规模专家并行最佳实践正式上线 DeepSeek-R1。

该服务在保证单用户 20 TPS水平前提下,单卡 Decode吞吐突破 1920 Tokens/s,可比肩 H100 部署性能。同时,经过主流测试集验证及大规模线上盲测,在昇腾算力部署 DeepSeek-R1的模型精度与 DeepSeek官方保持一致。


其中,通过架构的全面创新,基于新型高速总线架构的 CloudMatrix超节点集群在总算力、互联带宽、内存带宽上领先业界。

此前,硅基流动在大模型云服务平台 SiliconCloud首发推出了基于昇腾云的稳定生产级 DeepSeek-V3 & R1 推理服务,并支持模型私有化集群部署,这次合作推动基于国产算力的 DeepSeek-R1推理服务持续升级。


DeepSeek风暴席卷全球,特别是以其高效、低成本的 MoE架构为应对大模型推理挑战打开了局面。不过,如果没有强大的 AI Infra 技术能力,要想部署好 DeepSeek并非易事。

DeepSeek使用了大规模专家并行(Expert Parallelism,大 EP并行)的 MoE模型架构,若采用单机部署方案,最终的性能远不如 DeepSeek官方公布的部署方案,且至少有数倍成本差距。更具挑战的是,虽然 DeepSeek公开了大 EP 并行方案,但技术难度较大,业内还没有其他团队快速复现这一部署方法。

针对这些难题,硅基流动与华为云联合攻关实现了技术突破。我们在 CloudMatrix 384超节点昇腾云服务上部署 DeepSeek-R1 时采纳了大规模专家并行方案,通过多专家负载均衡和极致通信优化,实现高吞吐及更高性能,大幅提升了用户体验。同时,我们使用昇腾高性能算子库,以及硅基流动推理加速框架 SiliconLLM在模型、机制、算子上的协同优化,实现在国产算力上,不损失模型精度的情况下,获得 DeepSeek-R1 推理效率与资源利用率的显著提升。

硅基流动与华为云的合作不仅提供坚实的全国产软硬件体系部署方案,让 DeepSeek推理服务更经济高效,也展现了 AI 生态合作的强大能量。硅基流动将继续加深与华为云的联合创新,共同提升产品体验,加速模型在更多场景落地。


“比肩 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1” 的相关文章

DeepSeek红利耗尽后,元宝拿什么和豆包斗?

DeepSeek红利耗尽后,元宝拿什么和豆包斗?

原创 赵晋杰 字母榜短短60天内,中国AI原生应用下载排行榜的位次排名,就三易其主。最新情况是,截至4月15日中午,中国区苹果应用商店免费APP下载排行榜上,豆包再次超越DeepSeek,位列第二,紧...

deepseek目前帮到你的行业了吗?

deepseek目前帮到你的行业了吗?

帮到了,帮孩子分析数学题,教孩子怎么写作文,让孩子感觉写作文就是在做选择题写评论豪言片语北京 10小时前我之前是做开发的。公司强制要求所有开发人员必须装AI辅助编程的插件,确实可以提高一部分效率,我觉...

DeepSeek官方企业咨询账号在用户群中回应称,“辟谣:R2发布为假消息”

DeepSeek官方企业咨询账号在用户群中回应称,“辟谣:R2发布为假消息”

【消息称DeepSeek-R2或下周发布 官方暂无回应】财联社3月11日电,有消息称,DeepSeek下一代AI模型DeepSeek-R2或提前于下周一(3月17日)正式发布。截至目前,DeepSee...

崆峒山景区正式接入DeepSeek大模型

崆峒山景区正式接入DeepSeek大模型

近日,平凉崆峒山景区正式上线了智游崆峒AI小助手,将崆峒山智慧旅游服务平台成功接入深度求索(DeepSeek)大模型,通过AI技术深度挖掘崆峒山的道源文化底蕴,为游客打造更智能、更沉浸的文旅新体验。智...

不开玩笑,DeepSeek让成人玩具率先受益

不开玩笑,DeepSeek让成人玩具率先受益

 出品 | 妙投APP 作者 | 董必政 头图 | AI制图 Deepseek已经席卷全球。在此之前,代表硬件端侧的AI消费电子,仍是不温不火。 De...

DeepSeek在山东港口日照港落地应用

DeepSeek在山东港口日照港落地应用

在DeepSeek赋能千行百业的浪潮中,港口如何抓住机遇,培育和发展新质生产力?日前,山东港口日照港在私有化部署国产开源大模型DeepSeek R1基础上,上线日照港流动设备智慧运维平台,首次实现De...