当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

4个月前 (02-25)Deepseek最新资讯215

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。

“DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库” 的相关文章

DeepSeek“引燃”金融圈!券商、基金经理发声

DeepSeek“引燃”金融圈!券商、基金经理发声

记者获悉,近日,民生证券研究院内部下发通知,宣布将全面深化人工智能平台DeepSeek在研究业务中的融合应用,加速构建智能化研究体系。此外,国联民生将于2月27日至28日举办首届资本市场论坛,论坛聚焦...

医生自嘲“天塌了”!病人查DeepSeek后质疑治疗方案,关键还说对了!AI看病靠谱吗?

医生自嘲“天塌了”!病人查DeepSeek后质疑治疗方案,关键还说对了!AI看病靠谱吗?

本文转自【新民晚报】;“天都塌了!病人DeepSeek后质疑我的治疗方案,气得我自己又查了一遍指南,才发现指南更新了……”2月22日,广东一位医学博主“孤芳自赏”的网帖引起网友热议。截至23日14时,...

山东移动DeepSeek政务场景共创沙龙成功举办

山东移动DeepSeek政务场景共创沙龙成功举办

齐鲁网·闪电新闻3月7日讯 3月7日,山东移动与华为联合举办DeepSeek政务场景共创沙龙。本次交流会以“政通智合数聚泉城 共创政务AI新场景”为主题,邀请16地市大数据局相关专家、数百名政务领域资...

DeepSeek助你复试,复试秒杀!

DeepSeek助你复试,复试秒杀!

想必大家都开始准备复试了吧!今天来教大家如何深入的利用DeepSeek拿捏复试,给大家准备好指令,速来领取!一、生成系统复试学习计划向DeepSeek提供你的基础信息,如目标院校、专业、当前学习进度、...

鸿合科技(002955.SZ):目前平台已接入DeepSeek开源大模型,并且应用在高职教产品和AI课堂分析

鸿合科技(002955.SZ):目前平台已接入DeepSeek开源大模型,并且应用在高职教产品和AI课堂分析

格隆汇4月9日丨鸿合科技(002955.SZ)在投资者互动平台表示,公司自主研发AI应用开放平台,并积极推动AI技术在教育场景的应用。目前平台已接入DeepSeek开源大模型,并且应用在高职教产品和A...

深圳一公司抢注54个DEEPSEEK系列商标 国家知识产权局:坚决驳回!

深圳一公司抢注54个DEEPSEEK系列商标 国家知识产权局:坚决驳回!

2月24日,国家知识产权局发布通告,依法驳回抢注“DEEPSEEK”等相关商标注册申请。国家知识产权局通告中表示,近期,杭州深度求索人工智能基础技术研究有限公司研发的DeepSeek人工智能大模型在全...