当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

5个月前 (02-25)Deepseek最新资讯301

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。

“DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库” 的相关文章

升级版DeepSeek-V3模型开源!DeepSeek上可试用体验

升级版DeepSeek-V3模型开源!DeepSeek上可试用体验

【TechWeb】3月25日消息,DeepSeek在开源平台上线了升级后的DeepSeek-V3模型。新模型的版本号为DeepSeek-V3-0324,模型参数为6850亿,其早期版本参数为6710亿...

彬州市教育局开展Deepseek与教学融合创新专题培训

彬州市教育局开展Deepseek与教学融合创新专题培训

为贯彻落实教育部《教育数字化转型战略行动》部署要求,推动AI与教育教学的深度融合,全面提升我市教师数字素养,3月14日,彬州市教育局联合中国电信集团彬州市分公司在城关第二小学举办了“Deepseek与...

当红炸子鸡DeepSeek,为何花心思自研存储?

当红炸子鸡DeepSeek,为何花心思自研存储?

国产大模型DeepSeek横空出世,新的技术突破正快速转化为行业价值。近日,宇视科技正式推出DeepSeek一体机系列,以“开箱即用、私有化部署、应用赋能”等特性,无缝衔接用户需求,让智能应用真正“用...

一份DeepSeek概念股一览表,涵盖了多个行业和领域的上市公司

一份DeepSeek概念股一览表,涵盖了多个行业和领域的上市公司

以下是一份DeepSeek概念股一览表,涵盖了多个行业和领域的上市公司:行业/领域 股票代码 公司名称电子元件 300657 弘信电子通信设备 688080 映翰通半导体 688620 安凯微6880...

DeepSeek 入选2025 十大年度 IP

DeepSeek 入选2025 十大年度 IP

DeepSeek 入选2025 十大年度 IPIT之家 5 月 12 日消息,由中国版权协会、中国文化娱乐行业协会等单位指导,新浪财经、微博等单位联合主办的 2025 世界 IP 经济发展大会暨全球...

微信接入DeepSeek后,谁赢麻了

微信接入DeepSeek后,谁赢麻了

在未来,普通人体验满血版DeepSeek最简单的方式,可能就是打开微信。2月15日,有网友发现微信接入了DeepSeek-R1模型。2月16日,媒体记者在向腾讯集团求证后,证明了上述消息的真实性。有人...