当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周第三日 发布高性能通用矩阵乘法库

7个月前 (02-26)Deepseek最新资讯414

新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。

据了解,通用矩阵乘法是许多高性能计算任务的核心,所以其性能优化也是大模型降本增效的重点。

DeepSeek表示,DeepGEMM在Hopper GPU(一种英伟达GPU架构)上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算),并且像教程一样简洁,可完全即时编译,其核心逻辑只有约300行代码,且在大多数矩阵尺寸上均优于专家调优的内核,并支持密集布局和两种MoE布局。


标签: DeepSeek

“DeepSeek开源周第三日 发布高性能通用矩阵乘法库” 的相关文章

运营商全面接入DeepSeek意味着什么?

运营商全面接入DeepSeek意味着什么?

《科创板日报》2月12日讯 近日,三大运营商宣布全面接入DeepSeek,给市场带来了一波不小的冲击。中国电信率先成为国内首家实现DeepSeek模型全栈国产化推理服务落地的运营商级云平台;...

DeepSeek最高日赚346万元?官方称理论收益并非实际

DeepSeek最高日赚346万元?官方称理论收益并非实际

3月1日,DeepSeek在开源周最后一天抛出的"暴利"数据引发热议——V3/R1推理系统理论日利润高达346万元人民币(47.5万美元)。在这组看似惊人的数字背后,是一场关于AI...

电信运营商接入DeepSeek影响几何?

电信运营商接入DeepSeek影响几何?

中新网北京2月28日电 (记者 刘育英)中国三家电信运营商已全面接入DeepSeek,给运营商充分利用自身算力,加快赋能千行百业数智化转型,改善自身业绩带来机遇。至2月初,中国电信旗下天翼云“息壤”已...

幸福廊坊智慧城市平台正式接入DeepSeek

幸福廊坊智慧城市平台正式接入DeepSeek

河北日报客户端讯(刘英、刘杰、卢晔)2月20日,幸福廊坊App上线基于DeepSeek大模型的智能AI助手服务,可为用户提供免费顺畅的智能问答服务,有效提升便民惠企水平。同时,廊坊市市级政务云同步接入...

百万年薪!DeepSeek带火这个岗

百万年薪!DeepSeek带火这个岗

2025年春节,中国人工智能大模型DeepSeek在全球引发轰动。DeepSeek的崛起也让相关领域的人才在这个春招季炙手可热。有企业开出百万年薪!据南方日报报道,在2月的深圳市南山区新春大型招聘活动...

躺平拿证、含金量拉满?“工信部认证DeepSeek证书”是真的吗?

躺平拿证、含金量拉满?“工信部认证DeepSeek证书”是真的吗?

本文转自【法治网】;“课程永久有效且学习灵活,学完可获得工信部认证证书!”近日,河南郑州的张先生,在被某培训机构销售人员的话术打动后,支付了6480元报考学习deepseek课程、AI课程等。该培训机...