当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

7个月前 (02-24)Deepseek最新资讯369

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

同程旅行宣布接入DeepSeek,成为首家接入DeepSeek大模型的OTA平台

同程旅行宣布接入DeepSeek,成为首家接入DeepSeek大模型的OTA平台

2月28日,同程旅行宣布同程程心大模型将全面接入DeepSeek,成为首家接入DeepSeek大模型的OTA平台。据悉,同程程心是同程旅行自主研发的旅游行业专属模型,未来将与DeepSeek深度协同,...

工信部谈DeepSeek等大模型“出圈”:我国人工智能产业基础不断夯实

工信部谈DeepSeek等大模型“出圈”:我国人工智能产业基础不断夯实

封面新闻记者 代睿4月18日,国新办举行经济数据例行新闻发布会,介绍2025年一季度工业和信息化发展情况。工业和信息化部总工程师谢少锋在谈到以DeepSeek为代表的国产大模型火爆“出圈”现象时表示,...

「e公司观察」超级应用接连联姻DeepSeek “技术共同体式”互联互通或成新趋向

「e公司观察」超级应用接连联姻DeepSeek “技术共同体式”互联互通或成新趋向

腾讯和百度两大超级应用,接连在各自的基本盘业务中接入DeepSeek的AI技术,这对于我们观察中国互联网的演进趋势提供了重要窗口。从公司层面来看,两家巨头都有自研大模型,引入第三方开源模型意味着它们都...

青岛AI企业积极“接入”DeepSeek 提升自家行业模型能力

青岛AI企业积极“接入”DeepSeek 提升自家行业模型能力

原标题:青岛AI企业如何高效拥抱DeepSeek青岛日报/观海新闻记者 孙 欣 周晓峰 杨 光美国当地时间2月17日晚间,马斯克旗下人工智能公司xAI发布了最新人工智能模型Grok 3。在这场直播发布...

DeepSeek的成功对勘察设计行业的启示

DeepSeek的成功对勘察设计行业的启示

2025年DeepSeek的横空出世加速了勘察设计行业的技术革新,以DeepSeek为代表的人工智能技术正推动勘察设计行业从依赖个人经验转向数据驱动。DeepSeek的成功得益于五个关键因素:创新思维...

沈阳市注评行业党委举办DeepSeek专题培训班,以科技赋能行业提质增效

沈阳市注评行业党委举办DeepSeek专题培训班,以科技赋能行业提质增效

为提升注册会计师和资产评估行业从业人员专业能力与新技术应用水平,促进DeepSeek技术在注评行业内的普及与应用,沈阳市注评行业党委分阶段、分主题开展沈阳市注评行业DeepSeek专题培训班,通过前沿...