当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

2个月前 (02-25)Deepseek最新资讯130

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

哈医大一院开辟Deepseek“看病问诊”新场景

哈医大一院开辟Deepseek“看病问诊”新场景

“Deepseek作为当下热点,尤其是在医疗场景下的部署应用,是医疗新质生产力的生动实践。”近日,哈尔滨医科大学附属第一医院深入贯彻落实国家“人工智能+医学”深度融合政策,积极推动人工智能AI技术在医...

DeepSeek发布最新技术论文,梁文锋是共创之一

DeepSeek发布最新技术论文,梁文锋是共创之一

2月18日,DeepSeek官方在海外社交平台X上发布了一篇纯技术论文报告,论文主要内容是关于NSA(Natively Sparse Attention,原生稀疏注意力),官方介绍这是一种用于超快速长...

云米烟灶套装:DeepSeek赋能下的智慧厨房革命

云米烟灶套装:DeepSeek赋能下的智慧厨房革命

在智能家居浪潮中,厨房正成为AI技术落地的重要场景。云米科技凭借DeepSeek大模型的深度赋能,将其AI烟灶套装升级为"会思考的厨房指挥官",通过智能交互、主动安全和场景联动三大...

辰安科技推出DeepSeek+辰思智能体,解锁公共安全行业智慧决策新范式!

辰安科技推出DeepSeek+辰思智能体,解锁公共安全行业智慧决策新范式!

当DeepSeek遇上行业智能体会碰撞出怎样的火花?辰安科技大模型团队拥抱DeepSeek从“单点工具”迈向“复杂推理”重塑公共安全智能化日前,基于DeepSeek基座模型的辰思第三代智能体正式落地标...

DeepSeek崛起:人工智能如何重塑品牌营销的未来

DeepSeek崛起:人工智能如何重塑品牌营销的未来

随着数字化、智能化时代的深入发展,品牌营销不再仅仅依赖传统的广告投放或简单的营促销手段。如今,品牌必须采用更加精细化、个性化和互动化的策略,才能满足消费者日益多元化、快速变化的需求。与此同时,人工智能...

DeepSeek精准赋能 山大二院探索创建AI医院

DeepSeek精准赋能 山大二院探索创建AI医院

DeepSeek自2024年12月开源以来,凭借“高性能+低成本+开源生态”三重优势,迅速成为全球AI领域热点。近日,山东大学第二医院完成DeepSeek大模型的本地化部署,与自主研发的“智慧体”应用...