当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

5个月前 (02-24)Deepseek最新资讯258

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

天翼云加载DeepSeek应用助力区域智能升级

天翼云加载DeepSeek应用助力区域智能升级

DeepSeek作为国内AI大模型领域的重要参与者,通过技术创新和算法优化,推动了AI技术的快速发展。目前,中国电信云南公司在天翼云产品线完成DeepSeek的部署接入,为行业提供性能卓越、安全可控的...

周鸿祎谈“DeepSeek开源启示录”-《中国网信》2025年第3期

周鸿祎谈“DeepSeek开源启示录”-《中国网信》2025年第3期

DeepSeek持续火爆出圈,在算力、投入有限的情况下,实现了大模型强化学习技术范式的重大突破,跻身全球大模型的第一梯队。难能可贵的是,DeepSeek通过开源的方式促进了技术交流与创新协作,让大模型...

中旅国际与华为云合作接入DeepSeek满血版

中旅国际与华为云合作接入DeepSeek满血版

2月25日消息,中旅国际与华为云合作接入DeepSeek满血版大模型,打造面向文旅行业的领域大模型,推动文旅智能场景创新。据悉,华为昇腾AI云服务将在其中提供AI算力支持,将DeepSeek部署至客户...

持续看好!华尔街预测DeepSeek将推动A股“牛市”

持续看好!华尔街预测DeepSeek将推动A股“牛市”

中新网2月12日电(宫宏宇)DeepSeek对中国市场的利好还在持续。华尔街最新分析看好DeepSeek推动的发展势头,全球投资者正在重新评估中国的可投资性。据彭博社12日消息,摩根士丹利、摩根大通和...

DeepSeek大模型技术落地江汉区 AI赋能智慧政务

DeepSeek大模型技术落地江汉区 AI赋能智慧政务

荆楚网(湖北日报网)讯(通讯员 王硕)在数字经济与实体经济深度融合的今天,人工智能正深刻重塑政务服务模式。今年以来,武汉市江汉区率先引入DeepSeek大模型技术,在重大项目监管、民生需求匹配、政策资...

中国创新药的“DeepSeek”时刻已经到来

中国创新药的“DeepSeek”时刻已经到来

 全国政协委员、中国医学科学院肿瘤医院主任医师赵宏在全国两会首场“委员通道”上介绍,“一款名不见经传的中国抗癌药击败了全球最畅销的抗癌药。”这款药物,正是出自广东药企康方生物,其研发的PD-1/VEG...