当前位置:首页 > Deepseek应用场景 > 正文内容

英伟达宣布创造满血 DeepSeek 推理世界记录

6个月前 (03-19)Deepseek应用场景368

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲ 运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。


“英伟达宣布创造满血 DeepSeek 推理世界记录” 的相关文章

AI名家讲堂开讲!人工智能三次飞跃与DeepSeek技术深度解读

AI名家讲堂开讲!人工智能三次飞跃与DeepSeek技术深度解读

近日,中国航天科技集团有限公司四院精心组织开展人工智能与数字思维名家讲堂。讲堂特邀中国大数据应用联盟人工智能专家委员会主任以“人工智能三次飞跃与DeepSeek”为主题,用通俗易懂的语言拆解复杂的机器...

德州市公路巡查中心举行DeepSeek培训交流会

德州市公路巡查中心举行DeepSeek培训交流会

为紧跟科技发展最新趋势,提升干部职工对人工智能技术的理解与应用能力,助力工作提效能,3月3日,德州市公路巡查中心特邀中国电信人工智能领域专家团队,举办“DeepSeek应用与赋能业务”专题讲座。授课专...

接入DeepSeek架构 崂山区率先布局AI智能眼镜赛道

接入DeepSeek架构 崂山区率先布局AI智能眼镜赛道

原标题:接入DeepSeek架构 变身“超级大脑”日前,雷神AI智能眼镜发布,成为崂山区企业在AI眼镜产业链布局竞速赛中迈出的重要一步,也是崂山“玩家”加速驶入AI眼镜赛道的一个缩影。在数字经济与虚拟...

科研加速器:用DeepSeek一天精读80篇文献的30个实用指令

科研加速器:用DeepSeek一天精读80篇文献的30个实用指令

在科研与学习中,快速高效地阅读和理解大量文献是至关重要的能力。借助DeepSeeK这一强大的AI助手,我们可以将文献阅读效率提升至全新水平。以下是30个精心设计的指令,助您充分利用DeepSeeK高效...

接入DeepSeek及豆包大模型 瑞幸咖啡首个AI智能体(1.0版)上线

接入DeepSeek及豆包大模型 瑞幸咖啡首个AI智能体(1.0版)上线

随着AI应用热潮卷向现制饮品行业,消费体验正在加速重构。5月26日,瑞幸咖啡在官方APP和微信小程序正式上线首个AI智能体(1.0版),实现在线“动动嘴就能点咖啡”,为消费者带来更加便捷,且独具个性化...

四川一公安机关接入DeepSeek 守护辖区平安

四川一公安机关接入DeepSeek 守护辖区平安

四川新闻网-首屏新闻记者 谢川霞国产AI黑马DeepSeek,火爆全网,一时间风头正劲,成为热议的焦点。成都高新公安利用这把“大火”,积极探索新型警务模式,淬炼出一名新成员:技术警员DeepSeek!...