当前位置:首页 > DeepSeek技术交流 > 正文内容

全国高校首个!东南大学继DeepSeek又上线QwQ-32B

7个月前 (03-09)DeepSeek技术交流435

本文转自【新华日报】;

近日

东大基于昇腾国产算力平台

正式接入阿里最新开源模型QwQ-32B

成为全国首个上线QwQ-32B服务的高校

国产算力基座+头部大模型双轨融合

将为教学科研注入更强的AI动能

QwQ-32B:DeepSeek-R1的超强平替

性能比肩顶级模型

QwQ-32B虽仅有32B参数,但通过大规模强化学习训练,在数学推理(AIME24评测)、代码生成(LiveCodeBench)、工具调用(BFCL测试)等任务中表现媲美671B参数的DeepSeek-R1,甚至部分指标实现超越。

上图展示了 QwQ-32B 与其他领先模型在数学推理(AIME24评测)、代码生成(LiveCodeBench)、工具调用(BFCL测试)中的性能对比,QwQ-32B 表现与 DeepSeek-R1 相当,远胜于 o1-mini 及相同尺寸的 R1 蒸馏模型。

低成本、易部署

模型支持消费级显卡本地部署,大幅降低硬件门槛,适配昇腾平台的高效算力资源,助力师生在科研中快速实现AI推理需求。

智能体能力革新

集成工具调用与动态推理能力,模型可根据环境反馈调整策略,适用于复杂任务处理,如数据分析、实验模拟等科研场景。

来源:东南大学微信公众号


“全国高校首个!东南大学继DeepSeek又上线QwQ-32B” 的相关文章

腾讯搭上DeepSeek快车发力C端,字节、阿里、百度还坐得住?

腾讯搭上DeepSeek快车发力C端,字节、阿里、百度还坐得住?

文|萧俊然 编|张弘一出品|商业秀2月15日晚,科技圈又抛出一颗重磅炸弹:微信正在灰度测试接入DeepSeek-R1模型 。不少已经获得测试资格的用户,纷纷晒出体验。16日上午,腾讯方面回应称,确认正...

长虹美菱:公司冰箱、空调产品已接入DeepSeek

长虹美菱:公司冰箱、空调产品已接入DeepSeek

 证券日报网讯 长虹美菱4月9日在互动平台回答投资者提问时表示,公司冰箱、空调产品已接入DeepSeek,公司通过接入DeepSeek赋能公司产品,让消费者感受更好的产品体验。(编辑 王雪儿)...

接入DeepSeek,成都高新区企业这样布局

接入DeepSeek,成都高新区企业这样布局

国产AI公司深度求索发布的大模型DeepSeek火爆全球,在科技领域引发广泛关注。成都高新区多家人工智能相关企业也迅速布局。DeepSeek的横空问世,为人工智能全产业链的市场繁荣带来了新契机。成都高...

DeepSeek梁文锋亲自挂名,公开新注意力架构NSA

DeepSeek梁文锋亲自挂名,公开新注意力架构NSA

机器之心报道机器之心编辑部DeepSeek 新论文来了!相关消息刚刚发布到 𝕏 就吸引了大量用户点赞、转发、评论三连。据介绍,DeepSeek 的这篇新论文提出了一种新的注意力机制 ——NSA。这是一...

科技对话历史! 甘肃简牍博物馆导览AI机器人接入DeepSeek大模型

科技对话历史! 甘肃简牍博物馆导览AI机器人接入DeepSeek大模型

3月28日,记者获悉,甘肃简牍博物馆馆内导览AI机器人“小简”“小牍”正式接入DeepSeek大模型,提升AI机器人在复杂场景中的交互能力。这一创新举措标志着甘肃省文博领域在数字化、智能化方向迈出重要...

新华健康丨《医疗机构部署DeepSeek专家共识》发布

新华健康丨《医疗机构部署DeepSeek专家共识》发布

以DeepSeek为代表的人工智能(AI)技术正在给医疗领域带来前所未有的机遇,尤其是在提升医疗服务品质、优化医疗机构管理流程等方面,展现出巨大的市场潜力。与此同时,医疗行业因其专业性和敏感性,数据涉...