当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

7个月前 (02-24)Deepseek最新资讯362

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

在 DeepSeek 中,怎么处理查询结果为空的情况?

在 DeepSeek 中,怎么处理查询结果为空的情况?

在 DeepSeek 中,怎么处理查询结果为空的情况?在deepseek中处理查询结果为空的情况,可以尝试以下几种方法:检查输入关键词:确保你的关键词选择准确无误。尝试使用不同的关键词组合或更具体的关...

deepseek入局搜索混战

deepseek入局搜索混战

DeepSeek应用以史上最快速度达成3000万日活。据调研机构QuestMobile,1月28日,DeepSeek日活跃用户数首次超越豆包,随后在2月1日突破3000万大关。目前DeepSeek、字...

记者观察|DeepSeek和DeepFake:一字之差折射出什么?

记者观察|DeepSeek和DeepFake:一字之差折射出什么?

“以前识别假新闻看三要素:错别字、夸张标题、模糊图片。现在?连亲妈发来的生日祝福视频都可能是AI(人工智能)造的!”网络安全博主“代码侠”在直播间举起两瓶矿泉水,左边贴着“DeepSeek出品”标签,...

搭载国内首个Deep Research功能,元知平台让用户零门槛免费用满血DeepSeek

搭载国内首个Deep Research功能,元知平台让用户零门槛免费用满血DeepSeek

未来式智能今天推出元知:让满血DeepSeek R1触手可及未来式智能作为国内领先的AI智能体构建平台,始终致力于通过前沿的AI技术,为10亿知识工作者提升10倍生产力为愿景。今天,未来式智能推出元知...

Deepseek微信小程序入口使用教程-deepseek的微信入口在哪里?微信如何才能使用免费的 Deepseek小程序?

Deepseek微信小程序入口使用教程-deepseek的微信入口在哪里?微信如何才能使用免费的 Deepseek小程序?

太多的朋友在后台问deepseek的微信入口在哪里?微信如何才能使用免费的 Deepseek小程序?虽然deepseek有网页版(https://chat.deepseek.com),但毕竟访问没有微...

百度、微信接入DeepSeek

百度、微信接入DeepSeek

中国互联网行业再迎标志性技术事件。2月16日晚,百度搜索和文心智能体平台宣布将全面接入DeepSeek。搜索用户可免费使用DeepSeek和文心大模型深度搜索功能,文心智能体平台的开发者也将随时调用D...