当前位置:首页 > Deepseek最新资讯 > 正文内容

最新的DeepSeek更新了 有网友对新版R1模型进行了测试

2个月前 (05-29)Deepseek最新资讯302

5月28日,DeepSeek在官方交流群中公布,DeepSeek R1模型已完成小版本试升级。用户可在官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。DeepSeek在开源社区Hugging Face也开源了新版R1模型(R1-0528)。

有网友对新版R1模型进行了测试,并表示Deepseek-R1-0528在竞赛级编程的难度基准LiveCodeBench中的表现几乎与OpenAI的o3模型相当。

社交网络和信息网站City-data.com创始人Lech Mazur在社交媒体上表示,Deepseek-R1-0528在Extended NYT Connections基准测试中比原先的DeepSeek R1有了显著改进,分数从38.6上升到49.8。在Thematic Generation基准测试中,Deepseek-R1-0528也优于DeepSeek R1,分数从1.80变为1.74,该分数越低越好。Thematic Generation基准测试衡量各种大模型如何有效地从一小组正例和反例中推断出一个细分或特定的“主题”(类别/规则),然后在一组具有误导性的候选项中检测出哪一项真正符合该主题。

DeepSeek今年春节期间大火。3月份,DeepSeek V3模型完成小版本升级。新版V3模型借鉴DeepSeek R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。在中文写作任务方面,新版V3模型基于R1的写作水平进行优化,同时提升中长篇文本创作的内容质量。


“最新的DeepSeek更新了 有网友对新版R1模型进行了测试” 的相关文章

盛视科技:已完成DeepSeek大模型的接入

盛视科技:已完成DeepSeek大模型的接入

金融界4月10日消息,有投资者在互动平台向盛视科技提问:请问公司是否考虑接入deepseek系统或者与其公司进行合作?公司回答表示:公司已完成 DeepSeek 大模型的接入。公司接入DeepSeek...

华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

金磊 发自 凹非寺量子位 | 公众号 QbitAI要问最近哪个模型最火,混合专家模型(MoE,Mixture of Experts)绝对是榜上提名的那一个。它的巧妙之处,就在于把不同的任务分配给擅长处...

DeepSeek帮英特尔找到了退路

DeepSeek帮英特尔找到了退路

文源 | 源 Sight作者 | 柯基最近,全球半导体行业风云突变。3 月 18 日,英特尔官网一纸公告,如同平地惊雷,炸响全球科技界。陈立武,这位名字稍显陌生的投资教父级人物,正式接任英特尔第九任...

新版DeepSeek-V3接入每经大模型平台!小编亲测:敲代码、写报告、撰长文样样在行

新版DeepSeek-V3接入每经大模型平台!小编亲测:敲代码、写报告、撰长文样样在行

3月24日,DeepSeek悄悄上线了新版V3开源大模型——DeepSeek-V3-0324。专业AI模型评测机构Artificial Analysis最新排名显示,新版DeepSeek-V3在基准测...

时隔3个月再访北京 曝黄仁勋会见DeepSeek创始人梁文锋

时隔3个月再访北京 曝黄仁勋会见DeepSeek创始人梁文锋

快科技4月18日消息,日前,应中国贸促会邀请,英伟达CEO黄仁勋抵达北京,中国贸促会会长任鸿斌与黄仁勋举行会谈。这是黄仁勋时隔3个月再次到访北京,行程备受外界关注。据媒体报道,黄仁勋在北京还见了中国生...

DeepSeek新版本又“偷偷”变强了!苹果CEO库克此前回应:好极了

DeepSeek新版本又“偷偷”变强了!苹果CEO库克此前回应:好极了

3月24日深夜,中国人工智能初创公司深度求索(DeepSeek)低调上线了DeepSeek-V3的新版本DeepSeek-V3-0324,参数量为6850亿,在代码、数学、推理等多个方面的能力再次显著...