当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324

1个月前 (03-25)Deepseek最新资讯144

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。


从网友反馈的实测效果来看,V3编码能力已经接近 Claude3.7,数学能力也有提升,能像推理模型一样解题。

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。


其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。

综合/上海证券报、第一财经微信

来源:经济日报


“DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324” 的相关文章

DeepSeek热度持续升温,相关公司获机构密集调研

DeepSeek热度持续升温,相关公司获机构密集调研

近期,DeepSeek大模型的热度不减,吸引了众多机构的关注。数据显示,截至2月24日,近一个月内约有40家与DeepSeek相关的上市公司获得了机构的调研。其中,宇信科技、首都在线、顺网科技等公司的...

DeepSeek深度落地云南寻甸

DeepSeek深度落地云南寻甸

原标题:DeepSeek深度落地寻甸“政法AI小助手”模块部署完成培训会议。 寻甸融媒体中心供图  今年2月以来,全国多地陆续发布消息,不少政府部门在政务外网、政务系统接入DeepSeek,甚至开展本...

DeepSeek问世,加快联想全栈AI战略落地

DeepSeek问世,加快联想全栈AI战略落地

3月4日,在2025年世界移动通信大会期间,世界互联网大会国际组织在西班牙巴塞罗那举办以“打造融合、普惠、绿色的AI算力新生态”为主题的“AI算力发展”专题论坛。联想集团执行副总裁刘军表示,联想已经形...

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。据了解,MLA(多头潜在注意力机制)正是D...

拥抱新机遇,多家医疗企业接入DeepSeek

拥抱新机遇,多家医疗企业接入DeepSeek

近期,多家医疗企业密集宣布,公司已接入DeepSeek。互联网医疗企业称,DeepSeek可用于AI辅助诊疗、智能医疗服务等场景;医疗体检企业认为,DeepSeek可用于疾病监测、慢病管理等场景;中医...

谷歌CEO评DeepSeek:我认为DeepSeek团队做得非常非常出色

谷歌CEO评DeepSeek:我认为DeepSeek团队做得非常非常出色

据凤凰卫视现场报道,北京时间2月12日,在迪拜举行的第12届世界政府峰会(WGS 2025)上,谷歌CEO桑达尔·皮查伊(Sundar Pichai)与阿联酋人工智能部长奥马尔·苏丹·奥拉马(Omar...