当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324

4个月前 (03-25)Deepseek最新资讯356

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。


从网友反馈的实测效果来看,V3编码能力已经接近 Claude3.7,数学能力也有提升,能像推理模型一样解题。

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。


其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。

综合/上海证券报、第一财经微信

来源:经济日报


“DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324” 的相关文章

DeepSeek:“边缘革命” 的可能性

DeepSeek:“边缘革命” 的可能性

DeepSeek:“边缘革命” 的可能性复旦《管理视野》·2025年05月07日 10:32连这样优秀的前沿大模型都以开源的方式呈现,那么大学似乎就更应该以“开源”的魄力面对公众和未来专注通用人工智能...

中国电信咸阳分公司助力政务平台成功接入DeepSeek

中国电信咸阳分公司助力政务平台成功接入DeepSeek

2月19日,中国电信咸阳分公司助力“咸企通”平台接入中国电信自有算力适配的DeepSeek大模型,成功打造全省首个基于星辰大模型的AI政策服务的综合性平台。在原有中国电信“星辰大模型”的基础上,“咸企...

DeepSeek,激荡AI行业的“一股清流”

DeepSeek,激荡AI行业的“一股清流”

近期,外媒纷纷将聚光灯投向中国初创企业深度求索公司,其自主研发的人工智能(AI)大语言模型“深度求索”(DeepSeek)凭借“好用、开源、免费”三大特点,在全球范围内引发热烈反响。这一创新成果不仅在...

刘慈欣称 DeepSeek 暂时不太会替代科幻作家

刘慈欣称 DeepSeek 暂时不太会替代科幻作家

IT之家 3 月 30 日消息,DeepSeek 未来有可能替代科幻作家吗?据央视财经昨日报道,科幻作家刘慈欣表示,暂时不太会,但是再过 10 年、20 年,从理论上说完全可能代替科幻小说作家。刘慈欣...

白云机场:目前已在本地部署DeepSeek

白云机场:目前已在本地部署DeepSeek

证券日报网讯 白云机场3月26日在互动平台回答投资者提问时表示,目前已在本地部署DeepSeek,同时组织研究制定DeepSeek应用开发工作推进方案。现阶段主要聚焦在内部管理效率提升,比如知识库建立...

航天宏图:“天权”大模型产品矩阵均已全面接入DeepSeek大模型

航天宏图:“天权”大模型产品矩阵均已全面接入DeepSeek大模型

每经AI快讯,有投资者在投资者互动平台提问:董秘您好!请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepSeek有哪些成本、收益方面的考量?如果公...