当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek V3升级版发布:编程数学能力接近Claude 3.7

3个月前 (03-25)DeepSeek技术交流243

DeepSeek于24日夜间发布V3模型小版本升级,新版本DeepSeek-V3-0324在模型参数上达到685B,并采用MIT许可证,为用户带来全新体验。该版本重点提升了数学和编程能力,性能接近Claude 3.7 Sonnet,且对用户免费开放使用。

模型架构全面升级

DeepSeek-V3作为专家混合巨头模型,原始参数为671B,每个Token可激活370亿个参数。新版本DeepSeek-V3-0324的模型参数提升至685B,采用多头潜在注意力和DeepSeek MoE技术支持。知识截止日期从2023年12月延长至2024年7月,优化了Function call功能,解决了此前版本的函数调用问题。

编程能力显著提升

在前端编程领域,DeepSeek V3-0324展现出惊人实力。测试显示,其能在3分钟内完成750行电商网站代码,包含动态产品卡片悬停效果和手机端响应式布局等功能。自2024年6月以来,业界普遍认为仅Claude 3.5能够生成优质前端代码,而此次DeepSeek的升级版本终于为Anthropic带来了强劲竞争对手。在数学能力方面,V3-0324也表现出色,成功解答了此前大模型普遍解答错误的数学题目。

开源协议引领行业变革

DeepSeek V3-0324采用MIT许可证,允许用户出于任何目的使用、修改和分发模型,包括商业用途。这一决策获得业内广泛关注,Perplexity CEO阿拉文德认为,DeepSeek的开源策略具有革命性意义。该模型不仅能在AWS和Azure上以极低成本部署,仅需支付服务器费用,还为创业企业提供了可负担的AI解决方案。这种开源模式可能影响未来AI巨头的融资格局,推动行业向更开放、更透明的方向发展。

本文源自:金融界


“DeepSeek V3升级版发布:编程数学能力接近Claude 3.7” 的相关文章

中国电信助力宁德企业打造DeepSeek智能公文系统

中国电信助力宁德企业打造DeepSeek智能公文系统

数字化浪潮席卷千行百业,中国电信宁德分公司与福建省烟草公司宁德市公司紧密携手,从智慧大屏到智慧指挥中心,不断拓展企业数字化转型的深度与广度。近日,中国电信携手DeepSeek为宁德烟草注入全新动力,以...

鑫元基金已完成DeepSeek私有化部署

鑫元基金已完成DeepSeek私有化部署

国内领先的自主可控大模型DeepSeek横空出世,其开源生态吸引了众多开发者和企业的参与,通过在多行业的广泛应用,形成了丰富的应用场景和解决方案。公募基金行业也未缺席,不少基金公司已在尝试部署这一大模...

宝马多款新车将应用DeepSeek功能

宝马多款新车将应用DeepSeek功能

4月27日记者从宝马集团获悉,今年三季度,多款搭载第九代BMW操作系统的中国在售新车,将率先应用DeepSeek功能。明年起面世的宝马国产新世代车型亦将“上车”DeepSeek,实现AI与智能座舱的深...

DeepSeek接入上海医院发生了什么?建立知识库还将升级人文服务

DeepSeek接入上海医院发生了什么?建立知识库还将升级人文服务

大热的DeepSeek人工智能大模型,接入医院将会迸发出怎样的创新火花?记者了解到,迄今全国有近10家医疗机构已接入大模型,在上海,复旦大学附属中山医院、上海第四人民医院、和睦家医疗等已于近日接入De...

DeepSeek+腾讯双重龙头!“强得可怕”,连创历史新高!

DeepSeek+腾讯双重龙头!“强得可怕”,连创历史新高!

云计算利好频出。2月18日,A股主要指数集体调整。截至收盘,沪指跌0.93%,深证成指跌1.61%,两大科创指数跌幅均在2%左右水平。沪深两市成交额接近1.8万亿元,较昨日缩量逾千亿。行业板块呈现普跌...

东方中科:子公司智慧政务业务已接入DeepSeek大模型

东方中科:子公司智慧政务业务已接入DeepSeek大模型

金融界3月27日消息,有投资者在互动平台向东方中科提问:请问公司是否有智慧政务业务?这块业务是否已经接入deepseek。公司回答表示:公司子公司万里红定位于中国数字安全与数智应用的技术赋能者和综合服...