中邮·人工智能周观点:DeepSeek V3.1提振国产算力和应用
8月21日,深度求索正式发布并开源DeepSeek-V3.1,采用混合推理架构,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,且上下文均已扩展为128K。从性能来看:1)编程:V3.1在Aider编程基准测试中取得71.6%高分deepseek,“霸榜”开源模型、超越Claude Opus 4,同时推理和响应速度更快;2)SVGBench:实力仅次于GPT-4.1-mini,远超前代DeepSeek R1;3)MMLU:在多任务语言理解方面,V3.1的表现毫不逊色于GPT-5,得分达到88.5%。
1)更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。
2)思考效率更高效:相同性能下输出token减少,降低推理成本。根据深度求索团队测试结果,经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。同时,V3.1在非思考模式下的输出长度也得到了有效控制,相比于DeepSeek-V3-0324,能够在输出长度明显减少的情况下保持相同的模型性能。
3)持续保持API价格优势,单次编程任务仅需1.01美元,为专有系统的1/60。V3.1输入价格为0.5元/百万tokens (缓存命中) ,4元/百万tokens (缓存未命中) ;输出价格为12元/百万tokens。
1)UE8M0 FP8精度格式具备更小带宽、更低功耗和更高吞吐的优势。根据算力豹,UE8M0采用无符号、8位指数、0位尾数的设计,在相同硬件下可降低显存需求高达75%;更适合微缩放场景,减少量化误差;更低的内存和计算需求意味着数据中心的运营成本下降。
2)下一代国产芯片积极沿用FP8精度,有望形成国产芯片生态圈,提高算力利用率。根据通信世界,寒武纪最新一代MLU370-S4、思元590与690系列均已支持FP8计算;海光、沐曦、中昊芯英、摩尔线程等厂商均有芯片支持FP8;此外,华为昇腾虽在当前版本(910B/910C)尚未开放FP8,但路线图已明确“2025Q4原生FP8”。
3)我们认为,UE8M0 FP8参数精度的发布,代表着国产AI正走向软硬协同阶段,能够实质性减少对英伟达、AMD等国外算力的依赖,更加凸显国产芯片在AI大时代的竞争力。
1)国产算力:寒武纪、云天励飞、亿都(国际控股)、浪潮信息、曙光数创、超讯通信、华丰科技、神州数码、软通动力、烽火通信、广电运通、拓维信息、四川长虹;
2)AI Agent:鼎捷数智、泛微网络、致远互联、金蝶国际、用友网络、汉得信息、赛意信息、迈富时、光云科技、税友股份、润达医疗、同花顺、恒生电子、金山办公、万兴科技、福昕软件、科大讯飞、金桥信息、卓易信息、普元软件等。原文出处:中邮·人工智能周观点:DeepSeek V3.1提振国产算力和应用,感谢原作者,侵权必删!