当前位置:首页 > Deepseek最新资讯 > 正文内容

刚刚,DeepSeek发布更新

  DeepSeek更新日志显示,deepseek-chat和deepseek-reasoner都已经升级为DeepSeek-V3.1-Terminus。此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,主要包括以下方面:一是语言一致性,缓解了中英文混杂deepseek、偶发异常字符等情况;二是Agent能力,进一步优化了Code Agent与Search Agent的表现。

  今年年初,开源大模型DeepSeek曾掀起“开源潮”,引爆AI行业。作为一款开源模型,DeepSeek-R1在数学、代码、自然语言推理等任务上的性能能够与国际头部模型比肩。

  9月17日,DeepSeek-R1推理模型研究论文登上最新一期的Nature封面,引起广泛关注。该论文由DeepSeek团队共同完成,梁文锋担任通讯作者。该文章揭示了开源人工智能模型DeepSeek-R1所采用的大规模推理模型训练方法。开发团队称,该模型使用了强化学习而非人类示例来开发推理步骤,减少了训练成本和复杂性。

  在模型迭代方面,8月21日,DeepSeek宣布发布DeepSeek-V3.1。据介绍,DeepSeek-V3.1的升级包含以下主要变化。一是实现混合推理架构,一个模型同时支持思考模式与非思考模式;二是更高的思考效率;三是更强的Agent能力,新模型在工具使用与智能体任务中的表现有较大提升。

  其中,智能体支持能力方面,DeepSeek聚焦热门发展方向对编程智能体、搜索智能体展开测评,测试结果显示,DeepSeek-V3.1相较此前模型均有提升。在编程智能体方面,在代码修复测评SWE-bench(最具代表性的代码修复评测基准之一)等复杂任务测试中,DeepSeek-V3.1相比之前的DeepSeek系列模型有明显提高。在搜索智能体方面,DeepSeek-V3.1在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试与多学科专家级难题测试上,DeepSeek-V3.1性能已大幅领先DeepSeek-R1-0528。

  同时,DeepSeek宣布,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。其中,UE8M0 FP8是针对即将发布的下一代国产芯片设计。当日,DeepSeek概念板块火热。不少国产芯片产业链企业股价大涨。

  华安证券研报称,DeepSeek V3.1发布后即带动国产算力产业链标的大幅上涨。未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。DeepSeek V3.1在AI Agent能力端显著提升,未来将继续推动AI Agent商业化场景应用。原文出处:刚刚,DeepSeek发布更新,感谢原作者,侵权必删!

标签: deepseek

“刚刚,DeepSeek发布更新” 的相关文章

DeepSeek母公司腐败案曝光,涉案金额高达1.18亿元

DeepSeek母公司腐败案曝光,涉案金额高达1.18亿元

  近日,私募机构幻方量化员工卷入一场时间跨度长达六年,涉案金额高达1.18亿元的金融反腐案件,多位涉案人员已经移交司法机关。   幻方量化是量化私募领域的头部公司。今年...

阿联酋推出低成本AI模型K2 Think,挑战OpenAI与DeepSeek

阿联酋推出低成本AI模型K2 Think,挑战OpenAI与DeepSeek

  一场新的技术竞赛正在上演——阿联酋正式加入人工智能竞赛阵营。阿布扎比穆罕默德·本·扎耶德人工智能大学(MBZUAI)6月25日发布了一款低成本推理模型,旨在与DeepSeek和Open...

“人工智能+ ”,硅基流动在行动

“人工智能+ ”,硅基流动在行动

  8月26日,国务院发布了《关于深入实施“人工智能+”行动的意见》(以下简称《意见》),《意见》清晰具体地描述了到 2027 年、2030 年、2035 年的目标,行动是通向这些激动人心...

DeepSeek V3.1再更新:缓解中英文混杂,智能体输出更稳定

DeepSeek V3.1再更新:缓解中英文混杂,智能体输出更稳定

  9月22日晚间,据DeepSeek介绍,此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,包括:语言一致性:缓解中英文混杂、偶发异常字符等情况。在Agent(智能体)能...

当“政务+AI”遇上DeepSeek

当“政务+AI”遇上DeepSeek

  在数字化浪潮席卷全球的今天,人工智能正以前所未有的速度重塑各行各业的发展格局。今年3月,上海联通携手自贸区临港新片区企业服务中心,依托国内领先的深度求索(DeepSeek)大语言模型,...

DeepSeek一句话,沪指重回3800

DeepSeek一句话,沪指重回3800

  8月21日,深度求索(DeepSeek)公司在官方微信公众号发文,发布DeepSeek-V3.1模型。官方账号在置顶评论表示:“UE8M0 FP8是针对即将发布的下一代国产芯片设计。”...