当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek V3.1升级,优化语言一致性等能力

  继此前在今年8月DeepSeek线上大模型升级至V3.1,上下文长度从原有的64k拓展至128k后,日前DeepSeek方面宣布,DeepSeek-V3.1已更新至DeepSeek-V3.1-Terminus版本。据悉,此次更新已同步覆盖官方App、网页端、小程序,以及API。

  据了解,DeepSeek-V3.1-Terminus在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,包括改善语言一致性,缓解中英文混杂、偶发异常字符等情况,以及提升Agent能力,进一步优化Code Agent与Search Agent等表现。

  目前,DeepSeek-V3.1-Terminus提供了“思考模型”与“非思考模型”两种模式,均支持高达128K的上下文长度,能够处理更复杂的长文本任务,满足专业场景下的多轮对话与文档分析需求。

  在定价方面,该模型输入费用根据缓存命中情况区分,若请求内容命中缓存,每百万tokens为0.5 元,未命中缓存则为4元,输出则统一为每百万tokens 12元。

  但需要注意的是,由于是以Terminus(终极版)为名deepseek,因此有观点认为“这或许这也是DeepSeek-V3.1最后一次更新”。截止目前,DeepSeek方面尚未对此进行回应。

  此外值得一提的是,不久前有消息称,DeepSeek方面或正在开发一款具备更先进AI智能体(Agent )功能的大模型,意在与OpenAI等竞争对手在技术新前沿展开竞争。据称,DeepSeek正在开发的这一模型可根据用户给出的简单指令,自动完成多步骤任务,并具备从以往操作中学习、自我改进的能力。

  相关消息源还透露,该项目是由DeepSeek创始人梁文峰亲自带队,目标是今年最后一个季度正式发布相关新产品。原文出处:DeepSeek V3.1升级,优化语言一致性等能力,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek V3.1升级,优化语言一致性等能力” 的相关文章

[流言板]曝iPhone 17 Pro要涨价:或将突破1000美元大关

[流言板]曝iPhone 17 Pro要涨价:或将突破1000美元大关

  虎扑07月31日讯 据媒体报道,当地时间7月30日,美国总统特朗普发文称,自8月1日起,美国将对来自印度的商品征收25%的关税。   分析师称,若25%的关税生效,苹...

真是烦死人了-英超-曼城专区-虎扑社区

真是烦死人了-英超-曼城专区-虎扑社区

  这东西明显就是故意求骂来满足自己畸形的心理的,如果版主不能将它封印,那么建议各位城迷默契的无视即可,这种东西越骂它越来劲   这东西明显就是故意求骂来满足自己畸形的心...

刚刚,DeepSeek-R1论文登上Nature封面,通讯作者梁文锋

刚刚,DeepSeek-R1论文登上Nature封面,通讯作者梁文锋

  如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种『推理』与人类处理更复杂问题的方式类似,但这对人工智能有极大挑战,需要人工干预来添加标签和注释。在本周...

这一空白终于被DeepSeek打破

这一空白终于被DeepSeek打破

  /马斯克回应特斯拉Optimus人形机器人拿下1万台订单:假的!特斯拉市值一夜蒸发超2100亿元   /9月20日外盘头条:美参议院未通过临时拨款法案 iPhone1...

浪潮云AI智算云服务全新升级,聚势赋能数智化

浪潮云AI智算云服务全新升级,聚势赋能数智化

  为加快实施 “人工智能+”行动,强化智能算力统筹等基础支撑能力,近日,浪潮云全新升级新一代AI智算云服务,以可运营私有云为基础,以多云异构算力统一调度、高性能网络加速、高性能...

外滩大会观察:在Z世代涌入的科技现场,看见具象化的创新浪潮

外滩大会观察:在Z世代涌入的科技现场,看见具象化的创新浪潮

  当 DeepSeek席卷全球AI战场,当宇树机器人在春晚舞台上演 “机械之舞”,这些在今年让世界侧目的“小龙”也让人们开始关注起他们背后跃动着的年轻身影。他们不是传统意义上的商界大佬,...