当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

2个月前 (07-10)Deepseek应用场景216

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

突传重磅,获顶级域名认可!DeepSeek引爆“新生意”,已有上千人购买

突传重磅,获顶级域名认可!DeepSeek引爆“新生意”,已有上千人购买

春节期间,在杭州的梁文锋打破了世界科技舞台上沉默许久的平静,也给全球资本市场带来了巨大扰动,特别是对以英伟达为代表的美股巨头造成了直接冲击,一度引发硅谷“恐慌”。DeepSeek的横空出世,对靠AI产...

优刻得接入DeepSeek全系列模型适配工作

优刻得接入DeepSeek全系列模型适配工作

每经AI快讯,有投资者在投资者互动平台提问:传deepseekR2因算力短缺迟迟未发布,你司算力与deepseek公司合作进展的怎么样了,请加快推进与deepseek公司的算力合作。优刻得(68815...

酒泉市以DeepSeek为引擎 开启数智化创新实践

酒泉市以DeepSeek为引擎 开启数智化创新实践

酒泉市以DeepSeek为引擎 开启数智化创新实践每日甘肃网兰州讯(新甘肃·甘肃日报记者范海瑞通讯员雷璐)今年以来,酒泉市以DeepSeek大模型为技术支点,在政务服务、公共治理、产业升级等领域展开深...

外服控股:公司AI智能助手“云知道”已接入DeepSeek-R1

外服控股:公司AI智能助手“云知道”已接入DeepSeek-R1

证券之星消息,外服控股(600662)07月17日在投资者关系平台上答复投资者关心的问题。投资者:为评估公司价值,请说明1.是否在办公、研发、客户服务或业务流程中应用AI技术?(a)是(b)否2.若应...

百度 AI 搜索宣布全面接入 DeepSeek R1 最新版,推理能力更强

百度 AI 搜索宣布全面接入 DeepSeek R1 最新版,推理能力更强

IT之家 5 月 31 日消息,5 月 28 日晚,DeepSeek R1 模型宣布完成小版本试升级,在模型架构、推理能力和开放性方面均有显著提升。随后,腾讯宣布旗下元宝、ima 等一系列 AI 应用...

DeepSeek生态伙伴计划第五期落地宁波:城知科技赋能2025智能制造AI培训

DeepSeek生态伙伴计划第五期落地宁波:城知科技赋能2025智能制造AI培训

7月18日,由浙江大学CCAI宁波中心(城知科技)主办的2025宁波人工智能先锋工程师赋能行动--DeepSeek生态伙伴计划第五期人工智能赋能智能制造专项培训在宁波顺利举办。本次以“DeepSeek...