当前位置:首页 > DeepSeek技术交流 > 正文内容

文心大模型X1对上最新版DeepSeek V3,表现谁更好?

3个月前 (03-27)DeepSeek技术交流195

3月26日,在多个公开数据集测评中,百度最新发布的文心大模型X1,在数学、代码、推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。

在数学场景中,GSM8K数据集测试后结果显示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代码生成层面,HumanEval数据集测试后结果显示,文心X1得分90.9,DeepSeek-V3-0324得分86.6;在知识推理层面,C-Eval数据集测试后结果显示,文心大模型X1得分88.6,DeepSeek-V3-0324得分85.1。

近日,DeepSeek官方宣布V3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型X1,具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型X1即将上线千帆大模型平台,API调用价格为DeepSeek-R1调用价格的50%。


“文心大模型X1对上最新版DeepSeek V3,表现谁更好?” 的相关文章

生态环境部:DeepSeek在环境监测上得到初步应用

生态环境部:DeepSeek在环境监测上得到初步应用

3月26日,生态环境部召开3月例行新闻发布会。会上,生态环境部监测司司长蒋火华介绍,目前,DeepSeek已经在生态环境部中国环境监测总站和不少地方生态环境监测部门得到初步应用。蒋火华表示,生态环境监...

脉脉宣布接入DeepSeek-R1,用户数达1.2亿

脉脉宣布接入DeepSeek-R1,用户数达1.2亿

 职场社区平台脉脉宣布已接入DeepSeek-R1模型,旨在进一步优化人岗匹配,提升招聘效率。据悉,今年2月初,脉脉便已经接入DeepSeek-R1模型,并安排了测试部署工作。据悉,目前脉脉已拥有1....

航天宏图:DeepSeek已经部署完毕

航天宏图:DeepSeek已经部署完毕

每经快讯,航天宏图(688066)2月18日在互动平台表示,DeepSeek已经部署完毕,并在天权智能体上线。每日经济新闻...

DeepSeek开源周这次又打开了什么魔盒?将如何影响AI开发?

DeepSeek开源周这次又打开了什么魔盒?将如何影响AI开发?

国产人工智能企业深度求索开发的大模型DeepSeek开源周落下帷幕。2月28日,DeepSeek最新宣布,开源面向DeepSeek全数据访问的推进器3FS(Fire-Flyer File System...

有了DeepSeek加持,中国情趣娃娃干翻日本娃娃

有了DeepSeek加持,中国情趣娃娃干翻日本娃娃

没想到,DeepSeek走红之后,第一个搭上这股东风的产业竟然是充气娃娃。不过这次,不再靠充气和皮肤,而是靠AI了。最近,来自广东中山的成人玩偶制造公司金三玩美(WMdoll)一下子火了。去年12月,...

探索文艺与科技融合!湖北文艺家上了一堂DeepSeek应用课

探索文艺与科技融合!湖北文艺家上了一堂DeepSeek应用课

AI、AGI、GAI、AIGC的概念有什么不同?怎样清晰地给DeepSeek发出指令?美化PPT有哪些好用的软件……3月7日,湖北省文联举办的《DeepSeek等人工智能工具在文艺领域的应用与实践》讲...