当前位置：首页 > DeepSeek技术交流 > 正文内容

文心大模型X1对上最新版DeepSeek V3，表现谁更好？

6个月前 (03-27)DeepSeek技术交流405

3月26日，在多个公开数据集测评中，百度最新发布的文心大模型X1，在数学、代码、推理等能力上表现优异，超越升级后的DeepSeek-V3-0324。

在数学场景中，GSM8K数据集测试后结果显示，文心X1得分95.6，DeepSeek-V3-0324得分93.6；代码生成层面，HumanEval数据集测试后结果显示，文心X1得分90.9，DeepSeek-V3-0324得分86.6；在知识推理层面，C-Eval数据集测试后结果显示，文心大模型X1得分88.6，DeepSeek-V3-0324得分85.1。

近日，DeepSeek官方宣布V3模型完成小版本升级的消息，包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前，百度正式发布文心大模型X1，具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型，兼备准确、创意和文采，在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉，文心大模型X1即将上线千帆大模型平台，API调用价格为DeepSeek-R1调用价格的50%。

标签: DeepSeek 人工智能

返回列表

上一篇：从DeepSeek看人工智能自主创新的战略价值

下一篇：DeepSeek赋能临床诊疗医生助手还是有限工具？上海多家医院接连宣布完成DeepSeek的本地化部署

“文心大模型X1对上最新版DeepSeek V3，表现谁更好？” 的相关文章

文心大模型X1对上最新版DeepSeek V3，表现谁更好？

“文心大模型X1对上最新版DeepSeek V3，表现谁更好？” 的相关文章

微软纳德拉应对 AI 新挑战，DeepSeek 崛起引发战略调整

“DeepSeek医生”也能上岗“诊疗”了！人工智能自动生成处方靠谱吗？

西安工业大学研究团队发布基于DeepSeek的智能仿真想定新范式

从DeepSeek看人工智能自主创新的战略价值

神州泰岳：多条业务线产品已接入DeepSeek

中国信通院：启动DeepSeek国产化适配测试工作

温馨提示：
DeepSeek爱好者为非盈利站点，所有内容均来自网络整理，不保证内容的真实性。

Powered By Z-BlogPHP. Theme by TOYEAN.