当前位置:首页 > DeepSeek技术交流 > 正文内容

《自然》网站:中国AI模型“又一个DeepSeek时刻”

2个月前 (07-17)DeepSeek技术交流158

新华社伦敦7月16日电(记者郭爽)英国《自然》杂志网站16日发表文章说,中国人工智能(AI)模型Kimi K2发布后引发轰动,世界迎来“又一个DeepSeek时刻”。中国在6个月内推出第二款令人印象深刻的模型,表明这一成功并非偶然。文章摘要如下:

继今年1月DeepSeek-R1震惊世界之后,全球研究人员对中国推出的第二个强大的AI模型越来越感到兴奋。北京月之暗面科技有限公司于7月11日推出了Kimi K2。

Kimi K2在编程方面的表现尤其出色,在LiveCodeBench(一个专门用于评估大型语言模型编码能力的数据集)等测试中取得了高分。此外,Kimi K2似乎还颇具写作天赋,在一些专业测试中名列前茅。

目前,包括硅谷的开源社区等在内的AI开发者都在热议Kimi K2。官方数据显示,其总参数规模达到了万亿级别(1T),不过由于采用混合专家架构,每次任务仅动态激活320亿参数,只需调用模型中相关模块,从而有助于控制所需算力。

与DeepSeek系列模型类似,Kimi K2采用开源协议发布,允许研究人员免费下载并进行本地部署与二次开发。同时,该模型支持通过应用程序接口调用,其定价显著低于“克劳德4”等主流闭源模型。

美国艾伦人工智能研究所机器学习研究员纳坦·兰伯特说:“今年早些时候发布的DeepSeek-R1更像是AI发展轨迹中的前传,而非昙花一现。Kimi K2是全球最佳的全新开源模型。”

原标题:《《自然》网站:中国AI模型“又一个DeepSeek时刻”》


“《自然》网站:中国AI模型“又一个DeepSeek时刻”” 的相关文章

渭城区检察院举办DeepSeek助力检察实务专题培训会

渭城区检察院举办DeepSeek助力检察实务专题培训会

  为深入贯彻落实最高检关于检察工作现代化和数字检察战略的决策部署,积极探索人工智能前沿技术在检察工作中的深度应用,近日,渭城区检察院举办“DeepSeek助力检察实务专题培训会”。院党组副...

WAIC抢先爆料:金融黑马大模型超DeepSeek刷新SOTA,论文已上线

WAIC抢先爆料:金融黑马大模型超DeepSeek刷新SOTA,论文已上线

鱼羊 发自 纽凹非寺量子位 | 公众号 QbitAI又到了一年一度“中国AI春晚”WAIC,各家大厂动作频发的时候。今年会有哪些看点?你别说,我们还真在扒论文的过程中,发现了一些热乎线索。比如蚂蚁数科...

deepseek,到底是什么?请不要说“协和语”!

deepseek,到底是什么?请不要说“协和语”!

1945年前的东北,街头巷尾突然响起一阵夹杂着日语的奇怪腔调,大人小孩不得不强行学会“协和语”;而到了2024年,我们发现身边越来越多的科技产品、品牌名开始用洋文,甚至大媒体也不翻译,直接用“deep...

Deepseek开源社区的贡献有哪些?

Deepseek开源社区的贡献有哪些?

Deepseek开源社区的贡献有哪些?DeepSeek开源社区的贡献主要体现在以下几个方面:一、推动AI大模型技术的普及与发展DeepSeek通过开源其大模型,降低了AI技术的门槛,使得更多的开发者能...

深度解析:DeepSeek揭示7大时间浪费行为,助你高效管理时间

深度解析:DeepSeek揭示7大时间浪费行为,助你高效管理时间

时间是人生最宝贵的资源,浪费时间等同于慢性自杀。DeepSeek通过大数据分析,揭示了生活中最严重的7大时间杀手,帮助我们深刻反思,重新掌控生活节奏。第一,垃圾娱乐如游戏和短视频虽然短暂放松,但长期沉...

OpenAI没做到,DeepSeek搞定了!开源引爆推理革命

OpenAI没做到,DeepSeek搞定了!开源引爆推理革命

100多天前,DeepSeek-R1凭借低训练成本,名噪一时。而强化学习算法GRPO,是背后最大的功臣之一。然而,开源界对强化学习算法的探索并没有终结。DeepSeek-R1引爆了LLM推理革命。至今...