当前位置:首页 > Deepseek应用场景 > 正文内容

OpenAI罕见宣布将开源推理模型,DeepSeek给逼的

4个月前 (04-01)Deepseek应用场景285

就在刚刚,OpenAI CEO Sam Altman正式宣布,将在未来几个月内推出一款具备推理能力的强大开放权重语言模型,并期待与开发者共同探索如何最大化其潜力。


据Altman透露,这是自GPT-2以来OpenAI首次计划发布开放权重语言模型。


他坦言,虽然这一想法已酝酿许久,但此前其他优先事项占据了主导地位。如今,发布这款模型的时机变得尤为重要。



作为参考,开放权重(open weight)是指将AI模型(尤其是神经网络)的训练参数(即权重)公开,供公众使用、检查或进一步开发。


用户可以在这些权重的基础上进行修改,并将修改后的权重重新分发。


虽然开放权重不能完全等同于开源,是一种介于完全闭源和完全开源之间的折中方案,但它是开源理念在AI领域的一种延伸和部分实现,包括此前宣称开源的DeepSeek V3/R1同样只开放了权重。


在正式发布前,OpenAI将依据其“准备框架”对模型进行评估,确保其安全性与可靠性。


考虑到模型发布后可能被修改,团队还将开展额外测试与优化工作。


为进一步完善开发流程,OpenAI计划举办一系列开发者活动,以收集反馈并展示早期原型。首场活动将于数周后在旧金山启动,随后在欧洲和亚太地区陆续展开。


有兴趣参与的开发者可通过链接报名:
https://openai.com/open-model-feedback



OpenAI研究员约翰内斯·海德克(Johannes Heidecke)对此补充道:


“安全性是我们开发开放权重模型的核心。从预训练到发布,我们都会遵循严格的准备框架,确保不会推出可能引发灾难性风险的模型。尽管开放模型面临独特挑战,我们对此充满信心。”


目前,Altman的评论区已经乱成一锅粥了。


网友呼声最高的模型是OpenAI o1 mini,全球最大AI开源社区Hugging Face CEO Clément Delangue也现身评论区。



谈到开源,自然绕不开DeepSeek。R1和R2的身影也充斥着整个评论区。




网友是懂Sam Altman的。毕竟GPT-5也说是“未来几个月”发布,但至今未见踪影。



Altman此前发文透露,得益于GPT-4o的多模态图像生成功能,OpenAI在过去五天内新增了100万用户。



并且由于大量用户的涌入,导致OpenAI的GPU被“融化了”,等模型开放后只能说形势易转。



值得一提的是,Altman上个月曾与硅谷知名分析师Ben Thompson进行了一场深度对谈,其中也有谈到包括开源模型以及和DeepSeek的竞争。


他当时表示:


我认为DeepSeek确实是个很棒的团队,也做出了很优秀的模型,但他们真正走红的原因,并不完全是模型本身的能力。


这对我们来说是一个教训,那就是当我们隐藏一个功能时(思维链),我们给其他人留下了获得病毒式传播的机会。这是一个很好的警醒。它也让我重新思考我们在免费层中提供的内容,GPT-5将可以免费使用。


在今天的发文中,他表示“我们已经考虑这个问题很长时间了,但其他优先事项曾经占据了更高的优先级,现在感觉发布它变得非常重要。”


显然,这位曾罕见承认OpenAI封闭策略站在“历史的错误一方”的CEO已经深刻认识到开源的战略意义。


在接下来的几个月内,无论是Llama 4,还是DeepSeek R2都将成为击垮OpenAI声誉的重要一击,而此次宣布开源,或许正是OpenAI精心准备的一招反击。


“OpenAI罕见宣布将开源推理模型,DeepSeek给逼的” 的相关文章

DeepSeek创始人梁文锋入选《时代》周刊公布的“2025年全球最具影响力100人”

DeepSeek创始人梁文锋入选《时代》周刊公布的“2025年全球最具影响力100人”

上证报中国证券网讯 近日,美国《时代》周刊公布了2025年百大人物。榜单信息显示,DeepSeek创始人梁文锋入选了该杂志“2025年全球最具影响力100人”榜单。《时代》周刊如此评价道:通过更高效地...

DeepSeek总结最浪费时间的7大行为,看完我开始深度反思

DeepSeek总结最浪费时间的7大行为,看完我开始深度反思

作 者:每晚CC来 源:每晚一卷书(ID:JYXZ89896)鲁迅有句名言,影响了我很多年。他说:“生命是以时间为单位的,浪费别人的时间等于谋财害命;浪费自己的时间,等于慢性自杀。”而很多人几乎每天都...

DeepSeek7小时攻克缅甸救灾语言关

DeepSeek7小时攻克缅甸救灾语言关

缅甸发生中部地震后,中国驻缅甸使馆称,前方在使用基于DeepSeek紧急开发的中缅英互译系统,据了解,该系统是国家应急语言服务团秘书处和北京语言大学迅速组建的语言服务支持团队,利用DeepSeek在仅...

如果你非得用DeepSeek看病,建议这么看(附详细提问模版)

如果你非得用DeepSeek看病,建议这么看(附详细提问模版)

你用DeepSeek看过病了吗?打开它,说出自己的不舒服或拍照上传检查结果,几秒后就能得到诊断和治疗建议。继续问这个病是怎么回事或药怎么用,它还能给出更详细易懂的解释,有问必答。不花钱、不用抢号,还比...

美国银行证券分析师:DeepSeek或将加速中国车企开发自动驾驶技术

美国银行证券分析师:DeepSeek或将加速中国车企开发自动驾驶技术

IT之家 2 月 17 日消息,美国银行证券公司的分析师在一份研究报告中指出,DeepSeek 可能会加速中国汽车制造商开发自动驾驶方面的技术。该机构提出,DeepSeek 的开发逻辑与自动驾驶存在相...

为算力超市夯实底座 实现“DeepSeek自由”

为算力超市夯实底座 实现“DeepSeek自由”

在近日举行的 2025 年“智算申城”高峰论坛上,由上海电信牵头打造的长三角一体化示范区异构智算云网调度平台,因其在跨区域、跨架构算力资源智能调度方面的创新性和引领性,成功摘得一等奖。在此前举行的第二...