当前位置:首页 > Deepseek最新资讯 > 正文内容

OpenAI发布低成本模型 与

2个月前 (08-06)Deepseek最新资讯227

  OpenAI周二发布了自2019年推出GPT-2以来首批开放权重语言模型。这两款纯文本模型分别命名为gpt-oss-120b和gpt-oss-20b,旨在为开发者、研究人员和企业提供更易运行和定制的低成本选项。

  当人工智能模型的参数(即训练过程中优化输出和预测能力的要素)公开可用时,该模型即被视为开放权重。此类模型虽能提供透明度和控制权,但不同于开源模型——后者允许用户完全获取并修改源代码。

  近年来,Meta、微软支持的Mistral AI以及中国初创企业DeepSeek等公司也相继发布了开放权重模型。

  OpenAI总裁格雷格·布罗克曼在简报会上表示,见证这个生态系统的成长令人振奋,我们很荣幸能参与其中并推动技术边界,进而观察其发展轨迹。该公司与英伟达、超威半导体、Cerebras及Groq合作deepseek,确保模型能在多种芯片上稳定运行。

  OpenAI向世界展示了基于英伟达AI技术的可能性,如今他们正在开源软件领域推动创新,英伟达CEO黄仁勋在声明中评价道。

  此次发布备受期待,部分原因是公司曾多次推迟上线。OpenAI CEO萨姆·奥尔特曼七月在X平台发文称需要更多时间进行额外安全测试并审查高风险领域,此前六月他也明确表示模型不会当月发布。

  OpenAI周二声明已对开放权重模型实施全面安全训练与测试。在预训练阶段清除了有害的化学、生物、放射性与核武器相关数据,并模拟了恶意行为者可能进行的模型微调。

  测试表明,经恶意调优的模型无法达到其准备框架设定的高能力阈值——这是该公司衡量和防范危害的评估体系。OpenAI还透露已邀请三个独立专家团队对恶意微调评估提供反馈。

  用户可通过Hugging Face和GitHub等平台依据Apache 2.0许可证下载模型权重,并借助LM Studio、Ollama等程序在个人电脑运行。亚马逊云、Baseten和微软云也将提供模型服务。

  这两款模型均具备高级推理、工具调用和思维链处理能力,适配从消费级硬件到云端乃至终端设备的各种环境。例如gpt-oss-20b可在笔记本电脑运行,作为能检索文件和辅助写作的个人助手。

  我们很荣幸将这项耗资数十亿美元的研究成果开放给全世界,让尽可能多的人掌握AI技术,奥尔特曼在周二的声明中表示。原文出处:OpenAI发布低成本模型 与,感谢原作者,侵权必删!

标签: deepseek

“OpenAI发布低成本模型 与” 的相关文章

清华学者Nature Medicine发文:DeepSeek狂奔,已在近800家

清华学者Nature Medicine发文:DeepSeek狂奔,已在近800家

  DeepSeek-R1 成为美国苹果应用商店下载量最高的聊天机器人,超越了 OpenAI 的 ChatGPT。与相比,DeepSeek-R1 在效率、成本和透明度方面具有优势,一度导致...

戴尔 R740服务器主机支持DeepSeek深度学习

戴尔 R740服务器主机支持DeepSeek深度学习

  【中关村在线北京行情】近日,戴尔易安信PowerEdge R740 机架式服务器服务器在中关村在线商家“北京神州华杰(企业服务商)”特价促销,价格优惠,详情请咨询商家联系电话:1531...

DeepSeek预测:西班牙人VS马略卡!米拉领衔主场屠杀,马略卡难逃降级区噩梦

DeepSeek预测:西班牙人VS马略卡!米拉领衔主场屠杀,马略卡难逃降级区噩梦

  西甲第4轮即将迎来一场看似实力悬殊的对决——排名第5的西班牙人主场迎战深陷降级区的马略卡。主队目前以2胜1平的不败战绩高居欧战区,而客队仅积1分排名倒数第三。这场比赛的胜负或将直接影响...

中控技术的TPT 2,工业领域的“DeepSeek”?

中控技术的TPT 2,工业领域的“DeepSeek”?

  自 ChatGPT、DeepSeek 等大语言模型掀起全球 AI 浪潮以来,几乎所有的工业人都在思考一个问题:在工业领域,我们该如何使用AI技术?   甚至有的企业开...

DeepSeek预测:那不勒斯vs卡利亚里!孔蒂军团2-0碾压,德布劳内剑指连斩

DeepSeek预测:那不勒斯vs卡利亚里!孔蒂军团2-0碾压,德布劳内剑指连斩

  北京时间8月31日凌晨,马拉多纳球场将迎来意甲第2轮的重头戏——领头羊那不勒斯坐镇主场迎战中游球队卡利亚里。首轮比赛中deepseek,孔蒂的球队以2-0完胜萨索洛,而卡利亚里则1-1...

传DeepSeek正在开发具备更先进AI智能体功能的人工智能模型

传DeepSeek正在开发具备更先进AI智能体功能的人工智能模型

  有报道称,DeepSeek 正在开发一款具备更先进 AI 智能体功能的人工智能模型,意在与OpenAI等美国竞争对手在技术新前沿展开竞争。该公司正在打造的模型能够在用户仅提供最少指令的...