OpenAI发布新一代大模型o1,具有推理能力、在数学和编码方面表现更出色
2024-09-13 03:49
Odaily星球日报讯 OpenAI 宣布推出具备推理能力的人工智能模型 o1,内部代号为“草莓”。OpenAI o1 可以推理复杂的任务,并解决比之前科学、编码和数学模型更难的问题。
在测试中,OpenAI o1 在物理、化学和生物学等具有挑战性的基准任务上的表现与博士生类似,其在数学和编码方面表现出色。在国际数学奥林匹克(IMO)资格考试中,GPT-4o 只正确解决了 13%的问题,而推理模型的得分为 83%,OpenAI o1 的编码能力在 Codeforces 竞赛中达到了第 89 个百分点。
作为早期模型 OpenAI o1 尚不具备 ChatGPT 的许多有用功能,例如浏览网页以获取信息以及上传文件和图像,GPT-4o 在短期内将更加强大。但对于复杂的推理任务来说,这是一个重大进步,代表了人工智能能力的新水平。
鉴于此将计数器重置为 1,并将该系列命名为 OpenAI o1。医疗保健研究人员可以使用 o1 来注释细胞测序数据,物理学家可以使用 o1 生成量子光学所需的复杂数学公式,所有领域的开发人员可以使用 o1 来构建和执行多步骤工作流程。
OpenAI 还发布了 OpenAI o1-mini,这是一种经济高效的推理模型。o1-mini 在 STEM 方面表现出色,尤其是数学和编码——在 AIME 和 Codeforces 等评估基准上的表现几乎与 OpenAI o1 相当。OpenAI 预计,对于需要推理而无需广泛世界知识的应用程序,o1-mini 将是一种更快、经济高效的模型,比 o1-preview 便宜 80%。ChatGPT Plus、Team、Enterprise 和 Edu 用户可以使用 o1-mini 作为 o1-preview 的替代方案,具有更高的速率限制和更低的延迟。
在测试中,OpenAI o1 在物理、化学和生物学等具有挑战性的基准任务上的表现与博士生类似,其在数学和编码方面表现出色。在国际数学奥林匹克(IMO)资格考试中,GPT-4o 只正确解决了 13%的问题,而推理模型的得分为 83%,OpenAI o1 的编码能力在 Codeforces 竞赛中达到了第 89 个百分点。
作为早期模型 OpenAI o1 尚不具备 ChatGPT 的许多有用功能,例如浏览网页以获取信息以及上传文件和图像,GPT-4o 在短期内将更加强大。但对于复杂的推理任务来说,这是一个重大进步,代表了人工智能能力的新水平。
鉴于此将计数器重置为 1,并将该系列命名为 OpenAI o1。医疗保健研究人员可以使用 o1 来注释细胞测序数据,物理学家可以使用 o1 生成量子光学所需的复杂数学公式,所有领域的开发人员可以使用 o1 来构建和执行多步骤工作流程。
OpenAI 还发布了 OpenAI o1-mini,这是一种经济高效的推理模型。o1-mini 在 STEM 方面表现出色,尤其是数学和编码——在 AIME 和 Codeforces 等评估基准上的表现几乎与 OpenAI o1 相当。OpenAI 预计,对于需要推理而无需广泛世界知识的应用程序,o1-mini 将是一种更快、经济高效的模型,比 o1-preview 便宜 80%。ChatGPT Plus、Team、Enterprise 和 Edu 用户可以使用 o1-mini 作为 o1-preview 的替代方案,具有更高的速率限制和更低的延迟。
2025-11-08 00:01
美联储理事米兰:稳定币的广泛使用可能会使美联储的利率降低
2025-11-08 00:00
美国共和党拒绝民主党提出的结束政府停摆提议
2025-11-07 23:57
CZ将于今日进行赦免后首次电视采访
2025-11-07 22:07
BTC突破104000 USDT,24H涨幅2.68%
2025-11-07 19:49
美国参议院民主党提出一项结束政府停摆的方案
2025-11-07 19:37
BTC突破103000 USDT,24H涨幅1.15%
2025-11-08 00:01
美联储理事米兰:稳定币的广泛使用可能会使美联储的利率降低
2025-11-08 00:00
美国共和党拒绝民主党提出的结束政府停摆提议
2025-11-07 23:57
CZ将于今日进行赦免后首次电视采访
2025-11-07 22:07
BTC突破104000 USDT,24H涨幅2.68%
2025-11-07 19:49
美国参议院民主党提出一项结束政府停摆的方案
2025-11-07 19:37
BTC突破103000 USDT,24H涨幅1.15%
下载Odaily星球日报app
让一部分人先读懂 Web3.0
