站长之家 - 业界 2025-02-07 10:02

OpenAI升级o3-mini模型思维链:提升AI推理过程透明度

科技快报 2 月 7 日消息,OpenAI 公司 X 平台官方推特宣布更新 o3-mini 思维链,面向免费和付费用户开放。

OpenAI 对付费用户更新 o3-mini-high 思维链,以更清晰、更详细的方式展示模型的推理"过程"和答案的由来。

去年 12 月,OpenAI 发布推理模型 o3,该系列包括 o3 和 o3-mini 两个模型,其中 o3 是一款高性能推理模型,o3-mini 是一款更小的精简版模型,在保持智能的同时优化了性能和成本。

o3 模型在多个方面展现了卓越的能力。在ソフトウェアベンチマーク SWE-bench Verified 中,o3 以 71.7% 的准确率领先,比前代模型 o1 的性能提升了 20% 以上。

在编程竞赛领域,o3 在 Codeforces 竞赛中的评分高达 2727 分,接近 OpenAI 内部精英程序员的水平。更令人瞩目的是,在 AIME 数学竞赛模拟中,o3 模型的准确率达到了惊人的 96.7%,远超 o1 的 83.3%。

值得注意的是,o3 模型在 ARC-AGI 测试中取得了历史性突破,首次突破了人类水平门槛(85%),以 87.5% 的优异成绩,标志着 OpenAI 在通往实现人工智能(AGI)的道路上又迈出了重要一步。

推荐关键词

24小时热搜

查看更多内容

大家正在看

OpenAI透露明天发布满血版o3

SB OpenAI Japan正式成立!