超级重磅！刚刚OpenAI发布全新推理模型o1系列，IMO正确率高达83%

OpenAI放大招！全新推理模型o1系列来了，解题能力堪比博士生！

就在5分钟前，OpenAI发布了全新的 AI 模型系列——OpenAI o1，主打推理能力，号称能解决比以往模型更难的科学、编程和数学问题！

先别急着激动，这次只是预览版！ OpenAI 表示，o1 系列模型还将进行定期更新和改进，后续还会加入更多功能，例如网页浏览、文件和图像上传等。

推理能力大幅提升： OpenAI 表示，o1 模型在物理、化学和生物等学科的 challenging 基准测试中，表现与博士生相当

数学和编程能力爆表： 在一项国际数学奥林匹克竞赛（IMO）的资格考试中，GPT-4o 的正确率只有 13%，而 o1 模型的正确率高达 83%！在 Codeforces 编程竞赛中，o1 模型的成绩也达到了前 89%！

更像人类一样思考： o1 系列模型经过训练，能够花更多时间思考问题，尝试不同的策略，并识别自己的错误，就像人类一样！

o1 系列模型的安全性：

全新安全训练方法： OpenAI 开发了一种新的安全训练方法，利用 o1 模型的推理能力，让它们更好地遵守安全和对齐准则

更强的“越狱”抵抗力： OpenAI 用“越狱”测试来衡量模型的安全性，结果显示 o1 模型比 GPT-4o 更不容易被“越狱”

科学研究： o1 模型可以帮助医疗研究人员分析细胞测序数据，帮助物理学家生成复杂的数学公式

编程开发： o1 模型可以帮助开发者构建和执行多步骤工作流程。

o1-preview： 预览版模型，功能相对较少，但推理能力强大

o1-mini： 更小、更快的推理模型，特别擅长编程，成本也更低

ChatGPT Plus 和 Team 用户： 现在就可以在 ChatGPT 中使用 o1-preview 和 o1-mini 模型

ChatGPT Enterprise 和 Edu 用户： 下周开始可以使用这两个模型

API 用户： 符合条件的开发者现在就可以在 API 中使用这两个模型，但功能有限，例如不支持函数调用、流式传输、系统消息等

ChatGPT Free 用户： OpenAI 计划在未来向所有 ChatGPT Free 用户开放 o1-mini 模型

继续改进 o1 系列模型， 添加更多功能，例如网页浏览、文件和图像上传等

继续开发 GPT 系列模型， 与 o1 系列模型并行发展

文章版权归作者所有，未经允许请勿转载。

THE END