OpenAI重磅：全新自主Agent意外曝光！

1年前发布

082972

图片[1]-OpenAI重磅：全新自主Agent意外曝光！ - AI资源导航站-AI资源导航站

惊人的性能数据

在「Operator System Card Table」中，这个神秘的AI Agent在浏览器操作中拿下了87.0%的高分，远超Claude 3.5 Sonnet的56.0%和Google Mariner的83.5%。

图片[2]-OpenAI重磅：全新自主Agent意外曝光！ - AI资源导航站-AI资源导航站

更令人惊讶的是，在电脑操作方面，评测结果是38.1%，也是大幅超过Claude 3.5 Sonnet的22%

安全性能出众

图片[3]-OpenAI重磅：全新自主Agent意外曝光！ - AI资源导航站-AI资源导航站

在处理潜在危险指令时，Operator展现出了极高的安全性。根据数据显示，拒绝率均达到了97%以上。这意味着它能够有效识别并拒绝执行可能存在风险的操作指令。

更多细节即将揭晓？

图片[4]-OpenAI重磅：全新自主Agent意外曝光！ - AI资源导航站-AI资源导航站

据axios报道，Sam Altman已经安排了一场与美国政府官员的闭门会议，定于1月30日举行。很多人都在猜测，这可能预示着一个关于超级Agent的重大突破即将公布。

有消息称，Operator将作为ChatGPT应用的一部分推出。考虑到o3-mini即将发布的消息，这个时间点的选择似乎也很合理。

最后

从目前披露的技术指标来看，尽管Operator在某些方面可能略逊于GPT-4o，但其自主操作能力和安全性都已达到了相当高的水平。

不过昨天Sam Altman表示，会发布一些比较酷的东西，但是不要有太高预期，把预期降低100倍~ 另外有意思的是，头条评论是Deepseek r1的模型卡，并表示我们已经看到了AGI的火花。

图片[5]-OpenAI重磅：全新自主Agent意外曝光！ - AI资源导航站-AI资源导航站

© 版权声明

文章版权归作者所有，未经允许请勿转载。

THE END

AI资讯前沿科技

喜欢就支持一下吧

相关推荐

评论抢沙发

欢迎您留下宝贵的见解！

提交