联网/用电脑… OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)

下面这个,不是 Manus,是 OpenAI 新货:

凌晨 1 点的时候,OpenAI 发布了全套 Agent 开发套件,让手搓 Manus 触手可及。套件包含 4 个主要内容

  • Responses API:本次发布会的核心,可视作 Chat API 的上位升级
  • 内置工具 (Built-in Tools),有三个: 网页搜索文件搜索 和 Computer Using Agent(CUA)
  • Agents SDK:这是个开源 Agent 框架(你没看错,OpenAI Open 了),让开发者能够更轻松地构建和管理复杂的单 Agent 和多 Agent 系统。
  • 监控工具:在开发者后台,帮助追踪和检查 Agent 工作流的执行过程。


不黑不吹:这次的发布,比 GPT 4.5 有诚意太多了,值得掌声

在这篇文章里,我将结合发布会里的内容,以及「发布会中没说,但我知道的内容」,给大家带来最完整的呈现。


先说 Responses API

这是一个专门为 Agent 进行优化的 API,并支持以往 API (Chat Completions API )的所有功能。

这里需要小吹一下:Responses API 支持新的内置工具,并支持可预测性的流式事件,极大的简化了项目的复杂度


可以看一下这个视频,感受下:

为了直观的展示能力,这里我做了个对比图:

联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


对于原本的 Chat Completions API,未来虽不会下线,但一些新模型可能不再支持。

因此:如果没有历史包袱,开新坑的时候,无脑用新 API 就好了

从调用的角度,差异不大,稍微修改下就好了


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)
联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)

你看到这篇文章,很可能是老板发过来的:让你整理下这东西的价值/特性。

我给整理好了,贴在这里。


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


这里说个八卦,在 23 年的时候,OpenAI 搞了个叫做 Assistants API,被建议用于 Agent 开发。

而那时,作为 OpenAI 的生态负责人的 Logan,也向外传递了这一消息。

联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


但老实讲,这个 API 非常非常难用,甚至还要额外付费,就一直没啥人用,于是…

联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


24年3月初的时候,Logan 突然离职(那段时间 OpenAI 风波不止)

联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


自那之后,关于 Assistants API 的升级的事儿,就没后文了。

再然后就是今天 Response API 发布后,Assistants API 被预告了将在 2026 年下线。

果然,曾经的小甜甜,今天的牛夫人。

联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)




Built-in Tools

在这次的官方发布中,包含三种内置工具:

  • Web Search / 网页搜索
  • File Search / 文件搜索
  • Computer Use Agent(CUA)工具流程图

按官方计划,之后还会再加入「代码编译器」,等更新吧


这些东西,都需要前面提到的 Responses API,方式较为通用

from openai import OpenAI
client = OpenAI()

response = client.responses.create(
    model: "适用模型",  // computer-use-preview或gpt-4o等     
    tools: [{          
    type"工具名称",  // web_search_preview, file_search, computer_use_preview         // 工具特定参数...     
    }],
    truncation: "auto",  // computer_use必需
    input="What was a positive news story from today?"
    // 其他参数...
)

print(response.output_text)


Web Search / 网页搜索

没错…现在 OpenAI 的 API 支持搜索了,允许你配置的东西还蛮多的,比如国家、城市、时区、搜索量。

要点我整理如下:

联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)

老实讲,虽在合理范围,但还是偏贵。作为对比,常规的搜索 API 官方价格如下:

  • Google Search:$5/1000 次(每天限制 1 万次)
  • Bing Search:$20/1000 次


File Search / 文件搜索

这不算是新功能,之前就推出过,算是个版本更新。

使用流程大抵是:

  • 上传文件到 OpenAI 的向量库
  • 它会处理一阵子,完了就可以使用了
  • 使用 file_search 来获取回答


同样的,我给做了一份要点可视化

联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


Computer Use Agent(CUA)

它很像智谱的牛牛:《附内测地址:AI 开始接管物理世界》,让 AI 通过截图理解界面状态并执行交互操作,实现自动化任务。

联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


我翻了下接口文档,发现这东西目前支持 9 种行为

联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


这些行为,将会被 CUA 进行自动的组合和执行,达到操作电脑的效果

联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)



按 OpenAI 的说法,性能肯定是 Sota(遥遥领先) 的

联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


对了,如果你想快速体验,可以直接 fork 这个项目

联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)

https://github.com/openai/openai-cua-sample-app




Agents SDK

这次,必须得吹爆 OpenAI 了,他们开源了一个硬货:OpenAI Agent 框架。

Git 地址在这:

https://github.com/openai/openai-agents-python


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)

这是一个支持 multi-agent 的框架,任何符合 OpenAI Chat Completions API 的模型都可以来用。

换句话说,DeepSeek 也能用 OpenAI 的这个框架


这里放几个示例


基础示例

pip install openai-agents
from agents import Agent, Runner

agent = Agent(name="Assistant", instructions="You are a helpful assistant")

result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)
# 输出: Code within the code,
#      Functions calling themselves,
#      Infinite loop's dance.


代理交接

pip install openai-agents
from agents import Agent, Runner
import asyncio

spanish_agent = Agent(
    name="Spanish agent",
    instructions="You only speak Spanish.",
)

english_agent = Agent(
    name="English agent",
    instructions="You only speak English",
)

triage_agent = Agent(
    name="Triage agent",
    instructions="Handoff to the appropriate agent based on the language of the request.",
    handoffs=[spanish_agent, english_agent],
)

asyncdefmain():
    result = await Runner.run(triage_agent, input="Hola, ¿cómo estás?")
    print(result.final_output)
    # 输出: ¡Hola! Estoy bien, gracias por preguntar. ¿Y tú, cómo estás?

if __name__ == "__main__":
    asyncio.run(main())


函数工具

import asyncio
from agents import Agent, Runner, function_tool

@function_tool
defget_weather(city: str) -> str:
    returnf"The weather in {city} is sunny."

agent = Agent(
    name="Hello world",
    instructions="You are a helpful agent.",
    tools=[get_weather],
)

asyncdefmain():
    result = await Runner.run(agent, input="What's the weather in Tokyo?")
    print(result.final_output)
    # 输出: The weather in Tokyo is sunny.

if __name__ == "__main__":
    asyncio.run(main())


监控工具

OpenAI 这次带来了两个监控工具,一个叫 Logs,一个叫 Traces

https://platform.openai.com/traces

联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


对于请求,是会被归入 Logs 里;

如果是 Agent 调试,整个监控也会被归入 Trace,就像是这样;

联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


你可以在这里找到文档:

https://openai.github.io/openai-agents-python/


但我相信..如果你和我一样,是 Colab 用户,那么在调试的过程中,可能会出现这个问题:

联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)

之后 OpenAI 的朋友提醒道:在载入 openai agents 之前,先设置环境变量就行了

联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)

(我认为这是 bug,hhhhhh)

(以及在我测试下,记录还有点小的 bug,也反馈了,等修好)




最后

在发布会的最后,主持人说了这么一句:

2025 is going to be the year of Agent

2025,是 Agent 之年


那么,加油!你也可以站在聚光灯下!


© 版权声明
THE END
喜欢就支持一下吧
点赞28 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片