OpenAI 推出全新 Agent 开发工具:让你也可以快速搭建一个 Manus 那样的智能体出来

 

OpenAI 刚刚发布的一系列全新开发工具和 API,让开发智能体(Agent)变得更简单、更高效。

OpenAI 推出全新 Agent 开发工具:让你也可以快速搭建一个 Manus 那样的智能体出来

接下来,我将以一名开发者的视角,带你深入了解这些新工具究竟有什么亮点,开发者又能得到哪些实质性的好处。

开发者的痛点:明明模型很强,开发却很痛苦?

在最近一段时间,大家可能都感受到了智能体的火爆,比如 ChatGPT 的 Operator 能浏览网页,Deep Research 能帮你写研究报告,Claude Code 能自动写代码修复 Bug,更不用说上周大火的 Manus,但当想自己开发类似的 Agent 时,却发现现实并不美好:

  • • 工具链零散复杂,拼接底层API费时费力。
  • • API 设计抽象,入门困难,需要掌握太多概念。
  • • 处理状态管理、多工具调用、RAG 检索等问题繁琐且容易出错。

为此,OpenAI 刚发布的 「Responses API」 和 「Agents SDK」,搭配三款强大的内置工具,可以让我们构建智能体更加容易。

下面,我分别详细介绍一下。


Responses API:专为 AI 智能体设计的新型 API


OpenAI 推出全新 Agent 开发工具:让你也可以快速搭建一个 Manus 那样的智能体出来
Responses API 简介

OpenAI 全新发布的Responses API不再像之前的Chat Completions API那样单一、抽象,而是专门为多轮对话、多工具调用的智能体场景设计:

  • • 支持多轮对话、工具调用:
    可以一次性调用多个工具(比如同时使用文件搜索和网页搜索),无需复杂的多次请求。
  • • 自动存储对话状态:
    Responses API 会自动记录状态,后续对话不需要重复发送大量数据。
  • • 灵活、直观的设计:
    API采用了简单易懂的设计,只需4行代码就能开始使用,极大降低了开发者的入门门槛。

Responses API的亮点功能:

  • • Items概念取代传统message结构:
    Items 可以表示用户消息、推理过程、函数调用、网页搜索等多种内容。
  • • 更直观的流式响应(streaming):
    提供了明确的“语义事件”,大幅降低开发难度。
  • • 内置强大的工具支持:
    提供一行代码即可使用的内置工具,比如文件搜索、网页搜索,以及即将推出的代码解释器。

三大内置工具,一键集成,开发更高效

① Web Search 工具(网页搜索工具)


OpenAI 推出全新 Agent 开发工具:让你也可以快速搭建一个 Manus 那样的智能体出来
Web Search工具

开发痛点:

  • • 模型不掌握最新信息,知识库落后。

解决方案:

  • • 使用 GPT-4o 微调模型,实时从互联网上抓取最新数据。
  • • 准确度高,能给出可靠、带引用的答案。

OpenAI 推出全新 Agent 开发工具:让你也可以快速搭建一个 Manus 那样的智能体出来

简单来说,Web Search让你的AI智能体拥有实时更新的知识库。


② File Search 工具(文件搜索工具)



OpenAI 推出全新 Agent 开发工具:让你也可以快速搭建一个 Manus 那样的智能体出来
File Search 工具

开发痛点:

  • • 私有知识库难以检索,RAG(检索增强生成)流程繁琐。

解决方案:

  • • 支持向量存储与元数据过滤,快速从你私有文档中找到相关数据。
  • • 支持直接搜索端点,更高效地直接检索向量数据库。

现在,你只需简单上传文件,AI就能帮你快速从中找出你想要的信息。


③ Computer Use 工具(计算机使用工具)



OpenAI 推出全新 Agent 开发工具:让你也可以快速搭建一个 Manus 那样的智能体出来
Computer Use工具

开发痛点:

  • • 很多老旧系统或图形界面软件没有开放的API,难以实现自动化操作。

解决方案:

  • • Computer Use工具相当于在API中内置了Operator,可以自动控制计算机,实现点击、输入、拖动等复杂操作。
  • • 已经在多个基准测试中取得领先表现。

比如你想开发一个自动化购买商品的助手,这个工具就能帮你轻松实现。


Agents SDK:开源多智能体框架,生产级开发体验


OpenAI 推出全新 Agent 开发工具:让你也可以快速搭建一个 Manus 那样的智能体出来
Agents SDK介绍

开发痛点:

  • • 单一智能体无法满足复杂的业务场景(比如客服、购物、退货分离)。

解决方案:

  • • Agents SDK支持多个智能体协同工作,每个智能体拥有独立的工具和逻辑。
  • • 提供分流(handoff)功能,智能体之间可以轻松交接任务。
  • • 提供完整的监控与追踪功能,方便调试与优化。

Agents SDK 还开源了代码,方便你自由扩展,生产环境即插即用。

  • • 现在即可通过 pip install openai-agents 安装,JavaScript版本也即将发布。

除此之外,OpenAI 还推出了一个全新的追踪UI界面,方便开发者随时监控与调试智能体运行状态:


OpenAI 推出全新 Agent 开发工具:让你也可以快速搭建一个 Manus 那样的智能体出来
Tracing UI示意

总结与感受

新发布的 Responses API 与 Agents SDK,明显降低了构建AI智能体的门槛,也让更多想法得以轻松实现,可以更加专注于构建真正实用的AI应用。

OpenAI 首席产品官 Kevin Weil 在直播的最后说的话挺有意思:

“2025 年将会是 AI 智能体爆发的一年, 也是 ChatGPT 和我们开发者工具从‘仅仅回答问题’ 升级为‘真正能在现实世界里为你执行任务’的一年。”

希望本文的介绍能帮你快速理解这些新工具,也期待看到你创造出更多精彩的AI智能体应用。


更多信息可访问:

  • • OpenAI 官方博客介绍[1]
  • • Responses API 文档[2]
  • • Agents SDK GitHub仓库[3]
  • 直播视频(双语字幕):https://www.bilibili.com/video/BV1DuQjYaE3i/

引用链接

[1] OpenAI 官方博客介绍: https://openai.com/index/new-tools-for-building-agents/
[2] Responses API 文档: https://platform.openai.com/docs/api-reference/responses
[3] Agents SDK GitHub仓库: https://github.com/openai/openai-agents-python

 

© 版权声明
THE END
喜欢就支持一下吧
点赞20 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片