更多干货抢先看:大数据干货合集

OpenAI最近在旧金山举办的DevDay 2025开发者大会上,以 “从想法到实践的门槛革命” 为主题,推出了一系列颠覆性工具与API。此次发布不仅涵盖智能体开发、代码生成、应用生态和视频创作四大核心领域,更标志着OpenAI从AI模型提供者向 “可调用、可协同、可进化” 的智能操作系统平台全面转型。

本文将介绍AgentKit、Codex正式版、Apps SDK与Sora 2 API的核心功能、技术突破与行业影响,展现AI时代的生产力新范式。
图片

AgentKit:AI 智能体开发的 “民主化” 工具

在AI Agent领域长期存在"概念火热、落地困难"的困境,OpenAI推出的AgentKit通过模块化工具集,彻底改变了这一现状,让复杂智能体的开发周期从数月缩短至分钟级。

AgentKit构建于OpenAI Responses API基础之上,包含四大核心模块形成完整开发闭环:

- Agent Builder(不知对n8n和dify会有什么冲击呢?)

可视化拖拽画布是其标志性功能,开发者可像使用Canva一样组合逻辑节点、连接外部工具、配置安全护栏。支持if-else逻辑、循环流程、用户审批节点等复杂编排,同时内置版本控制与预览运行功能,极大降低了工作流设计门槛。
在这里插入图片描述

  • ChatKit

可定制化嵌入组件,支持将智能体对话界面无缝集成到网站或应用中,保留品牌风格的同时提供ChatGPT级别的交互体验。目前已在HubSpot客服系统、Evernote研究助手等场景广泛应用。

  • Connector Registry

企业级连接管理中心,整合了Dropbox、Google Drive等预置连接器与第三方MCP标准接口,管理员可统一管控数据访问权限,兼顾灵活性与合规性。

Agent Evals

智能化评估工具,通过trace评分、自动提示词优化、第三方模型对比等功能,精准定位智能体决策链条中的薄弱环节,提供数据驱动的优化建议。

Codex 正式版:从编码助手到 “软件自编程” 引擎

作为GPT-5家族的专业分支,Codex正式版(General Availability)结束预览阶段,以agentic coding为核心定位,将AI编程能力从代码补全升级为全流程软件工程协作。带来了三项全新功能:

  • Slack集成。用户现在可以像与同事交流一样,在团队频道或线程中直接向Codex分配任务或提问。
  • Codex SDK。可将驱动Codex CLI的同款智能体嵌入用户自己的工作流、工具或应用中,在GPT-5-Codex上实现最先进性能,无需额外微调。
  • 管理员工具。通过环境控制、监控与分析面板,ChatGPT工作区管理员可以更好地掌控Codex的使用和运行。

Apps SDK:ChatGPT的"操作系统化" 革命

Apps SDK的推出标志着ChatGPT从对话工具向AI原生应用平台的战略转型,通过开放标准与深度集成,构建起类似iOS的生态系统,直接触达8亿周活跃用户。
在这里插入图片描述

Apps SDK基于MCP开放标准构建,实现了三大技术突破:

  • 沉浸式应用嵌入

开发者使用TypeScript/JavaScript编写后端逻辑,通过MCP接口连接数据,可在ChatGPT对话流中渲染地图、视频播放器等交互式UI。

  • 上下文感知交互

通过应用对话机制,第三方应用可将实时状态暴露给模型。

  • 标准化生态体系

提供完整的开发规范与审核机制,要求开发者通过实名验证与功能测试,引入年龄分级和权限管理;即将推出的应用目录支持搜索发现,Agentic Commerce协议则实现了ChatGPT内的即时结账功能。

Sora 2 API:多模态创作的 “全感官” 进化

Sora 2 API的预览发布将生成式AI从视觉媒介升级为全感官体验,在物理真实性、音视频协同与创作可控性上实现质的飞跃,重塑创意产业生产流程。
在这里插入图片描述

Sora 2 API的进化主要体现在三大技术维度:

  • 物理世界理解

相比初代的分镜拼接,实现端到端长视频生成,能精准模拟物理定律。复杂人体运动与体育动作的还原度显著提升,支持跨镜头的场景状态一致性。

  • 音视频协同生成

首次实现画面与音效的同步 “生长”,根据画面元素自动生成环境音、动作音效等丰富音景。

  • 可控性与个性化

支持用户通过身份验证后,将自己的肖像与声音融入AI生成场景,且完全掌握使用权可随时撤销;API调用则支持更长序列,满足从短视频到分镜脚本的多元需求。

更多干货抢先看:大数据干货合集

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐