OpenAI Agents SDK: новая база для production AI-агентов

OpenAI обновила Agents SDK: теперь у агентов появляется рабочая среда, состояние и восстановление после сбоев. Это шаг от демо к production-сценариям.

OpenAI Agents SDK в документации OpenAI Developers

OpenAI Agents SDK получил обновление, которое меняет акцент в агентных приложениях: от «модель умеет вызывать инструменты» к «у агента есть контролируемая рабочая среда, состояние и понятная граница безопасности».

15 апреля 2026 года OpenAI объявила новые возможности Agents SDK: model-native harness для работы с файлами и инструментами, native sandbox execution для безопасного запуска задач, Manifest для описания рабочей области, snapshot/rehydration для возобновления работы и интеграции с sandbox-провайдерами. По состоянию на 16 апреля 2026 года эти возможности доступны через API, используют стандартную оплату по токенам и инструментам и сначала выходят в Python. TypeScript-поддержка заявлена на будущий релиз.

Главный вывод не в том, что появился ещё один SDK. OpenAI постепенно собирает инфраструктурный слой, где AI-агент может не только отвечать, но и работать с файлами, командами, зависимостями и долгими задачами. Это близко к тому, что мы разбирали в материале про боевой контур для AI-агентов: сильной модели мало, если вокруг неё нет среды исполнения, политики доступа и восстановления после сбоев.

Что OpenAI добавила в Agents SDK

Agents SDK и раньше был кодовым способом собрать агента вокруг модели, инструментов, handoffs, guardrails и трассировки. Обновление делает этот слой ближе к production-сценарию: агент получает не только промпт и функции, а рабочее окружение, где можно читать и писать файлы, запускать команды и продолжать задачу после паузы.

В документации OpenAI описывает Agents SDK как путь для приложений, где сервер разработчика сам владеет оркестрацией, исполнением инструментов, состоянием и approvals. Это важная оговорка. SDK не забирает у команды архитектурные решения, а даёт стандартные примитивы, чтобы не писать с нуля цикл агента, маршрутизацию инструментов, состояние и наблюдаемость.

Страница OpenAI Developers с обзором Agents SDK и ссылкой на Sandbox agents
OpenAI Developers: обзор Agents SDK и новые Sandbox agents. Источник: developers.openai.com

В анонсе OpenAI отдельно перечисляет примитивы, которые теперь становятся частью общего harness: tool use через MCP, progressive disclosure через skills, инструкции в AGENTS.md, shell, apply patch, память и sandbox-aware orchestration. Это не случайный набор функций. Это попытка стандартизировать то, что разработчики агентных систем обычно собирают вручную и по-разному.

Harness: кто управляет агентным циклом

В агентной системе harness - это управляющий слой вокруг модели. Он отвечает за сам цикл работы: вызовы модели, маршрутизацию инструментов, handoffs, approvals, трассировку, восстановление и состояние запуска. Если всё это размазано по промптам, shell-скриптам и одноразовым воркерам, агент быстро становится хрупким.

OpenAI продвигает model-native harness как способ держать агента ближе к тому, как frontier-модели лучше всего выполняют длинные задачи: через работу с файлами, явные инструкции, инструменты и промежуточные артефакты. Здесь заметна связь с Codex-подходом, но статья не про Codex как отдельный продукт. Важно другое: patterns из агентного программирования постепенно переезжают в общий SDK.

Для разработчика это снижает количество самописной инфраструктуры. Вместо отдельного слоя для памяти, ещё одного слоя для shell, отдельного формата инструкций и ручного восстановления после сбоя можно использовать общий каркас. Но это не отменяет ответственности команды: права доступа, бизнес-логика, аудит и проверка результата всё равно остаются на стороне приложения.

Sandbox agents: рабочая среда вместо длинного промпта

Самая практичная часть релиза - sandbox agents. В документации OpenAI пишет, что они нужны, когда ответ агента зависит от работы внутри workspace, а не только от рассуждения по контексту. Примеры понятные: каталог документов, генерация файлов, запуск команд, установка зависимостей, отчёты, скриншоты, сервисы на портах и задачи, которые ждут human review, а потом продолжаются в той же среде.

На 16 апреля 2026 года sandbox agents доступны только в Python Agents SDK. OpenAI описывает sandbox как изолированную Unix-подобную среду с файловой системой, shell, пакетами, mounted data, портами, snapshots и контролируемым доступом к внешним системам.

Страница Sandbox Agents в документации OpenAI с диаграммами harness и compute
Sandbox Agents в OpenAI Developers: разделение harness и sandbox compute. Источник: developers.openai.com

Manifest описывает стартовое содержимое такой рабочей области: файлы, директории, репозитории, mounts, переменные окружения, пользователей и группы. В анонсе OpenAI указывает, что через Manifest можно подключать локальные файлы, выходные директории и хранилища вроде AWS S3, Google Cloud Storage, Azure Blob Storage и Cloudflare R2.

Отдельно важно, что OpenAI не привязывает sandbox к одному исполнителю. Разработчик может принести свой sandbox или использовать встроенную поддержку Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop и Vercel. В статье про ставку OpenAI на enterprise AI мы уже писали, что рынок двигается к агентам поверх корпоративных систем. Здесь видно, почему: без переносимой рабочей среды такой агент остаётся демо.

Snapshot и rehydration: почему агент не должен умирать вместе с контейнером

Долгие агентные задачи ломаются не только из-за ошибок модели. Контейнер может истечь, окружение может упасть, шаг может уйти на ручное согласование, а потом продолжиться через час. Если состояние живёт только внутри одного процесса, работа теряется.

OpenAI разделяет три поверхности состояния: RunState для управляющего слоя, session_state для подключения к sandbox-сессии и snapshot как сохранённое содержимое workspace. В анонсе это описано как snapshotting и rehydration: SDK может восстановить состояние агента в свежем контейнере и продолжить с последней контрольной точки.

Это выглядит скучно только на уровне терминов. На практике именно такие детали отделяют игрушечного агента от production-сервиса. Пользователь не должен заново объяснять задачу только потому, что контейнер умер. Система не должна терять артефакты, если задача стала долгой. И команда разработки должна понимать, где хранится состояние, кто может его читать и как оно восстанавливается.

Почему это важно для надёжности, а не только для удобства

У AI-агентов уже есть сильные модели, но остаётся проблема выполнения. IBM Research в разборе benchmark VAKRA описывает среду с более чем 8 000 локально размещённых API, 62 доменами, документами и многошаговыми задачами. Вывод жёсткий: умение вызвать инструмент ещё не равно надёжной работе агента в end-to-end сценарии.

Эта внешняя точка хорошо объясняет, почему OpenAI усиливает именно инфраструктуру. Агенту нужны границы: где он работает, какие файлы видит, какие команды запускает, как соблюдает policy, как возвращает артефакты и как его поведение проверяется. Иначе модель может выглядеть убедительно в коротком демо, но ломаться на длинной цепочке действий.

В этом смысле Agents SDK идёт рядом с MCP как слоем интеграции с инструментами. MCP помогает описывать доступные инструменты и контекст. Sandbox agents отвечают за другую часть: где исполняется работа и как workspace живёт между шагами.

Границы релиза

OpenAI Agents SDK не превращает любую модель в автономного сотрудника. По состоянию на 16 апреля 2026 года новые sandbox-возможности сначала доступны в Python, TypeScript поддержка только запланирована. Цены не вынесены в отдельный тариф: OpenAI указывает стандартную оплату API по токенам и tool use. Это значит, что стоимость зависит от конкретного сценария, числа вызовов модели, инструментов и объёма работы внутри агента.

Вторая граница - безопасность. Разделение harness и compute помогает держать credentials и аудит вне среды, где выполняется код, сгенерированный или выбранный моделью. Но это не автоматическая защита от prompt injection, утечек данных и ошибочных действий. Нужны ограничения доступа, allowlist инструментов, human review для рискованных шагов, трассировка и тесты на типовые сбои.

Третья граница - продуктовая. Если вам нужен короткий ответ модели, sandbox agents избыточны. Если агент должен работать с репозиторием, документами, отчётами, вычислениями или долгой задачей, они становятся частью архитектуры, а не украшением.

Что это меняет для разработчиков

Раньше многие агентные проекты начинались с одного и того же набора самописных решений: как дать агенту файлы, как запустить команду, как сохранить результат, как продолжить после сбоя, как ограничить доступ. Обновлённый Agents SDK предлагает готовый язык для этих решений.

Это не отменяет инженерной работы. Но меняет её фокус. Вместо сборки базовой инфраструктуры команда может больше времени тратить на доменную логику: какие данные агенту доступны, какие действия допустимы, как проверяется результат и где нужен человек в контуре.

Если коротко: OpenAI Agents SDK делает production AI-агентов менее похожими на набор промптов и больше похожими на обычные программные системы. С окружением. С состоянием. С восстановлением. И с ответственностью за то, что происходит между запросом пользователя и финальным ответом.

Telegram-канал @toolarium