Как сделать ИИ-агентов безопасными? Разбор архитектуры безопасности агентского ИИ от OpenAI

newsare.net

Когда агент может сам читать репозитории, выполнять shell-команды и взаимодействовать с инструментами разработки, возникает закономерный вопр

Как сделать ИИ-агентов безопасными? Разбор архитектуры безопасности агентского ИИ от OpenAI

Когда агент может сам читать репозитории, выполнять shell-команды и взаимодействовать с инструментами разработки, возникает закономерный вопрос: как обеспечить информ.безопасность? OpenAI опубликовали подробности о том, как они сами у себя внутри работают с агентами. Разберём по частям.Что такое Codex, для тех, кто еще не успел попробоватьCodex - это ИИ-агент: он автономно обходит репозитории, запускает команды, дёргает внешние API и инструменты разработчика. Агенты могут работать параллельно, в изолированных копиях кода, а пользователь переключается между задачами, смотрит изменения и забирает результат. Зачастую пользователи создают мультиагентскую среду, не требующую участия человека. Если учесть, что и с человеком дыры в безопасности поражают, то о какой безопасности может идти речь, если агенты имеют вседозволенность в контуре?Именно поэтому у OpenAI сформировался чёткий принцип развёртывания: низкорисковые действия - без остановок, высокорисковые - с проверкой.Слой 1: Песочница и система одобренийПервая линия контроля sandbox. Он определяет техническую границу выполнения, куда Codex может писать, к каким путям имеет доступ, что остаётся защищённым.Поверх sandbox работает политика одобрений: если агент хочет сделать что-то за пределами песочницы, он обязан запросить разрешение. Пользователь может одобрить действие разово или разрешить целый класс действий на сессию.Чтобы агент не превращался в машину по генерации диалогов «разрешить/запретить», OpenAI добавили режим автопроверки (auto_review). Это субагент, который запущен рядом и молча одобряет рутинные низкорисковые запросы без прерывания пользователя. Но стоит появиться чему-то нестандартному или потенциально опасному - управление передаётся человеку. Читать далее Read more

Facebook Twitter

11:00 12.05.2026

Дочь Славы раскрыла причину конфликта с мамой и рассказала о ее самочувствии сегодня

newsare.net

Начало 2026 года выдалось для певицы непростым — у нее случилось несколько нервных срывов. Мы встретили Александру Морозову на премьере шоу «�

Дочь Славы раскрыла причину конфликта с мамой и рассказала о ее самочувствии сегодня

Начало 2026 года выдалось для певицы непростым — у нее случилось несколько нервных срывов. Мы встретили Александру Морозову на премьере шоу «Ставка на любовь» и решили узнать, как же сейчас дела у мамы.

World and Local News

newsare.net