DeepReinforce представила Ornith-1.0 – AI-модели для агентного кодирования

DeepReinforce выпустила Ornith-1.0 — серию открытых моделей для программирования, ориентированных на агентные ИИ, работающие в реальных терминалах и репозиториях. Модель с 9 миллиардами параметров достигает 69,4 балла по тесту SWE-bench Verified, превосходя Google Gemma 4-31B с 52 баллами. Вместе с этим доступны варианты с 31, 35 и даже 397 миллиардами параметров – последние используют архитектуру mixture-of-experts для повышения производительности.

Особенность Ornith — это агентный подход: модель не просто отвечает на запросы, а самостоятельно выполняет цепочки задач в коде — от чтения файлов и тестирования до исправления ошибок. Такой ИИ способен работать без постоянного вмешательства человека, что выгодно отличает его от классических чат-ботов с обычным диалогом.

Важным элементом обучения Ornith стало совместное развитие стратегии и кода с использованием усиленного обучения. Модель разрабатывает тактику решения задачи и получает обратную связь, оптимизируя оба процесса одновременно. Это помогает избегать подделки результатов и обмана системы благодаря трехуровневой защите, включая неизменяемое окружение и внешний мониторинг.

Флагманская модель с 397 миллиардами параметров показывает рекордные 82,4 балла на SWE-bench Verified и 77,5 на Terminal Bench 2.1, превосходя некоторые коммерческие аналоги. Однако Ornith-1.0 не предназначена для универсальных задач — её сильная сторона именно развитие сложных мультишаговых рабочих процессов в разработке софта.

Таким образом, Ornith-1.0 интересна преимущественно для специалистов, создающих автономные системы программирования и агентные инфраструктуры. Для массового пользователя или общих задач в ИИ эта линейка пока не подходит.

Ornith-1.0 – открытые AI-модели для агентного программирования от DeepReinforce