GPT-5.5 набрала вдвое больше Opus 4.7 в синьорском кодинге

На бенчмарке Senior Engineer GPT-5.5 набирает 62,5 балла против 33,5 у Claude Opus 4.7 — лучший релиз OpenAI за год по кодингу и текстам.

Автор: Michael Kokin ·

Every.to (медиа для разработчиков и операторов ИИ) прогнали новую модель по тестам сразу после релиза — это второй крупный выпуск OpenAI за неделю, после Images 2.0.

– Разрыв в синьорском кодинге. На новом бенчмарке Senior Engineer (где модель должна переписать сырой продакшен-код так, как это сделал бы опытный разработчик) GPT-5.5 выбивает 62,5 балла. Для сравнения, у Opus 4.7 — всего 33,5. До людей ещё расти (живые инженеры берут под 80–90 баллов). Смешная деталь: абсолютный максимум GPT-5.5 показала, когда работала по архитектурному плану, написанному Opus'ом ¯_(ツ)_/¯

– OpenAI снова умеет в тексты. Это лучшая пишущая модель от них за последний год — наконец чистая структура и плавное логическое повествование.

– Рутина стала надёжнее. Модель обходит Opus 4.7 в сборке дашбордов, клиентских отчётах и рутинных ответах саппорта.

– Любит структуру. GPT-5.5 сияет, когда есть чёткий план, существующая система или плотный цикл фидбека. Для кодинга с нуля «на вайбах», презентаций в PowerPoint, Ruby или абстрактного продуктового дизайна — Opus 4.7 всё ещё впереди.

Если Opus хорош для широких креативных мазков, GPT-5.5 — уверенный мид/синьор, которому можно скинуть легаси-код и пойти пить кофе.