OpenAI Images 2.0: текст в картинках, UI-генерация и режим extended thinking

Что умеет

Три заметных улучшения по сравнению с предыдущим поколением:

**Текст в изображениях** — нормально читаемые буквы, не каша. Была хроническая проблема для всех генеративных моделей — здесь заметный шаг вперёд.
**Генерация UI** — можно описать интерфейс словами и получить готовый макет. Лента рекомендаций справа сделана аккуратно.
**Свежие данные из сети** — модель подтягивает актуальную информацию во время генерации, не только то, что было в обучающей выборке.

Ещё есть режим extended thinking: по простому промпту нейронка сама придумывает сюжет и выдаёт готовую картинку — без детальных инструкций.

Примеры работы с нестандартными форматами

OpenAI также показала, как модель справляется с произвольными макетами — рекламные баннеры, многоколоночные полосы, полноценные газетные страницы с заголовками и основным текстом:

![](/media/posts/openai-images-2-test-2.jpg)
![](/media/posts/openai-images-2-test-3.jpg)
![](/media/posts/openai-images-2-test-4.jpg)
![](/media/posts/openai-images-2-test-5.jpg)
![](/media/posts/openai-images-2-test-6.jpg)
![](/media/posts/openai-images-2-test-7.jpg)

Почему это важно

Точный текст в картинках — это то, из-за чего дизайнеры не могли всерьёз использовать генеративные модели для рабочих задач: логотипы, баннеры, UI-макеты. Теперь это работает. В целом — очень хороший (и не стыдный) релиз от Альтмана и команды.

Ждём GPT-5.5 или новую модель Spud в течение ближайших двух недель.

Сайт OpenAI — попробовать можно через «try in ChatGPT»; в браузерной версии работает, в приложении пока нет.
TechCrunch