OpenAI Images 2.0: текст в картинках, UI-генерация и режим extended thinking

OpenAI Images 2.0 умеет рисовать текст на изображениях, генерировать интерфейсы и подтягивать свежие данные из сети; в режиме extended thinking модель сама придумывает сюжет по короткому промпту.

Автор: Michael Kokin ·

Что умеет

Три заметных улучшения по сравнению с предыдущим поколением:

Ещё есть режим extended thinking: по простому промпту нейронка сама придумывает сюжет и выдаёт готовую картинку — без детальных инструкций.

Примеры работы с нестандартными форматами

OpenAI также показала, как модель справляется с произвольными макетами — рекламные баннеры, многоколоночные полосы, полноценные газетные страницы с заголовками и основным текстом:

![](/media/posts/openai-images-2-test-2.jpg)
![](/media/posts/openai-images-2-test-3.jpg)
![](/media/posts/openai-images-2-test-4.jpg)
![](/media/posts/openai-images-2-test-5.jpg)
![](/media/posts/openai-images-2-test-6.jpg)
![](/media/posts/openai-images-2-test-7.jpg)

Почему это важно

Точный текст в картинках — это то, из-за чего дизайнеры не могли всерьёз использовать генеративные модели для рабочих задач: логотипы, баннеры, UI-макеты. Теперь это работает. В целом — очень хороший (и не стыдный) релиз от Альтмана и команды.

Ждём GPT-5.5 или новую модель Spud в течение ближайших двух недель.

Сайт OpenAI — попробовать можно через «try in ChatGPT»; в браузерной версии работает, в приложении пока нет.
TechCrunch