GPT Image — это семейство моделей OpenAI для генерации и редактирования картинок, которое в 2025 году пришло на смену линейке DALL-E. Именно эту нейросеть теперь используют, когда просят ChatGPT «нарисуй картинку»: она встроена прямо в диалог и понимает контекст переписки. В API она известна под именами gpt-image-1 и более новыми версиями. В этом обзоре разберём по порядку: что такое GPT Image, чем она отличается от DALL-E, что умеет, сколько стоит, как ей пользоваться из России и какие ошибки встречаются чаще всего.

Что такое GPT Image и откуда она взялась

GPT Image — это первая нативно мультимодальная модель OpenAI, которая принимает на вход и текст, и изображения, а на выходе выдаёт готовую картинку. Первая версия для разработчиков, gpt-image-1, вышла в API в апреле 2025 года. Тогда же генератор картинок в ChatGPT перевели с DALL-E 3 на новый движок, а в марте 2026 года DALL-E 3 окончательно вывели из эксплуатации.

Главное отличие от предшественников — в архитектуре. Раньше языковая модель просто передавала текстовый запрос отдельному «рисовальщику» (DALL-E), и они работали как два разных инструмента. GPT Image обрабатывает текст и изображение внутри одной нейросети. Из-за этого модель гораздо лучше понимает смысл запроса: учитывает контекст предыдущих сообщений, опирается на «знание мира» и точнее следует сложным многошаговым инструкциям.

За счёт этой архитектуры GPT Image заметно вырвалась вперёд по качеству. В слепом голосовании сообщества на площадке LM Arena модель заняла первое место, обойдя Midjourney, Flux и Stable Diffusion. Но у неё есть и свои слабые стороны — о них ниже.

Чем GPT Image отличается от DALL-E

Если коротко: GPT Image — это не «DALL-E 4», а принципиально другой подход. Ниже — ключевые различия.

Параметр	DALL-E 3	GPT Image
Архитектура	Отдельный генератор, языковая модель передаёт запрос	Единая мультимодальная нейросеть
Текст на картинке	Слабое место, часто с ошибками	Читаемый текст, подходит для инфографики и макетов
Понимание контекста	Каждый запрос отдельно	Учитывает предыдущие сообщения в диалоге
Редактирование фото	Ограниченное	Полноценное, включая частичную правку по маске
Ввод картинок	Нет	Принимает изображения как референс
Статус	Выведена из эксплуатации в марте 2026	Актуальная модель

Самое заметное улучшение — рендеринг текста. Раньше буквы на сгенерированных картинках почти всегда превращались в кашу. GPT Image умеет писать читаемые надписи прямо внутри изображения, что делает её пригодной для инфографики, обложек, макетов интерфейсов и товарных этикеток. Второе важное преимущество — способность принимать изображения на вход: можно загрузить фото и попросить его отредактировать или использовать как основу для новой сцены.

Что умеет GPT Image

Возможности модели выходят далеко за рамки «сгенерировать картинку по тексту». Вот основные сценарии.

Что умеет	Как это выглядит на практике
Генерация с нуля	Создать изображение по текстовому описанию через эндпоинт Generations
Редактирование	Изменить загруженную картинку по новому промпту, целиком или по маске (эндпоинт Edits)
Текст на изображении	Отрисовать читаемые надписи — для инфографики, обложек, макетов
Работа с референсом	Принять фото на вход и опереться на него при генерации
Разные форматы	Квадрат 1024×1024, альбом 1536×1024, портрет 1024×1536
Прозрачный фон	Сгенерировать PNG с прозрачностью — удобно для стикеров и логотипов
Гибкое качество	Три уровня: low, medium, high — компромисс между ценой и детализацией

Модель поддерживает три размера кадра: квадрат (1024×1024), альбомную (1536×1024) и портретную (1024×1536) ориентацию. Через параметры API можно управлять форматом файла (PNG или JPEG), уровнем качества, прозрачностью фона и сжатием. Есть и параметр модерации: по умолчанию стоит строгий фильтр, но его можно смягчить.

Сколько стоит GPT Image

GPT Image в API тарифицируется по токенам, а не по фиксированной цене за картинку. Стоимость складывается из входного текста, входных изображений (если вы что-то редактируете) и сгенерированного изображения на выходе. Порядок цен на квадратную картинку 1024×1024 такой:

Модель	Уровень	Ориентировочная цена за картинку
GPT Image 1 Mini	low	от 0,005 $
GPT Image 1	low–high	0,011–0,25 $
GPT Image 1.5	low	от 0,009 $

Для сравнения: старый DALL-E 3 стоил около 0,04–0,08 $ за картинку по фиксированному тарифу. GPT Image в среднем дороже, особенно на высоком качестве, но и результат заметно лучше. Учитывайте, что редактирование с референсом дороже генерации с нуля — за счёт входных токенов изображения.

Как пользоваться GPT Image: пошагово

Есть два пути — через интерфейс ChatGPT и через API.

Через ChatGPT (для обычных задач):

Откройте диалог с ChatGPT.
Опишите картинку словами: сцену, объект, стиль, освещение. Например: «нарисуй уютную кофейню в скандинавском стиле, тёплый свет из окна, вид от барной стойки».
Дождитесь результата (обычно 10–40 секунд).
Уточните запрос в том же диалоге — модель помнит контекст: «сделай теплее», «добавь надпись COFFEE на вывеске», «поменяй ракурс».
Скачайте готовое изображение.

Через API (для разработчиков):

Создайте аккаунт OpenAI и пройдите верификацию организации.
Получите API-ключ.
Обратитесь к эндпоинту Generations (генерация) или Edits (редактирование), указав модель gpt-image-1, промпт, размер и качество.
Получите картинку в ответе и сохраните её.

Как работать с GPT Image из России

Здесь начинаются сложности. OpenAI официально не работает с пользователями из России: регистрация по российскому номеру заблокирована, оплата ChatGPT Plus и Pro российскими картами невозможна, а API-ключ нельзя получить без верифицированного аккаунта с привязанной иностранной картой. Продвинутые режимы GPT Image доступны только на платных тарифах от 20 $ в месяц.

Обходные пути есть, но каждый со своими минусами: зарубежная виртуальная карта, платёжные посредники с комиссией, сервисы-агрегаторы. Почти везде дополнительно нужен VPN — а это лишний слой нестабильности, оплаты и риска.

Если задача — просто получить качественную картинку по описанию или отредактировать фото, а не именно попробовать модель OpenAI, есть более простой путь. Guru.AI работает из России без VPN и без иностранной карты — на движке Nano Banana от Google, который по многим сценариям (редактирование фото, сохранение лиц, работа с референсом) даёт результат не хуже. Можно сгенерировать изображение нейросетью или обработать своё фото прямо в браузере, с оплатой российской картой и пробным доступом без карты для первого знакомства.

Частые ошибки при работе с GPT Image

Мелкий текст расплывается. Модель хорошо пишет крупные надписи, но текст меньше примерно 18 пунктов и абзацы длиннее 20–30 слов часто идут с опечатками. Просите короткие фразы крупным шрифтом.

Кириллица и нестандартные шрифты. Латиница отрисовывается стабильнее. Для надписей на русском и для декоративных шрифтов результат менее предсказуем — проверяйте каждую генерацию.

Руки, пальцы и несколько лиц. Как и большинство генераторов, GPT Image иногда путается со сложной анатомией — кистями рук, ступнями. Когда в кадре несколько лиц, они могут получаться неодинаково. При правке одного лица модель, наоборот, хорошо сохраняет черты, если вы явно не просите их менять.

Перегруженный промпт. Если запихнуть в один запрос 10 объектов, модель начнёт терять детали. Держите в кадре 3–5 ключевых элементов, остальное дорабатывайте итерациями в диалоге.

Ограничение по разрешению. Максимум — 1536×1024. Для веба и многих задач печати достаточно, но для большого формата придётся дополнительно апскейлить.

Как писать хорошие промпты для GPT Image

Стройте запрос по порядку: сцена и фон → главный объект → детали → ограничения.
Указывайте назначение картинки (реклама, обложка, макет интерфейса) — модель подстроит уровень проработки.
Для фотореализма используйте операторные термины: тип объектива, диафрагму, характер света — это работает надёжнее общих слов «красиво» и «качественно».
Точный текст для надписи берите в кавычки: надпись "SALE" крупным жирным шрифтом.
Для читаемого текста задавайте высокий контраст: «белый текст на тёмном фоне».

FAQ

GPT Image — это то же самое, что DALL-E? Нет. Это новое поколение, пришедшее на смену DALL-E. Архитектура другая: текст и картинка обрабатываются в одной нейросети, а не двумя отдельными инструментами. DALL-E 3 выведена из эксплуатации в марте 2026 года.

GPT Image — это платно? Через ChatGPT базовая генерация доступна, но продвинутые режимы — только на платных тарифах Plus и Pro от 20 $ в месяц. В API оплата идёт по токенам. Для знакомства без карты и без VPN проще воспользоваться Guru.AI с пробным доступом.

Можно ли редактировать своё фото в GPT Image? Да, у модели есть режим редактирования (Edits): загружаете картинку и описываете, что изменить, — целиком или по маске. При правке лица черты сохраняются, если вы явно не просите их менять.

Почему на картинке текст с ошибками? GPT Image рисует текст лучше предшественников, но не идеально. Мелкий шрифт, длинные абзацы, кириллица и декоративные шрифты — зоны риска. Пишите короткие фразы крупным контрастным шрифтом.

Работает ли GPT Image из России? Официально — с ограничениями: нужна иностранная карта, верификация аккаунта и, как правило, VPN. Как альтернатива без этих сложностей — генерация изображений нейросетью на Guru.AI, которая работает из России без VPN и с оплатой российской картой.

Какое максимальное разрешение у GPT Image? До 1536×1024 пикселей. Этого хватает для веба и многих задач печати, но для большого формата картинку придётся дополнительно увеличивать.

Итог

GPT Image — это заметный шаг вперёд по сравнению с DALL-E: единая мультимодальная архитектура, читаемый текст на картинках, понимание контекста диалога и полноценное редактирование фото. Слабые места тоже есть — мелкий текст, кириллица, сложная анатомия и ограничение по разрешению. Главная же практическая проблема для пользователя из России — доступ и оплата.

Если вам нужен именно результат, а не конкретная модель OpenAI, начать проще у нас: сгенерируйте изображение нейросетью или обработайте своё фото на Guru.AI — из России, без VPN, с оплатой российской картой и пробным доступом без карты.

GPT Image от OpenAI: обзор и возможности

Что такое GPT Image и откуда она взялась

Чем GPT Image отличается от DALL-E

Что умеет GPT Image

Сколько стоит GPT Image

Как пользоваться GPT Image: пошагово

Как работать с GPT Image из России

Частые ошибки при работе с GPT Image

Как писать хорошие промпты для GPT Image

FAQ

Итог

Попробуй нейрофотосессию прямо сейчас

Что такое GPT Image и откуда она взялась

Чем GPT Image отличается от DALL-E

Что умеет GPT Image

Сколько стоит GPT Image

Как пользоваться GPT Image: пошагово

Как работать с GPT Image из России

Частые ошибки при работе с GPT Image

Как писать хорошие промпты для GPT Image

FAQ

Итог