GPT Image — это семейство моделей OpenAI для генерации и редактирования картинок, которое в 2025 году пришло на смену линейке DALL-E. Именно эту нейросеть теперь используют, когда просят ChatGPT «нарисуй картинку»: она встроена прямо в диалог и понимает контекст переписки. В API она известна под именами gpt-image-1 и более новыми версиями. В этом обзоре разберём по порядку: что такое GPT Image, чем она отличается от DALL-E, что умеет, сколько стоит, как ей пользоваться из России и какие ошибки встречаются чаще всего.
Что такое GPT Image и откуда она взялась
GPT Image — это первая нативно мультимодальная модель OpenAI, которая принимает на вход и текст, и изображения, а на выходе выдаёт готовую картинку. Первая версия для разработчиков, gpt-image-1, вышла в API в апреле 2025 года. Тогда же генератор картинок в ChatGPT перевели с DALL-E 3 на новый движок, а в марте 2026 года DALL-E 3 окончательно вывели из эксплуатации.
Главное отличие от предшественников — в архитектуре. Раньше языковая модель просто передавала текстовый запрос отдельному «рисовальщику» (DALL-E), и они работали как два разных инструмента. GPT Image обрабатывает текст и изображение внутри одной нейросети. Из-за этого модель гораздо лучше понимает смысл запроса: учитывает контекст предыдущих сообщений, опирается на «знание мира» и точнее следует сложным многошаговым инструкциям.
За счёт этой архитектуры GPT Image заметно вырвалась вперёд по качеству. В слепом голосовании сообщества на площадке LM Arena модель заняла первое место, обойдя Midjourney, Flux и Stable Diffusion. Но у неё есть и свои слабые стороны — о них ниже.
Чем GPT Image отличается от DALL-E
Если коротко: GPT Image — это не «DALL-E 4», а принципиально другой подход. Ниже — ключевые различия.
| Параметр | DALL-E 3 | GPT Image |
|---|
| Архитектура | Отдельный генератор, языковая модель передаёт запрос | Единая мультимодальная нейросеть |
| Текст на картинке | Слабое место, часто с ошибками | Читаемый текст, подходит для инфографики и макетов |
| Понимание контекста | Каждый запрос отдельно | Учитывает предыдущие сообщения в диалоге |
| Редактирование фото | Ограниченное | Полноценное, включая частичную правку по маске |
| Ввод картинок | Нет | Принимает изображения как референс |
| Статус | Выведена из эксплуатации в марте 2026 | Актуальная модель |
Самое заметное улучшение — рендеринг текста. Раньше буквы на сгенерированных картинках почти всегда превращались в кашу. GPT Image умеет писать читаемые надписи прямо внутри изображения, что делает её пригодной для инфографики, обложек, макетов интерфейсов и товарных этикеток. Второе важное преимущество — способность принимать изображения на вход: можно загрузить фото и попросить его отредактировать или использовать как основу для новой сцены.
Что умеет GPT Image
Возможности модели выходят далеко за рамки «сгенерировать картинку по тексту». Вот основные сценарии.
| Что умеет | Как это выглядит на практике |
|---|
| Генерация с нуля | Создать изображение по текстовому описанию через эндпоинт Generations |
| Редактирование | Изменить загруженную картинку по новому промпту, целиком или по маске (эндпоинт Edits) |
| Текст на изображении | Отрисовать читаемые надписи — для инфографики, обложек, макетов |
| Работа с референсом | Принять фото на вход и опереться на него при генерации |
| Разные форматы | Квадрат 1024×1024, альбом 1536×1024, портрет 1024×1536 |
| Прозрачный фон | Сгенерировать PNG с прозрачностью — удобно для стикеров и логотипов |
| Гибкое качество | Три уровня: low, medium, high — компромисс между ценой и детализацией |
Модель поддерживает три размера кадра: квадрат (1024×1024), альбомную (1536×1024) и портретную (1024×1536) ориентацию. Через параметры API можно управлять форматом файла (PNG или JPEG), уровнем качества, прозрачностью фона и сжатием. Есть и параметр модерации: по умолчанию стоит строгий фильтр, но его можно смягчить.
Сколько стоит GPT Image
GPT Image в API тарифицируется по токенам, а не по фиксированной цене за картинку. Стоимость складывается из входного текста, входных изображений (если вы что-то редактируете) и сгенерированного изображения на выходе. Порядок цен на квадратную картинку 1024×1024 такой:
| Модель | Уровень | Ориентировочная цена за картинку |
|---|
| GPT Image 1 Mini | low | от 0,005 $ |
| GPT Image 1 | low–high | 0,011–0,25 $ |
| GPT Image 1.5 | low | от 0,009 $ |
Для сравнения: старый DALL-E 3 стоил около 0,04–0,08 $ за картинку по фиксированному тарифу. GPT Image в среднем дороже, особенно на высоком качестве, но и результат заметно лучше. Учитывайте, что редактирование с референсом дороже генерации с нуля — за счёт входных токенов изображения.
Как пользоваться GPT Image: пошагово
Есть два пути — через интерфейс ChatGPT и через API.
Через ChatGPT (для обычных задач):
- Откройте диалог с ChatGPT.
- Опишите картинку словами: сцену, объект, стиль, освещение. Например: «нарисуй уютную кофейню в скандинавском стиле, тёплый свет из окна, вид от барной стойки».
- Дождитесь результата (обычно 10–40 секунд).
- Уточните запрос в том же диалоге — модель помнит контекст: «сделай теплее», «добавь надпись COFFEE на вывеске», «поменяй ракурс».
- Скачайте готовое изображение.
Через API (для разработчиков):
- Создайте аккаунт OpenAI и пройдите верификацию организации.
- Получите API-ключ.
- Обратитесь к эндпоинту Generations (генерация) или Edits (редактирование), указав модель
gpt-image-1, промпт, размер и качество.
- Получите картинку в ответе и сохраните её.
Как работать с GPT Image из России
Здесь начинаются сложности. OpenAI официально не работает с пользователями из России: регистрация по российскому номеру заблокирована, оплата ChatGPT Plus и Pro российскими картами невозможна, а API-ключ нельзя получить без верифицированного аккаунта с привязанной иностранной картой. Продвинутые режимы GPT Image доступны только на платных тарифах от 20 $ в месяц.
Обходные пути есть, но каждый со своими минусами: зарубежная виртуальная карта, платёжные посредники с комиссией, сервисы-агрегаторы. Почти везде дополнительно нужен VPN — а это лишний слой нестабильности, оплаты и риска.
Если задача — просто получить качественную картинку по описанию или отредактировать фото, а не именно попробовать модель OpenAI, есть более простой путь. Guru.AI работает из России без VPN и без иностранной карты — на движке Nano Banana от Google, который по многим сценариям (редактирование фото, сохранение лиц, работа с референсом) даёт результат не хуже. Можно сгенерировать изображение нейросетью или обработать своё фото прямо в браузере, с оплатой российской картой и пробным доступом без карты для первого знакомства.
Частые ошибки при работе с GPT Image
Мелкий текст расплывается. Модель хорошо пишет крупные надписи, но текст меньше примерно 18 пунктов и абзацы длиннее 20–30 слов часто идут с опечатками. Просите короткие фразы крупным шрифтом.
Кириллица и нестандартные шрифты. Латиница отрисовывается стабильнее. Для надписей на русском и для декоративных шрифтов результат менее предсказуем — проверяйте каждую генерацию.
Руки, пальцы и несколько лиц. Как и большинство генераторов, GPT Image иногда путается со сложной анатомией — кистями рук, ступнями. Когда в кадре несколько лиц, они могут получаться неодинаково. При правке одного лица модель, наоборот, хорошо сохраняет черты, если вы явно не просите их менять.
Перегруженный промпт. Если запихнуть в один запрос 10 объектов, модель начнёт терять детали. Держите в кадре 3–5 ключевых элементов, остальное дорабатывайте итерациями в диалоге.
Ограничение по разрешению. Максимум — 1536×1024. Для веба и многих задач печати достаточно, но для большого формата придётся дополнительно апскейлить.
Как писать хорошие промпты для GPT Image
- Стройте запрос по порядку: сцена и фон → главный объект → детали → ограничения.
- Указывайте назначение картинки (реклама, обложка, макет интерфейса) — модель подстроит уровень проработки.
- Для фотореализма используйте операторные термины: тип объектива, диафрагму, характер света — это работает надёжнее общих слов «красиво» и «качественно».
- Точный текст для надписи берите в кавычки:
надпись "SALE" крупным жирным шрифтом.
- Для читаемого текста задавайте высокий контраст: «белый текст на тёмном фоне».
FAQ
GPT Image — это то же самое, что DALL-E?
Нет. Это новое поколение, пришедшее на смену DALL-E. Архитектура другая: текст и картинка обрабатываются в одной нейросети, а не двумя отдельными инструментами. DALL-E 3 выведена из эксплуатации в марте 2026 года.
GPT Image — это платно?
Через ChatGPT базовая генерация доступна, но продвинутые режимы — только на платных тарифах Plus и Pro от 20 $ в месяц. В API оплата идёт по токенам. Для знакомства без карты и без VPN проще воспользоваться Guru.AI с пробным доступом.
Можно ли редактировать своё фото в GPT Image?
Да, у модели есть режим редактирования (Edits): загружаете картинку и описываете, что изменить, — целиком или по маске. При правке лица черты сохраняются, если вы явно не просите их менять.
Почему на картинке текст с ошибками?
GPT Image рисует текст лучше предшественников, но не идеально. Мелкий шрифт, длинные абзацы, кириллица и декоративные шрифты — зоны риска. Пишите короткие фразы крупным контрастным шрифтом.
Работает ли GPT Image из России?
Официально — с ограничениями: нужна иностранная карта, верификация аккаунта и, как правило, VPN. Как альтернатива без этих сложностей — генерация изображений нейросетью на Guru.AI, которая работает из России без VPN и с оплатой российской картой.
Какое максимальное разрешение у GPT Image?
До 1536×1024 пикселей. Этого хватает для веба и многих задач печати, но для большого формата картинку придётся дополнительно увеличивать.
Итог
GPT Image — это заметный шаг вперёд по сравнению с DALL-E: единая мультимодальная архитектура, читаемый текст на картинках, понимание контекста диалога и полноценное редактирование фото. Слабые места тоже есть — мелкий текст, кириллица, сложная анатомия и ограничение по разрешению. Главная же практическая проблема для пользователя из России — доступ и оплата.
Если вам нужен именно результат, а не конкретная модель OpenAI, начать проще у нас: сгенерируйте изображение нейросетью или обработайте своё фото на Guru.AI — из России, без VPN, с оплатой российской картой и пробным доступом без карты.