Замена лица в Grok бесплатно: что реально работает в 2026 году
Короткий ответ: классического face swap «загрузи два фото и получи результат» в Grok нет. Grok Imagine рисует изображения по тексту и референсу, поэтому он умеет создать похожее лицо, но не гарантирует идентичность конкретного человека. Чтобы получить настоящую замену лица бесплатно, проще всего совместить два инструмента: Grok собирает сцену и образ, а Telegram-бот +Вайб или Bananogen вставляет в неё нужное лицо. Если Grok недоступен из-за блокировки в России, тот же результат закрывает Magic Hour, который работает прямо в браузере без VPN и регистрации.
Умеет ли Grok заменять лицо: честный ответ
Под «заменой лица» обычно подразумевают перенос конкретного лица с одного фото на другое: было лицо A в кадре, стало лицо B в той же позе и при том же свете. Это отдельный класс задач, его решают специализированные face swap модели, которые сначала находят ключевые точки лица, а затем сшивают донорскую текстуру с целевым кадром.
Grok Imagine устроен иначе. Это генератор картинок по описанию: вы пишете промпт, прикрепляете референс, и модель рисует новое изображение с нуля. Лицо при этом получается «по мотивам»: модель ловит общую геометрию, тип внешности, цвет волос, иногда форму глаз, но почти всегда сдвигает мелочи: разрез век, посадку ушей, рисунок губ. Один пользователь YouTube жалуется ровно на это: при генерации видео лицо человека «меняется до неузнаваемости». Это не баг и не плохой промпт, это устройство модели.
Отсюда правило для всей статьи. Если задача звучит как «хочу другое лицо в стилистике, похожее на этого человека», работайте в самом Grok. Если задача звучит как «нужно именно лицо моего друга на этом снимке», без специализированного face swap инструмента не обойтись.
Та же логика объясняет, почему ChatGPT с DALL-E плохо подходит для подмены лица. По обзору Habr, DALL-E имеет выраженный художественный почерк, добавляет «пластиковую» кожу и не сохраняет идентичность. Это не вопрос промпта: модель просто не обучена удерживать конкретного человека в кадре.
Что подготовить заранее
Большая часть провалов случается не на этапе генерации, а на этапе исходников. Хорошие фото вытягивают даже посредственный сервис, плохие убивают результат у самого продвинутого.
- Два фото: целевое (куда вставляем лицо) и донорское (чьё лицо берём).
- Разрешение каждого фото: от 800×800 пикселей. По данным Habr, ниже этого порога нейросеть теряет ключевые точки лица и начинает фантазировать.
- Формат: JPG или PNG, без сильной компрессии и постеризации.
- Ровный свет на лице. Без жёстких теней, перекрывающих половину носа, скулы или один глаз.
- Похожий ракурс. Анфас сшивается с анфасом, три четверти с тремя четвертями. Анфас + профиль почти всегда даёт швы.
- Аккаунт Grok: вход через X, Google, Apple или email. С российского IP сайт grok.com напрямую недоступен, потребуется VPN.
- Telegram (для +Вайб и Bananogen) или просто браузер (для Magic Hour) – без VPN.
Если выбора нет и единственное донорское фото снято при контровом свете, лучше потратить пять минут на ретушь и выровнять экспозицию по лицу, чем потом перебирать десятки неудачных генераций.
Способ 1: генерация лица в Grok Imagine с референсом
Этот сценарий подходит, когда нужен похожий человек: тот же типаж, цвет волос, общая внешность, но не обязательно идентичная личность. Чаще всего так делают аватарки, обложки, артовые портреты в заданной стилистике.
- Откройте grok.com и войдите через X, Google, Apple или email. С российского IP сначала включите VPN.
- Перейдите в раздел Imagine: его видно в левом меню или на главной. Если вы хотите править существующее изображение, в чате Grok доступна команда Edit Image, но она тоже работает через перерисовку, а не через face swap.
- Прикрепите референсное фото лица. Это ключевой момент: без визуального якоря модель будет придумывать черты сама.
- Напишите детальный промпт по формуле, разбор которой ниже в отдельной секции. Пишите на английском: модель уверенно работает с английским описанием, кириллицу на изображении не воспроизводит.
- Сгенерируйте 3–5 вариантов и выберите ближайший к нужному типажу.
- Уточняйте промпт итеративно. Меняйте за один шаг ровно один параметр: или свет, или ракурс, или возрастной маркер.
Про лимиты честно. Бесплатный Grok 3 доступен всем; по данным kod.ru, в нём заложен лимит порядка 10–20 видеороликов за 24 часа, а сами ролики ограничены 6 секундами и считаются за 15–20 секунд. Для статичных фото лимиты мягче, поэтому 5–7 итераций промпта в день укладываются в бесплатный тариф без проблем. Платный SuperGrok за $30 в месяц нужен только для тяжёлой нагрузки, для одной обложки он избыточен.
Прикрепляйте референсное фото даже там, где, кажется, можно описать внешность словами. По нашим наблюдениям, наличие визуального якоря в Grok Imagine поднимает шанс получить узнаваемый типаж в разы.
Способ 2: гибридный workflow Grok + Telegram-бот
Это и есть основной рабочий рецепт, ради которого стоит читать статью. Идея простая: Grok отвечает за всё, кроме лица, а специализированный бот занимается только лицом. Так вы используете каждую модель в её сильной зоне.
- В Grok Imagine соберите сцену: фон, одежду, позу, освещение. В промпте про лицо пишите минимум, разрешите модели нарисовать любое подходящее.
- Сохраните результат как целевое фото. Лучше брать вариант с нейтральным фоном и чётко видимым местом для лица: боту проще совмещать.
- Откройте бот +Вайб в Telegram и зайдите в раздел замены лица. Регистрация не нужна.
- Загрузите целевое фото из Grok и донорское фото с нужным лицом.
- Получите 4 варианта за одну попытку. По данным Habr, у +Вайб одна бесплатная генерация, без водяного знака и без обязательного аккаунта.
Альтернатива на тот же случай – Bananogen. Он работает в Telegram и MAX, движок под капотом – Nano Banana Pro. Регистрации нет, но логика другая: вы загружаете целевое фото и пишете промпт на английском, в котором явно указываете, что сохранить (фон, одежда, поза) и что заменить (лицо, его черты, цвет глаз, возрастные маркеры). После 3–5 генераций обычно появляется реалистичный кадр.
| Инструмент | Регистрация | Водяной знак | Бесплатные попытки | Сильная сторона |
|---|---|---|---|---|
| Grok Imagine | Да, через X/Google/Apple/email | Нет | Лимит 10–20 видео/сутки; для фото мягче | Сцена, образ, стиль |
| +Вайб (Telegram) | Нет | Нет | 1 попытка, 4 варианта в выдаче | Классический face swap по двум фото |
| Bananogen (Telegram/MAX) | Нет | Нет | Несколько попыток на промпт | Face swap по фото + промпту |
| Magic Hour | Нет | Нет | Несколько попыток подряд | Запасной вариант без VPN |
Выбор между +Вайб и Bananogen чаще всего сводится к привычке. Если удобнее «два фото и кнопка», берите +Вайб. Если хочется тонко рулить тем, что именно меняется (например, оставить очки и серьги, заменить только лицо), удобнее Bananogen с текстовым промптом.
Способ 3: Magic Hour, когда Grok недоступен
Если VPN под рукой нет, а Telegram-бот по какой-то причине не подходит, открывайте Magic Hour. Сервис делает face swap прямо в браузере и не требует регистрации.
- Перейдите на magichour.ai/products/face-swap.
- Загрузите целевое фото в верхний слот и донорское – в нижний.
- Нажмите Swap Faces. По данным самого сервиса, результат готов за секунды.
- Скачайте файл. Водяного знака нет, поддерживаются фото, видео и GIF.
Что у Magic Hour реально хорошо: автоматическое выравнивание и смешение лиц. По заявлению сервиса, это сокращает ручную доработку на 70–90% – проверять каждый кадр и выравнивать тон вручную не приходится. На практике это значит, что неудачный результат чаще связан с исходниками, чем с самим алгоритмом.
Промпт для Grok, после которого лицо перестаёт «гулять»
Главная боль Grok Imagine – «модель нарисовала другого человека». В большинстве случаев виноват не сервис, а слишком общий промпт. Чем больше параметров вы оставляете на усмотрение модели, тем шире её свобода и тем дальше она уходит от референса.
Рабочая формула выглядит так: объект + черты лица + свет + ракурс + тон кожи + стиль + ограничения. Это расширение базовой формулы из обзора Klerk («объект + сцена + стиль + свет + композиция + детали + ограничения»), адаптированное под задачу удержать лицо.
Пример рабочего промпта на английском: Portrait of a woman in her early thirties, oval face, high cheekbones, hazel eyes, slightly arched brows, warm olive skin, soft side light from camera left, three-quarter angle, photorealistic editorial style, preserve facial identity, no plastic skin, no artifacts, preserve eye color, preserve facial structure. Дальше прикрепляете референс и запускаете 3–5 генераций.
- Не смешивайте конфликтующие стили в одном запросе. По обзору Klerk, модель не вытягивает «акварель + киберпанк + студийное фото» одновременно: она усредняет всё до невнятного результата.
- Меняйте промпт по одному параметру за раз. Поменяли свет – оценили. Потом ракурс – оценили. Иначе вы не поймёте, какое слово в действительности улучшило кадр.
- Не пытайтесь получить кириллическую надпись на изображении. Grok распознаёт кириллицу в промпте, но конкретный русский текст на картинке не воспроизводит – это известное ограничение модели, описанное на vc.ru.
- Добавляйте негативные ограничения отдельным блоком: «no plastic skin, no artifacts, preserve eye color». Это самый дешёвый способ снизить «силиконовость» лица.
Типичные ошибки и как их обойти
Лицо плывёт от кадра к кадру
Механика проста. Алгоритмы face swap работают через детекцию ключевых точек: уголки глаз, крылья носа, контур губ, линия челюсти. Если на исходнике освещение жёсткое и половина точек скрыта в тени, детектор берёт лишь часть, а недостающее «достраивает» на лету. Так появляется чужой подбородок и сдвинутые скулы. Лечится не промптом, а исходным фото с ровным светом и видимыми обоими глазами.
Меняется цвет глаз
Модели генерации усредняют редкие признаки в сторону частотных: серо-зелёные глаза в тренировочных данных встречаются реже карих, поэтому без явного указания модель «съедет» в карий. Прямой фикс: вписывайте конкретный цвет в промпт и добавляйте preserve eye color в ограничения.
Результат выглядит пластиково
Это типичный почерк DALL-E, но и Grok иногда уходит в ту же сторону, если в промпте слишком много слов вроде «glossy», «cinematic», «hyperreal». Уберите их и оставьте photorealistic, natural skin texture, no plastic skin. На face swap уровне Magic Hour и +Вайб таких артефактов почти нет: они не перерисовывают лицо, а вшивают донорскую текстуру.
Швы и неестественные тени
Возникают, когда донорское и целевое фото сняты при разном свете или с разных углов. Алгоритм пытается сшить два разных трёхмерных пространства, и на стыке получается видимая граница. Подберите донорское фото под ракурс целевого: анфас под анфас, три четверти под три четверти, контровый свет под контровый.
Не получилось с первого раза
Это норма, а не повод бросать. Постфактумный анализ обзоров на postium.ru показывает: реалистичные кадры выходят на 3–5 итерации, не на первой. Первая генерация – это не финал, а проверка того, что модель в принципе поняла задачу.
Этика и закон: что важно держать в голове
Face swap и генерация лица – дешёвая технология, но дешёвая ответственность к ней не прилагается. Любой deepfake без согласия человека, на котором держится узнаваемый образ, в большинстве юрисдикций трактуется как нарушение прав на изображение, а в части случаев – как клевета или мошенничество. Редакция kod.ru напрямую рекомендует помнить о действующем законодательстве страны пользователя при создании подобного контента.
Со стороны самого Grok тоже есть рычаг. По данным vc.ru, в настройках приватности любой пользователь может запретить использование своих постов и загруженных материалов для обучения модели. Если вы не хотите, чтобы ваши тестовые фото уходили в обучающий датасет, эту галочку лучше снять заранее, до первой загрузки.
И последнее. Если вы делаете face swap для шутки, подарка или собственной аватарки – это одно. Если вы публикуете чужое лицо в коммерческом контексте без согласия – вы рискуете не нейросетью, а вполне обычным иском. Технология удобная, ответственность всё та же.
ну да, формула рабочая, я в +Вайб за вечер прогнал 47 кадров под одну обложку, и где-то 9 вышли годными, остальное мусор по свету. Grok сцену собрал нормально, лицо реально гуляет, это не лечится промптом, только донорским фото с фронтальным светом.
звучит как пресс-релиз честно. где замеры по 9 годных из 47, и почему это считается нормой
обе стороны по своему правы, +Вайб даёт стабильный шов когда ракурс совпал, иначе тоже плывёт
+
@Misaya потому что любая бесплатная попытка на face swap это лотерея, у Magic Hour у меня вообще из 23 кадров 4 без шва, остальные править руками
я только начал щупать grok, расскажите пжл, реально надо vpn для grok.com из рф?
плюсую вопрос
да, без vpn не пускает
@Quackity 4 из 23 это всё, на чём держится твой аргумент? я в Bananogen за 6 итераций получил один кадр без артефактов, и это не повод хвалить инструмент
@Misaya никто и не хвалит, я говорю что бот делает работу за которую Grok вообще не берётся. Grok рисует похожее лицо, не то же самое, в статье ровно про это написано
короче, я просто для аватарки делал в grok imagine, прикрепил фото бабушки в молодости (длинная история), получилось похоже но не она
ну такое
@Devon это и есть кейс №1 из статьи, для аватарки этого хватает. Если нужен именно человек, то только face swap снаружи Grok
а Magic Hour реально бесплатный или там лимиты как у всех
там не лимит по кадрам, а очередь, в час пик ждёшь минут 8
по моим логам очередь поднималась до 11 минут пару раз в выходные, в будни обычно секунд 40
хз, у меня с первого раза прошло
и при этом ты делаешь вывод по своему чайнику что magic hour стабильнее +Вайб? у +Вайб одна попытка, его невозможно нормально оценить за один раз
@Misaya одна попытка даёт 4 варианта в выдаче, это не одна генерация. Я выбирал из 4 в каждом из 5 повторных запусков, выборка не дикая но достаточно
слушайте, а если донорское фото в профиль, а целевое анфас, реально ничего не вытащить?
почти. шов будет на виске и на ухе, ловится сразу
у меня кстати с разрешением 720 на 720 в magic hour прокатило, в статье пишут от 800, но видимо не жёсткий порог
это про детектор точек лица, на 720 он часть теряет, у тебя просто повезло с углом
+
коллеги, кто пробовал DALL-E последний раз? я в обед читаю, может уже не пластиково
пластиково. я гонял в апреле, кожа всё та же
почерк DALL-E не лечится промптом, это в самой архитектуре
согласен
@Quackity апрель это апрель, модель апдейтят, твой опыт уже не аргумент
@Misaya возможно. но я каждые 3 недели гоняю один и тот же контрольный референс через все три, не вижу с чего DALL-E внезапно научится держать идентичность, это другой класс модели
а supergrok за 30 баксов оно хоть кому-то надо? я для одной обложки точно не возьму
не бери. бесплатного 3 хватает с головой, у меня 5-7 итераций промпта в день и ни разу не упёрся в лимит
плюсую, на бесплатном норм
у меня в проекте на 40k строк никакой grok вообще не нужен (это к слову не к теме), просто к вопросу, не каждому нужен платник
видео в grok 6 секунд, на бесплатном 10-20 в сутки. если делаешь даже простой ролик, лимит ловится за час
это про видео, а статья про фото. в статье ровно это и сказано, для фото лимиты мягче
тогда заголовок "что реально работает" вводит в заблуждение. видео там работает плохо, а фото только в гибридной связке с ботом, который не часть grok
формально ты прав, но и заголовок ничего не обещает кроме связки
@Misaya а я нигде не сказал что один grok решает задачу, я с первого коммента про гибрид говорю
ребят а Nano Banana Pro это под капотом у Bananogen? я думала это разные сервисы
в статье так написано, не проверял
по моим тестам Bananogen ведёт себя именно как Nano Banana Pro, та же манера держать фон и съезжать на возрасте
звучит мутно
tldr, скипнул половину, кто-нибудь по-короче, +Вайб или Magic Hour для аватарки в тг?
Magic Hour. без vpn, без регистрации, и ракурс под аватарку обычно фронт, то есть и сшивается лучше
magic hour стабильно режет шею тенью если донор снят с верхним светом, проверял на 14 кадрах подряд
у меня этого не было ни разу за последние недели, мы про разные исходники говорим
вот именно. поэтому твоё "стабильнее" это твои исходники, не свойство сервиса
погодите, а кто-нибудь пробовал тот, как же её, ну там еще модель была для face swap, вылетело из головы, она в дискорде сидела
InsightFace? или ты про что-то поновее
может и она, не подскажу
а в Bananogen реально можно сказать оставь очки и серьги? у меня всегда одно тащит другое
можно, но порядок слов имеет значение, сначала preserve, потом replace. иначе модель путает что куда
имхо все эти промпт формулы это шаманство, у меня вообще одинаковый промпт даёт разный результат через сутки
+
это потому что у grok нет фиксированного seed на бесплатном, два одинаковых запроса дадут две разные картинки, это не баг это устройство
@Misaya вот тут согласен, без seed никакая воспроизводимость не работает
значит про итерации в статье корректно, но одинаковый промпт = одинаковый кадр не получится никогда
и кстати про обучение, в настройках x галочку про использование загрузок для тренинга мало кто снимает, а статья это упоминает мимоходом
там в начале писали уже про приватность, всё верно, я снял её сразу как сделал аккаунт
а если мне надо лицо моей мамы вставить в портрет в стиле акварель, лучше +Вайб или Magic Hour?
ни то ни другое для акварели, оба сшивают фотореализм. сначала собери акварельный портрет в Grok с любым лицом, потом face swap на исходник в фото-режиме, а потом обратно прогоняй через стиль. шов будет, но это самый чистый путь
три прогона ради одной картинки, это всё ещё бесплатно?
погодите, а как тогда сохраняется идентичность лица если мы прогоняем через стиль второй раз?