Как пользоваться нейросетью Different Dimension Me?
В китайском мессенджере QQ добавили нейросеть Different Dimension Me, превращающую портреты людей и фотографии кукол в красивые аниме аватарки.
Хочу поделиться личным опытом использования нейронной сети и пошаговой инструкцией, которая поможет вам запустить DDM с помощью браузера на ПК или смартфоне. Приятного просмотра!
Как сделать аниме аватарку с помощью нейросети Different Dimension Me?
- Откройте сайт нейросети Different Dimension Me в новой вкладке браузера (подойдёт любой, но я рекомендую пользоваться Firefox или Google Chrome);
- Примите пользовательское соглашение. Если оно не появилось, сразу переходите к следующему шагу;
- Если используете ПК, промотайте страницу вниз, пока не появится большая градиентная кнопка со скруглёнными краями. Нажмите на неё, чтобы запустить экранную заставку с портретом милой китайской леди. Под фотографией девушки находится ещё одна кнопка. Кликнув по ней, вы откроете меню выбора фотографий;
- Чтобы создать аниме аву на смартфоне, вам понадобится меньше действий — по сравнению с ПК, в браузере не съехала вёрстка и кнопки находятся сразу под картинками;
- Подождите, пока нейросеть Me In Comics генерирует изображение. Если создать аватарку не удалось и появилась ошибка (небольшое текстовое окно на китайском языке), попробуйте перезагрузить страницу, ещё раз добавить снимок или заменить фотографию. Чтобы уменьшить количество сбоев, рекомендую обрезать портреты, использовать качественные селфи или удалять лишние детали перед заливкой фото;
- Перезапустите нейронную сеть H5 QQ несколько раз, чтобы получить оптимальный результат. Нейросеть не всегда создаёт качественные изображения с первой попытки, поэтому стоит сделать как минимум три запуска;
- Чтобы открыть и сохранить аватарку, созданную в Different Dimension Me, нажмите на левую кнопку под сгенерированным изображением. С помощью правой кнопки под картинкой сохраняется анимированное видео, демонстрирующее фото до и после обработки в нейросети. Однако сохранение видео работает не у всех пользователей, поэтому рекомендую проигнорировать эту опцию, либо использовать веб-консоль, позволяющую сохранять любые доступные медиафайлы (подробности написал в конце списка);
- Если в нейросети Different Dimension Me не появилась кнопка для скачивания аниме аватарки (чаще всего это случается на ПК), есть два способа сохранить картинку — найти область, где должна находиться «невидимая кнопка», либо вызвать веб-консоль. В первом случае вам необходимо нажать на пустое пространство под картинкой, постепенно перемещаясь вниз и влево. Активная «зона клика» находится примерно здесь (выделена маленьким алым прямоугольником):
- Чтобы вызвать веб-консоль для сохранения готового изображения в QQ Small World, нажмите F12 в Google Chrome или Ctrl+Shift+K в Firefox. После вызова консоли в Chrome появится исчезнувшая кнопка, а в Firefox — список ссылок для скачивания медиа. На мой взгляд, в браузере Firefox будет проще добыть не только арты, но и видео, поэтому рекомендую начинать с него.
Скриншоты, демонстрирующие консоль в браузерах Google Chrome и Firefox:
Поддельные сайты Different Dimension Me
У Different Dimension Me есть только один официальный сайт, нет отдельных приложений размером от 4 до 20 МБ, "англоязычных" или "русскоязычных" версий! Все остальные сайты, с которыми вы столкнётесь - подделки, решившие воспользоваться хайпом вокруг темы, которые могут не соответствовать ожиданиям, либо угрожать безопасности ваших данных.
Остерегайтесь их и использйте надёжные альтернативы!
Как распознать поддельную нейросеть QQ?
- Она опубликована не на домене h5.tu.qq.com;
- Нет заставки, либо она полностью отличается от базовой;
- Примеры изображений выглядят иначе. Нейросеть создаёт картинки с уникальным стилем, поэтому всё, что сильно отличается — очевидная подделка;
- Есть описание, содержащее SEO-ориентированный текст. Например, имитаторы могут одновременно упоминать Different Dimension Me, Different Diffusion, AnimeGan, чтобы увеличить охват сайта или приложения;
- Ворованный контент. Если вы обнаружите картинки из моей статьи на странице нейросети — это гарантированная фальшивка. Я не разрешал использовать изображения в чужих проектах, включая разработчиков из Tencent;
- Отличается процесс обработки фото. Если нейросеть предлагает вам меню с выбором параметров перед превращением в арт — вероятнее всего, она базируется на AnimeGan или Stable Diffusion, но никак не на DDM;
- Кадрирование в соотношении 1:1. Нейросеть QQ создаёт несколько вариантов артов, но не делает квадратную обрезку;
- Плохое качество готовых изображений. Если стиль, детализация и общее качество обработанных фото намного ниже, чем примеры, продемонстрированные на этой странице, — вы 100% столкнулись с подделкой под нейросеть QQ Small World.
Пример фальшивого сайта, предлагающего скачать приложение нейросети Different Dimension Me для Android. Обратите внимание, что липовая версия использует ворованную картинку с моего сайта, демонстрирующую работу другой нейросети - Anything v3:
Что делать, если нейросеть Different Dimension Me не работает?
Во-первых, попробуйте перезагрузить страницу. На ПК это можно сделать с помощью F5, Ctrl+R или Cmd+R, на смартфоне — нажав кнопку обновления (перезагрузки) в верхней части браузера.
Если нейросеть Different Dimension Me запускается, но прерывает генерацию, скорее всего, она не работает из-за повышенной нагрузки, либо доступ к проекту заблокирован разработчиками.
Чтобы вернуться к созданию аниме аватарки, в обычных условиях достаточно немного подождать, затем заново загрузить фотографию. При пиковой нагрузке генерация может прерываться несколько раз подряд, поэтому вам потребуется больше времени, чтобы сформировать изображение.
Если доступ к нейросети Me In Comics был заблокирован разработчиками, вам понадобится использовать один из азиатских VPN (например, с японскими IP-адресами).
Во-вторых, внимательно изучите, какие предупреждения появились на странице нейросети.
Ошибка 502 означает, что сервер не может принять ваш запрос. Например, если нагрузка превысила допустимую или он недоступен по техническим причинам (из-за сбоя, неудачного обновления, бага конфигурации).
Ошибка 404 появляется, если страница нейросети QQ временно недоступна, удалена или перенесена на другой адрес без добавления перенаправления.
После появления ошибок 404 и 502 достаточно подождать от 15-20 минут до 1 часа. Как правило, за это время разработчики успевают исправить баги и восстановить доступ к сервису.
Исключением может стать удаление нейросети из общего доступа. В таком случае может выдаваться ошибка 410 («Содержимое удалено») или демонстрироваться соответствующее уведомление.
Ошибка ERR_CONNECTION_TIMED_OUT («Время ожидания соединения истекло») появляется, если у вас слишком низкая скорость подключения к нейросети QQ Small World, либо есть проблемы в настройках соединения, VPN или прокси-сервера.
В большинстве случаев неполадка возникает из-за слишком медленного или отсутствующего подключения к веб-ресурсам. Например, если изменить параметры сети в браузере, добавив нерабочий прокси-сервер, подобная ошибка будет наблюдаться на любых сайтах, а не только на странице нейросети.
Чтобы исправить ошибку «Время ожидания соединения истекло» на странице нейросети, проверьте соединение (включая интернет-адаптер и роутер), отключите или перенастройте VPN, прокси-сервер, верните настройки сети в браузере к параметрам по умолчанию и отключите расширения, использующие прокси.
Не обязательно делать всё это одновременно. Если вы недавно включили VPN, лучше начать с него. Проверяйте все вероятности поочерёдно, чтобы быстро найти источник проблем.
Если с настройками всё в порядке и сбой возникает исключительно на сайте нейросети, он может быть недоступен или перегружен запросами. В таком случае достаточно немного подождать и обновить страницу, чтобы вернуться к созданию аниме аватарки.
Если в Different Dimension Me выдаётся ошибка Error: No detected faces (на фотографии не обнаружено лицо), либо User face not detected, please try another image (лицо пользователя не обнаружено, пожалуйста, попробуйте другое изображение), загрузите в нейронную сеть ещё один снимок.
Вероятнее всего, нейросеть QQ выдала ошибку, не сумев распознать ваше лицо из-за угла съёмки или посторонних предметов, перекрывающих обзор. Рекомендую использовать портретные кадры, снятые крупным планом анфас и в профиль на нейтральном фоне, чтобы уменьшить вероятность сбоя.
Окно с предупреждением Service is being upgraded, please come back later (сервис обновляется, пожалуйста, зайдите позже) возникает, когда разработчики добавляют новые возможности, модернизируют нейросеть, либо блокируют доступ для пользователей из других стран.
Предупреждение Service upgrade, temporarily unavailable (сервис обновляется, временно недоступен) действует аналогичным образом:
Обновление может длиться от пары часов до нескольких дней, блокировка — бесконечно.
Релиз новой версии не произошёл спустя 5-7 дней? Попробуйте зайти на страницу нейросети Me In Comics с помощью японских или корейских VPN. Например, VPN Gate.
Если доступ к нейросети для пользователей из России заблокирован в Китае, смена IP-адреса поможет разблокировать QQ World AI Painter. Этот способ поможет вам генерировать аниме аватарки без использования других площадок, но только в том случае, если причина в блокировке, а не в обновлении нейронной сети.
Если после включения VPN не загружаются готовые картинки, вам нужно выключить VPN и немного подождать, пока арт не отобразится. После этого изображение можно скачивать.
Перед заливкой нового снимка снова включите VPN.
Помимо этого, вы можете использовать альтернативные нейросети или Telegram-ботов, создающих арты в стиле H5 TU QQ.
Альтернативы нейросети Different Dimension Me
Сначала я расскажу про онлайн альтернативы DDM, затем перейду к нейросетям и приложениям, требующим установку на ПК или смартфон.
Artbreeder. Бесплатно позволяет создать лишь 3 аватарки из ваших изображений. Количество "бесплатных артов по фото" сбрасывается каждый месяц.
Если вы не хотите долго ждать, помните, что вы можете сделать больше аватарок во встроенном редакторе, генерирующем портреты с помощью базовых моделей нейросети, фотографий и работ других пользователей, либо оплатив подписку.
Про возможности Артбридер я рассказывал в 2020 году. С тех пор несколько раз поменялось оформление редактора, но основные функции остались прежними.
Создание портретов в Artbreeder делится на два этапа:
- Выбор типа создаваемого арта (на основе фото или с нуля);
- Доработка арта с помощью визуального редактора.
Чтобы сделать портрет из фото, сначала нужно залить снимок в Artbreeder.
Для заливки изображения нажмите на иконку с плюсом, находящуюся рядом с вашим профилем в правом углу экрана, затем на кнопку с иконкой ДНК — splicer (classic). Перед вами появится всплывающее окно с двумя вариантами создаваемых нейросетевых артов и четырьмя опциями над ними — Image, Upload, Video, Gene.
Нажмите на Upload, затем Portraits. Перед вами появится раздел с двумя окнами, выделенными пунктирной линией, — Upload (с его помощью вам нужно будет залить фото) и All Uploads (в нём будут храниться все залитые вами изображения).
Кликнув по Upload, укажите снимок, который хотите использовать в качестве исходника, затем подождите, пока он появится на странице нейросети. В зависимости от времени суток картинка может добавиься моментально, либо вам понадобится подождать в очереди на загрузку. Очередь может состоять как из пары пользователей, так и из 40-50 человек.
Как только загрузка завершится, нажмите на кнопку Remix рядом с изображением.
В этом разделе находится модифицированный «Редактор генов», позволяющий изменить внешний вид создаваемой аватарки. Модифицировать можно одежду, цвет и длину волос, цвет глаз, выражение лица, эмоции, яркость, насыщенность, резкость, цвет, расу, размер и поворот головы, пол и возраст.
Каждый параметр регулируется ползунком. Чем сильнее вы сдвините его вправо или влево, тем больше изменится начальное изображение.
Небольшие изменения влево-вправо больше влияют на цвет, выражение лица, добавление или уменьшение морщин, а также другие небольшие детали.
Отдельно стоит упомянуть параметр Chaos. Минимальное значение приведёт вас к одной из базовых моделей нейросети Artbreeder, максимальное — хардкорно усилит все задействованные параметры. Рекомендую использовать его с осторожностью, чтобы не ухудшить картинку.
Помимо базовых настроек, вы можете "заимствовать гены" у другой модели, выложенной в Artbreeder, либо выбрать "родителя", с которым хотите скрестить изображение. Рекомендую второй вариант.
Во-первых, изображения можно заимствовать у любых пользователей, опубликовавших свои работы в нейросети.
Во-вторых, вы можете скрестить снимок с другими артами или фотографиями, которые создадите своими руками!
Таким образом, простор для экспериментов будет больше, а готовые аватарки — оригинальнее.
Визуально редактор немного изменился, но основные настройки выглядят примерно так же, как и в моей старой публикации. Можете изучить её, если не можете разобраться со скрещиванием аватарок.
Artbreeder может создавать как реалистичные, так и художественные аватарки, больше похожие на концепты или аниме. Для усиления «эффекта рисунка» можно использовать параметр Art в разделе Color:
Если вы хотите с нуля создать аниме аватарку в Artbreeder, нажмите на иконку с плюсом, Splicer (classic), затем Anime portraits.
На мой взгляд, генератор аниме заметно уступает генератору портретов по количеству настроек и качеству создаваемых артов.
Вторая (и очень крутая!) замена нейросети Different Dimension Me — Novel AI.
Novel AI позволяет генерировать истории, а также создавать арты на основе текстовых запросов. Это одна из самых известных и продвинутых моделей, создающих аватарки в стиле аниме на момент написания статьи.
Созданные в Novel AI арты выглядят прекрасно и спокойно могут конкурировать с картинками, сгенерированными в нейросети QQ:
К сожалению, с помощью веб-версии создавать аватарки бесплатно не получится — минимальная стоимость доступа к генератору изображений начинается от 10 долларов в месяц:
Третий вариант на замену Different Dimension Me — Waifu Labs.
Ключевая особенность сервиса — создание рандомных аниме аватарок. Вы не можете загрузить свои фото, а лишь влияете на отдельные параметры персонажей — цвет волос, детали лица, позы. Всё это выбирается простым нажатием на наиболее понравившийся вариант изображения.
Подробнее о Waifu Labs можно прочитать в этой статье.
Теперь расскажу про оффлайн нейросети и приложения, которые могут заменить Different Dimension Me.
Лучше всего с генерацией аниме аватарок справляются Anything v3, Waifu Diffusion и пиратская версия Novel AI.
Обязательно скачивайте как сами модели, так и файлы VAE для них! Генерация без использования вариационного автоэнкодера (Variational Autoencoder) заметно ухудшает качество финальных изображений.
Самый простой способ установить Anything v3, Waifu Diffusion и Novel AI — скачать дистрибутив NMKD и добавить сохранённые ранее нейросети в папку models. Учитывайте, что установленные нейросети предназначены для генерации картинок на основе текстовых подсказок и не будут работать адекватно, если у вас нет мощной видеокарты.
Чтобы облегчить вам задачу, я написал инструкцию по добавлению моделей на ПК с операционной системой Windows 10.
Рекомендую начать с Anything v3.
Эта модель нейросети не только отлично создаёт аниме арты по текстовому описанию, но и прекрасно подходит для преобразования фото в аниме.
Как создать аниме арт из фото с помощью Anything v3, Novel AI или Waifu Diffusion?
- Перенесите скачанные модели нейросетей в папку model. В model создайте папку VAE и скопируйте в неё все вариационные автоэнкодеры;
- Запустите NMKD;
- Зайдите в настройки;
- Укажите путь к моделям нейросетей и файлам VAE;
- Добавьте в разделе Stable Diffusion Model ту модель, которую хотите использовать;
- Аналогично подгрузите файл VAE. Учитывайте, что они должны быть из одного набора. Например, novelai и novelaivae;
- Заполните текстовую подсказку и негативную текстовую подсказку. Первая необходима, чтобы подсказать нейросети, как и что именно вы хотите создать, вторая — для исключения нежелательных элементов. Например, удвоенных голов и лишних конечностей;
- Настройте остальные параметры нейросети — тип сэмплера, разрешение аватарки, количество шагов, необходимых для генерации артов, «креативность» нейросети (CFC Scale), количество изображений в серии. Рекомендую использовать сэмплеры PLMS, DDIM, DPM++2 Ancestral, CFG 7,5 — 9,5, 30-80 шагов. Если используете вертикальные фотографии, измените разрешение на 576×832 пикселей или любое похожее соотношение, чтобы избежать искажения пропорций тел и лиц;
- Чтобы подсказать нейросети, насколько похожим на исходник должен быть готовый арт, используйте ползунок напротив Initialization image strenght (influence). Чем ближе к 0,1, тем сильнее будет разница, чем ближе к 1, тем больше арт будет похож на оригинал. По моему опыту, пограничные значения вносят больше искажений, поэтому лучше использовать диапазон от 0,2 до 0,6;
- Включите в настройках постобработки восстановление лиц, чтобы улучшить качество создаваемых аватарок. Сначала активируйте CodeFormer и поставьте галочку напротив надписи «Запускать восстановление лиц для каждого генерируемого изображения» (run face restoration for every generated image), затем сместите на 0 ползунки в дополнительных настройках. Если лица генерируются с артефактами, попробуйте изменить параметр CodeFormer Fidelity на 0,2-0,4;
- Запустите создание аватарок, нажав кнопку Generate.
Все перечисленные мной модели работают быстрее, если создавать арты с нуля, не используя исходники. Если вам принципиальна скорость, а не то, чьё лицо будет на аватарке, шаг с добавлением фотографий можно пропустить.
На мой взгляд, среди всех упомянутых мной нейросетей самые красивые картинки получаются в Anything v3. Причём они выглядят намного интересней, чем арты в Different Dimension Me:
На смартфонах вместо QQ Small World можно использовать Meitu AI Art. Однако для использования нейросети понадобится устанавливать приложение, да и качество готовых изображений будет намного ниже.
Боты в Telegram, использующие Different Dimension Me
После взрывного роста популярности Different Dimension Me в Telegram появились боты, использующие API нейросети или имитирующие её стиль. Учитывайте, что все перечисленные ниже боты не имеют никакого отношения к компании, разработавшей H5 TU QQ, и могут иметь проблемы с конфиденциальностью:
- Anime AI 2D. Создаёт две картинки — превью с разрешением 999×752 пикселей и аватарку с разрешением 1158×740 пикселей. Работает медленней следующего бота, зато сразу обрезает всё лишнее. Главные плюсы — два изображения вместо одного и возможность сразу опубликовать арты в соцсетях, не затрачивая время на обрезку картинок;
- Anime AI. Генерирует стандартный постер, сравнивающий исходник и готовый арт. Размер и вид обложки совпадает с работами, сформированными в веб-версии Different Dimension Me;
Anime AI! — Telegram-бот нейросети Me In Comics, бесплатно и без подписки превращающий фото в аниме арт. Создаёт два изображения — стандартный коллаж с QR-кодом и информацией о нейросети, а также отдельную картинку в высоком разрешении:
Минус третьего бота - навязчивая реклама, появляющаяся во время простоя. Рекомендую останавливать бота после использования, удалять чат или отключать уведомления, чтобы не засорять ленту мусором.
В Telegram есть и другие боты, позволяющие создавать аниме аватарки в стиле нейросети QQ, но лично мне они не понравились. Если хотите, попробуйте найти их самостоятельно, вбив название нейросети в мессенджере.
Есть две причины, почему я их не добавил. Первая - боты требуют подписки на каналы авторов. Вторая - излишнее количество низкосортного юмора, которое выглядит неуместно и лишь отвлекает, а не помогает пользователям.
По сравнению с оригинальной нейросетью, у всех имитаций DDM есть три крупных недостатка:
- Они могут создавать аватарки исключительно на основе портретных снимков. Никаких вам аниме котиков или пейзажей, только селфи и хардкор;
- Боты плохо определяют лица. Это сказывается не на качестве генерации (с ним как раз всё нормально), а на том, что преобразование фото в арт может вообще не начаться;
- Практически не воспринимает арты и картинки из других нейросетей. Половина попыток перерисовать свои скетчи закончилась уведомлением об ошибке.
Для справки - модифицированные рисунки получаются настолько же хорошо, как и в оригинальной нейросети, но процент успешных запусков удручает.
Что делать, если боты не работают или выдают ошибку?
Если бот Different Dimension Me зависает и не отвечает, введите /start и нажмите на кнопку ввода (Enter на ПК или «Отправить» на смартфоне). С помощью этого действия вы перезапустите бота.
Альтернативный способ перезагрузить Telegram-бота на ПК - выделить иконку в меню каналов правой кнопкой мыши, затем последовательно нажать "Остановить и блокировать" во всплывающем меню и "Перезапустить" в чате. Этот вариант может помочь, если нейросеть не реагирует на загруженные изображения после ввода команды /start.
После перезапуска подождите, пока бот предложит добавить снимок. Отправьте фотографию и скачайте готовый результат.
Если бот QQ Small World выдаёт сообщение «»Сервис перегружен и временно не отвечает», нужно будет подождать, пока нагрузка не уменьшится. В зависимости от популярности бота это может быть как 5-10 секунд, так и несколько минут.
Ожидание не помогло? Есть вероятность, что в работе бота произошла критическая ошибка, либо на сервере нейросети в Китае ведутся технические работы и вывод подходящего информационного сообщения не был предусмотрен разработчиком.
Ошибка «Error: No detected faces!», «На фотографии не обнаружено лицо» выдаётся, если бот не смог распознать ваше лицо. В таком случае стоит выбрать другой снимок, чтобы создать аниме арт.
Список критических ошибок, обозначающих, что бот не будет работать в ближайшее время:
- AUTH_FAILED
- Error: {«code»:-2111,»msg»:»AUTH_FAILED»}
- Service codec Unmarshal: json: cannot unmarshal object into Go value of type string
- Китайский сервер умер
- Сервер заблокирован
- Сервис находится на переработке
- Технические работы на китайском сервере
- Сервер недоступен
После таких уведомлений можно не отправлять фотографии. Будьте готовы к долгому ожиданию, которое может затянуться от нескольких часов до пары дней.
Автор первого бота в моей подборке восстановил его работу примерно за 5 часов. Ориентируйтесь на это время, если видите подобные ошибки. Максимальное время может быть больше, если разработчик не мониторит состояние бота или не может исправить баг из-за проблем со стороны китайского сервера.
Причины критических ошибок могут быть разными:
- Изменились настройки сервера
- Нет доступа к API
- Разработчик исходной нейросети заблокировал её для сторонних приложений
- Генерация временно недоступна из-за обновления
- Ошибка в коде
- Бот превысил лимиты тарифа хостинга, на котором был развёрнут
- На сервере нейросети в Китае ведутся технические работы
- Нейросеть недоступна, удалена или заблокирована
Вне зависимости от причин, я рекомендую использовать альтернативные варианты, пока нейросеть и боты находятся в ауте.
Как сохранить медиа из Different Dimension Me с помощью веб-консоли?
- Запустить браузер Firefox на ПК;
- Открыть веб-консоль с помощью Ctrl+Shift+K;
- Перейти в раздел Object;
- Открыть ссылки с медиа в новых вкладках, затем сохранить их.
Если будете использовать Google Chrome, нажмите F12, затем на левую кнопку для скачивания изображения, либо перейдите в раздел Console, чтобы найти отдельные файлы и перенести их на компьютер.
Главные плюсы использования консоли для сохранения аватарок в DDM:
- Хранение всех видов медиа на одной странице;
- Быстрый доступ к файлам;
- Удобная классификация медиа;
- Отсутствие необходимости пользоваться невидимыми кнопками.
Главные минусы использования консоли браузера для сохранения артов в нейросети QQ:
- Скачивание медиа периодически недоступно из-за ошибок и высокой нагрузки;
- Из-за сбоев могут работать лишь некоторые функции (например, только доступ к горизонтальным или вертикальным превью);
- Картинки в разделе Object могут повторяться, хотя должны быть разными;
- Скачивание с помощь консоли в любой момент может быть заблокировано разработчиками из Tencent.
Варианты классификации медиа в разделе Object
В fetchImgUrl содержится вертикальная картинка, демонстрирующая исходник, готовый арт, водяной знак и название приложения. Разрешение изображения — 1280×720 пикселей, размер — 1–1,5 МБ.
В fetchVideoUrl содержится вертикальный клип, демонстрирующий исходник и готовый арт, сопровождающийся одним из музыкальных треков, доступных в нейросети. Разрешение видео — 1280х720 пикселей, продолжительность — 8 секунд, размер — 2,3–2,5 МБ.
В fetchVideoUrlWithQrCode содержится ещё одно вертикальное видео, демонстрирующее фото до и после обработки, а также QR-код и ссылку на нейросеть QQ. Разрешение видео — 1280х720 пикселей, продолжительность — 12 секунд, размер — 3,2–3,5 МБ.
В fetchQrCodeUrl содержится горизонтальная картинка, демонстрирующее фото до и после обработки в нейросети Different Dimension Me, а также QR-код, рекламный слоган и информацию об использовании технологии искусственного интеллекта QQ Small World. Разрешение изображения — 1000×930 пикселей, размер — 200–350 КБ.
В некоторых случаях создаёт вертикальные картинки с разрешением 1257x800 пикселей. Средний размер изображений остаётся прежним.
В resultImageWithoutWatermark содержится вертикальная картинка, демонстрирующая готовый арт, QR-код и информацию об использованной технологии ИИ. Разрешение изображения — 1400×830 пикселей, размер — 250–350 КБ.
В img_urls хранится общий список всех файлов, доступных для скачивания.
Может содержать как фото и видео, так и одну картинку, сравнивающую исходник с созданным изображением. Во втором случае полностью совпадает с fetchQrCodeUrl.
После создания видео на сайте нейросети QQ будет находиться файл с расширением .mp4, совпадающий с fetchVideoUrl.
Если расширенные возможности недоступны (например, функционируют только img_urls и fetchQrCodeUrl), вам понадобится несколько дополнительных действий, чтобы получить картинки в высоком разрешении.
Во-первых, нужно скачать арт и обрезать всё лишнее (рамки, QR-код, слоган и другие надписи).
Во-вторых, необходимо увеличить картинку с помощью нейросети или бесплатного онлайн-сервиса.
Подробную информацию о платных и бесплатных способах изменения размера изображений написал в конце статьи.
Примеры артов, созданных в DDM
Как можно использовать созданные арты?
Всё, что вы создадите в нейросети Different Dimension Me, можно использовать исключительно для личных некоммерческих проектов (онлайн и оффлайн). Например, для оформления публикаций в блоге, создания аватарок для профилей в социальных сетях, распечатки артов для своего ежедневника или генерации забавных подборок, которыми можно поделиться с друзьями.
Коммерческое использование артов из DDM запрещено.
Сгенерированные изображения нельзя печатать крупными тиражами для продажи в магазинах или на фестивалях, использовать для календарей, открыток и любой иной серийной продукции, не получив разрешения от разработчика (компании Tencent).
Особенности и рекомендации
Чтобы получить отличный результат, рекомендую использовать крупные лицевые портреты, сделанные на нейтральном фоне в хорошем освещении.
Почему это важно?
Чем хуже условия съёмки, тем больше искажений появится на генерируемых изображениях. Если вы не хотите получить сцену из хоррора вместо симпатичного аниме арта, лучше не добавлять снимки из подвала, где сияющие глаза соседского кота заметней вашего лица!
Ухудшить качество картинок могут:
- Избыточные детали;
- Сложные костюмы;
- Геометрические узоры;
- Машины, кабели, скульптуры;
- Растения на переднем плане, загораживающие тело или лицо;
- Руки в кадре;
- Использование полноростовых и групповых фотографий;
- Добавление снимков с нестандартным поворотом головы или причёской, закрывающей существенную часть лица.
Необычные элементы на фото не всегда ухудшают качество изображений. Чаще они приводят к сбою или замедлению генерации картинок.
Можно ли использовать нейросеть QQ для создания артов с животными?
Да. Нейросеть QQ позволяет создавать как иллюстрации с людьми, так и арты с животными.
Учитывайте, что приложение рассчитано на модификацию снимков с людьми, поэтому добавление фотографий с животными может вызывать ошибки. Проявляются они двумя способами — невозможностью загрузить изображение или добавлением лишних деталей.
Если у вас не получилось сделать арт с любимым котиком в нейросети, попробуйте загрузить картинку несколько раз или выбрать другой снимок.
Помимо животных, в нейронной сети можно генерировать натюрморты, пейзажи, текстуры. К сожалению, пока довольно медленно и нестабильно.
Результат того стоит, но будьте готовы многократно перезагружать страницу в браузере:
UPD: пока идёт обновление нейросети Different Dimension Me, пользователям доступны только Telegram-боты, в которых невозможно обработать снимки с животными и пейзажи. Это может свидетельствовать о двух фактах — либо разработчики временно ограничили функциональность, чтобы исправить баги, либо грядущее обновление будет направлено исключительно на портреты с людьми.
Возможно, это позволит улучшить качество генерации и добавить больше вариативности, но об этом можно будет сказать только после выхода апдейта. До тех пор советую использовать другие способы преобразования ваших любимцев в аниме арты.
В первую очередь рекомендую обратить внимание на Stable Diffusion, Novel AI и Waifu Diffusion.
Альтернативные названия нейросети
В русскоязычном сегменте интернета нейросеть Different Dimension Me известна под несколькими названиями:
- QQ Small World — AI Painter;
- QQ World AI Painter;
- Аниме нейросеть QQ;
- Китайская нейросеть H5 TU QQ;
- QQ Another Dimension Me;
- AI Sketch;
- Нейросеть MIC;
- DDM;
- Нейросеть Me In Comics;
- «Я в комиксе»;
- Нейросеть «Маленький мир» от Tencent;
- Нейросеть H5 QQ com.
Где лучше работает нейросеть QQ — на ПК или смартфонах?
Если говорить о качестве генерации, аниме нейросеть QQ работает одинаково хорошо на всех платформах. Однако на ПК чаще встречаются баги и сбои, поэтому я рекомендую пользоваться смартфоном.
При запуске H5 QQ на ПК часть элементов может исчезнуть или переместиться за край экрана, например, кнопка «Скачать». Баги с артами носят визуальный характер — изображения могут растягиваться на весь экран, изменять пропорции или не полностью загружаться, но без проблем открываются в новом окне.
Важен ли размер фото для нейросети?
Нейросеть Different Dimension Me без проблем обрабатывает фотографии низкого, среднего и высокого разрешения. Тяжеловесные исходники с современных фотоаппаратов обрабатываются лишь чуть-чуть дольше, чем сжатые картинки из соцсетей.
Я протестировал снимки с разрешением до 8000 пикселей по большей стороне и размером до 34 МБ, и все они без проблем преобразовались в аниме арты.
Сложности начались при использовании снимков со сверхвысоким разрешением.
У меня ушло 3 попытки, чтобы создать аниме арт на основе изображения с разрешением 8960×13440 пикселей, занимающего 106 МБ на жёстком диске. Первоначально сервер выдавал сообщение о повышенной нагрузке и предлагал повторить попытку позже.
Вывод из этого эксперимента довольно прост: даже если вы используете фотографии со среднеформатной камеры, нейросеть QQ позволит создать аватарку в стиле аниме, но вам придётся сделать больше попыток, чем обычным пользователям.
Разрешение артов в нейросети DDM от Tencent
Стандартное разрешение горизонтальных картинок в нейросети Different Dimension Me — 1000×930 пикселей, вертикальных — 1257×800 пикселей.
Учитывайте, что реальный размер аватарки будет заметно меньше (примерно 471x705 пикселей), так как созданная картинка будет включать миниатюрную копию исходника, ссылку на мессенджер, QR-код и нейтральный фон с градиентной заливкой.
Если использовать консоль разработчика, можно скачать аватарку с разрешением до 1400 пикселей по большей стороне. В таком случае размер аниме арта без рамки, QR-кода и названия приложения составит 1158×773 пикселей.
Как увеличить разрешение артов?
Чтобы увеличить разрешение любого изображения, созданного с помощью нейросети Different Dimension Me, я рекомендую использовать:
- Waifu2x — бесплатный онлайн сервис, позволяющий увеличить разрешение артов до 1500 пикселей;
- Upscale Pics — сервис, предлагающий как бесплатное, так и платное изменение размера фото. Бесплатно позволяет увеличить размер арта до 8 раз, но добавляет водяной знак на готовое изображение. Платный тариф обойдётся в 9 долларов в месяц (в чёрную пятницу и перед праздниками может стоить меньше — примерно 3 доллара);
- Upscale Media — бесплатный русскоязычный сервис для масштабирования изображений. Увеличивает разрешение изображений до 1500 пикселей по большей стороне, поддерживает форматы jpg, jpeg, png и webp;
- Real-Esrgan — модель нейросети, специализирующаяся на увеличении изображений. Её главные плюсы — бесплатное и качественное воссоздание аниме артов в высоком разрешении. В зависимости от выбранной версии, увеличивает картинки в 2 раза, 4 раза, 8 или 10 раз. Использовать Real-Esrgan можно как онлайн, так и оффлайн, скачав программу для ПК. Чтобы запустить нейросеть, перейдите на Replicate (1, 2) или Google Colab, сохраните портативную версию на Github или скачайте GUI для Windows 10;
- Stockphotos Upscaler. Бесплатно позволяет увеличить арты в 2 раза, но всего лишь трижды, а затем предложит оплатить подписку. Тарифы «Стандарт» и «Премиум» помогут увеличить картинки из нейросети QQ вплоть до 8 раз;
- Bigjpg — ещё один сервис для масштабирования изображений. Базовая версия позволяет увеличить разрешение в 2–4 раза. Если нагрузка на сервер превышает допустимую, апскейл может прерваться, либо придётся ждать своей очереди на обработку арта;
- Topaz Gigapixel AI — нейросетевой комбайн, масштабирующий изображения до 600% от изначального размера. Производительный монстр, предлагающий 5 моделей апскейла картинок, подходящих как для аниме артов, так и фотографий. Стоимость программы варьируется от 74,99 до 99,99 долларов (могут быть проблемы с покупкой ПО в России).
На мой взгляд, с масштабированием артов из нейросети Different Dimension Me лучше всего справляются Real-Esrgan и Topaz Gigapixel AI.
Нейросеть Real-Esrgan предварительно натренирована на аниме, поэтому увеличивает картинки с минимумом шумов и искажений. Topaz Gigapixel AI лучше справляется с боке и дорисовыванием размытых текстур, но может добавить больше искажений, аберраций и цифрового шума, чем Esrgan.
Примеры масштабированных картинок (увеличение в 4 раза, приближение на 150%):
Дополнительное преимущество Real-Esrgan — меньший размер файлов после масштабирования.
Если увеличить арты из нейросети Different Dimension Me в 4 раза, воспользовавшись Topaz Gigapixel, размер картинок увеличится до 10–30 МБ. Real-Esrgan бережней относится к дисковому пространству пользователей — готовые изображения занимают 5–8 МБ.
Учитывайте, что размер файлов может меняться в зависимости от выбранной модели и даты выпуска Real-Esrgan.
В худшем случае изображения займут на 20-30% меньше дискового пространства, чем с использованием Topaz Gigapixel AI. Рекомендую скачивать самые свежие версии нейросети, чтобы уменьшить вес масштабированных картинок.
Могу сэкономить ваше время и порекомендовать Real-ESRGAN-GUI от Tsukumijima.
Автор приложения позаботился о комфорте новичков и запросах продвинутых «нейросетевых гиков», поэтому в ПО есть всё, что необходимо для работы на ПК:
- Графический интерфейс с удобным выбором файлов;
- Возможность поменять название, формат и место сохранения картинок;
- Одиночная и пакетная обработка изображений;
- 3 базовые модели нейросети с примечаниями, в каких случаях их стоит использовать;
- Масштабирование артов от 2 до 4 раз;
- Дополнительная встроенная нейросеть — Real-Cugan.
Основные возможности Real-Cugan совпадают с Real-Esrgan, но есть и существенные отличия.
Во-первых, нейросеть больше подходит для увеличения фотографий, а не масштабирования аниме, потому что размывает обработанные объекты, если у них не хватает детализации.
С одной стороны, небольшой блюр позволяет убрать грязь и мелкие дефекты, сохраняя детали даже после сильного апскейла. С другой стороны, разница между изображениями с размытием и без него достаточно велика, чтобы считаться недостатком.
Смягчая текстуры, чтобы компенсировать пикселизацию, Real-Cugan одновременно делает картинку слишком ровной и гладкой, «съедая» мелкие неровности, которые часто присутствуют в аниме артах.
Учитывайте, что размытие заметно только при увеличении картинки в 1,5-2 раза.
В небольшом виде между Real-Cugan и Real-Esrgan практически не видно разницы:
Примечательно, что при масштабировании фотореалистичных иллюстраций наблюдается обратная ситуация - model-se Real-Cugan лучше справляется с мелкими деталями и увеличивает резкость изображения, а Real-Esrgun x4plus-anime сильнее разглаживает текстуру кожи. Воздействие настолько мощное, что его можно сравнить с применением бьютификации на смартфонах!
Перед масштабированием фотографий учитывайте, что Real-Cugan может избыточно усилить резкость и проявить недостатки кожи, а модель realesrgan-x4plus-anime не очень подходит для увеличения снимков с людьми.
Чтобы Real-Esrgan не размывал кожу, рекомендую использовать модель animevideov3:
На мой взгляд, animevideov3 оптимально подходит для масштабирования фото.
По сравнению с x4plus-anime, модель не так сильно размывает кожу и сохраняет оригинальные текстуры снимка. Перед Real-Cugan у realesr-animevideov3 есть другое преимущество — нет чрезмерной резкости или потери детализации, характерной для применения «Denoise».
Во-вторых, нейросеть Real-Cugan предлагает несколько алгоритмов шумоподавления, а Real-Esrgan — ни одного (по крайней мере, в распространённых версиях GUI).
Вы можете не использовать шумоподавление, максимально сохранить детали, либо установить один из 3 уровней коррекции, чтобы избавиться от искажений:
На мой взгляд, аниме арты в нейросети Different Dimension Me не требуют подобной постобработки. Оставьте Real-Cugan для устранения искажений после Topaz Gigapixel или удаления цифровых шумов (включая «горячие пиксели») с ночных фотографий, а по умолчанию используйте Real-Esrgan.
Удачных экспериментов!
Понравилась статья? Поддержите автора комментарием, донатом, подпиской на Telegram и другие страницы!