Подрывные инновации всегда начинаются с простых приложений где-то на задворках рынка и продвигаются наверх, пока не изменят всю отрасль. За последние годы мы стали свидетелями того, как искусственный интеллект (ИИ) вошел в область творческого и графического производства. Мы можем ожидать, что влияние творческого ИИ — или генеративного ИИ — будет расти в ближайшие несколько лет вместе с развитием технологий.
Сегодня мы обсудим некоторые примеры, иллюстрирующие текущее состояние ИИ, и то, как он может повлиять на работу креативщиков и графических дизайнеров.
Содержание статьи
Эксперименты: превращение идей в образы
Создание фотореалистичных изображений из текста
Разве не было бы здорово, если бы ИИ мог синтезировать фотореалистичное изображение на основе вашего описания? В январе 2021 года OpenAI выпустил DALL-E, модель ИИ, которая создает изображения на основе введеного текста.
DALL-E может создавать антропоморфные версии животных и объектов, правдоподобно комбинировать несвязанные концепции, использовать перспективу, визуализировать текст и использовать различные стили, от фотореалистичных до мультфильмов и картин.
Изображение, сгенерированное DALL-E из текстовой подсказки: «иллюстрация редиски дайкон в пачке, выгуливающей собаку» (скриншот из блога OpenAI)
Примеры ошеломляют. Объединение двух несвязанных концепций или применение художественного стиля к объекту — типичное задание для первокурсников, направленное на раскрытие творческого мышления у студентов, изучающих дизайн продукта.
А вот «кресло в форме авокадо».
ИИ может создать такой объект за считанные секунды, а студенты будут работать над ним неделями.
Изображение, сгенерированное DALL-E из текстовой подсказки: «кресло в форме авокадо» (скриншот из блога OpenAI)
OpenAI не предоставляет живую демонстрацию, мы можем увидеть только несколько изображений. Однако OpenAI гарантирует, что эти изображения не были отобраны людьми. Другая модель искусственного интеллекта под названием CLIP выбрала лучшие изображения.
Изображение, созданное GauGan2 из текстовой подсказки: «гора рядом с озером» .
GauGan2 от Nvidia (21 ноября) предоставляет живую демонстрацию. GauGan2 может создавать ландшафтные изображения на основе ввода текста или эскизов. Модель ИИ была обучена на 10 миллионах ландшафтов, но теоретически та же модель ИИ может быть обучена и на других типах изображений. Хотя технология и впечатляет, она по-прежнему является экспериментальной: она ограничена ландшафтами, а результаты пока сложно назвать полезными.
Создание рисунков из текста
Ах, рисовать, не проделывая всю эту тяжелую работу? Это возможно. Группа исследователей ИИ создала концепцию под названием CLIPDraw(21 июня). CLIPDraw — это алгоритм, который синтезирует новые рисунки на основе ввода текста.
Изображение, созданное CLIPDraw из текста: «Человек выгуливает собаку»
Если бы ваш 4-летний ребенок нарисовал это, вы были бы впечатлены, но мы ожидаем большего от ИИ. Однако большее количество набросков в качестве обучающих данных должно привести к лучшим результатам.
Другая группа исследователей опиралась на эту модель и создала StyleCLIPDraw(сентябрь 21 г.), искусственный интеллект, который создает рисунки с учетом как описания, так и стиля рисования.
Вот картина Генри Тейлора «Возможно, она любила те летние дни, но позже она заплакала!», обработанная с помощью StyleCLIPDraw. Ему дали изображение картины и текстовую подсказку: «Мужчина в купальнике выгуливает собаку на пляже». Слева вы видите исходную картину, справа сгенерированное изображение.
Слева: оригинальная картина Генри Тейлора. Справа: изображение, созданное с помощью StyleCLIPDraw.
В результате получается явно не картина Генри Тейлора, которую можно продать за 150 000 долларов. Хотя… куда более безумные вещи продавались как NFT за большие деньги.
Создание фотореалистичных изображений из эскизов
GauGan2 от Nvidia не только понимает текстовые подсказки, но и превращает грубые наброски в фотореалистичные пейзажи. Вы можете нарисовать свое видение различными кистями на так называемой карте сегментации. В мгновение ока ваш набросок появляется как фотореалистичная визуализация на другой стороне экрана.
Это довольно круто в качестве демонстрации, но для реальных приложений результаты недостаточно стабильны.
Например, если добавить в ландшафт пруд, деревья могут изменить форму, как вы можете видеть в видео-примере.
Слева: эскиз, сделанный автором. Справа: изображение, созданное искусственным интеллектом GauGan2 на основе скетча.
Исследователи находят способы лучше контролировать выпуск продукции. Искусственный интеллект PSP(ноябрь 21), объединяет карты сегментации или эскизы со стилями и превращает их в фотореалистичные изображения лиц.
Изображение со страницы проекта Pixel2Style2Pixel
Это может ускорить работу художников, ландшафтных архитекторов или сценаристов, превратив их эскизы в концептуальные визуальные эффекты или раскадровки. Затем вы можете превратить раскадровку в видео.
Создание мемов
Киберкультура знает, что кто-то объединил многомиллионные исследовательские проекты ИИ для создания мемов. Мемы — на первый взгляд простые изображения с подписью белым текстом шрифтом Impact, — являются воплощением интернет-культуры, соперничать с которым может только TikTok с точки зрения виральности и креативности.
ИИ никогда не мог сделать такое, не так ли? Что ж, художник, изобретатель и инженер Роберт А. Гонсалвес попытался это сделать. И у него были хорошие результаты. Его проект иллюстрирует текущую динамику в области ИИ: любое исследование мгновенно подхватывается другими для создания новых знаний и новых приложений.
Мем от AI-Memer, изображение от Шона Финна, подпись от OpenAI GPT-3, лицензия: CC BY-SA 4.0
Испытано и проверено: редактирование изображений с помощью ИИ
В то время как предыдущие примеры все еще являются экспериментальными, генеративный ИИ вошел в коммерческие приложения, включая приложения для фотографий, фильтры AR, Photoshop и редактирование видео.
Сфера развлечений
С тех пор, как слово «селфи» было официально принято для использования в Scrabble в 2014 году, мир стал еще больше одержим тем, чтобы хорошо выглядеть на снимках самих себя.
FaceApp использует ИИ для фотореалистичных настроек селфи. Миллионы людей загрузили приложение, чтобы выглядеть лучше, моложе, старше, отрастить волосы на лице и так далее с десятками фильтров. И миллионы людей использовали 3D-объектив Snapchat Cartoon,чтобы поделиться этим на TikTok, потому что кто не хочет выглядеть как персонаж Диснея.
Даже собаки могут выглядеть как 3D-персонажи с объективом Snap 3D Cartoon. Скриншоты из TikTok.
Приложение Deep Nostalgia, предлагаемое генеалогической онлайн-компанией MyHeritage(21 февраля), использует искусственный интеллект для создания эффекта движущегося неподвижного изображения. Излишне говорить, что в Twitter был настоящий челлендж — все пытались пытаясь придумать самую жуткую анимацию.
Изображение Deep Nostalgia из блога Myheritage
Сфера производительности
Adobe Photoshop выпустила свои «нейронные фильтры» на базе искусственного интеллекта в октябре 2020 года. Фильтры могут улучшать портреты, увеличивать изображения без потери качества, раскрашивать черно-белые изображения, изменять выражение лица или возраст модели на изображении и т.д.
Фильтр Photoshop Smart Portrait может изменить выражение лица. Изображение из FAQ по Adobe.
Некоторые фильтры — это уловки, некоторые все еще требуют ручной очистки, но другие могут реально сэкономить время, освобождая вас от утомительных задач и предоставляя больше времени для экспериментов и творческой свободы.
Маскирование изображений — разделение объектов переднего плана и фона — одна из самых трудоемких задач при редактировании фотографий. Последний выпуск Photoshop от 21 октября содержит функцию «Автомаскирование при наведении» на базе искусственного интеллекта: наведите курсор на изображение, и оно автоматически маскируется.
Автоматический фильтр Adobe Hover. Изображение из блога Adobe.
Вернемся к сфере исследований
Исследователи из NVIDIA опубликовали метод под названием EditGan(21 ноября) для высококачественного редактирования изображений на основе масок сегментации. Например, пользователь берет кисть, изображающую фары, рисует большие заголовки на маске сегментации автомобиля, а модель визуализирует фотореалистичный автомобиль с большими фарами. Метод можно использовать на любом объекте, лице или животном.
Видео с экрана, демонстрирующее EditGAN. Изображение из лаборатории искусственного интеллекта NVidia в Торонто
Хотя этот метод все еще находится в лаборатории, только подумайте, сколько часов утомительного редактирования он устранит, если можно будет получить высокое разрешение.
Получат ли креативщики и графические дизайнеры сверхспособности?
2021 год был знаменательным для генеративного ИИ, с большим количеством экспериментов с преобразованием текста в изображение. Dall-E от OpenAI поразил нас. Особенно потому, что он создает реалистичные образы фантазий, в то время как большинство людей просто предполагали, что фантазии — это прерогатива людей. Я не знаю, когда это произойдет — и многим креативщикам эта идея не понравится, — но я определенно вижу экономическое обоснование для генерации идей с помощью ИИ.
Наряду с захватывающими демонстрациями мы видим, как генеративный ИИ постепенно внедряется в творческие инструменты, такие как Photoshop, облегчая утомительные и трудоемкие задачи. Результаты могут быть не идеальными, но это вопрос времени. Это даст сверхспособности креативщикам и дизайнерам, и в конечном итоге изменит их работу.
В лучшем случае эти сверхспособности дадут креативщикам, дизайнерам и фоторедакторам больше времени для творчества и меньше времени на возню с инструментами. Однако, если ваша работа основана на вашей способности работать с основными графическими инструментами, вам нужно будет искать более творческую работу.
Кроме того, руководство креативного агентства должно будет пересмотреть бизнес-модель с почасовой оплатой.
Источник