Подрывные инновации всегда начинаются с простых приложений в нижней части рынка и продвигаются вверх, пока не изменят всю отрасль. За последние годы мы стали свидетелями того, как искусственный интеллект (ИИ) вошел в область творческого и графического производства. Мы можем ожидать, что влияние творческого ИИ — или генеративного ИИ — будет расти в ближайшие несколько лет по мере того, как технологии станут более мощными. ИИ и как он может повлиять на работу креативщиков и графических дизайнеров. если бы ИИ мог синтезировать фотореалистичное изображение на основе вашего описания? В январе 2021 года OpenAI произвел впечатление на DALL-E, модель ИИ, которая создает изображения на основе ввода текста. , и использовать разные стили, от фотореалистичных до мультфильмов и картин. (скриншот из блога OpenAI)
Примеры ошеломляют. Объединение двух несвязанных концепций или применение художественного стиля к объекту — типичное задание первого года обучения для развития творческого мышления у студентов, изучающих дизайн продукта. друзьям-дизайнерам продуктов они не были удивлены. Идея о том, что ИИ может создать такой объект за секунды, в то время как студенты будут работать над ним неделями, заставила их чувствовать себя некомфортно.
OpenAI не предоставляет живую демонстрацию, мы можем увидеть только несколько изображений. Однако OpenAI гарантирует, что эти изображения не были отобраны людьми. Другая модель искусственного интеллекта под названием CLIP выбрала лучшие изображения.
GauGan2 от Nvidia (21 ноября) предоставляет живую демонстрацию. GauGan2 может создавать ландшафтные изображения на основе ввода текста или эскизов. Модель ИИ была обучена на 10 миллионах ландшафтов, но теоретически та же модель ИИ может быть обучена и на других типах изображений. Несмотря на то, что эта технология впечатляет, она по-прежнему является экспериментальной: она ограничена пейзажами, а результаты слишком случайны, чтобы быть полезными. все, что тяжелая работа, это может быть сделано. Группа исследователей ИИ создала доказательство концепции под названием CLIPDraw (21 июня). CLIPDraw — это алгоритм, который синтезирует новые рисунки на основе ввода текста. ваш 4-летний ребенок нарисовал бы это, вы были бы впечатлены, но мы ожидаем большего от ИИ. Однако больше набросков в качестве обучающих данных должно привести к лучшим результатам. Другая группа исследователей построила эту модель и создала StyleCLIPDraw (сентябрь 21 г.), ИИ, который создает рисунки с учетом как описания, так и стиля рисования.
Я снял картину Генри Тейлора «Возможно, ей нравились те летние дни, но позже она заплакала!» с помощью StyleCLIPDraw. Я предоставил изображение картины и текстовую подсказку: «Мужчина в купальнике выгуливает собаку на пляже». Слева вы видите исходную картину, справа сгенерированное изображение. Слева: оригинальная картина Генри Тейлора — Справа: изображение автора, созданное с помощью StyleCLIPDraw. Результат явно не картина Генри Тейлора, которую можно продать за 150 000 долларов. На самом деле, я беру свои слова назад, более безумные вещи продавались как NFT за большие деньги.
Содержание статьи
Создавайте фотореалистичные изображения из эскизов
GauGan2 от Nvidia не только принимает текстовые подсказки, но и делает их грубыми. эскизы в фотореалистичные пейзажи. Вы можете нарисовать свое видение различными «материальными кистями» на так называемой карте сегментации. В мгновение ока ваше видение предстает в виде фотореалистичного рендеринга на другой стороне экрана. ]
Например, если добавить к ландшафту пруд, деревья могут изменить форму, как показано в примере видео.
Благодаря большему количеству сред на выбор и стабильным результатам можно увидеть, как это может ускорить работу визуальных художников, ландшафтных архитекторов или сценаристов, превращая их эскизы в концептуальные изображения или раскадровки. Поднявшись на ступеньку или две, вы можете превратить раскадровку в видео.
Создание мемов
Для киберкультуры подходит только то, что кто-то объединил многомиллионные исследовательские проекты ИИ для создания мемы. Мемы — на первый взгляд простые изображения с подписью, обведенной белым текстом шрифтом Impact, — являются воплощением интернет-культуры, с которой может соперничать только TikTok с точки зрения виральности и креативности. ИИ никогда не сможет, не так ли? Что ж, художник, изобретатель и инженер Роберт А. Гонсалвес попытался это сделать. И у него были хорошие результаты. Его проект иллюстрирует текущую динамику в области ИИ: любое исследование мгновенно подхватывается другими для создания новых знаний и новых приложений. Подпись OpenAI GPT-3, лицензия: CC BY-SA 4.0
Хотя предыдущие примеры все еще являются экспериментальными, генеративный ИИ вошел в коммерческие приложения, включая приложения для фотографий, фильтры AR, Photoshop и редактирование видео.
Развлекательный отдел
С тех пор, как слово «селфи» было официально принято для использования в Scrabble в 2014 году, мир стал еще больше одержим тем, чтобы хорошо выглядеть на селфи.
FaceApp использует ИИ для фотореалистичных настроек селфи. Миллионы людей загрузили приложение, чтобы выглядеть лучше, моложе, старше, отрастить волосы на лице и так далее с десятками фильтров. А миллионы людей использовали 3D-линзу Snapchat Cartoon 3D, чтобы делиться ими в TikTok, потому что они не хотят выглядеть как персонажи Диснея. Скриншоты из TikTok.
Deep Nostalgia, предлагаемая генеалогической онлайн-компанией MyHeritage (21 февраля), использует искусственный интеллект для создания эффекта движения неподвижной фотографии. Излишне говорить, что у Twitter был полевой день, когда они пытались придумать самую жуткую анимацию.
Adobe Photoshop выпустила свои «нейронные фильтры» на основе искусственного интеллекта в октябре 2020 года. Фильтры могут улучшать портреты, увеличивать изображения без потери качества, раскрашивать черно-белые изображения, изменять выражение лица или возраст модели на изображении и т. д. Фильтр Photoshop Smart Portrait может изменять выражение лица. . Изображение из часто задаваемых вопросов Adobe.
Некоторые фильтры — это уловки, некоторые по-прежнему требуют ручной очистки, но другие могут реально сэкономить время, освобождая вас от утомительных задач и предоставляя больше времени для эксперименты и творческая свобода. Маскирование изображений — разделение объектов переднего плана и фона — одна из самых трудоемких задач при редактировании фотографий. Последний выпуск Photoshop от 21 октября содержит функцию «Автомаскирование при наведении» на базе искусственного интеллекта: наведите указатель мыши на изображение, и оно автоматически маскируется. Изображение из блога Adobe.
Назад в исследовательский отдел
Исследователи из NVIDIA опубликовали метод под названием EditGan (21 ноября) для высококачественного редактирования изображений на основе масок сегментации. Например, пользователь берет кисть, изображающую фары, рисует большие заголовки на маске сегментации автомобиля, а модель визуализирует фотореалистичный автомобиль с большими фарами. Этот метод может быть использован на любом объекте, лице или животном. Изображение из лаборатории искусственного интеллекта NVidia в Торонто
Хотя этот метод все еще находится в лаборатории, только подумайте, сколько часов утомительного редактирования он устранит, если будет достигнуто высокое разрешение.
Год 2021 год был знаменательным для генеративного ИИ, с большим количеством экспериментов с преобразованием текста в изображение. Dall-E от OpenAI поразил нас. Особенно потому, что он создает реалистичные образы фантазий, в то время как большинство людей просто предполагали, что фантазии — это удел людей. Я не знаю, когда это произойдет — и многим креативщикам эта идея не понравится — но я определенно вижу экономическое обоснование для генерации идей с помощью ИИ. ИИ постепенно внедряется в творческие инструменты, такие как Photoshop, упрощая утомительные и трудоемкие задачи. Результаты могут быть еще не идеальными, но это вопрос времени. Это даст креативщикам и дизайнерам сверхспособности и в конечном итоге изменит их работу. В лучшем случае эти сверхспособности дадут креативщикам, дизайнерам и фоторедакторам больше времени для творчества и меньше времени на возню с инструментами. . Однако, если ваша работа основана на вашей способности работать с основными графическими инструментами, вы можете искать более творческую или высококлассную производственную работу. бизнес-модель.