Искусственный Интеллект навсегда меняет правила создания контента

Программы генеративного ИИ могут освободить создателей контента от утомительных задач и позволить им сосредоточиться на своих идеях и творческом мышлении

В течение многих лет в штате Колорадо проводились конкурсы изобразительного искусства под пристальным вниманием средств массовой информации. Но когда в августе было объявлено о победителях 2022 года, это событие вызвало споры во всем мире. Судьи выбрали работу Джейсона Аллена, созданную с помощью искусственного интеллекта, « The Théâtre D’Opera Spatial » победителем в категории цифрового искусства. Это решение вызвало множество критических постов в Твиттер, в том споры о том, что «настала смерть художественного искусства» и технологии скоро лишат художников работы.

До недавнего времени компьютеры и алгоритмы, традиционно считавшиеся предсказуемыми и лишенными креативности, вряд ли ассоциировались с творчеством. Однако развитие искусственного интеллекта привело творческую индустрию к переломному моменту: алгоритмы на базе ИИ становятся ключевой частью созидательного и творческого процесса. И работа Аллена, на которой изображена сюрреалистическая сцена «театра космической оперы», как следует из названия, не только демонстрирует способность современных машин создавать образы, но и конкурирует с человеческим творчеством.

 

Новый взгляд на создание контента

Среди технологий, связанных с ИИ, появившихся за последние несколько лет, — генеративный ИИ — алгоритмы глубокого обучения, которые позволяют компьютерам генерировать оригинальный контент, такой как текст, изображения, видео, аудио и программный код. И спрос на такой контент, скорее всего, вырастет в ближайшие годы — специалисты прогнозируют, что к 2025 году на генеративный ИИ будет приходиться 10% всего  создаваемого контента по сравнению с 1% в 2022 году.«Пространственный театр оперы» — это пример контента, сгенерированного искусственным интеллектом (AIGC, AI generated content), созданного с помощью программы-генератора текста в изображение Midjourney.

В 2022 году также появилось несколько других программ для создания произведений искусства на основе ИИ, способных создавать картины из однострочных текстовых подсказок. Разнообразие технологий отражает широкий спектр художественных стилей и различные требования пользователей. DALL-E 2 и Stable Diffusion, например, ориентированы в основном на произведения искусства в западном стиле, в то время как ERNIE-ViLG  и  Wenxin Yige от Baidu  создают изображения, вдохновленные китайской эстетикой. На конференции разработчиков глубокого обучения Baidu Wave Summit+ 2022 компания объявила, что Wenxin Yige была обновлена ​​​​с новыми функциями, включая преобразование фотографий в картину, созданную искусственным интеллектом.

 

«Пламенный феникс»: изображение кинематографического качества с разрешением 8K, созданное с помощью текстовой подсказки ERNIE-ViLG от Baidu.

 

Между тем, AIGC также может включать статьи, видео и различные другие медиа-предложения, такие как синтез голоса. Технология синтеза голоса, которая генерирует слышимую речь, неотличимую от голоса исходного говорящего, может применяться во многих сценариях, включая голосовую навигацию по цифровым картам. Baidu Maps , например, позволяет пользователям настраивать голосовую навигацию под свой голос, просто записав девять предложений.

Недавние достижения в области технологий искусственного интеллекта привели к созданию генеративных языковых моделей, которые позволяют свободно составлять тексты одним щелчком мыши. Их можно использовать для создания маркетинговых текстов, обработки документов, составления резюме и других текстовых задач. Одной из ведущих генеративных языковых моделей является  ERNIE 3.0 от Baidu , которая широко применяется в различных отраслях, таких как здравоохранение, образование, технологии и развлечения.

«За последний год искусственный интеллект совершил большой скачок и изменил свое технологическое направление, — говорит Робин Ли, генеральный директор Baidu. «Искусственный интеллект перешел от задач по распознаванию изображений и текста к созданию контента». Сделав еще один шаг вперед, Baidu App, популярное приложение для поиска новостей, недавно выпустило функцию редактирования видео, которая может создавать короткое видео, сопровождаемое закадровым голосом, созданным на основе данных, предоставленных в статье.

Повышение эффективности

Поскольку AIGC становится все более распространенным явлением, он может сделать создание контента более эффективным, избавившись от рутинных и трудоемких задач для создателей, таких как сортировка исходных ресурсов и создание изображений. Например, начинающим кинематографистам уже давно приходится расплачиваться, тратя бессчетное количество часов на освоение сложного и утомительного процесса редактирования видео. AIGC вскоре может сделать это ненужным, взяв на себя эту задачу.

Помимо повышения эффективности, AIGC также может спровоцировать рост бизнеса в области создания персонализированного цифрового контента, с которым пользователи могут взаимодействовать. InsightSLICE прогнозирует  , что мировой рынок цифрового творчества будет расти в среднем на 12% ежегодно в период с 2020 по 2030 год и достигнет 38,2 млрд долларов. Поскольку потребление контента быстро опережает производство, традиционные методы создания, скорее всего, не смогут удовлетворить такой растущий спрос, который может удовлетворить AIGC. «ИИ может удовлетворить этот огромный спрос на контент в десять раз дешевле и в сто или тысячи раз быстрее в следующем десятилетии», — говорит Ли.

ИИ для обучения студентов

AIGC также может служить образовательным инструментом, помогая детям развивать свои творческие новыки. Например,  StoryDrawer — это программа на основе искусственного интеллекта, предназначенная для развития творческого мышления детей, которое часто страдает из за того, что акцент в их образовании смещается на зазубривание материала.

Программа, разработанная Чжэцзянским университетом с использованием алгоритмов искусственного интеллекта Baidu, стимулирует воображение детей посредством визуального повествования. Когда ребенок описывает воображаемое изображение системе, она, в свою очередь, генерирует изображение на основе описания, одновременно предоставляя словесные подсказки, чтобы поощрять и вдохновлять ребенка. Данный метод основан на предположении, что дети лучше развивают свое творческое мышление, рисуя и визуализируя образы во время обучения. Команда продолжает развивать программу, они видят потенциал StoryDrawer в том, чтобы помогать детям-аутистам в развитии навыков речи.

Переопределение человеческого потенциала в искусстве

Специалисты выделяют три основных этапа развития ИИ. Во-первых, это «этап помощника», на котором ИИ помогает людям создавать контент, например аудиокниги. Далее следует «стадия сотрудничества», где AIGC предстает в виде виртуальных аватаров, сосуществующих в реальности с создателями. Заключительный этап — «этап первоначального создания», когда ИИ самостоятельно генерирует контент.

Как и в случае с любой новой технологией, никто не может догадаться, как AIGC будет развиваться и совершенствоваться. Несмотря на то, что существует множество неизвестных, история доказала, что новые технологии  нередко полностью заменяют своих предшественников. Когда в 1800-х годах была впервые изобретена камера, многие критиковали ее за то, что фотографии были малохудожественными, но сейчас фотокамеры практически полностью заменили опытных художников с многолетним опытом создания реалистичных картин. Тем не менее, живопись остается в мира искусства по сей день.

 

Подобно тому, как прошлые технологии прошлого расширили сферу искусств, доступность AIGC помогает попробовать себя в творчестве большему количеству людей, позволяя им участвовать в создании ценного контента. Бросая вызов давним представлениям об искусстве, AIGC может помочь пересмотреть то, что значит быть художником.