Иллюзия обмана
Сегодня искусство, созданное с помощью генеративных моделей, как правило, воспринимается упрощенно: ввел запрос — получил картинку. Никаких мук творчества, ни одной трудовой мозоли, наработанной многолетним совершенствованием мастерства, — машина все сделает сама. И это мы причисляем к искусству? Мухлеж, да и только! Но если отринуть предрассудки и присмотреться к работе художника с нейросетями внимательнее, все оказывается гораздо сложнее.
Роопе Раинисто. Пилот (из серии «Жизнь в Западной Америке»). 2023. NFT. Источник: rooperainisto.com
Миф 1. Быстро, дешево и без усилий
Существует расхожее мнение, что генеративное искусство устроено примерно так же, как кофемашина: засыпал «зерно» — пару загадочных слов вроде cinematic portrait, hyperreal, 8k, — нажал кнопку и получил шедевр. Не вышло? Значит, не те слова. Попробуй еще раз.
Реальность же больше похожа не на кофемашину, а на целую кофейню — с большим штатом сотрудников, разного качества сырьем, техникой, расходниками и счетами за электричество.
Начнем с того, что не все генеративные модели выглядят как чатик с красивым интерфейсом и кнопкой generate. Существуют так называемые «локальные» модели — программы весом 10–20 гигабайт (а иногда и больше), которые устанавливаются на ваш компьютер. Их можно скачать бесплатно, но «бесплатность» тут не стоит воспринимать буквально — нередко этот путь оборачивается еще большими вложениями. Чтобы система стабильно генерировала изображения высокого качества, нужна мощная видеокарта — в идеале с 16–24 ГБ видеопамяти. Это уже не офисный ноутбук, а серьезная машина, стоимость которой может исчисляться сотнями тысяч рублей.
Кроме того, локальные модели работают на вашем электричестве. Одна 4K-картинка может генерироваться около пяти минут — но сколько попыток потребуется, чтобы получить желаемый результат? Иногда десятки, а иногда сотни, поэтому ежемесячные расходы на электричество можно смело увеличивать в несколько раз.

Альтернатива — облачные сервисы, работающие по подписке. Они быстрее, мощнее, но всё еще стоят денег. Чем выше качество и разрешение итоговой картинки, тем выше цена. Популярные сервисы обходятся в среднем в $30–40 в месяц. За эти деньги пользователь получает ограниченное число генераций — например, около трехсот изображений либо несколько десятков коротких видеороликов. И вроде бы для личных целей или небольшой компании такого объема достаточно, но есть нюанс: нужного результата редко удается достичь с первого раза. Особенно если речь идет о коммерческой иллюстрации или точной визуализации объекта. Попыток может быть пять, десять или пятнадцать — и тогда из трехсот генераций в итоге останется лишь 30–60 подходящих изображений. Хочешь больше? Докупай токены или повышай тариф.
Учитывайте, что помимо токенов вы расходуете свое личное время. Многие сервисы ограничивают число одновременных генераций: например, не более трех картинок или видео одновременно. Пока одна партия рендерится, следующую запустить нельзя.
Дорого нейросети обходятся не только пользователю, но и планете. Любой запрос к генеративной модели — это работа дата-центров, многочисленных серверов и охлаждающих их систем. Согласно пусть и спекулятивному, зато яркому образу простое «спасибо», которое вы отправили чату, затратит столько же энергии, сколько потребуется, чтобы вскипятить чайник. В масштабе миллионов пользователей такое энергопотребление становится ощутимым. Обучение крупных моделей тоже требует колоссальных вычислительных мощностей — иногда тысяч видеокарт, непрерывно работающих неделя за неделей. В некоторых регионах концентрация дата-центров уже вызывает экологические дискуссии.






Миф 2. Все делает машина
Появление нейросетей часто сравнивают с изобретением фотографии в XIX веке. Тогда живописцы потеряли монополию на изображение реальности, а сегодня с похожим сдвигом сталкиваются иллюстраторы, дизайнеры и музыканты. Но как камера не делает снимок самостоятельно, так и генеративные модели не способны создать работу без человека. Машина не выбирает тему, не формулирует идею и не несет ответственности за высказывание. Генеративная модель — это система, обученная на огромных массивах данных, которая всего лишь предсказывает наиболее вероятное продолжение запроса. Проще говоря, она не «знает» и не «чувствует», как лучше. Она лишь пытается статистически угадать, какой результат будет максимально похож на то, что люди обычно считают уместным или красивым.
Поэтому ключевая роль остается за человеком. Именно он определяет тему, собирает визуальные референсы, формулирует запрос и решает, какой результат оставить, а какой отбросить. Путь к задуманному произведению требует внутренней дисциплины и бескомпромиссности. Риск соблазна здесь очень высок: хотел одно, получил другое — и вроде тоже красиво, можно согласиться с этим вариантом. Но если художник принимает любое предложенное программой решение, авторство постепенно растворяется. Чтобы сохранить его, приходится крепко держаться за придуманный образ, снова и снова возвращать нейросеть к исходной идее — или менять ее сознательно.

Миф 3. ИИ — идеальный исполниитель
Общаться с ИИ — психологически непросто. В отличие от уединенной работы с холстом, при работе с нейросетями вы будто постоянно находитесь в диалоге — вот только собеседник слышит вас через раз. Несмотря на доброжелательную и услужливую интонацию чатов, нейросеть может неверно интерпретировать запрос, игнорировать важные детали или неожиданно менять композицию. Иногда кажется, что она просто упрямо предлагает свои варианты.
При этом многие популярные модели вообще не ведут диалог с пользователем. В специализированных системах взаимодействие происходит по принципу «запрос — изображение». Человек формулирует описание, иногда прикрепляет референс, а нейросеть в ответ выдает картинку, никак ее не комментируя.
Отдельная тема — цензура. В локальных общедоступных моделях фильтры минимальны или вовсе отсутствуют. Это дает художнику свободу высказывания — можно неограниченно работать с телесностью, тревожными образами, радикальными сюжетами, которые не пройдут фильтры безопасности платных моделей. Однако у такой вседозволенности есть и обратная сторона: экосистема переполнена моделями, ориентированными на 18+ контент и нередко используемыми в сомнительных целях.
Платные сервисы устроены иначе. Порой они напоминают тревожного взрослого, который на все отвечает «нельзя» и «опасно». Система может отказаться генерировать сцену, если сочтет ее неэтичной. Например, изображение человека под водой может интерпретироваться как угроза жизни, а абстрактная композиция из группы тел — как нарушение этического регламента. Приходится поднатореть в искусстве дипломатии. Работа превращается в настоящий интеллектуальный квест: художник ищет «правильные слова», которые могли бы точно передать идею, но при этом обойти «моральный кодекс» и ограничения системы безопасности.






Миф 4. Все как под копирку
Это один из самых частых упреков, которые приходится слышать художникам, работающим с ИИ. Вы заходите в соцсети и видите очередную бессмыслицу вроде странных собак, превращающихся в желе, или псевдорекламных роликов в стиле известных брендов. Кажется, что все, кто работает с нейросетями, штампуют одно и то же. Но это оптический обман алгоритмов: платформы продвигают то, что собирает больше просмотров, то есть мемы, простой и развлекательный контент. Этот слой и оседает в ленте пользователей соцсетей, создавая иллюзию однородности. За пределами алгоритмической витрины существует гораздо более разнообразная сцена: артхаусные, сюрреалистические и намеренно странные изображения, где целью становится уже не охват, а исследование состояний, эмоций и визуальных возможностей самой технологии.
Как и в любом виде визуальной культуры, в генеративном искусстве постепенно формируются собственные паттерны. Например, неожиданно популярными стали изображения рыцарей или космонавтов среди цветущих полей, дримкор-пейзажи[1] с пустынными детскими площадками и бесконечные вариации киберпанка. Картинки-близняшки появляются по известному механизму. Начинающий пользователь попадает в среду ИИ-авторов, смотрит на тех, кто добился популярности, и начинает повторять их стиль. Ученики онлайн-курсов по нейросетям часто копируют стиль преподавателя в надежде повторить его успех, не понимая, что он вырос из индивидуальной манеры. В общем-то, на начальных стадиях обучения любой художник или дизайнер копирует. Просто с нейросетями этот процесс становится гораздо заметнее — инструмент доступен всем, скорость производства изображений огромна, и на одного сложившегося автора приходятся тысячи начинающих.
Есть и технологическая причина однообразия. Генеративное искусство в его современном виде существует всего несколько лет: первые заметные эксперименты с нейросетевыми изображениями относятся к середине 2010-х годов (например, GAN-модели[2]), а массовые инструменты появились уже в 2020-х. Ранние модели часто ошибались, и у этих ошибок была своя романтика: аморфные формы, лишние пальцы, страшноватые искажения. Такие сбои породили множество мемов, но несли и художественный потенциал, привносили в задуманное автором новые неожиданные и выразительные образы.
Совершенствование технологии привело к усреднению результата. Современные модели обучены на гигантских массивах визуального контента и потому легко воспроизводят то, что уже признано «красивым»: киношный свет, глянцевую кожу, симметричную композицию. В результате возникает бесконечный поток визуально приятных, но взаимозаменяемых изображений. Поэтому задача художника меняется: по сути, ему нужно «сломать» систему, придумать, как обойти алгоритм, и вытолкнуть его за пределы стандартного визуального языка. Иногда это значит сознательно нарушать ее логику, смешивать несовместимые стили, провоцировать сбой — практика, во многом похожая на стратегии современного искусства.



Миф 5. Вы воруете у реальных художников
Это, пожалуй, самое неудобное обвинение — и полностью опровергнуть его сложно.
Генеративные модели обучаются на огромных массивах данных: фотографиях, иллюстрациях и живописи — то есть на всем, что когда-либо оказалось в открытом доступе в интернете. Именно так они формируют представление о гармоничной композиции или приятном глазу сочетании цветов. Авторы этих работ, разумеется, не давали согласия на использование своих изображений для обучения моделей. Теоретически компании могли бы выкупать права на использование работ и обучать алгоритмы на лицензированных данных. На практике же это почти невозможно: речь идет о миллиардах изображений, и ни один юридический отдел не способен обработать такой объем.
Есть и второй уровень проблемы. Многие модели хорошо реагируют на имена конкретных авторов в промпте[3]. Можно попросить систему создать изображение «в духе Дэвида Линча» или любого известного иллюстратора — и получить работу, стилистически напоминающую оригинал. Самому художнику, конечно, не достанется за это ни рубля.
Особенно чувствительно это ударило по начинающим иллюстраторам и фотографам. Их работы стоят относительно недорого, но и качество часто не дотягивает до уровня, которого требует заказчик. Порой клиенту проще сгенерировать изображение самостоятельно, чем писать техническое задание и проходить через процесс правок. Опытных авторов проблема затрагивает меньше: к ним обращаются не только за техническими навыками, но и за авторским видением, концепцией и художественным языком.
Решение этой проблемы пока не найдено. Генеративные модели уже стали частью цифровой среды и вряд ли исчезнут из нее в ближайшие годы. Как только изображение попадает в интернет, оно становится частью огромного потока данных, на котором учатся алгоритмы.



Однако на происходящее можно посмотреть и с другой стороны. Генеративные модели чаще всего обсуждают в контексте искусства, но вполне возможно, что их главное влияние проявится в другой области — дизайне. История технологий показывает, что новые инструменты редко заменяют человека, однако почти всегда меняют способы его работы. Когда-то у дизайнеров не было Photoshop — только ножницы, пленка и фотолаборатории. Появление цифровых инструментов ускорило процессы и расширило возможности, но не уничтожило профессию.
С генеративными моделями происходит нечто похожее. Они снимают часть рутинных задач, позволяют быстрее тестировать идеи и искать формы. Но выбор направления, смысл высказывания и ответственность за результат остаются за человеком. Поэтому вопрос не столько в том, заменит ли искусственный интеллект художников. Скорее — в том, как художники научатся работать с новым инструментом.
Примечания
- ^ Дримкор — визуальная интернет-эстетика, для которой характерны сюрреалистичность образов, напоминающих о странных или кошмарных снах.
- ^ GAN (Generative Adversarial Nets), генеративно-состязательные сети — тип генеративных моделей, обучающихся одновременно с другой сетью, которая старается отличить сгенерированные объекты от настоящих.
- ^ Текстовый запрос, который пользователь отправляет нейросети для создания контента.




