1. Обзор проблематики нейрогенеративных изображений
В последние несколько лет нейросети «научились» генерировать высококлассные фотореалистичные изображения, а также точно копировать живописные стили и манеры. Степень сходства, достоверность и точность этих нейрогенеративных изображений настолько высоки, что это породило множество обсуждений в основном в юридической, искусствоведческой и философско-культурологической плоскости. В данной статье предпринята попытка разобраться всегда ли нейрогенеративные изображения вторичны, и могут ли они являться произведением искусства.
Нейросеть — это математическая модель, существенной характеристикой которой является то, что она обучаема. То есть она не строит изображения по готовым алгоритмам, а выявляет эти алгоритмы на основе загруженных в нее данных.
Нейрогенеративные изображения — это изображения, сгенерированные при помощи нейросетей через конструирование пользователем текстового запроса.
В начале 2023 года на онлайн-платформе Reddit в сообществе Midjourney были опубликованы «фотографии» папы римского Франциска в модном пуховике, которые мгновенно стали вирусными [1] (рис. 1).
Примерно в это же время по сети разлетелись изображения ареста Дональда Трампа. В обоих случаях «фотографии» оказались фейковыми, они были сгенерированы одной из самых популярных и мощных нейросетей Midjourney. Точность и реалистичность изображений были настолько высокими, что определить фейк было практически невозможно. В пятой версии Мidjourney появилась возможность не только рисовать портретные иллюстрации, но также фотореалистично передавать свет и текстуру. Когда все выяснилось, разразился скандал, вскоре после которого Мidjourney ввела запрет на генерацию изображений публичных людей и закрыла бесплатный доступ.
Две основных темы, которые обсуждали пользователи в интернете — это дипфейки (как мы будем жить в мире, где невозможно отличить фото от фейка) и авторство нейроизображений (кто является автором — человек сгенерировавший запрос, сама нейросеть в лице разработчиков или авторы изображений, на которых нейросеть обучали).
На наш взгляд, оба этих вопроса возникли минимум на четверть века раньше и относятся к цифровым гибридным изображениям вообще, а не только к нейрогенеративным изображениям, как частному их случаю. Коллаж, сделанный искусно в Adobe Photoshop, вполне может быть фейком, хотя создать его сложнее, чем сгенерировать картинку по текстовому описанию, но он тоже может выглядеть фотореалистично. Такой коллаж технически может быть собран на основе нескольких фотографий, у каждой из которых есть автор, и, если разобрать в процессе работы этот коллаж на элементы (слои в Adobe Photoshop), материнские изображения будут узнаваемы. Однако в финальной композиции эти фрагменты могут соединиться так, что определить, из чего скомпонован коллаж будет практически невозможно. Так является ли автор фотографий соавтором коллажа?
Сейчас, когда нейросети уже способны выдавать абсолютно фотореалистичный результат, более того, имитировать настройки фотокамеры, тип объектива, стиль ретуши, экспериментировать с ними начали не только любители, но и профессионалы — художники, фотографы, дизайнеры, люди с большой художественной эрудированностью. В связи с этим на первый план выходит другой вопрос — могут ли являться нейроизображения искусством? Можем ли мы считать их творчески оригинальными или они всегда дубликатны?
Большинство научных статей, вышедших за последние несколько лет, рассматривают нейросети и нейроизображения с математической, алгоритмической и технической точек зрения.
До сих пор крайне мало статей, изучающих нейросети в эстетическом, культурологическом аспекте, а статей, изучающих в этих аспектах нейроизображения, нам найти не удалось.
Так, например, в статье Е. Петровской «Мир без картины (икона — «насыщенный феномен» — нейросеть)» рассматривается вопрос о понимании культуры без понятия изображения. Автор высказывает ряд интересных идей относительно картины и феномена изображений, однако тема нейросетей затрагивается вскользь, а феномен нейроизображенией не рассматривается [2].
В статье М. А. Иванченко и П. Е. Архипова «Человек играющий, машина играющая: путь к идеальной нейросети и предпосылки возникновения постгуманизма» нейросеть рассматривается в ракурсе философии постгуманизма и эссенциокогнитивизма. Осмысляется феномен и роль нейросети как «машины играющей», но не уделяется внимания нейроизображениям как культурологическому феномену [3].
В. А. Кузнецов в статье «Эволюция систем искусственного интеллекта (ИИ), появление цифровых и иных сверхтехнологий и их влияние на изменение социальной реальности, на создание нового качества общественной жизни» рассматривает влияние искусственного интеллекта на изменение жизни человека в философском аспекте. Однако феномен нейроизображений не рассматривается отдельно, вне понятия искусственного интеллекта, в культурологическом ключе [4].
Таким образом, на данный момент феномен нейроизображений еще довольно плохо изучен и практически не концептуализирован. Изучая его, мы можем опереться на обширную базу теоретических исследований по медиевистике, на исследования феномена цифровых объектов вообще, но однозначно ответить на вопрос, могут ли нейроизображения являться произведениями искусства, довольно сложно. Цель этой статьи — наметить направление концептуализации.
2. Определение и признаки произведения искусства
В статье «Произведение искусства» в энциклопедии культурологии под редакцией С. Я. Левита даются такие определения произведения искусства:
«Произведение искусства — продукт художественного творчества; результат обработки того или иного материала (речь, камень, полотно и краски и т.п.), с целью создания такого предмета, который является носителем смысла одновременно личного и сверхличного индивидуального и традиционного, ответного по отношению к предшествующим предметам того же рода и вместе с тем актуального для созерцателя — адресата в настоящем и будущем; имеющий отношение и к жизненной практике, и к отвлеченной идеологии, но не сводимого ни к тому, ни к другому, а самоценного (т. е. эстетически, а не практически или идеологически значимого)» [5, с. 297].
Речь в статье идет о художественном литературном тексте, как о произведении искусства. На основе этого мы можем выделить несколько ключевых для нас черт, переосмыслив их относительно цифровых изображений:
У произведения искусства есть два плана. Первый — план медиа (носителя, материала). Этот план изучен и описан у исследователей медиа, таких, например как М. Маклюэн [6], Л. Манович [7], социологов, например, Г. Рейнгольд [8], культурологов, например у С. Жижжека [9].
Второй план — план содержания (семантический план). Это план хорошо изучен советской школой семиотики (Ю. М. Лотман) [10], французскими культурологами и философами постструктуралистами, например, Р. Бартом [11, 12], Ж. Бодрияром [13].
Оба плана неразрывно связаны между собой, и влияют друг на друга. М. Маклюэн считал, что медиа и есть сообщение (содержание). Для цифрового изображения мы сформулируем это иначе: особенности медиа влияют и до некоторой степени определяют план содержания.
Итак, в плане медиа, произведение искусства появляется в результате обработки автором материала, т.е. смыслы, которые хочет транслировать автор, передаются зрителю обязательно посредством медиа. Медийность произведений искусства сильно расширилась на протяжении XX века, когда вначале появились тиражные произведения искусства, а затем произведения искусства в виде цифровых объектов. Некоторые свойства цифровых объектов (как медиа) могут транслироваться на все произведения искусства цифровой эпохи, даже на аналоговые.
В плане содержания произведение искусства является носителем смыслов, транслируемых культурой и лично автором. Более того, оно является смыслообразующей системой, способной создавать новые смыслы, попадая в новый контекст. Так же произведение искусства транслирует отношение автора к культурным ценностям и к визуальному языку (манере выражать). Произведение искусства всегда обогащает художественную культуру.
Далее в статье приводятся признаки, позволяющие отличить произведение искусства (высокохудожественное произведение) от нехудожественного. Категории в статье сформулированы с опорой на сюжетные литературные произведения:
- единство смысла всех входящих в произведение частей и элементов как выражение авторской «внежизненной», то есть не чисто познавательной или этической установки (позиции, художественной «воли» или «задания») по отношению герою и его миру и одновременно к адресату — зрителю, слушателю, читателю;
- проявленность этого смысла, с одной стороны, в иерархии ценностей изображенного мира (предметов, событий, поступков), с другой — в системе точек зрения и жизненных позиций различных субъектов восприятия, изображение и оценки различных предметов и событий (персонажей, рассказчика, а также потенциального зрителя, слушателя, читателя);
- подчиненность материальной структуры текста авторским задачам воплощения и передачи адресату единого смысла всего им изображенного и оцененного [1, с. 297].
Эта формулировка хорошо подходит для оценки сюжетных произведений: фильмов, литературных произведений, жанровых сюжетных картин, но не всегда подходит для изображений.
Нейрогенеративные изображения вообще не однородны с точки зрения жанра. С помощью нейросети можно создать сюжетную картину в каком-либо художественном стиле, а можно фешн-фотографию (жанр, который сейчас тоже относится к искусству) или стрит-арт изображение, которое оценить по этим признакам нельзя.
Поэтому, переформулируем их более универсально:
- оригинальность, неожиданность, остроумность авторского замысла, задач, которые ставил перед собой автор, смыслов, которые транслирует произведение;
- единство смысла и цельность художественного образа всех входящих в произведение частях и элементах;
- самобытность, оригинальность художественного языка, подчиненность его авторским задачам.
3. Анализ примеров нейрогенеративных изображений
Рассмотрим несколько примеров на основании этих критериев.
В галерее Midjourney v5 можно найти множество цифровых художников, нейродвойников известных художников, создающих нейрогенеративные изображения, порой максимально схожие с аналоговыми работами своих прототипов. Например, двойник Алексея Явленского под псевдонимами @Alexej von Jawlensky (рис. 2), двойник Альфреда Сислея — @Alfred_Sisley, двойник Андрея Ремнева — @Andrey Remnev, двойник Аристарха Лентулова — @Aristarkh Lentulov и многие другие.
Если математическая модель (нейросеть) выявила алгоритм (визуальный язык) картин какого-то известного художника (например, Алексея Явленского), любой пользователь, умеющий конструировать правильные точные запросы для нейросети, сможет создавать новые картины, абсолютно точно копируя творческую манеру художника.
Естественно, многим художникам, по крайней мере, нашим современникам, не хочется, чтобы нейросеть обучали на их работах, но для того, чтобы этого избежать, в интернете не должно быть ни одной фотографии, что в условиях современного арт-рынка совершенно невозможно.
Реакцией на эту ситуацию стало создание исследователями из Чикагского университета в конце 2023 года инструмента Nigtshade, который позволяет обманывать алгоритмы машинного обучения, не изменяя при этом изображение для зрителей. При этом, чем больше «сломанных» картинок попадет в базу нейросети, тем хуже в целом будут генерации [14].
Однако перенимать творческую манеру другого художника далеко не всегда является дубликаторством. Более того, в обучении художников традиционно используется копирование работ других художников (например, старых мастеров), как элемент обучения.
Художественные практики XX века показали нам, что физически в создании произведения искусства художник может даже не участвовать, он может использовать для произведения готовый объект. Яркий пример — «Фонтан» Марселя Дюшана, представленный им на выставке в 1917 году, представляющий из себя обычный писсуар из магазина сантехники, которому художник лишь придумал название (рис. 3).
Бытовые объекты (например, банка фасолевого супа) или популярная в то время фотография лица Мэрилин Монро на произведениях Энди Уорхола не уникальны и не созданы им. Художник демонстративно не создает никакой особенной необычной композиции и не использует новаторскую манеру изображения, он переводит их на холст через трафарет с фотографий (которые тоже сделал не он). Искусство здесь именно в переосмыслении, концептуализации художником бытовых предметов. Он демонстрирует как легко привычное низкое и бытовое может подняться до высокого статуса произведения искусства, просто будучи перенесенным на холст.
В работе Казимира Малевича 1914 года «Композиция с Моной Лизой» в супрематическую композицию вклеен фрагмент портрета Моны Лизы, вырезанный видимо из какого-то журнала (рис. 4). Создавая произведение искусства, художник действительно всегда «обрабатывает материал», но иногда эта «обработка» может заключаться в переосмыслении какого-то объекта, в конструировании особой символической дистанции, которая существует между произведением искусства и зрителем и не существует между бытовыми предметами и зрителем. Произведение искусства может присвоить себе изображение или бытовой объект, или даже часть другого произведения искусства.
Таким образом, сама по себе способность нейросетей точно воспроизводить манеру того или иного художника, предметы искусства, картины, изображения массовой культуры вовсе не делает еще нейроизображения дубликатными.
Однако все же жанр, о котором мы говорим, нейроизображения, копирующие великих мастеров дубликатны, потому что, кроме точного копирования, автором не внесено ничего нового. Цифровой художник не поставил себе никаких новых оригинальных задач, не переосмыслил великое произведение, не концептуализировал его по-новому, не создал символическую дистанцию. Художественную культуру такие изображения не обогащают. Эти изображения — клоны великих произведений.
Другим интересным с исследовательской точки зрения примером является работа «Theater D'Opera Spatial» Джейсона Аллена (@Sincarnate), занявшая первое место в художественном конкурсе в Колорадо (США) (рис. 5). Оценивая ее по трем признаком, сложно согласиться с решением жюри. В работе нет оригинального неожиданного замысла, художественный язык — манера письма, колорит довольно традиционные, можно даже сказать, что они усредненные. Можно предположить, что работа получила столь высокую оценку потому, что оценивалась по основному критерию оценки аналогового искусства — по уровню мастерства обработки материала. Когда же выяснилось, что изображение было создано с помощью нейросети, случился скандал.
Однако эта история выражает тенденцию: с появлением нейросетей средства создания изображений становятся все более доступными.
Третий пример, который нам хотелось бы рассмотреть, работы нейрохудожника под ником @sculpturware. Художник занимается фешн-съемкой и, как он рассказывает в своем телеграмм-канале, в нейрогенерациях этот опыт позволяет ему составлять промпты для нейрогенераций максимально точно, вплоть до технических характеристик камеры и осветительных приборов.
По каждому из наших критериев работы выполнены на очень высокий уровне — авторский замысел оригинален, в каждой работе художник ставит перед собой новые задачи, экспериментирует с формой, при этом сохраняет цельность художественного образа (рис. 6). Можно проследить своеобразный, характерный именно для этого автора художественный язык, решающий творческие задачи. В некоторых изображениях мы можем прочитать следы работ других фотографов или знаковым фотокадрам, однако это скорее точка инспирации для автора, свидетельство его художественной эрудированности, потому что в каждой генерации была поставлена оригинальная творческая задача.
Таких высоких результатов удается добиваться, когда художник очень четко определяет свою творческую задачу и имеет четкое представление, что именно он хочет увидеть. Нейросеть как инструмент дает широкие возможности для гибридизации, она определяет визуальную суть того или иного художественного стиля, того или иного объекта или предмета. Фактически то же самое делает художник, когда рисует. Опасность здесь видится только в том, что профессия художника (фотографа, дизайнера моды) подразумевает обучение и опыт работы в профессии, во время которого человек приобщается к культурному наследию, развивает вкус и намеренность, художественную эрудицию. Это все позволяет такому человеку создавать нейроизображения высокого художественного уровня.
Сама возможность автоматической «обработки материала», то есть художественное мастерство, которое автор не добывает сам во время обучения, а одалживает у нейросети, не дает еще возможности создавать высокохудожественные произведения искусства. А самое главное, не позволяет автору отличить высокохудожественное от посредственного.
4. Выводы
Сам по себе факт использования нейросетью других произведений и изображений как обучающего материала еще не делает нейрогененеративные изображения вторичными. Они могут довольно точно повторять заданный образец (если человек дававший задание нейросети, преследовал такую цель), а могут быть на него совершенно не похожи.
Нейрогенеративные изображения, как и все изображения, могут быть как дубликатными, так и высокохудожественными произведениями. Все зависит от уровня творческого видения человека, дававшего задание нейросети. Безусловно, навыки составления текстового задания для нейросети и уровень развитости нейросети оказывают на результат влияние, но определяющим является именно человек, с его индивидуальным неповторимым художественным видением, который способен отобрать из множества вариантов лучший, развить его и снова из множества отобрать лучший вариант.
Нейросеть — это инструмент, одалживающий мастерство художнику, с одной стороны экономящий силы время и ресурсы художника, освобождая его от технической стороны для более важного — для создания замысла. С другой стороны — не способный полностью заменить художника, по крайней мере пока.
Мастерство, как владение материалом, уже не является ключевым навыком художника. Основными навыками становятся художественное видение и умение творчески мыслить.
International
Nikitina, A.A. (2023) AI-Generated Images — Artistic Works or Duplication?. Culture and technologies studies. Vol. 8, № 4. P. 176-185. Available at: http://cat.itmo.ru/en/2023/v8-i4/450, DOI: 10.17586/2587-800X-2023-8-4-176-185
Russian
Nikitina, A.A. AI-Generated Images — Artistic Works or Duplication? // Culture and technologies studies. 2023. Vol. 8. № 4. P. 176-185. DOI: 10.17586/2587-800X-2023-8-4-176-185
- The Pope Drip. Available at: https://www.reddit.com/r/midjourney/comments/120vhdc/the_pope_drip/ &nb…; (access date: 6/3/2024).
- Petrovskaya, E.В. (2021). The world without a picture (icon - "saturated phenomenon" - neural network). Philo-philosophical and literary journal "Logos". Vol. 31. No. 5(144). 189-200. DOI: 10.22394/0869-5377-2021-5-189-200.
- Ivanchenko, M.A., Arkhipov, P. E. (2021). Man playing, machine playing: the path to the ideal neural network and prerequisites for the emergence of posthumanism. Journal of Ideas and Ideals. Vol. 13. No. 1-1. 151-165. DOI: 10.17212/2075-0862-2021-13.1.1-151-165.
- Kuznetsov, V.A. (2019). Evolution of artificial intelligence (AI) systems, the emergence of digital and other supertechnologies and their impact on the change of social reality, on the creation of a new quality of public life. Bulletin of Chelyabinsk State University. No. 8(430). 5-10. DOI: 10.24411/1994-2796-2019-10801.
- Levit, S.Y. (2007). Kul'turologija. Jenciklopedija [Cultural Studies. Encyclopaedia. in 2 vol,, vol. 2]. Moscow. Russian Political Encyclopaedia, 2007. 1184 p.
- McLuhan, M. (2005). Galaktika Gutenberga: stanovlenie cheloveka pechatajushhego [Gutenberg Galaxy: The Becoming of the Printing Man]. Moscow. Academic Project; Fund Mir. 495 p.
- Manovich, L. (2018). Jazyk novyh media [The language of new media]. Moscow. Ad Marginem Press. 399 p.
- Reingold, G. (2006). Umnaja tolpa: novaja social'naja revoljucija [The Intelligent Crowd: A New Social Revolution]. Moscow. Faire Press. 415 p.
- Žižek, S. (2017). Chuma fantazij [The plague of fantasies]. Kharkiv. Humanitarian Centre. 388 p.
- Lotman, Yu.M. (2000). Ob Iskusstve [About Art]. St. Petersburg. Art-SPb. 704 p.
- Barthes, R. (1994). Izbrannye raboty: Semiotika. Pojetika [Selected Works: Semiotics. Poetics]. Moscow. Progress. Univers. 615 p.
- Barthes, R. (1994). Mifologii [Mythologies]. Moscow. Akademicheskiy Prospect. 351 p.
- Baudrillard, J. (2015). Simuljakry i simuljacii [Simulacra and Simulations]. Moscow. Postum. 240 p.
- Nightshade. Available at: https://nightshade.cs.uchicago.edu/ (access date: 6/3/2024).