Na skróty:

Przejdź bezpośrednio do treści (Alt 1) Przejdź bezpośrednio do menu głownego (Alt 2)

AI i sztuka
Utrata znaczenia w stylu Studia Ghibli

Ilustracja chłopca w stylu studia Ghibli. Postać w połowie rozpada się na pojedyncze piksele.
Ilustracja: © Ricardo Roa

Co pozostanie ze sztuki, gdy sztuczna inteligencja będzie w stanie naśladować wszystko? Erik Hoel pisze o filtrze Ghibli i cichej erozji znaczeń kulturowych w erze generatywnych systemów AI.  
 

Mój osobisty czarny scenariusz właśnie się spełnia. W 2019 roku, gdy sztuczna inteligencja z prostym czatem GPT-2 była raczej niszą, przewidziałem, że technologia ta doprowadzi do „apokalipsy semantycznej”, odbierając sztuce i językowi ich znaczenie. Taki był zresztą temat pierwszego eseju, który opublikowałem w moim newsletterze The Intrinsic Perspective.

Dystopijny potencjał przyszłości uświadomiłem sobie w chwili, gdy natrafiłem na pewien wers w zapomnianym już eksperymencie Kane’a Hsieha Transformer Poetry, w którym opublikował wiersze wygenerowane przez czat GPT-2. Większość z nich nie była udana, ale w pewnym momencie system napisał:

Thou hast not a thousand days to tell me thou art beautiful.

Spojrzałem na ten wers i pomyślałem tylko: „Cholera”.

Sześć lat później apokalipsa semantyczna trwa w najlepsze. Ludzie opisują dziś swoje doświadczenia związane z wewnętrznymi przemianami psychicznymi, które wtedy przewidywałem dla naszej świadomości zbiorowej.  

Ghiblifikacja internetu

W marcu 2025 roku firma OpenAI wprowadziła na rynek swój najnowszy generator obrazów – znacznie wydajniejszy nawet w porównaniu z technologią sprzed zaledwie roku. W jednym z tweetów ktoś zasugerował, że można go używać jako filtr Studia Ghibli do zdjęć rodzinnych. Dwadzieścia milionów odsłon później internet został zalany estetyką rodem z japońskiego studia filmów animowanych.
Dwoje dzieci siedzi na podłodze obok regału pełnego książek. Dziecko z przodu, o kręconych włosach, czyta książkę z ilustracją przedstawiającą osobę. Dziecko z tyłu, o prostych włosach, patrzy w obiektyw aparatu. Po prawej stronie stoi pasiasty fotel, na którego siedzisku rozrzucone są kolorowe cukierki. Zdjęcie zostało pokryte filtrem, dzięki czemu wygląda jakby zostało narysowane przez artystów ze studia Ghibli.

Zdjęcie dzieci autora, które dzięki filtrowi czata GPT wygląda jak kadr z filmu Studia Ghibli | Foto: © Erik Hoel

Na styl Ghibli zaczęto przerabiać niemal wszystko: memy, fotografie rodzinne, a nawet zdjęcia profilowe anonimowych kont. Jedno jest pewne: „ghiblifikacja” to czysta frajda, nie zamierzam temu zaprzeczać. Kiedy zdjęcie moich dzieci czytających książki zostało przerobione przez AI na kadr w estetyce Ghibli i pojawiło się w moim czacie jak za dotknięciem czarodziejskiej różdżki, wydałem z siebie okrzyk zachwytu. Doskonale rozumiem tę fascynację. Świat wydaje się łagodniejszy, gdy patrzy się na niego przez okulary Ghibli. Ale już przy trzecim takim obrazie mój entuzjazm zaczął słabnąć, a jego miejsce zajęło rosnące poczucie przygnębienia.
  Internetowa fala ghiblifikacji nie była dziełem przypadku. OpenAI zaprezentowało możliwość edycji zdjęć w stylu anime jako jedną z kluczowych funkcji nowej wersji swojego narzędzia.

Dlaczego? Ponieważ OpenAI ustawia swoje modele pod gust ich twórców, każąc im imitować wybranych artystów – niekoniecznie w imię sztuki, lecz własnych preferencji. W przypadku anime jest to najprawdopodobniej Miyazaki. Podobnie wygląda sytuacja z nowym botem do kreatywnego pisania, który – przynajmniej takie sprawia wrażenie – został wyszkolony do imitowania stylu Nabokova.

Narzędzie nie trafiło jeszcze na rynek, ale już na początku roku otrzymało pierwszą recenzję, gdy Sam Altman opublikował stworzone przez nie opowiadanie, które szybko stało się viralem. Choć tekst był wyraźnie przesadzony (klasyczny błąd debiutanta), zawierał kilka trafnych metafor – jak choćby wtedy, gdy AI rozważa:

I am nothing if not a democracy of ghosts.

Problem w tym, że metafory stworzone przez AI brzmiały aż zbyt dobrze – i wydały mi się dziwnie znajome. Sprawdziłem i rzeczywiście: zostały wprost zapożyczone od Nabokova:

Pnin slowly walked under solemn pines. The sky was dying. He did not believe in an autocratic God. He did believe, dimly, in a democracy of ghosts.
Reszta opowiadania sprawiała wrażenie, jakby ktoś na przemian naśladował Nabokova i Murakamiego, którzy – zupełnym przypadkiem – są ulubionymi pisarzami niektórych członków zespołu pracującego nad projektem. Cóż za zaskoczenie!

Podobnie działa nowy generator obrazów, który nieco gorzej radzi sobie z innymi stylami anime. W przypadku estetyki Studia Ghibli nie powiedziałbym, że efekty są w pełni satysfakcjonujące, ale niektóre motywy wypadają całkiem dobrze. AI wciąż nie potrafi odwzorować wszystkich charakterystycznych dla Ghibli detali – ograniczają ją inteligencja i kreatywność – ale ma nieograniczoną zdolność kopiowania stylów. Nad sceną w lewym dolnym rogu prawdziwy artysta Ghibli pracował 15 miesięcy. Obraz w prawym dolnym rogu stworzyłem za pomocą czata w 30 sekund.
 
Dwa umieszczone obok siebie obrazy w stylu Studio Ghibli przedstawiają duże tłumy ludzi. Po lewej stronie wiele osób stoi lub siedzi ściśniętych w skalistym otoczeniu. Po prawej stronie również widać gęsty tłum, ale w ciemniejszym, bardziej zacienionym otoczeniu, z mniej widocznymi szczegółami.

Studio Ghibli (po lewej) oraz scena odwzorowana przez czat GPT (po prawej) | Fot.: © Erik Hoel | Foto: © Erik Hoel

W wersji AI bohaterowie poruszają się tylko w jednym kierunku – brakuje jej złożoności i charakteru oryginału oraz nie oddaje wrażenia chaosu. Nie twierdzę, że to wierna kopia. Jednak różnica między 30 sekundami a 15 miesiącami pracy powinna dać nam sporo do myślenia.

Utrata znaczenia i magii

Internetowa „ghiblifikacja” ma w sobie coś przewrotnego, gdyż sam Miyazaki nigdy nie krył swojej niechęci do sztucznej inteligencji. W jednym z filmów dokumentalnych stwierdził wręcz:
  To, że czat GPT nie potrafi stworzyć idealnej kopii dzieła Miyazakiego, nie ma większego znaczenia. Aby doszło do „apokalipsy semantycznej”, sztuka generowana przez AI wcale nie musi dorównywać najlepszym ludzkim pracom. Wystarczy zalać świat masą niemal identycznych wytworów, by osłabić siłę oddziaływania oryginałów. Coraz więcej osób w mediach społecznościowych opisuje, jak zmienia się ich mentalny stosunek do sztuki. Choć nieograniczone „ghiblifikowanie” sprawia przyjemność, oryginał nieuchronnie traci na wartości. Jedna z osób tak relacjonuje swoją reakcję na tę kulturową „szarą maź” (grey goo):
  Moim zdaniem pierwsze symptomy apokalipsy semantycznej odzwierciedlają mechanizm „satiacji semantycznej”: dobrze znanego zjawiska psychologicznego, w którym nieustanne powtarzanie jednego słowa sprawia, że przestaje ono cokolwiek znaczyć. Spróbujmy ze słowem „Ghibli” – powtarzaj je bez przerwy: Ghibli. Ghibli. Ghibli. Ghibli. Ghibli. Ghibli. Ghibli. Ghibli. Ghibli. Czytaj dalej, słowo po słowie: Ghibli. Ghibli. Ghibli. Ghibli. Ghibli. Ghibli. Ghibli. Ghibli. Ghibli. Ghibli. Ghibli. Ghibli. Ghibli. Ghibli. Wypowiedz je na głos: Ghiiiiiiiii-bliiiiiii. Ghibli. Ghibli. Ghibli. Ghibli. Powtarzaj to słowo wystarczająco długo, aż przestanie cokolwiek znaczyć. Ghibli. Ghibli. Ghibli. Ghibli. Nagle wydaje się obce i dziwne. Ghibli. Ghibli. Ghibli. Ghibli. W końcu pozostają tylko litery i dźwięki. „Ghib”, potem „Li”. Ghibli. Ghibli. Ghibli. W końcu nic. Tak jak twarz własnego dziecka nagle może wydać się obca. Ghibli. Ghibli. Ghibli. Ghibli. Zostaje już tylko naga składnia. Ghibli. Ghibli.

Satiacja semantyczna na poziomie kulturowym

Nikt nie potrafi dokładnie wyjaśnić, jak przebiega proces satiacji semantycznej. Przypuszcza się, że powtarzając to samo słowo, uruchamia się mechanizm neuronalnego przyzwyczajenia: neurony reagują coraz słabiej na powtarzający się bodziec. Męczą się podobnie jak mięśnie – po wyzwoleniu potencjału czynnościowego uwalniają coraz mniej neuroprzekaźników, aż początkowo silny sygnał zamienia się w ledwo słyszalny szmer. W rezultacie sygnał nie dociera do ośrodków językowych i nie uruchamia standardowych skojarzeń, które w naszym mózgu tworzą sieci pojęciowe. Pozostaje jedynie czysta informacja sensoryczna, która najwyraźniej jest niczym więcej niż przypadkowymi sylabami wypowiedzianymi w pozbawionym znaczenia kontekście. Ghibli. Ghibli. Ghibli. Istnieją jednak przesłanki, że to coś więcej niż tylko „zmęczenie neuronów”. Satiacja semantyczna sugeruje, że w grę wchodzą procesy wyższego rzędu: przy wystarczającej liczbie powtórzeń nasza uwaga przesuwa się z treści semantycznej na samą strukturę. Ghibli. Ghibli. Słowo to odnosi się już tylko do samego siebie. Ghibli.

Apokalipsa semantyczna wywołana przez AI jest właśnie taką formą satiacji przeniesionej na poziom kulturowy. Ponieważ tym, co modele sztucznej inteligencji opanowały najlepiej, jest imitacja – czyli powtarzanie. Powtarzanie w skali masowej. Ghibli. Ghibli. Ghibli. Kolejne repliki, pojawiające się tak szybko, że z koncepcyjnego punktu widzenia stają się jednym ciągiem. Ghibli. Ghibli. Nawet niedoskonała kopia potrafi osiągnąć ten sam efekt. Ghebli. Ghebli. Ghibli. Ghebli. Ghibli. W ten sposób sztuka – mam na myśli całość ludzkiej twórczości artystycznej – staje się przesycona, pozbawiona znaczenia, sprowadzona do czystej składni.

W kontekście sztucznej inteligencji to właśnie ta kwestia budzi mój największy niepokój – przynajmniej w najbliższej przyszłości. Nie mówię o superinteligencji pochłaniającej świat (obecnie nie radzi ona sobie nawet z Pokémonami, grą, którą wielu z nas opanowało w wieku dziesięciu lat) – lecz o subtelnej apokalipsie: o kulturze, która rozpada się pod ciężarem migotliwego, matematycznie wyliczonego nadmiaru imitacji z Doliny Krzemowej. Nadmiaru, który przesyca nas na poziomie kulturowym, aż całkowicie odrywamy się od znaczenia i widzimy już tylko tanie elementy jego struktury. A gdy iluzja pęka, nie ma już do czego się odnieść. Pozostają tylko piksele. Tylko sylaby. Ułożone wprawdzie w określonym porządku. Ale kogo to jeszcze obchodzi?
 

Perspectives_Logo Publikacja tego artykułu jest częścią projektu PERSPECTIVES – nowego przedsięwzięcia promującego niezależne, konstruktywne dziennikarstwo uwzględniające różnorodne punkty widzenia. Projekt ten, współfinansowany przez Unię Europejską, jest realizowany przez JÁDUwe współpracy z sześcioma redakcjami z Europy Środkowo-Wschodniej pod przewodnictwem Goethe-Institut. >>> Więcej o projekcie PERSPECTIVES