בינה מלאכותית ואומנות
אובדן משמעות בסגנון סטודיו ג'יבלי

איור של ילד בסגנון סטודיו ג'יבלי, כאשר הדמות מתפרקת למחצה לפיקסלים בודדים.
איור: © ריקרדו רואה

מה נותר מהאומנות כאשר בינה מלאכותית מחקה הכול? מאמר על פילטרים בסגנון ג'יבלי ועל השחיקה השקטה של משמעות תרבותית בעידן של מערכות בינה מלאכותית גנרטיבית.

מאת אריק הול

נבואת אימה אישית מתגשמת. באותה העת, בשנת 2019, כאשר הבינה המלאכותית עם GPT-2 הפשוט עוד הייתה נושא נישתי למדי, ניבאתי שהטכנולוגיה תגרום ל"אפוקליפסה סמנטית", וכך תשדוד מהאומנות ומהשפה את משמעותן. זה אפילו היה נושא המאמר הראשון שכתבתי לניוזלטר שלי "The Intrinsic Perspective".

פוטנציאל העתיד הדיסטופי התברר לי בדיוק ברגע שקראתי שורה מסוימת בניסוי שנשכח בינתיים של קיין שיה, "Transformer Poetry", שבו הוא פרסם שירים שחוברו בידי GPT-2. רובם לא היו טובים, אבל בנקודה מסוימת כתבה המערכת:

"אין לך אלף ימים לומר לי שאת יפה".-
Thou hast not a thousand days to tell me thou art beautiful.

ראיתי את השורה וחשבתי, "לעזאזל".
והינה, בחלוף שש שנים, האפוקליפסה הסמנטית בעיצומה. אנשים מדווחים על חוויות עם אותם השינויים הנפשיים הפנימיים בתודעה הקולקטיבית שלנו שחזיתי כבר אז.

הג'יבליזציה של האינטרנט
 

במרץ 2025 השיקה OpenAI את מחולל התמונות החדש ביותר שלה, המציע פונקציות בעלות יכולות משופרות משמעותית אפילו מהטכנולוגיה של השנה הקודמת. בציוץ בטוויטר הציע מישהו להשתמש בבינה המלאכותית החדשה כמסנן "סטודיו ג'יבלי" לתמונות משפחתיות. עשרים מיליון צפיות לאחר מכן הציף סטודיו ג'יבלי את האינטרנט.

 
תמונה של ילדיו של המחבר, שנראית, באמצעות פילטר של ChatGPT, כאילו נלקחה מסרט של סטודיו ג'יבלי

תמונה של ילדיו של המחבר, שנראית, באמצעות פילטר של ChatGPT, כאילו נלקחה מסרט של סטודיו ג'יבלי | צילום: © אריק הול

כל מם נוצר מחדש בסגנון ג'יבלי. היו תמונות משפחתיות בסגנון ג'יבלי, תמונות פרופיל של חשבונות אנונימיים הוצגו בסגנון הזה. ודבר אחד אפשר לומר בוודאות: כיף ליצור תמונות ברוח ג'יבלי. איני מתכוון להכחיש זאת. כשהתמונה של ילדיי הקוראים שנוצרה מתצלום אמיתי הופיעה פתאום כמו קסם בהיסטוריית הצ'אט שלי, פרצתי בקריאות שמחה. גם אני נשביתי בקסם. העולם נראה רך יותר מבעד למשקפיים של ג'יבלי. עם זאת כבר בתמונה השלישית הצטננה ההתלהבות שלי וחשתי עצב הולך וגובר. הג'יבליזציה של האינטרנט לא הייתה מקרית. Open AI השיקה כלי חדש שמאפשר לערוך תמונה בסגנון אנימה כתכונה מיוחדת בגרסה החדשה.

מדוע? מפני שנראה כי האסטרטגיה של Open AI נובעת מכוונות רעות של ממש או לפחות זה הרושם שנוצר: המפתחים מאמנים את המודלים שלהם לחקות דווקא את האומנים שמוצאים חן בעיניהם באופן אישי. בעולם האנימה סביר להניח שמדובר במיאזאקי. אך אותו הדבר קורה כעת עם בוט הכתיבה היצירתית החדש של החברה, אשר (אהמ, כך לפחות זה נראה) אומן לחקות את הכתיבה של נבוקוב.

אמנם הבוט זה עדיין לא זמין בשוק, אולם כבר בתחילת השנה התפרסמה ביקורת ראשונית כאשר סם אלטמן שיתף סיפור קצר שנכתב על ידי הבוט.  הסיפור הפך ויראלי מכיוון שלמרות שהוא נכתב באופן מוגזם לחלוטין (טעות קלאסית של מתחילים), היו בו לפחות  כמה מטאפורות טובות, למשל, כאשר הבינה המלאכותית הרהרה כך:

“I am nothing if not a democracy of ghosts.”

בעצם המשפטים היו טובים מדי ונשמעו לי מוכרים באופן מטריד. בדקתי וראיתי שאכן  זה נלקח ישירות מנבוקוב.

“Pnin slowly walked under solemn pines. The sky was dying. He did not believe in an autocratic God. He did believe, dimly, in a democracy of ghosts.”

שאר הסיפור נקרא כאילו מישהו חיקה לסירוגין את נבוקוב ואת מורקמי, שניהם, במקרה, סופרים אהובים על כמה מחברי הצוות המשתתפים בפרויקט. כמה מפתיע!

מחולל התמונות החדש עובד קצת פחות טוב גם עם סגנונות אנימה אחרים. במקרה של סטודיו ג'יבלי לא הייתי מרחיק לכת ואומר שהתוצאה סבירה, אך חלק מהמוטיבים בהחלט מרשימים. הבינה המלאכותית לא מסוגלת לשים לב לכל הפרטים האופייניים לג'יבלי - היא עדיין מוגבלת באינטליגנציה וביצירתיות שלה, אך לא ביכולת שלה להעתיק סגנונות. אומן אמיתי מסטודיו ג'יבלי עבד על הסצנה למטה משמאל במשך 15 חודשים. את התמונה למטה מימין יצרתי תוך 30 שניות בעזרת פרומפט.

 
שני ציורים המוצבים זה לצד זה בסגנון סטודיו ג'יבלי מציגים קהל רב של אנשים. בציור השמאלי עומדים או יושבים אנשים רבים בצפיפות בסביבה סלעית. בציור הימני נראית גם כן התקהלות צפופה, אך בסביבה כהה ומוצלת יותר, עם פחות פרטים גלויים לעין.

סטודיו ג'יבלי (משמאל); הסצנה ששוחזרה באמצעות ChatGPT (מימין) | צילום: © אריק הול

בגרסה של הבינה המלאכותית, האנשים מתקדמים רק בכיוון אחד. כתוצאה מכך חסרים בתמונה המורכבות והאישיות של המקור, והיא לא מצליחה באמת להעביר את תחושת הכאוס. אני לא אומר שמדובר בהעתק מושלם. אבל ההבדל בין 30 שניות ל-15 חודשים צריך לעורר את כולנו למחשבה. 

המשמעות והקסם הולכים לאיבוד
 

האירוניה שבג'יבליזציה של האינטרנט היא שמיאזאקי אינו מהסס להביע את סלידתו מהבינה המלאכותית. בסרט תיעודי הוא אמר פעם:

  העובדה ש-ChatGPT לא יכול ליצור העתק מושלם של מיאזאקי לא באמת משנה. עבור האפוקליפסה הסמנטית, אמנות שנוצרה בידי בינה מלאכותית לא חייבת להיות טובה כמו האמנות הטובה ביותר שנוצרה בידי בני אדם. מספיק להציף את העולם במבול של יצירות כמעט זהות כדי לצמצם את כוח הביטוי של המקור.

רבים מדווחים ברשתות החברתיות על שינוי ביחס הרגשי לאמנות. שכן למרות שג'יבליזציה חסרת מעצורים היא מהנה, היא גורמת ליצירה המקורית להפחית מערכה באופן מהותי. כאן אדם אחד מתאר את תגובתו הפנימית האישית ל"Grey Goo" התרבותי הזה.

  סימנים מנטליים ראשונים של אפוקליפסה סמנטית, שלדעתי עוברת את אותם תהליכים נוירו-מדעיים כמו הרוויה הסמנטית. התופעה הפסיכולוגית הנפוצה של רוויה סמנטית יכולה להיגרם כאשר מילה חוזרת על עצמה שוב ושוב עד שהיא מאבדת את משמעותה. אפשר ליצור אפקט כזה עם כל מילה. מה דעתכם על המילה "ג'יבלי?"

פשוט תקראו בלי הפסקה: ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. פשוט תמשיכו לקרוא, מילה אחר מילה. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי.
תגידו את זה לעצמכם בקול רם. ג'יבלי-בליייייי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. אם תעשו את זה מספיק פעמים, המילה תאבד את משמעותה. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. פתאום המילה נשמעת מוזרה ולא מוכרת. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. זה כלום. רק אותיות. צלילים. "ג'יב". ואז "לי". ג'יבלי. ג'יבלי. ג'יבלי.  בדיוק כמו שהפנים של הילד שלכם נראות לכם פתאום זרות. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. רק חלקי המילה נשארים. ג'יבלי. ג'יבלי.

רוויה סמנטית ברמה התרבותית

איש אינו יכול להסביר בדיוק כיצד מתרחש תהליך הרוויה הסמנטית. מניחים שמדובר במנגנון של הסתגלות נוירונלית, שבו נוירונים מגיבים לגירוי חוזר בעוצמה פחות חזקה. הם מתעייפים כמו שריר ומשחררים פחות נוירוטרנסמיטרים אחרי פוטנציאל פעולה, עד שנותר רק רחש חלש מהאות שהיה פעם חזק. 

מניחים שמסיבה זו האות אינו מסוגל עוד להתפשט דרך מרכזי עיבוד השפה ולעורר את כל האסוציאציות הסטנדרטיות המשולבות זו בזו ברשתות המושגים שבמוחנו. מה שנותר בסוף הוא המידע החושי עצמו, שנראה כלא יותר מצלילי הברות הנאמרות בהקשר חסר משמעות. ג'יבלי. ג'יבלי. ג'יבלי. אולם יש גם סימנים לכך שמדובר ביותר מעייפות נוירולית בלבד. רוויה סמנטית מרמזת על רמה גבוהה יותר בתוך רשתות הנוירונים. לא מדובר רק ב"נוירונים עייפים". כאשר יש חזרה מספקת, תשומת הלב שלנו עוברת מהתוכן הסמנטי להתמקדות במבנה התחבירי בלבד. ג'יבלי. ג'יבלי. המילה מתייחסת כעת אך ורק לעצמה. ג'יבלי.

האפוקליפסה הסמנטית המונעת בידי הבינה המלאכותית היא סוג של רוויה סמנטית ברמה התרבותית. משום שהדבר שהמודלים האלה שולטים בו בצורה הטובה ביותר הוא בסופו של דבר חיקוי כצורה של חזרה. חזרה בהיקף רחב. ג'יבלי. ג'יבלי. ג'יבלי. חזרה מהירה מספיק מבחינה מושגית. ג'יבלי. ג'יבלי. אפילו העתק שאינו לגמרי מושלם יכול להשיג את האפקט הרצוי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. ג'יבלי. וכך אומנות - ואני מתכוון לכל דבר, כל היצירה האומנותית של האנושות - הופכת לדבר רווי, חסר משמעות, תחביר טהור.
 
בהקשר של בינה מלאכותית, זה הדבר שמדאיג אותי יותר מכול, לפחות בעתיד הקרוב. לא הסכנה של אינטליגנציית-על שטורפת את העולם (היא אפילו לא מסוגלת לשלוט בפוקימון, משחק שרבים מאיתנו שלטו בו כבר מגיל עשר) אלא אפוקליפסה כמעט בלתי מורגשת, שבה התרבות חווה את אותה הקריסה כמו הקהילה, על גבו של עודף רוטט ומחושב של כוח חיקוי מעמק הסיליקון. שפע מיותר שמשביע אותנו ברמה התרבותית עד שאנו מתנתקים לחלוטין מהמשמעות הסמנטית ונותרים רק עם החלקים הזולים של המבנה שלו. ברגע שהדבר נחשף, אנו מאבדים כל קשר אליו. נותרים רק פיקסלים. רק הברות. אמנם בסדר מסוים, אך את מי זה בכלל מעניין?