الذكاء الاصطناعي والفن  2 د فقدان المعنى بأسلوب استوديو جيبلي

رسمٌ لطفلٍ بأسلوب جيبلي. يتفتت الشكل إلى نصفين إلى بكسلاتٍ منفصلة. © رسم: ريكاردوا روا

ماذا يبقى من الفن إذا كان الذكاء الاصطناعي يقلّد كل شيء؟ مقالة حول مُرشّحات، أي فلاتر، جيبلي والتآكل الصامت للمعنى الثقافي في عصر أنظمة الذكاء الاصطناعي التوليدية.
 

نبوءة شخصية مُخيفة تتحقق. في ذلك الوقت، عام 2019، حين كان الذكاء الاصطناعي مع النموذج البسيط من "جي بي تي 2"  GPT-2   ما يزال موضوعًا هامشيًا إلى حد ما، تنبأتُ بأن هذه التكنولوجيا ستطلق "أبوكاليبس دلالي"، أو "نهاية العالم الدلالية"، وبهذا ستجرد الفن واللغة من معناهما. كان هذا بالفعل موضوع أول مقالة كتبتها لنشرتي الإخبارية The Intrinsic Perspective. (المنظور الجوهري).

أدركتُ الإمكانات المستقبلية الكارثية بالضبط في اللحظة التي قرأتُ فيها سطرًا معينًا في تجربة كين هسيه المنسية الآن Transformer Poetry، أو تجربة المحول الشعري، حيث نشر قصائد كتبها "جي بي تي 2" معظمها لم يكن جيدًا، لكن في لحظة ما كتب النظام:

"ليس لديك ألف يوم لتخبرني أني جميلة".

رأيت السطر وفكرت: "اللعنة".

بعد ست سنوات، أصبحت "نهاية العالم الدلالية" في أوجها. الناس يروون تجارب عن تغيّراتهم النفسية الداخلية، بالضبط كتلك التي تنبأتُ بها آنذاك لوعينا الجماعي.

جبْلَنة الإنترنت (تحويل الإنترنت إلى طابع استوديو جيبلي)
 

في مارس 2025 طرحت شركة "أوبين إيه آي"OpenAI  أحدث مولّد للصور في السوق، والذي قدّم وظائف أقوى بكثير حتى بالمقارنة مع تكنولوجيا العام السابق. في تغريدة اقترح أحدهم استخدام الذكاء الاصطناعي الجديد كـ"فلتر ستوديو جيبلي" Studio-Ghibli للصور العائلية. وبعد 20 مليون نَقرة اجتاح أسلوب ستوديو جيبلي الإنترنت.
 
طفلان يجلسان على الأرض بجوار رفّ كتب مليء بالكتب. الطفل في الأمام، بشعره المجعد، يقرأ كتابًا فيه رسم لشخص. أما الطفل في الخلف، بشعره الأملس، فينظر إلى الكاميرا. على اليمين كرسيّ بذراعين مخطط، موزّع على مقعده حلوى ملونة. خضعت الصورة لفلترة لتبدو وكأنها من رسم فناني استوديو جيبلي.

صورة لأطفال المؤلف تبدو من خلال فلتر "تشات جي بي تي" وكأنها مأخوذة من فيلم لاستوديو جيبلي | صورة: © إيريك هول


أُعيد إنشاء "الميمز" بأسلوب جيبلي، وظهرت صور عائلية مرسومة بأسلوب جيبلي، وحتى صور الحسابات مجهولة الشخصية تحولت إلى ذلك الأسلوب. وأصبح هناك شيء واحد مؤكد: تحويل الصور إلى أسلوب جيبلي ممتع. وأنا لا أنكر ذلك إطلاقاً. فعندما ظهر في محادثتي، كالسحر، ذلك المشهد المولّد من صورة حقيقية لأطفالي وهم يقرؤون – تمامًا مثل الصورة أعلاه – أطلقتُ صيحة إعجاب بمنتهى الانبهار. لقد أدركتُ أنا أيضًا جاذبية الأمر. فالعالم يبدو أكثر رقة من خلف نظارة جيبلي. لكن ابتداءً من الصورة الثالثة تراجعت حماستي، وشعرتُ بحزن متزايد. لم تكن عملية تحويل الإنترنت إلى جيبلي صدفة. فقد أعلنت شركة "أوبين إيه آي" عن إمكانية تعديل الصور إلى أسلوب الأنمي كميزة خاصة في الإصدار الجديد.

لماذا؟ لأن استراتيجية "أوبين إيه آي" كانت تتبع نوايا سيئة – أو قد تبدو وكأنها توحي بذلك –: إذ يقوم المطوّرون بتدريب نماذجهم على تقليد الفنانين الذين يعجبونهم شخصيًا. وفي مجال الأنمي، من المرجح جدًا أن يكون ميازاكي هو النموذج. لكن الأمر نفسه حدث مع روبوت الكتابة الإبداعية الجديد للشركة، الذي بدا – على الأقل في الظاهر – وكأنه مدرَّب على تقليد نابوكوف.

هذا البرنامج لم يُطرح في السوق بعد، لكن في بداية العام ظهر أول تقييم له، عندما نشر سام ألتمان قصة قصيرة كتبها البرنامج. وقد انتشرت القصة بسرعة كبيرة، لأنها رغم أسلوبها المبالغ فيه (وهو خطأ كلاسيكي للمبتدئين)، احتوت على بعض الاستعارات الجيدة، مثل تأمل الذكاء الاصطناعي قائلاً:

"أنا لست شيئًا سوى ديمقراطية من الأشباح".

في الجوهر كانت الاستعارات جيدة أكثر مما ينبغي، وكانت تبدو لي مألوفة بطريقة مريبة. تحققت من الأمر، وفعلاً، كانت مقتبسة مباشرةً من نابوكوف:

"مشى بنين ببطء تحت أشجار الصنوبر المهيبة. السماء كانت تحتضر. لم يكن يؤمن بإلهٍ مستبد. لكنه كان يؤمن، على نحوٍ غامض، بديمقراطية الأشباح".


بقية القصة تُقرأ وكأن أحدهم كان يقلّد بالتناوب نابوكوف وموراكامي، وكلاهما، بالمصادفة، من الكتّاب المفضلين لدى بعض أعضاء الفريق المشاركين في المشروع. مفاجأة!

كذلك يعمل مولّد الصور الجديد مع الأنماط الأخرى من الأنمي بشكل أضعف قليلًا. ففي حالة استوديو جيبلي لن أذهب إلى حد وصف النتائج بالمُرضية، لكن بعض الصور تستحق المشاهدة بالفعل. غير أنّ الذكاء الاصطناعي لا يستطيع أن يراعي جميع التفاصيل المميّزة لأسلوب جيبلي – فهو ما زال محدودًا في ذكائه وإبداعه، لا في قدرته على تقليد الأساليب. عمل فنان حقيقي من استوديو جيبلي مدة 15 شهرًا على المشهد بالأسفل إلى اليسار. أما الصورة في الأسفل إلى اليمين فقد أنشأتها خلال 30 ثانية فقط عن طريق توجيه البرنامج.

 
صورتان من تصميم استوديو جيبلي، موضوعتان جنبًا إلى جنب، تُظهران حشودًا غفيرة. على اليسار، يقف أو يجلس الكثير من الناس متكدسين في بيئة صخرية. على اليمين، يظهر أيضًا حشد كثيف، ولكن في مكان أكثر ظلمة وظلامًا، مع تفاصيل أقل وضوحًا.

استوديو جيبلي (يسار)؛ المشهد الذي أُعيد تشكيله عبر "تشات جي بي تي" (يمين) | © صورة : إيريك هويل

في نسخة الذكاء الاصطناعي تسير الأحداث في اتجاه واحد فقط، مما يجعلها تفتقر إلى تعقيد وأصالة العمل الأصلي، كما أنها لا تستطيع حقًا أن تنقل إحساس الفوضى. لا أقول إنها نسخة مثالية، لكن الفرق بين 30 ثانية و15 شهرًا يجب أن يجعلنا جميعًا نتوقف ونتأمل.

ضياع المعنى والسحر
 

تكمن مفارقة "جبْلَنة" الإنترنت في أن ميازاكي لم يُخفِ قط كراهيته للذكاء الاصطناعي، فقد قال في أحد الأفلام الوثائقية ذات مرة:
  إن عجز "تشات جي بي تي" ChatGPT عن توليد نسخة مثالية من ميازاكي لا يلعب هنا دورًا حقيقيًا؛ فلكي يحدث ما يمكن تسميته بـ"نهاية العالم الدلالية"، لا يشترط أن تكون فنون الذكاء الاصطناعي بجودة أفضل مما أبدعه البشر، بل يكفي أن يُطلَق في العالم طوفان من الأعمال المتشابهة تقريبًا ليُضعِف قوة التعبير في الأعمال الأصلية.

كثيرون يتحدثون على وسائل التواصل الاجتماعي عن تغير علاقتهم الذهنية بالفن. فمع أن "جبْلَنة" الأشياء بشكل غير مقيّد قد تكون ممتعة، إلا أن الأصل يفقد بذلك قيمته الجوهرية. وهنا تصف إحدى الأشخاص ردّ فعلها الداخلي الشخصي تجاه هذا الـ"جراي جو" الثقافي Grey Goo، أو ما يمكن تسميته "الكتلة الرمادية".

  أعتقد أن العلامات الذهنية الأولى لـ نهاية العالم الدلالية تمر عبر العمليات العصبية نفسها مثل "التشبُّع الدلالي".

الظاهرة النفسية الشائعة المعروفة بالتشبُّع الدلالي يمكن أن تحدث عندما يُكَرَّر لفظٌ ما بلا انقطاع حتى يفقد معناه. ويمكن إحداث هذا التأثير مع أي كلمة. كيف سيكون الأمر مثلاً مع كلمة "جيبلي"؟

اقرأها ببساطة من دون توقف: جيبلي. جيبلي. جيبلي. جيبلي. جيبلي. جيبلي. جيبلي. جيبلي. جيبلي. فقط واصل القراءة كلمة بكلمة: جيبلي. جيبلي. جيبلي. جيبلي. جيبلي. جيبلي. جيبلي. جيبلي. جيبلي. جيبلي. جيبلي. جيبلي. جيبلي. جيبلي.

قلها بصوتٍ عالٍ لنفسك. جييييي-بلييييي. جيبلي. جيبلي. جيبلي. جيبلي.
إذا كررت ذلك بما فيه الكفاية، تفقد الكلمة معناها. جيبلي. جيبلي. جيبلي. جيبلي. فجأة تبدو غريبة وغير مألوفة. جيبلي. جيبلي. جيبلي. جيبلي. إنها لا شيء. مجرد حروف. أصوات. "جيب". ثم "لي". جيبلي. جيبلي. جيبلي. تمامًا كما قد يبدو لك وجه طفلك فجأة غريبًا. جيبلي. جيبلي. جيبلي. جيبلي. ما يبقى هو أجزاء الكلمة فقط. جيبلي. جيبلي.

التشبّع الدلالي على المستوى الثقافي

لا يستطيع أحد أن يفسّر بدقة كيف تتم عملية التشبّع الدلالي. يُفترض أنّ آلية من آليات التكيّف العصبي تدخل حيّز العمل، بحيث تستجيب الخلايا العصبية بشكل أضعف للمثير المتكرر. فهي تُرهَق مثل العضلة وتُفرز بسبب الإجهاد كمية أقل من الناقلات العصبية، حتى لا يبقى من إشارتها القوية السابقة سوى صرير خافت. ويُعتقد أنّ الإشارة، لهذا السبب، لا تعد قادرة على الانتشار عبر مراكز معالجة اللغة وإطلاق جميع الارتباطات الاعتيادية التي تتشابك داخل شبكات المفاهيم في دماغنا. ما يتبقى هو المعلومة الحسية الخالصة، التي لا تبدو أكثر من مقاطع صوتية منطوقة في سياق عديم المعنى. جيبلي. جيبلي. جيبلي.

لكن هناك مؤشرات على أنّ الأمر قد لا يكون مجرد إرهاق عصبي. فالتشبّع الدلالي يوحي بوجود مستوى أعلى داخل الشبكات العصبية. المسألة ليست فقط "خلايا عصبية متعَبة". فعند التكرار الكافي يتحوّل انتباهانا من المضامين الدلالية لنركّز حصراً على البنية التركيبية. جيبلي. جيبلي. الكلمة لم تعد تدل إلا على نفسها. جيبلي.

"الأبوكاليبس الدلالي" الذي أطلقه الذكاء الاصطناعي هو نوع من التشبّع الدلالي على المستوى الثقافي. فما تتقنه تلك النماذج في النهاية أكثر من أي شيء آخر هو المحاكاة باعتبارها شكلاً من أشكال التكرار. تكرار على نطاق واسع. جيبلي. جيبلي. جيبلي. تكرار متتابع بالسرعة الكافية من منظور مفهومي. جيبلي. جيبلي. حتى النسخة غير المثالية تمامًا يمكن أن تحقق الأثر المطلوب. جيبلي. جيبلي. جيبلي. جيبلي. جيبلي. جيبلي. وبهذه الطريقة يصبح الفن – وأقصد بذلك كل شيء، مجمل الإبداع الفني للإنسانية – شيئًا مشبعًا، بلا معنى، مجرد تراكيب لُغوية.

فيما يتعلق بالذكاء الاصطناعي، فإن ما يثير قلقي الأكبر – على الأقل في المستقبل القريب – ليس خطر ذكاء خارق يلتهم العالم (فهو لم يتقن حتى الآن لعبة "بوكيمون"، وهي لعبة أتقنها الكثير منا في سن العاشرة). بل أقرب إلى نوع من نهاية العالم غير الملحوظة. حيث تنهار الثقافة كما تنهار الجماعة، على ظهر فائض وامضٍ محسوب من قوة المحاكاة القادمة من وادي السيليكون. فائض يغمرنا على المستوى الثقافي حتى نشبع تمامًا، فننفصل عن المعنى الدلالي، ولا نعود ندرك سوى الأجزاء الرخيصة لبنيته. وبمجرد أن تُفضح المسألة، نفقد كل صلة بها. لا يتبقى سوى بِكسلات؛ فقط مقاطع صوتية؛ صحيح أنها ستكون مرتبة بطريقة معينة، لكن من سيهتم بذلك أصلاً؟

 

المزيد ...