בינה מלאכותית בהוראת שפה זרה
תיקון טקסטים בלימוד שפות ימשיך להיות משימתם של מורים

Hand mit Rotstift korrigiert Text
תיקון איכותי מצריך כישורים מקצועיים ויכולות גבוהות | © Getty Images

ספקים רבים של עוזרי כתיבה בינה מלאכותית מבטיחים לנו "טקסטים איכותיים ברמה גבוהה בלחיצת כפתור". מערכות מבוססות מכונה מסוגלות כבר עכשיו ליצור באופן מיידי תיקוני טקסט והצעות לשיפור מקיפים. עם זאת יש לבחון עד כמה התיקונים האלה טובים ואיכותיים ואם הם אכן מסייעים ללומדי שפה זרה לחבר בעצמם טקסטים איכותיים.

מאת דר'. מוריץ דיטמאייר

ניתן לשאול לשם מה כדאי בכלל ללמוד שפות זרות בהתחשב בעובדה שיש אינספור טכנולוגיות שפה חדשות וכלי תמיכה דיגיטליים באינטרנט. אפליקציות חכמות מתרגמות את הטקסטים שלנו תוך אלפית השנייה ( DeepL , Google Translate ) או שהן מסייעות לנו לחבר טקסטים איכותיים בעצמנו ללא טעויות: בין אם מדובר בתיקון שגיאות אוטומטי של תוכנת אופיס ובדפדפן לבחירתנו או בעוזרי כתיבה מקיפים יותר דוגמת Duden Mentor , Grammarly או LanguageTool .

ספקים רבים של מה שמכונה עוזרי כתיבה מעידים על עצמם שהם מסוגלים לספק לנו טקסטים טובים ואיכותיים בכל מצבי החיים וכך להסב לנו אושר ולגרום לנו להצליח יותר. אפליקציות מציעות למשל בדיקת איות, דקדוק וסימני פיסוק כמו גם שיפור סגנוני של טקסטים או ניסוח מחדש של משפטים שלמים.

אם כך האם אין זה מובן מאליו שיש להשתמש בעוזרי התיקון החדשים האלה גם בלימוד שפות? האם עדיין יש צורך במורים בעלי הכשרה מתאימה כשהתיקונים וההצעות לשיפור שאפליקציות מכונה מציעים הם מהירים, מדויקים ואובייקטיביים יותר, כפי שמצהירים לעיתים קרובות במקומות מסוימים?

בחנו את ה- LANGUAGETOOL

מחקר שנערך במכון גתה בהשתתפות מדענים מאוניברסיטת הומבולדט בברלין הגיע למסקנה שהתשובה אינה כל כך פשוטה: כלי תיקון אוטומטיים הקיימים בשוק עשויים לסייע לדוברים ילידים או ללומדי שפה ברמת המתקדמים לכתוב טקסטים טובים יותר. עם זאת, הם אינם כלי יעיל המאפשר ללמוד כיצד לכתוב טקסטים טובים ברמת המתחילים. ניתן להמליץ ​​על כלי תיקון אוטומטי מבחינה דידקטית ואיכותית רק לאחר התאמות נרחבות.
 
 LanguageTool
נושא המחקר היה ה- LanguageTool: אפליקציה בקוד פתוח לבדיקה של דקדוק, סגנון ואיות לשפות שונות רבות. בזכות הקוד הפתוח שלה אפליקציה זו מהווה בסיס לאפליקציות תיקון רבות שניתן למצוא באינטרנט. ה- LanguageTool הפך לעוזר כתיבה עצמאי שמגיע לפוטנציאל המירבי שלו רק בגרסה בתשלום. האפליקציה בשימוש של מיליוני אנשים ברחבי העולם. סביב ה- LanguageTool נוצרה קהילה שלמה שמשפרת ללא הרף את האפליקציה. הגרסה הנוכחית עבור השפה הגרמנית כוללת מעל ל-4,500 כללים בקטגוריות של דקדוק, סימני פיסוק, איות, טיפוגרפיה, ניבים, שפה תואמת מגדר ועוד.
 

הניסוי

בהשוואה למורים במכון גתה, בלט ה- LanguageTool באי הדיוק שלו. הוא סימן כמות רבה יותר של שגיאות בטקסטים של לומדי שפה בקורסים המקוונים ברמה A2 במכון גתה מאשר המורים שהשתתפו במחקר. פעמים רבות היה מדובר בשגיאות שאינן באמת שגיאות או בשגיאות שאינן רלוונטיות, למשל שמות פרטיים או חלקי משפטים אחרים שזוהו בטעות כשגיאות ודברים שלא תאמו את רמת הידע של הלומדים. ההפך הוא הנכון בכל הנוגע לשגיאות דקדוק מורכבות יותר. שגיאות במבנה המשפטים כמעט ולא סומנו, כך שסך הכול איכות התיקונים הייתה נמוכה מאוד.

הגישות הטכנולוגיות בכל הקשור לזיהוי טעויות דקדוקיות, כמו גם העובדה שאין התייחסות להיבט המשמעות בתיקונים המבוססים על כללים, אחראיות לרמת הדיוק הנמוכה של ה-LanguageTool. על אפליקציית תיקון איכותית להתחשב גם במידע הקשור לסמנטיקה ולהקשר, למשל כדי שתהיה מסוגלת לזהות שמות פרטיים ולא לתקן אותם.

דוגמה לטקסט של לומד שפה שתוקן בידי LangugeTool.
דוגמה לטקסט של לומד שפה שתוקן בידי LangugeTool | © מכון גתה

משוב מתקן בלימוד שפה זרה

מתברר כי המצב מורכב אף יותר. באופן טבעי לימוד שפה זרה משמעו לימוד של שפה חדשה. משום כך תיקון של טקסטים כולל גם היבטים דידקטיים. המשוב המתקן האופטימלי תלוי במצבם הספציפי של הלומדים ובמאפייני הלמידה שלהם. המשוב יכול להיות ממוקד ומרומז, אך גם מקיף ומפורש. כשמורה מתמקד בתיקונים בסוג מסוים של שגיאות הוא יכול להסב את תשומת ליבם של התלמידים לבעיה מסוימת. כשמורה רק רומז על טעויות הוא מעורר את המוטיבציה של הלומדים לבדוק בעצמם את כללי הדקדוק הבסיסיים. המורים ששוחחנו איתם מתחו ביקורת בראש ובראשונה על החוסרים הדידקטיים האלה בתיקונים ובהצעות לשיפור של ה- LanguageTool .
כמו כן הדגישו המורים חזור והדגש כי מה שזוהה בטעות כשגיאה והצעות לשיפור שאינן במקום הם בעייתיים במיוחד עבור לומדי שפה מכיוון שהם אינם מסוגלים להבין כי ה"טעויות" שזוהו אינן באמת טעויות. נוסף על כך אין להתעלם גם מגורמים פסיכולוגיים מעוררי מוטיבציה. תיקונים רבים מדי ואף תיקונים שאינם נכונים עלולים להוריד את המוטיבציה ללמידה.

סיכום ומחשבות לעתיד

ללא התאמות מקיפות וספציפיות לתחום של לימוד גרמנית כשפה זרה, הטכנולוגיה ש- LanguageTool מבוססת עליה מתאימה בקושי לתיקון נאות של טקסטים שכותבים לומדי השפה הגרמנית.

בנוסף לגישות המבוססות על כללים, מזה כמה שנים אפשר לבצע תיקונים ושיפורים בטקסטים באמצעות מה שמכונה מודלים של שפה. הכוונה היא לארכיטקטורות של רשתות עצביות מורכבות, מאומנות מראש, המסוגלות לשמש מודל לשפה בשלמותה. היתרון המשמעותי הוא שמודלים של שפה מסוגלים להתפתח. יש להם רמה מסוימת של הבנה בזכות מתן משמעות והקשר למילים או לחלקי מילים שהם מעבדים.

שיאים נשברו שוב ושוב בפיתוח מודלים של שפה. מעניין לציין כי ארכיטקטורות רשת אלו טובות באמת ביכולת להשתמש בשפה טבעית, "להבין" ולחקות אותה. אחד ממודלי השפה הידועים ביותר הוא GPT-3  של הארגון האמריקני Open AI.

אולם לצורך תיקון ושיפור של טקסטים של לומדי שפה, יהיה צורך להתאים את המודלים באופן נרחב. מודלים של שפה מוכנים לשימוש ומקיפים קיימים כיום בעיקר עבור השפה האנגלית. לאחרונה רווח מנהג לתיקון טקסטים בגרמנית: ראשית לתרגם אותם לאנגלית, שם לשפר אותם ולאחר מכן לתרגם אותם בחזרה לגרמנית. עם זאת, לעיתים הטקסטים הופכים מנוכרים באופן משמעותי בשלבי התהליך השונים. כמו כן יש בהם מילים, ביטויים ומבנים דקדוקיים שלומדי השפה עדיין אינם מכירים.

נוסף על כך, מודלים של שפה הוכשרו לשימוש אידיאלי או רגיל בשפה ולכן אין ביכולתם לתקן באופן מובחן מבחינה דידקטית. תיקונים והצעות לשיפור לרוב אינם מתאימים ללומדי שפה ברמת המתחילים מכיוון שכפי שהוזכר לעיל, לא רק שימוש אידיאלי בשפה אלא גם גורמים אחרים ממלאים פה תפקיד.

דוגמה לטקסט של לומד שפה שעבר תהליך שיפור באמצעות מודל של שפה (GPT-NeoX 20B via https://nlpcloud.com)
דוגמה לטקסט של לומד שפה שעבר תהליך שיפור באמצעות מודל של שפה (GPT-NeoX 20B via https://nlpcloud.com) | © מכון גתה
כמו כן במודלים של שפה קיים חשש שכבר אי אפשר יהיה להבין מדוע נעשה תיקון או שיפור כלשהו. בניגוד לגישות המבוססות על כללים, לא קיימים כללים מסוימים המאפשרים הסקת מסקנות בנוגע לרקע. אם לנסח זאת בפשטות, התיקונים מבוססים על מה שנראה הכי סביר בהקשר מסוים מבחינה סטטיסטית. סימן פיסוק או מילה המזוהים כשגויים מוחלפים בסימן פיסוק או במילה המופיעים בתדירות הגבוהה ביותר בהקשר המסוים של המשפט ושל הטקסט.

בהקשר של קיימות יש להזכיר כי השימוש במודלים של שפה הוא עניין עתיר משאבים. פיתוח, הכשרה ותפעול של מודלים גדולים של שפה מאומנים מראש כמו ה-GPT-3 הידוע צורכים כאלף מגה וואט חשמל, עולים מיליונים ומצריכים מיליארדים של נקודות נתונים.

תיקון טקסטים של לומדי שפה באופן הולם ומשמעותי מבחינה דידקטית ימשיך אפוא להיות משימתם של מורים שהוכשרו לכך.

ספק?

אם כך נסו זאת בעצמכם. להלן  שני טקסטים אנונימיים של לומדי שפה שתוכלו לבדוק עם עוזר שפה לבחירתכם.
 

Hallo Kadira. Mein Traum haus hat eine großküche, ein groß und hell bad mit ein groß Spiegel. Mein Slafszimmer hat einen groß bett, viel Schranks, Meinen Arbeitzimmer hat einen Bibliothek, einen Tisch für den Computer un ein bequemer Stuhl. Sie hat auch ein großer und farbenfroher Garten. Mit Freundlichen Grüßen, Tho

Liebe Taisha. Das ist meine Tag. Jeden Morgen ich aufstehe um 5:30 Uhr und ich zaubere den Frühstück für mich und meine Tochter Khaleesi. Dann ich arbeite bis 16 Uhr. ; Von 16:15 bis 18:45 spiele ich mit Khaleesi, um 19 Uhr haben wir das Abendessen und ich vorbereite Khaleesi für das Bett um 8 Uhr. Sie habe ein Bad und sie schlaft von 21 Uhr. Dann ich arbeite, zaubere die Essen für den Morgen oder ich lerne Deutsch. Es kann helfen um eine Kultur besser zu verstanden, und auch um mehrere Leute zu können lernen. Viele Grüße, Sichin

ביבליוגרפיה:

Sylvio Rüdian, Moritz Dittmeyer, und Niels Pinkwart (2022): Challenges of using auto-correction tools for language learning. In LAK22: 12th International Learning Analytics and Knowledge Conference (LAK22). Association for Computing Machinery, New York, NY, USA, 426–431. https://doi.org/10.1145/3506860.3506867

Nassaji, H., & Kartchava, E. (Herausgeber) (2021): The Cambridge Handbook of Corrective Feedback in Second Language Learning and Teaching (Cambridge Handbooks in Language and Linguistics). Cambridge: Cambridge University Press. https://doi.org/10.1017/9781108589789