באתר זה נעשה שימוש בקבצי עוגיות בין היתר של צדדים שלישיים. חלקן חיוניות לחוויית גלישה תקינה וחלק משמשות לסטטיסטיקה ושיווק. המשך גלישה באתר מהווה הסכמה לשימוש זה. המידע נשמר בהתאם למדיניות הפרטיות של מכון דוידסון.
הזמנת כרטיסים
עב
הזמנת כרטיסים
arrow עב
מדע וחברה גחלילית

שפת הבוט

פיתוחים טכנולוגיים מתקדמים משנים את פניהם של אמצעי התקשורת שדרכם אנו צורכים שפה. איתם משתנה גם השפה – התקשורת עצמה
Getting your Trinity Audio player ready...

הבינה המלאכותית מכניסה לנו מילים לפה – זו המסקנה שמהדהדת ממאמר חדש, שפורסם פרסום ראשוני ולא עמד עדיין לבחינתם של מומחים בתחום (ביקורת עמיתים). ממצאיו מעלים שמילים באנגלית שמודל השפה הפופולרי צ’אט-GPT מרבה להשתמש בהן חלחלו מתכנים שהוא ייצר לשפה המדוברת של בני אדם. “מערכות בינה מלאכותית שמאומנות על תוצרי התרבות האנושית מחוללות תכונות תרבותיות שבני האדם מאמצים, וסוגרים כך לולאת משוב תרבותית”, מציינים כותבי המאמר.

מודלי השפה הגדולים הנפוצים כיום, כמו GPT או ג’מיני, נחשפו לכמויות עתק של טקסט בתהליך שנקרא אימון, במטרה שילמדו לחזות מהי המילה הסבירה הבאה בהקשר מסוים. האם התהליך פועל לשני הכיוונים? הייתכן כי בזמן שמודלי השפה הגדולים מאומנים על טקסטים שכתבו בני אדם, הם מעצבים בעצמם את השפה שבה בני האדם משתמשים?

החוקרים בחנו אילו מילים באנגלית מתועדפות על ידי מודלי שפה גדולים, כלומר נפוצות יותר בטקסטים שיצר בוט שיחה בהשוואה לטקסטים שכתבו בני אדם. כדי לאמוד את מידת ההשפעה של מודלי השפה על שפה אנושית, החוקרים סרקו מאות אלפי שעות דיבור של דוברים אנושיים בסרטוני יוטיוב ופודקאסטים. הם מצאו כי מאז שנכנס לחיינו צ’אט-GPT, בשלהי 2022, מילים “מתועדפות” כאלה החלו להופיע יותר ויותר גם בדיבור האנושי. דוגמה אחת לכך היא המילה “delve”, שפירושה להתעמק או לצלול לעומק. החוקרים מצאו כי הפופולריות שלה עולה בעקבות הופעת הבוט.

מדוע זה משנה בעצם? החוקרים חוששים מהתפתחות של משוב חוזר שיפעפע את ההעדפות הלשוניות של מודלי השפה אל בני האדם. עם הזמן, הם מזהירים, ייתכן שהשונות והייחודיות של השימושים שבני האדם עושים בשפה ידעכו, השפה תאבד חלק מהגיוון והעושר שבה, והשימושים הלשוניים שכלי הבינה המלאכותית מקדמים יתקבעו ויהפכו לנורמה.

האם אכן מדובר בתקדים?

מאז שנכנס לחיינו צ'אט-GPT, בשלהי 2022, מילים "מתועדפות" כאלה החלו להופיע יותר ויותר גם בדיבור האנושי. שימוש במילה delve בסרטוני יוטיוב | מתוך המאמר Yakura et al. 2025
מאז שנכנס לחיינו צ'אט-GPT, בשלהי 2022, מילים "מתועדפות" כאלה החלו להופיע יותר ויותר גם בדיבור האנושי. שימוש במילה delve בסרטוני יוטיוב | מתוך המאמר Yakura et al. 2025

מכונות לשכפול שפה

הרבה לפני מודלי השפה של ימינו, טכנולוגיית הדפוס הפיצה דפוסים לשוניים. הופעת טכנולוגיית הדפוס במערב במאה ה-15 אפשרה לראשונה ייצור יעיל של עותקי טקסט רבים וזהים. ההפקה הזריזה של העתקים תרמה להפצה נרחבת של יצירות כתובות ושל השפה הכתובה עצמה.

טרם ימי הדפוס מרבית הטקסטים שהועלו על הכתב באירופה היו יצירות וכתבי דת שנכתבו בלטינית. האנגלית הייתה אז שפה מדוברת בעיקרה, והיו לה ניבים (דיאלקטים) רבים שנמצאו בשימוש ברחבי אנגליה והופיעו באופן לא אחיד בכתבי יד ובמסמכים של מוסדות השלטון. עם הופעת הדפוס, מלאכת הפרסום של יצירות כתובות התרכזה בבתי הדפוס ובידי המוציאים לאור. הם אלה שבחרו את הניבים הלשוניים שיודפסו וקבעו את כללי הדקדוק והאיות. באנגלית הקדומה היו אותיות שהמדפיסים הזניחו, ועם הזמן הן נשמטו כליל מהשפה האנגלית. במהלך המאות הבאות האנגלית התפתחה, היא עברה תהליכי תקנוּן והאחדה, והופצה בעותקים רבים של ספרים וכתבים אחרים. תהליכים דומים התרחשו גם בשפות אחרות.

“בתחילת המאה ה-19 התפתחה טכניקה שאפשרה ליצור תבנית דפוס, או שבלונה”, מספרת ד”ר ננה אריאל מאוניברסיטת תל אביב בשיחה עם אתר מכון דוידסון. “זה איפשר להאיץ מאוד את ההדפסה של טקסטים – ספרים ועיתונים – בעותקים רבים”. במקום למקם אות אחרי אות ליצירת מילים ומשפטים, כמו שעשו במכבשי הדפוס המוקדמים, הופיעה אפשרות ליצור תבנית מלאה ולשכפל אותה בשלמותה. “ההאצה ביכולת להדפיס הגבירה את התפוצה של דפוסי לשון חוזרים, שבתורם נחשבו שחוקים” – קלישאות.

אריאל, ועמיתתה ד”ר דנה ריזנפלד מהפקולטה למדעי הרוח באוניברסיטת תל אביב, עוסקות בקלישאות. משערים כי מקור המילה “קלישאה” הוא בלשון של עובדי דפוס, שתיארו את תבניות ההדפסה על סמך צליל הקליק, או ליותר דיוק “קליש”, של נקישת אותיות העופרת במכונת הדפוס.

כיום למילה קלישאה יש משמעות שלילית, שמדגישה את הצד האפל של הקידמה הטכנולוגית – הסיכון שהאדם המודרני ייהפך למכונת רעיונות שרק משכפלת דפוסים קיימים, משוללת שיקול דעת אינדיבידואלי ומקוריות. הטענה הזאת מהדהדת חששות דומים לאלה שהשמיעו החוקרים שסקרו את ההשפעות של צ’אט-GPT על השפה האנושית.

הופעת טכנולוגיית הדפוס במערב במאה ה-15 אפשרה לראשונה ייצור יעיל של עותקי טקסט רבים וזהים. תבניות דפוס ממתכת | ויקימדיה, Céréales Killer
הופעת טכנולוגיית הדפוס במערב במאה ה-15 אפשרה לראשונה ייצור יעיל של עותקי טקסט רבים וזהים. תבניות דפוס ממתכת | ויקימדיה, Céréales Killer

סימנים חדשים

גם העידן הדיגיטלי הוא מעצב חרוץ של השפה. עם הופעת רשת האינטרנט, מלאכת הפצת השפה עברה ממוקדי הפצה ריכוזיים, למשל העיתונות הכתובה והתקשורת המשודרת, לאנשים פרטיים מכל רחבי העולם, שיכלו לראשונה לנהל תקשורת תדירה על פני מרחקים גיאוגרפיים ופערי שפות וניבים. על ידי כך היא עודדה תהליכי ערבוב ואימוץ של מונחים ורעיונות משפות שונות. לדוגמה, לשפה האנגלית יש כמה וכמה ניבים ברחבי העולם – ביניהם אנגלית בריטית, אמריקאית, הודית או אוסטרלית. דוברי הניבים הנבדלים האלה נפגשים באינטרנט, וכשמילה שצמחה בניב אנגלי מסוים, למשל ניו זילנד, קונה לעצמה פופולריות ברשת, היא עשויה לפעפע לכל ניב אחר של השפה. 

העידן הדיגיטלי הביא איתו גם את שפת האינטרנט. בשנות התשעים נולדה מסורת חדשה שבמסגרתה גופים העוסקים במחקר בלשני, כגון מילון אוקספורד, בוחרים בכל שנה את מילת השנה. מילים כמו “לצייץ” (פרסום ברשת החברתית X, לשעבר טוויטר), “פומו” (חרדת החמצה), או “סלפי” הן מילים שכיכבו ברשימות כאלה ומשקפות שינויים תרבותיים שחלו עם הופעת האינטרנט, לצד מבנים לשוניים חדשים שנוצרו בתחומי הרשת. שפת האינטרנט היומיומית כוללת קיצורים נוחים להקלדה של ביטויים ארוכים כמו “LOL” (צוחק בקול רם) ו-“BRB” (מיד אשוב), שזלגו מהתכתבויות אישיות לתקשורת רשמית יותר כמו תכתובות מייל, ולבסוף מצאו את דרכן גם למילון אוקספורד.

מילים כמו "לצייץ" , "פומו", או "סלפי" משקפות שינויים תרבותיים שחלו עם הופעת האינטרנט. אפליקציית טוויטר בטלפון | Shutterstock, kavi designs
מילים כמו "לצייץ" , "פומו", או "סלפי" משקפות שינויים תרבותיים שחלו עם הופעת האינטרנט. אפליקציית טוויטר בטלפון | Shutterstock, kavi designs

גם למקלדת, כמרכיב בטכנולוגיה שמאפשר לנו לתקשר ברשת, יש השפעה על השימוש בשפה. מספר מחקרים ניסו לכמת את מה שמכונה “אפקט QWERTY”, הטיה לשונית שנובעת מסדר האותיות במקלדת הנפוצה לשפה האנגלית. חוקרים טוענים שאנשים נוטים להעדיף אותיות מהצד הימני של המקלדת, ולכן נוצרת הטיה בבחירת שמות ומילים לטובת אלה שכוללים את אותן אותיות. עם זאת, הראיות לקיומה של ההטיה הזאת סותרות ויש מחלוקת בין חוקרים אם היא אכן קיימת.

ולבסוף, שפת האינטרנט הביאה לעולם מבחר רב של דרכי ביטוי וסמלים שאינם מילוליים, שהפכו לחלק בלתי נפרד מהתקשורת שלנו. הדוגמה המוכרת ביותר היא הסמיילי, שפותח ב-1963 במסגרת קמפיין פרסום של חברת ביטוח, והתגלגל בראשית ימי האינטרנט למערכת של סמלים מביעי רגשות בשם אמוטיקונים, שהשתמשו בסימני מקלדת כמו סוגריים, מקף ונקודתיים ליצירת פרצוף. בהמשך עיצבו גרפיקאים אמוטיקונים חזותיים לאותה מטרה בדיוק, והם הפכו לאימוג’ים שאנו מכירים היום. האימוג’ים הללו מחליפים לא פעם מבעים טקסטואליים שלמים בתבנית קבועה ומוגבלת: סמיילי במקום הבעת שביעות רצון, אימוג’י לב במקום הבעת חיבה מילולית. הסמלים החזותיים האלה, וכך גם הממים המוכרים לכולנו, נכנסו לתקשורת הכתובה ואפילו לדיבור, ונוצרה סביבם תרבות תקשורת שלמה המשתמשת בתבניות ובפרפרזות עליהן. שלל טכנולוגיות לאורך השנים השפיעו על השפה דרך הטמעת העדפות לשוניות ויצירת תבניות תקשורת.

שפת האינטרנט הביאה לעולם מבחר רב של דרכי ביטוי וסמלים שאינם מילוליים, שהפכו לחלק בלתי נפרד מהתקשורת שלנו. אימוג'ים צוחקים | Shutterstock, tovovan
שפת האינטרנט הביאה לעולם מבחר רב של דרכי ביטוי וסמלים שאינם מילוליים, שהפכו לחלק בלתי נפרד מהתקשורת שלנו. אימוג'ים צוחקים | Shutterstock, tovovan

השפעות והשלכות

לולאת המשוב שמטרידה את חוקרי ההשפעה הלשונית של צ’אט-GPT, נוצרת כשביטויים שזוכים לעדיפות בתוצרים של מודל שפה מוטמעים בשפה היומיומית. מודלי השפה מאומנים על כמויות אדירות של טקסטים שכתבו בני אדם, ובטקסטים האלה יש הטיות. הן עשויות לנבוע מפערים שקיימים בחברה שלנו בפועל: לדוגמה, בתיעוד הכתוב יש הרבה יותר ראשי ממשלה גברים מנשים. אחרות נובעות מברירת החומרים שעליהם אימנו את המודל, כך שלמשל עלולים להיות במאגר האימון יותר ספרים שנכתבו בארצות הברית לעומת ספרים ממדינות אחרות, אם אמריקאים נוטים יותר מאחרים ליצור גרסאות דיגיטליות של ספרים.

הטיות כאלה מוטמעות בשפה של המודלים. בהמשך, משתמשים אנושיים צורכים שפה שהמודלים הגדולים משתמשים בה, דרך שיחות עם התוכנה או קריאה של טקסטים שנוצרו בעזרת בוטים. לא מן הנמנע שהם יתרגלו להטיות שחלחלו לחומרי הקריאה העכשוויים שלהם.

באופן כזה טקסטים חדשים שיכתבו בני אדם עלולים להכיל הטיות שמקורן בטקסטים שיצרו מודלי השפה. מודלי השפה עצמם לומדים עוד ועוד טקסטים חדשים שכתבו בני אדם, כדי להמשיך ולשפר את הביצועים שלהם, ותוך כדי כך סופגים הטיות שגרסאות קודמות שלהם הפיצו. וכן הלאה. כך נוצרת  לולאת משוב שמחזקת את עצמה.

הבעיה הזאת אינה ייחודית לשימוש במודלי שפה גדולים, וקיימת גם בדרכי ביטוי אחרות. למשל, אם ספרי לימוד לבתי ספר או ללימודים גבוהים באוניברסיטאות יתעדפו ביטויים או דפוסים לשוניים מסוימים, תהיה לבחירות העורכים והכותבים שלהם השפעה נרחבת. אחרי הכול חומרי לימוד כאלה מעצבים את דור העתיד.

הטכנולוגיה היא מצע שעל גביו נכתבת ומתועדת השפה שלנו, כך שהתקדמות הטכנולוגיה משפיעה כמעט בהכרח גם על השפה עצמה. האנשים שמעורבים בעיצוב האופן שבו נשתמש בטכנולוגיה, ובכלל זה עובדי דפוס, משפיעני אינטרנט, והמפתחים של מודלי השפה, משפיעים על השפה שלנו בכך שהם מפיצים אותה.

התפתחות השפה משקפת הלכי רוח חברתיים ומגמות פוליטיות. שינויים בשפה יכולים להופיע באופן סביל למדיי, כמו הדרת מילים שלא נמצאות בשימוש משפת היומיום, או באופן פעיל במסגרת מאמץ להתאים את השפה לערכים משתנים, כגון הנכחה של המין הדקדוקי נקבה בעברית או פיתוח של עברית רב מגדרית. השפה שלנו היא גמישה ודינמית, כנדרש מתוקף תפקידה כאמצעי תקשורת.

במהותה, אין חידוש גדול בעצם התופעה של הפצת שפה והטמעתה. כל במה לשימושים שלנו בשפה, ולא חשוב אם זה פורום באינטרנט, תוכנית טלוויזיה או ספר לימוד היסטוריה, עשויה להשפיע על צרכניה לאמץ מאפייני שפה מסוימים.

אלא שבמקרה זה הבינה המלאכותית, וייצור התוכן הנרחב שלה, עשויים לעודד תהליכי ניוון מסוימים אצל הקוראים, וגם אצל היוצרים שמשתמשים בכלים כאלה. תשומת לב לא מספקת לתכנים שהבינה המלאכותית מפיקה, ולהשלכות של הטמעה לא ביקורתית של תוצריה, עלולה להכניס תמורות מרחיקות לכת ובלתי רצויות לחיינו. דוגמה רלוונטית היא בוטים שלוקחים חלק בקמפיינים להנדסת תודעה, אך זהו כנראה רק קצה הקרחון.

האחריות לשים לב לשפה המופקת באמצעות מחוללי שפה, ובאותה מידה גם לשפה שנכתבת בעיתונים וברשתות החברתיות, מוטלת על הכותבים והקוראים יחד. לשפה יש כוח לעצב תודעה, והיא משפיעה על תפיסות עולם ועל ההשקפות חברתיות ופוליטיות. כדאי להישאר ביקורתיים כלפי תופעות שמשתקפות מהשפה, בכל במה שמקדמת אותה.

תכנים נוספים עבורך

הדרך הארוכה והקשה אל החשיבה המדעית

אני הייתי הגיבור של הסיפור שסיפרו לי אבי ואימי, והוא נתן משמעות לחיי – עד שכמעט איבדתי אותם בגללו

calendar 19.4.2025
reading-time 8 דקות

ובמקום השישי בעולם: מכון ויצמן למדע

מכון המחקר הישראלי שיפר השנה שוב את מקומו בדירוג ליידן CWTS, המעריך את השפעת הפרסומים המדעיים של מאות מוסדות אקדמיים ברחבי העולם

calendar 4.11.2025
reading-time 4 דקות

בקרת איכות להוכחות

פיתוחים טכנולוגיים מסייעים באימות תמונות במאמרים מדעיים, ומקדמים שקיפות ומהימנות במדע

calendar 3.5.2025
reading-time 7 דקות