האם מערכות בינה מלאכותית גנרטיבית כמו ChatGPT יכולות ליצור רעיונות מקוריים באמת? מחקר חדש בראשות פרופסור קארים ג'רבי מהמחלקה לפסיכולוגיה באוניברסיטת מונטריאול, בהשתתפות חוקר הבינה המלאכותית הנודע יושע בנג'יו, לוקח על השאלה הזו בקנה מידה חסר תקדים. המחקר הוא ההשוואה הישירה הגדולה ביותר שנערכה אי פעם בין יצירתיות אנושית ליצירתיות של מודלים שפות גדולים.
המחקר, שפורסם ב דוחות מדעיים (תיק טבע), מצביע על שינוי משמעותי. מערכות בינה מלאכותית גנרטיביות הגיעו כעת לרמה שבה הן יכולות להתעלות על האדם הממוצע במדדי יצירתיות מסוימים. יחד עם זאת, האנשים היצירתיים ביותר עדיין מראים יתרון ברור ועקבי אפילו על דגמי הבינה המלאכותית החזקים ביותר.
AI מגיע לרמות יצירתיות אנושיות ממוצעות
חוקרים העריכו מספר מודלים מובילים של שפות, כולל ChatGPT, קלוד, ג'מיני ואחרים, והשוו את הביצועים שלהם עם תוצאות של יותר מ-100,000 משתתפים אנושיים. הממצאים מדגישים נקודת מפנה ברורה. חלק ממערכות הבינה המלאכותית, כולל GPT-4, עלו על ציונים אנושיים ממוצעים במשימות שנועדו למדוד יצירתיות לשונית שונה.
"המחקר שלנו מראה שכמה מערכות בינה מלאכותית המבוססות על מודלים של שפות גדולות יכולות כעת לגבור על היצירתיות האנושית הממוצעת במשימות מוגדרות היטב", מסביר פרופסור קארים ג'רבי. "התוצאה הזו עשויה להיות מפתיעה – אפילו מטרידה – אבל המחקר שלנו גם מדגיש תצפית חשובה לא פחות: אפילו מערכות הבינה המלאכותית הטובות ביותר עדיין נופלות מהרמות שהגיעו אליהן של בני האדם היצירתיים ביותר."
ניתוח נוסף על ידי המחברים הראשונים של המחקר, חוקר הפוסט-דוקטורט אנטואן בלמאר-פפין (Université de Montréal) והמועמד לדוקטורט פרנסואה לספינאס (Université Concordia), חשף דפוס בולט. בעוד שחלק מדגמי הבינה המלאכותית עולים כעת על האדם הממוצע, שיא היצירתיות נשאר אנושי בהחלט.
למעשה, כאשר החוקרים בחנו את המחצית היצירתית ביותר של המשתתפים, הציונים הממוצעים שלהם עלו על אלו של כל מודל AI שנבדק. הפער גדל עוד יותר בקרב 10 האחוזים המובילים של האנשים היצירתיים ביותר.
"פיתחנו מסגרת קפדנית שמאפשרת לנו להשוות בין יצירתיות אנושית ובינה מלאכותית תוך שימוש באותם כלים, בהתבסס על נתונים של יותר מ-100,000 משתתפים, בשיתוף עם ג'יי אולסון מאוניברסיטת טורונטו", אומר פרופסור קארים ג'רבי, שהוא גם פרופסור חבר במילה.
כיצד מדענים מודדים יצירתיות בבני אדם ובינה מלאכותית
כדי להעריך את היצירתיות בצורה הוגנת בין בני אדם ומכונות, צוות המחקר השתמש במספר שיטות. הכלי העיקרי היה ה-Divergent Association Task (DAT), מבחן פסיכולוגי בשימוש נרחב שמודד יצירתיות מתפצלת, או היכולת להפיק רעיונות מגוונים ומקוריים מתוך הנחיה אחת.
נוצר על ידי מחבר המחקר ג'יי אולסון, ה-DAT מבקש מהמשתתפים, בין אם אנושיים או בינה מלאכותית, לרשום עשר מילים שאינן קשורות במשמעותן ככל האפשר. דוגמה לתגובה יצירתית ביותר כוללת מילים כמו "גלקסיה, מזלג, חופש, אצות, מפוחית, קוונטים, נוסטלגיה, קטיפה, הוריקן, פוטוסינתזה".
ביצועים במשימה זו קשורים מאוד לתוצאות במבחני יצירתיות מבוססים אחרים המשמשים בכתיבה, יצירת רעיונות ופתרון בעיות יצירתי. למרות שהמשימה מבוססת שפה, היא חורגת הרבה מעבר לאוצר המילים. הוא עוסק בתהליכים קוגניטיביים רחבים יותר המעורבים בחשיבה יצירתית על פני תחומים רבים. ל-DAT יש גם יתרונות מעשיים, מכיוון שהוא לוקח רק שתיים עד ארבע דקות להשלמתו וניתן לגשת אליו באופן מקוון על ידי הציבור הרחב.
מרשימות מילים לכתיבה יצירתית אמיתית
החוקרים בדקו אם הצלחה בינה מלאכותית במשימת שיוך מילים פשוטה זו יכולה להתרחב לפעילויות יצירתיות מורכבות ומציאותיות יותר. כדי לבדוק זאת, הם השוו בין מערכות בינה מלאכותית ומשתתפים אנושיים באתגרי כתיבה יצירתית כמו הלחנת הייקו (צורה פואטית קצרה בת שלוש שורות), כתיבת סיכומי עלילה של סרטים והפקת סיפורים קצרים.
התוצאות עקבו אחר דפוס מוכר. בעוד שמערכות בינה מלאכותית חרגו לפעמים מהביצועים של בני אדם ממוצעים, היוצרים האנושיים המיומנים ביותר סיפקו באופן עקבי עבודה חזקה ומקורית יותר.
האם ניתן להתאים את יצירתיות הבינה המלאכותית?
ממצאים אלו העלו שאלה חשובה נוספת. האם יצירתיות בינה מלאכותית קבועה, או שניתן לעצב אותה? המחקר מראה שניתן להתאים את היצירתיות ב-AI על ידי שינוי הגדרות טכניות, במיוחד הטמפרטורה של הדגם. פרמטר זה שולט עד כמה התגובות שנוצרות צפויות או הרפתקניות.
בהגדרות טמפרטורה נמוכות יותר, AI מייצר תפוקות בטוחות יותר וקונוונציונליות יותר. בטמפרטורות גבוהות יותר, התגובות הופכות מגוונות יותר, פחות צפויות ויותר חקרניות, מה שמאפשר למערכת לנוע מעבר לרעיונות מוכרים.
החוקרים מצאו גם שיצירתיות מושפעת מאוד מאיך שנכתבים הוראות. לדוגמה, הנחיות המעודדות מודלים לחשוב על מקורות ומבנה מילים באמצעות אטימולוגיה מובילות ליותר אסוציאציות בלתי צפויות וציוני יצירתיות גבוהים יותר. תוצאות אלו מדגישות כי יצירתיות בינה מלאכותית תלויה במידה רבה בהנחיה אנושית, מה שהופך את האינטראקציה והנעה לחלק מרכזי בתהליך היצירתי.
האם בינה מלאכותית תחליף את היוצרים האנושיים?
המחקר מציע פרספקטיבה מאוזנת על חשש שבינה מלאכותית יכולה להחליף אנשי מקצוע יצירתיים. בעוד שמערכות AI יכולות כעת להתאים או לחרוג מהיצירתיות האנושית הממוצעת במשימות מסוימות, עדיין יש להן מגבלות ברורות והן מסתמכות על כיוון אנושי.
"למרות שבינה מלאכותית יכולה כעת להגיע ליצירתיות ברמת האדם במבחנים מסוימים, עלינו לעבור מעבר לתחושת התחרות המטעה הזו", אומר פרופסור קארים ג'רבי. "בינה מלאכותית גנרית הפכה מעל הכל לכלי רב עוצמה בשירות היצירתיות האנושית: היא לא תחליף את היוצרים, אלא תשנה באופן עמוק את האופן שבו הם מדמיינים, חוקרים ויוצרים – עבור אלה שיבחרו להשתמש בו."
במקום לאותת על סיום הקריירה היצירתית, הממצאים מצביעים על עתיד שבו בינה מלאכותית משמשת כעוזר יצירתי. על ידי הרחבת רעיונות ופתיחת נתיבים חדשים לחקר, AI עשויה לעזור להגביר את הדמיון האנושי במקום להחליף אותו.
"על ידי התמודדות ישירה עם יכולות האדם והמכונה, מחקרים כמו שלנו דוחפים אותנו לחשוב מחדש למה אנחנו מתכוונים ביצירתיות", מסכם פרופסור קארים ג'רבי.
על המחקר
המאמר שכותרתו "יצירתיות מגוונת בבני אדם ומודלים לשוניים גדולים" פורסם ב דוחות מדעיים ב-21 בינואר 2026. המחקר הפגיש מדענים מאוניברסיטת מונטריאול, אוניברסיטת קונקורדיה, אוניברסיטת טורונטו מיססאוגה, מילה (מכון AI קוויבק), ו-Google DeepMind.
פרופסור קארים ג'רבי הוביל את המחקר, כאשר אנטואן בלמאר-פפין (Université de Montréal) ופרנסואה לספינאסה (Université Concordia) שימשו ככותבים ראשונים. צוות המחקר כלל גם את יושע בנג'יו, מייסד Mila ו-LoiZéro, וחלוץ הלמידה העמוקה, הטכנולוגיה מאחורי מערכות בינה מלאכותית מודרניות כמו ChatGPT.
קישור לכתבת המקור – 2026-01-25 16:50:00


