חוקרים מפתחים AI כדי להפוך את האינטרנט לנגיש יותר

פרסומת
X-ray_Promo1


במאמץ להפוך את האינטרנט לנגיש יותר עבור אנשים עם מוגבלויות, חוקרים מאוניברסיטת אוהיו סטייט החלו לפתח סוכן בינה מלאכותית שיכול לבצע משימות מורכבות בכל אתר אינטרנט באמצעות פקודות שפה פשוטות.

פרסומת

בשלושת העשורים מאז שוחרר לראשונה לרשות הציבור, הרשת העולמית הפכה למערכת מורכבת ודינאמית להפליא. עם זאת, מכיוון שתפקוד האינטרנט הוא כעת כל כך אינטגרלי לרווחת החברה, המורכבות שלה גם מקשה משמעותית על הניווט.

כיום ישנם מיליארדי אתרים זמינים כדי לסייע בגישה למידע או לתקשר עם אחרים, ומשימות רבות באינטרנט יכולות לקחת יותר מתריסר צעדים. לכן יו סו, מחבר שותף למחקר ועוזר פרופסור למדעי המחשב והנדסה במדינת אוהיו, אמר כי עבודתם, המשתמשת במידע שנלקח מאתרים חיים כדי ליצור סוכני אינטרנט – עוזרי AI מקוונים – היא צעד לקראת מה שהופך את העולם הדיגיטלי למקום פחות מבלבל.

"עבור אנשים מסוימים, במיוחד אלה עם מוגבלויות, לא קל להם לגלוש באינטרנט", אמרה סו. "אנחנו מסתמכים יותר ויותר על עולם המחשוב בחיי היומיום ובעבודה שלנו, אבל יש יותר ויותר מחסומים לגישה הזו, מה שבמידה מסוימת מרחיב את הפער".

המחקר הוצג בדצמבר בכנס השלושים ושבע על מערכות עיבוד מידע עצבי (NeurIPS), כנס דגל למחקר בינה מלאכותית ולמידת מכונה.

על ידי ניצול הכוח של מודלים שפות גדולים, הסוכן פועל בדומה לאופן שבו בני אדם מתנהגים בעת גלישה באינטרנט, אמר סו. צוות מדינת אוהיו הראה שהמודל שלהם מסוגל להבין את הפריסה והפונקציונליות של אתרים שונים תוך שימוש רק ביכולת שלו לעבד ולחזות שפה.

חוקרים התחילו את התהליך על ידי יצירת Mind2Web, מערך הנתונים הראשון עבור סוכני אינטרנט כלליים. למרות המאמצים הקודמים לבנות סוכני אינטרנט התמקדו באתרי אינטרנט מדומים לצעצועים, Mind2Web מאמצת במלואה את האופי המורכב והדינמי של אתרים בעולם האמיתי ומדגישה את יכולתו של סוכן להכליל לאתרים חדשים לחלוטין שלא ראה קודם לכן. סו אמר שחלק גדול מההצלחה שלהם נובע מהיכולת של הסוכן שלהם להתמודד עם עקומת הלמידה המתפתחת של האינטרנט. הצוות הרים למעלה מ-2,000 משימות פתוחות מ-137 אתרי אינטרנט שונים בעולם האמיתי, שבהם השתמשו אז כדי להכשיר את הסוכן.

חלק מהמשימות כללו הזמנת טיסות בינלאומיות לכיוון אחד ולחזור, מעקב אחר חשבונות מפורסמים בטוויטר, עיון בסרטי קומדיה מ-1992 עד 2017 בסטרימינג בנטפליקס, ואפילו תזמון מבחני ידע לרכב ב-DMV. רבות מהמשימות היו מורכבות מאוד – למשל, הזמנת אחת מהטיסות הבינלאומיות המשמשות במודל תבצע 14 פעולות. צדדיות בלתי מתאמצת כזו מאפשרת סיקור מגוון במספר אתרים, ופותחת נוף חדש לדוגמניות עתידיות לחקור וללמוד בצורה אוטונומית, אמרה סו.

"זה הפך להיות אפשרי לעשות משהו כזה רק בגלל הפיתוח האחרון של מודלים גדולים של שפה כמו ChatGPT," אמר סו. מאז שהצ'טבוט הפך לציבורי בנובמבר 2022, מיליוני משתמשים השתמשו בו כדי ליצור תוכן אוטומטי, משירה ובדיחות ועד עצות בישול ואבחונים רפואיים.

ובכל זאת, מכיוון שאתר אחד יכול להכיל אלפי רכיבי HTML גולמיים, זה יהיה יקר מדי להזין כל כך הרבה מידע למודל שפה גדול יחיד. כדי להתמודד עם הפער הזה, המחקר מציג גם מסגרת בשם MindAct, סוכן דו-צדדי המשתמש במודלים של שפות קטנות וגדולות כאחד כדי לבצע משימות אלו. הצוות מצא כי על ידי שימוש באסטרטגיה זו, MindAct מתעלה משמעותית על אסטרטגיות דוגמנות נפוצות אחרות ומסוגלת להבין מושגים שונים ברמה הגונה.

עם יותר כוונון עדין, מציין המחקר, המודל עשוי לשמש במקביל למודלים של שפות גדולות בקוד פתוח וסגור כדוגמת Flan-T5 או GPT-4. עם זאת, עבודתם מדגישה בעיה אתית יותר ויותר רלוונטית ביצירת בינה מלאכותית גמישה, אמר סו. למרות שהוא בהחלט יכול לשמש סוכן מועיל לבני אדם הגולשים באינטרנט, המודל יכול לשמש גם כדי לשפר מערכות כמו ChatGPT ולהפוך את האינטרנט כולו לכלי רב עוצמה חסר תקדים, אמר סו.

"מצד אחד, יש לנו פוטנציאל גדול לשפר את היעילות שלנו ולאפשר לנו להתמקד בחלק היצירתי ביותר של העבודה שלנו", אמר. "אבל מצד שני, יש פוטנציאל אדיר לפגיעה". לדוגמה, סוכנים אוטונומיים המסוגלים לתרגם צעדים מקוונים לעולם האמיתי יכולים להשפיע על החברה על ידי נקיטת פעולות שעלולות להיות מסוכנות, כגון שימוש לרעה במידע פיננסי או הפצת מידע מוטעה.

"עלינו להיות זהירים ביותר לגבי הגורמים הללו ולעשות מאמץ משותף כדי לנסות למתן אותם", אמר סו. אבל ככל שמחקרי הבינה המלאכותית ממשיכה להתפתח, הוא מציין שסביר שהחברה תחווה צמיחה משמעותית בשימוש המסחרי ובביצועים של סוכני אינטרנט כלליים בשנים הבאות, במיוחד מכיוון שהטכנולוגיה כבר צברה כל כך הרבה פופולריות בציבור.

"לאורך הקריירה שלי, המטרה שלי תמיד הייתה לנסות לגשר על הפער בין המשתמשים האנושיים לעולם המחשוב", אמר סו. "עם זאת, הערך האמיתי של הכלי הזה הוא שהוא באמת יחסוך לאנשים זמן ויהפוך את הבלתי אפשרי לאפשרי".

המחקר נתמך על ידי הקרן הלאומית למדע, מעבדת המחקר של צבא ארה"ב ומרכז מחשבי העל של אוהיו. מחברים אחרים היו שיאנג דנג, יו גו, בויואן ג'נג, שיג'י צ'ן, סמואל סטיבנס, בושי וואנג והואן סאן, כולם ממדינת אוהיו.



קישור לכתבת המקור – 2024-01-10 00:05:21

Facebook
Twitter
LinkedIn
Telegram
WhatsApp
Email
פרסומת
X-ray_Promo1

עוד מתחומי האתר