בשנת 2024 נרשמה התקדמות חסרת תקדים בציוני מבחן ARC AGI (ראשי תיבות של Abstraction and Reasoning Corpus for Artificial General Intelligence), המהווה אתגר מרכזי בבדיקת היכולות של מערכות בינה מלאכותית להתמודד עם משימות מופשטות ומורכבות. הישגי השנה אינם רק חיזוק ליכולות המודלים אלא גם עדות לפריצות דרך בטכניקות למידה.
רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.
אפשר גם להרשם לניוזלטר שלנו
ARC AGI: מהותו והשלכותיו על תחום ה-AI
לפני הכל – שימו לב לגרף הבא:
שימו לב לקפיצה בסוף השנה האחרונה – קפיצה שתפסה את תשומת ליבם של רבים מסביב לעולם! הגרף ממחיש את התקדמות מודלי ה-AI בשנים האחרונות, לפי מבחן Arc AGI. מבחן זה פותח על ידי החוקר פרנסואה שולה (François Chollet), מפתח ספריית Keras, בשנת 2019. מטרת המבחן היא להעריך את היכולת של מערכות בינה מלאכותית להתמודד עם משימות חדשות שמעולם לא נצפו, תוך דגש על הכללה (Generalization) ולא על מומחיות מבוססת נתונים. המבחן שם דגש על הפרמטרים הבאים:
- יכולת הכללה ולא ידע מוקדם: ARC AGI אינו בוחן יכולות שמבוססות על אימונים מסיביים או על מאגרי נתונים גדולים, אלא את היכולת להתמודד עם בעיות חדשות ומורכבות באמצעות חשיבה מופשטת.
- משימות מופשטות ובלתי צפויות: המשימות במבחן דורשות זיהוי דפוסים, הפעלת חוקים על בסיס דוגמאות בודדות והסקת מסקנות – יכולות הנחשבות לליבה של אינטליגנציה אנושית.
- השוואת AI לאדם: ARC AGI מספק פלטפורמה להשוואת ביצועים של מערכות AI לאינטליגנציה אנושית, תוך נטרול הטיות תרבותיות או לשוניות.
או במילים אחרות – ARC AGI מבקש למדוד את מהות האינטליגנציה הכללית: היכולת להסתגל למצבים חדשים ולרכוש מיומנויות שאינן נלמדו מראש. בניגוד למבחנים מסורתיים, הוא מתמקד בהערכה אובייקטיבית של חשיבה והסקת מסקנות.
2024 – שנת ה-AI
התקדמות בכל החזיתות!
שנת 2024 ללא ספק התבלטה כ”שנת ה-AI” בזכות ההתקדמות המשמעותית והמהירה בתחום הבינה המלאכותית והשפעתה הרחבה על תחומי חיים רבים. פריצות הדרך הטכנולוגיות של השנה שינו את האופן שבו אנו תופסים ומשתמשים בטכנולוגיה זו. אחת הדוגמאות הבולטות הייתה השדרוג למודלים מולטימודליים, דוגמת GPT-4o של OpenAI, שהציג יכולות לעיבוד משולב של טקסט, תמונות, אודיו ווידאו. אפשרות זו פתחה בפני משתמשים יישומים חדשים כמו יצירת מתכונים בהתבסס על תמונה של מקרר, או ניתוח תוכן אודיו לצרכים שונים. בחזית זו, ראוי לציין את מודלי ג’מיניי 2.0 שמתבססים על מולטימודאליות וצועדים אל עבר עתיד שחוזה שימוש נרחב בסוכני AI חכמים ועוזרים אישיים.
פריצות דרך נוספות פקדו את תעשיית הווידאו הג’נרטיבי – תחום שנהנה מהתפתחות מרחיקת לכת, עם הופעת כלים ליצירת סרטוני וידאו איכותיים מתיאור טקסטואלי בלבד (כמו סורה, קלינג, לומה, מינימקס ועוד). טכנולוגיה זו חוללה מהפכה בתעשיית הפרסום והפקת התוכן, והפחיתה בצורה דרמטית את התלות במשאבים מסורתיים.
מעבר לפריצות דרך טכנולוגיות, הבינה המלאכותית השפיעה בצורה מוחשית על תחומים מגוונים בתעשייה ובחברה. במגזר הבריאות, AI שיפרה את יכולות האבחון הרפואי, עם כלים שהצליחו לזהות מחלות מוקדם יותר מרופאים אנושיים ואף לזרז פיתוח תרופות. מיקרוסופט ופייג’ (Paige) תרמו לכך עם פיתוח מודל AI ייחודי לזיהוי סרטן באמצעות ניתוח תמונות רפואיות (מודל Virchow). בתחום המסחר האלקטרוני, טכנולוגיות AI הפכו את חוויית הקנייה האישית ליעילה ומותאמת יותר, עם צ’אטבוטים המספקים שירות לקוחות זמין ומדויק יותר. במקביל, במגזר התחבורה, מערכות נהיגה אוטונומיות כמו Tesla Autopilot הוסיפו להשתפר, והציגו פתרונות בטיחותיים ומתקדמים.
השפעת הבינה המלאכותית התפשטה גם אל מעבר לתעשיות ספציפיות, עם נתון מעניין במיוחד: 75% מהארגונים ברחבי העולם דיווחו בשנת 2024 על שימוש יומיומי בבינה מלאכותית ג’נרטיבית. דמוקרטיזציה של הטכנולוגיה התאפשרה גם בזכות התרחבות השימוש במודלים קטנים יותר, שהפכו את ה-AI לנגישה יותר לעסקים קטנים ולמשתמשים פרטיים (מודלי מיני או מודלי SLM).
עם זאת, לצד ההתקדמות, שנת 2024 התאפיינה גם בדיונים מעמיקים על סוגיות אתיקה ורגולציה. ממשלות וארגונים בינלאומיים החלו להניח את היסודות לחוקים ותקנות שנועדו להבטיח שימוש אחראי בטכנולוגיה, כולל פה בישראל, תוך מניעת ניצול לרעה שלה. שנת 2024 סימנה אפוא את המעבר של AI מטכנולוגיה חדשנית בלבד לכלי שמשפיע על כל תחום אפשרי, מה שהופך אותה לציון דרך היסטורי בתחום זה. כלי שמשנה מקצה לקצה את שוק התעסוקה בארץ ובעולם.
פתאום המודלים נהיו חכמים יותר
שנת 2024 סימנה גם נקודת מפנה משמעותית במבחן ARC AGI, עם עלייה ממוצעת בציונים מ-33% בינואר ל-70% בדצמבר. השיפור נזקף לזכות פיתוחים מתקדמים בטכניקות למידה עמוקה, דוגמת סינתזת תוכניות ואימון בזמן אמת (Test-Time Training). תרומה ניכרת לשיפור נרשמה גם בזכות תחרויות כמו ARC Prize 2024, שיצרו שיתוף פעולה בין חוקרים מובילים בעולם. מודל O3 של OpenAI הציג פריצת דרך חסרת תקדים, עם ציון של 87.5% במבחן ARC AGI – קפיצה משמעותית בהשוואה למודלים קודמים כמו GPT-4o (5%) ו-o1-preview (18%). מדובר במודל הראשון שחצה את סף ה-85%, הממוצע האנושי במדד. המשמעות היא שהמודל הזה נמצא כבר בסקאלה של חשיבה אנושית (אדם ממוצע מקבל ציון של 85% במבחן ARC AGI).
מה עמד מאחורי ההישג? בדומה ל-O1 (שזמין לשימוש למנויים בתשלום בפלטפורמה של ChatGPT), מודל O3 שילב טכניקות חדשניות כמו “הסקה רב שלבית” ו”שרשרת מחשבה” (Chain-of-Thought Reasoning). בניגוד למודלים שהתבססו על אימונים מסיביים, O3 התמקד ביכולת לפתור בעיות מופשטות בזמן אמת – ללא הכנה מוקדמת. הנתונים מדברים בשם עצמם – שימו לב לציונים של המודלים המובילים במבחן ARC AGI:
- GPT-3: 0%, ללא יכולת לפתור משימות.
- GPT-4o: 5%, שיפור קל בלבד.
- Claude 3.5: 14%, שיפור ניכר אך רחוק מהיעד.
- o1-preview: 18%, צעד משמעותי קדימה.
- O3: 87.5%, פער עצום ביחס למודלים קודמים.
הגרף ממחיש בבירור את העלייה הדרמטית בביצועי O3 ביחס למודלים קודמים, עם התקרבות ליכולות אנושיות.
המעבר מהגדלת כוח חישוב לחשיבה “כמו אנושית”
הישגי O3 מהווים צעד חשוב לקראת פיתוח AGI (מערכות AI עם בינה כללית, ולא בינה צרה, כמו המערכות הקיימות). מערכות אלו אמור להיות מסוגלות לבצע משימות מגוונות ללא הכנה מוקדמת. אף שהפערים בין מה שיש היום ליכולות אנושיות עדיין קיימים, הישגים אלה משנים את האופן שבו אנו רואים את תחום ה-AI. אנחנו צריכים סקאלה חדשה כדי למדוד אינטינליגנציה של כלי AI. כבר לא ניתן להשוות אותם למוח האנושי, כי הם כבר ב”מגרש משחקים” חדש משלהן. בעוד שהמוח שלנו סטטי – ה”מוח” של מערכות AI, וכמובן של מערכות AGI, ימשיך לגדול ולהתפתח. הפערים בין המין האנושי לאניטינליגנציה מלאכותית רק ילכו ויגדלו.
מודל O3 של OpenAI מדגים מעבר מ”הגדלת כוח חישוב” להתמקדות בחדשנות טכנולוגית. הצלחתו מעידה כי טכניקות כמו סינתזת תוכניות ושילוב הערכה מבוססת למידה עמוקה יכולות לשפר משמעותית ביצועים ללא צורך במאגרי נתונים עצומים. השלב הבא יתמקד במבחנים חדשים כמו ARC-AGI-2, שיציבו משימות מורכבות יותר. הצלחת O3 היא צעד אחד מתוך מסע ארוך שבו השאיפה היא פיתוח מערכות בינה מלאכותית כללית אמיתית.
2025 – שנת ה-AGI
אם 2024 הייתה שנת ה-AI, נראה כי 2025 תהיה שנת ה-AGI. השנה בה נאלץ להתרגל לחיות לצד מערכות שחכמות כמעט כמונו, או אולי אפילו יותר. ARC AGI הוא לא רק מבחן – הוא מסמן את הכיוון שבו תחום הבינה המלאכותית מתקדם. בשנת 2024, הישגי O3 הדגישו את הפוטנציאל האדיר של AI, אך גם את המגבלות שעוד נותרו. ייתכן שבשנים הבאות (או בחודשים הבאים) נידרש לפתח סולמות מדידה חדשים שיעריכו יצירתיות וחדשנות, מעבר ליכולות ההשוואה המסורתיות לאדם. ההתפתחויות בתחום מזמינות אותנו לחשוב מחדש על הדרך שבה אנו רואים בינה מלאכותית – לא כתחום שמחקה את האדם, אלא ככזה שמרחיב את גבולות היכולת הטכנולוגית בדרכים בלתי צפויות.