במשך שנים, עולם הבינה המלאכותית התקדם בצעדים מדודים: עוד מודל, עוד שיפור, עוד קפיצה בביצועים. אבל מתחת לפני השטח, משהו עמוק יותר מתחיל להשתנות - לא רק מה המודלים יודעים לעשות, אלא עד כמה ניתן להפוך את תהליך השיפור שלהם לאוטומטי. אחד המודלים שממחישים את הכיוון הזה הוא MiniMax-M2.7 - מודל שפה מתקדם שפותח על ידי חברת מינימקס (MiniMax) הסינית, בדומה למודלי שפה כמו ChatGPT, שמסוגל להבין טקסט, לענות על שאלות, לכתוב קוד ולבצע משימות מורכבות.
המודל נבנה כחלק ממאמץ רחב יותר של חברות טכנולוגיה בסין לפתח מודלי שפה מתקדמים בקנה מידה גדול, תוך הסתמכות על תשתיות חישוב, דאטה ואופטימיזציה של תהליכי אימון. במסגרת הזו, MiniMax-M2.7 לא רק אומן על כמויות גדולות של מידע, אלא גם שולב בתהליך הפיתוח של עצמו, כך שחלק מהמשימות שבדרך כלל מבוצעות על ידי מהנדסים עברו אוטומציה. השאלה כבר איננה רק מה המערכת יודעת, אלא עד כמה היא משתתפת ביצירת הדור הבא שלה.
רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו. אפשר גם להרשם לניוזלטר שלנו
בשנת 2016, חוקרי גוגל הציגו לעולם את AlphaGo - מערכת שלמדה לשחק גו ברמה על-אנושית. אחד הרגעים הזכורים ביותר היה מהלך 37 במשחק מול לי סדול, מהלך שנראה בתחילה כשגוי, אך בדיעבד התברר כגאוני.
הרגע הזה לא היה רק ניצחון טכנולוגי, אלא נקודת מפנה תפיסתית. זו הייתה הפעם הראשונה שבה רבים הבינו שמכונה לא רק מחקה חשיבה אנושית, אלא מסוגלת לייצר מהלכים שאפילו מומחים מתקשים לצפות. כמעט עשור אחרי, נדמה שאנחנו מתקרבים לשלב הבא - לא רק מודלים שלומדים בעצמם, אלא מערכות שמשתלבות בתהליך הפיתוח של עצמן.
איך המודל משתלב בתהליך השיפור של עצמו?
במקרה של MiniMax-M2.7, מדובר בתהליך מבוקר שבו המודל משתלב בלולאת שיפור מתמשכת, אך פועל בתוך מסגרת שמוגדרת ומנוהלת על ידי חוקרים ומהנדסים. לפי התיאור הרשמי, המודל השתתף בתהליך השיפור של עצמו: הוא סייע לעדכן זיכרון, לבנות יכולות (Skills), ולשפר את סביבת העבודה ותהליך ההרצה של המודל (Harness). כלומר, הוא פעל בתוך לולאת שיפור, אך כזו שהוגדרה ונוהלה על ידי חוקרים ומהנדסים.
מה באמת קורה בתוך התהליך?
החידוש המרכזי אינו "מודל שממציא את עצמו", אלא מעבר הדרגתי למערכות שבהן חלקים הולכים וגדלים מתהליך הפיתוח הופכים לאוטומטיים.
במקרה הזה, המודל השתלב בתוך ה-workflow של צוותי הפיתוח. לפי הדיווחים, הוא ביצע חלק מהמשימות שבדרך כלל נעשות על ידי צוותי reinforcement learning, כולל ניתוח תקלות, דיבוג (Debugging), הצעת שינויים בקוד, הרצת ניסויים והערכת תוצאות.
ההערכות מדברות על כך שבחלק מהמקרים, המערכת השתתפה בכ-30% עד 50% מהעבודה התפעולית בתהליך.
במילים אחרות, לא מדובר במערכת שמפתחת את עצמה באופן עצמאי, אלא בכזו שמסייעת לבנות את הגרסה הבאה שלה בתוך מסגרת מוגדרת.
עד כמה זה משמעותי?
המשמעות המרכזית היא שינוי בקצב ובסקייל. כאשר חלקים משמעותיים מהעבודה עוברים אוטומציה, תהליך הפיתוח הופך למהיר יותר, ולעיתים גם עקבי יותר.
עם זאת, חשוב להדגיש, אין כאן "הבנה עצמית" או קבלת החלטות חופשית. מדובר באופטימיזציה של תהליך, לא בהחלפה של האדם.
כמה רחוק זה מאוטונומיה אמיתית?
כדי להבין את המשמעות של MiniMax-M2.7, צריך להבחין בין שני מושגים שונים: שיפור עצמי במסגרת מוגדרת, ואוטונומיה מלאה.
מה כבר קורה היום?
כבר היום קיימים תהליכים של AutoML, חיפוש ארכיטקטורות אוטומטי, ושימוש במודלים כדי לשפר מודלים אחרים. MiniMax-M2.7 משתלב במגמה הזו, אך מרחיב אותה מבחינת היקף האוטומציה והמעורבות בתהליך. במובן הזה, המודל כבר אינו רק תוצר - אלא גם כלי בתוך תהליך הפיתוח.
ומה עדיין לא קיים?
אוטונומיה מלאה - כלומר מערכת שמגדירה לעצמה מטרות, בונה אסטרטגיה ומבצעת אותה ללא התערבות אנושית - עדיין אינה קיימת.
גם כאן, בני אדם מגדירים את המטרות, הכלים והגבולות. המודל פועל בתוך המסגרת הזו, ולא מחוץ לה.
בין הצהרות למציאות
השיח סביב מודלים מהסוג הזה נשען לעיתים על פרשנות רחבה של היכולות בפועל. עם זאת, בהיעדר שקיפות מלאה לגבי אופן הבדיקה, הנתונים והמתודולוגיה, קשה לקבוע עד כמה ההישגים ניתנים להשוואה ישירה למודלים אחרים. אין כיום הוכחה לכך שמדובר במערכת האוטונומית הראשונה מסוגה, לא בסין ולא בעולם. גם ההשוואות למודלים אחרים דורשות זהירות, במיוחד כאשר אין שקיפות מלאה לגבי המתודולוגיה והנתונים. בפועל, מדובר בשלב נוסף באבולוציה של תהליכי פיתוח - לא בקפיצה ישירה לאוטונומיה מלאה.
אז מה כן השתנה?
השינוי האמיתי אינו בכותרות, אלא בתהליך. במקרה של MiniMax, השינוי הזה כבר מקבל ביטוי מעשי: חלקים מהעבודה שפעם בוצעו ידנית על ידי חוקרים ומהנדסים - כמו ניתוח תקלות, הרצת ניסויים והערכת תוצאות - משתלבים בתוך מערכת שבה המודל עצמו לוקח חלק פעיל.
המודל כבר אינו רק תוצר של הפיתוח, אלא גם כלי בתוך תהליך הפיתוח. הוא משתלב בלולאת עבודה שבה כל גרסה מסייעת לשפר את הבאה אחריה, במסגרת שמוגדרת ומנוהלת על ידי בני אדם.
זהו שינוי שקט יחסית, אך כזה שיכול להשפיע על קצב ההתקדמות, על מבנה הצוותים, ועל האופן שבו חברות כמו מינימקס (MiniMax) בונות את הדורות הבאים של המודלים שלהן.
בסופו של דבר, אולי השאלה החשובה אינה האם מודלים יפעלו באופן עצמאי, אלא עד כמה אנחנו מוכנים לשלב אותם בתוך תהליך הפיתוח עצמו. לא אוטונומיה מלאה, אלא השתתפות הולכת וגדלה - בתוך גבולות שהאדם עדיין מגדיר.
במקרה של מינימקס (MiniMax), השילוב הזה כבר מתממש בפועל, כחלק ממאמץ רחב יותר של חברות טכנולוגיה בסין להאיץ את קצב הפיתוח ולצמצם תלות בתהליכים ידניים. אם המגמה הזו תימשך, ייתכן שהיתרון לא יגיע דווקא ממודל "חכם יותר", אלא ממערכת שיודעת לשפר את עצמה מהר יותר.






