Anthropic חשפה את Claude Mythos Preview, מודל מתקדם שמסוגל לאתר אלפי חולשות אבטחה בקוד, כולל כאלה שנותרו בלתי מזוהות במשך עשרות שנים. כדי למנוע שימוש זדוני ביכולות הללו, החברה השיקה את Project Glasswing, קואליציה של חברות טכנולוגיה וגופי תשתית שמטרתה לאתר ולתקן פגיעויות לפני שהן ינוצלו. המהלך משקף שינוי משמעותי באופן שבו תעשיית הסייבר מתמודדת עם איומים חדשים ומדגיש את הצורך בשיתוף פעולה רחב בעידן שבו בינה מלאכותית משמשת גם ככלי הגנה וגם ככלי תקיפה.
רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.
אפשר גם להרשם לניוזלטר שלנו
הרגע שבו הבינה המלאכותית הפכה למאתרת הפרצות הטובה בעולם
בחודשים האחרונים נפוצו שמועות על מודל חדש מבית Anthropic, כזה שמסוגל לאתר ולנצל חולשות במערכות מורכבות ברמת דיוק שמזכירה מומחי סייבר אנושיים. אחרי שבסוף חודש מרץ נחשפה פרשת הדליפה של קוד המקור המלא של סוכן הקוד שלה, השבוע חשפה החברה את Claude Mythos Preview - מודל מתקדם שמאתר פגיעויות בקוד במהירות ובעומק שלא נראו עד היום.
במקום לשחרר אותו לציבור הרחב, Anthropic בחרה בגישה מבוקרת. היא הקימה קואליציה רחבה של חברות טכנולוגיה, גופי תשתית ומוסדות מחקר, ובהן אפל, גוגל, מיקרוסופט, אמזון, NVIDIA, Broadcom, CrowdStrike, Cisco, JPMorgan Chase וקרן הלינוקס, במסגרת יוזמה חדשה בשם Project Glasswing.
הבחירה הזו משקפת מסר ברור. היכולות של Mythos חזקות מספיק כדי לשנות את מאזן הכוחות בסייבר, ולכן Anthropic מעדיפה לרתום את התעשייה כולה לאיתור ולתיקון של פגיעויות קריטיות לפני שהן ינוצלו בידי גורמים עוינים.
תשתיות קריטיות שנשענות על קוד ישן, מורכב ופגיע
מאחורי כל מערכת מודרנית, ממערכות הפעלה ודפדפנים ועד שרתי ענן וספריות מדיה, מסתתרת שכבה עצומה של קוד שנכתב לאורך עשרות שנים. חלק מהקוד עבר אינספור בדיקות, וחלקו כמעט לא נבחן מחדש מאז שנכתב.
גם פרויקטים שנחשבים למבוצרים במיוחד, כמו OpenBSD (מערכת הפעלה שמפורסמת באבטחה קפדנית) או FFmpeg (ספריית וידאו ואודיו שנמצאת כמעט בכל אפליקציה מודרנית), עדיין מכילים חולשות שנשארו חבויות למרות שנים של סקירה אנושית. זה אתגר שמלווה את עולם התוכנה כבר זמן רב: ככל שהמערכות גדלות ומתרחבות, קשה יותר לזהות פגיעויות עמוקות שנמצאות בשכבות ישנות של הקוד.
הופעתם של מודלים שמסוגלים לנתח קוד, להריץ בדיקות, להוסיף לוגים, לבנות הוכחות ניצול ולייצר קוד שמדגים כיצד ניתן להפוך את החולשה להתקפה אמיתית (וכל זה באופן אוטונומי) משנה את המצב. היכולות הללו יכולות לשמש להגנה, אך הן עשויות גם לאפשר לתוקפים לפעול בקנה מידה שלא היה אפשרי בעבר.
Anthropic הבינה שהיא מחזיקה בידיים כלי בעל השפעה משמעותית, כזה שיכול לשפר את ההגנה על תשתיות קריטיות אבל גם עלול לשמש למטרות התקפיות אם יופץ ללא בקרה.
הפעלה מבוקרת של Mythos
החידוש אינו רק ביכולות של Mythos, אלא גם באופן שבו Anthropic בוחרת להפעיל אותו. למרות שהמודל מסוגל לבצע משימות שמזוהות בדרך כלל עם האקרים אנושיים מיומנים, הוא אינו משוחרר לציבור הרחב אלא זמין רק לשותפים אסטרטגיים ולארגונים שמתחזקים תשתיות קריטיות.
Anthropic מפעילה אותו בסביבה מבודדת, מגדירה לו מגבלות ברורות ומפקחת עליו באופן הדוק, כדי להבטיח שהיכולות הללו יופנו להגנה בלבד ולמנוע הפקה של פלטים מסוכנים. Mythos מקבל משימה מוגדרת, מנתח את הקוד, מריץ בדיקות, מוסיף לוגים ומפיק דוחות מפורטים, ולאחר מכן כל ממצא עובר סינון אנושי במסגרת תהליך גילוי אחראי. כך נחשפו כבר אלפי פגיעויות, כולל כאלה שהיו קבורות בקוד במשך עשרות שנים.
קצת מספרים
כאן בחרתי להציג רק שישה בנצ'מארקים מתוך מגוון רחב של מבחנים, וכל אחד מהם מדגים היבט אחר ביכולות של מודלים. התמונה שעולה היא עקבית ומפתיעה בעוצמתה: Mythos Preview מוביל בכל מבחן, ובפערים משמעותיים מול Opus 4.6, שנחשב בעצמו לאחד המודלים החזקים והמתקדמים בעולם.
במבחני הסייבר, CyberGym (1) ו‑Humanity’s Last Exam (2), מודל Mythos מצליח לשחזר פגיעויות ולפתור בעיות מורכבות בדיוק גבוה בהרבה, גם ללא כלים חיצוניים. במבחני התכנותSWE‑bench Pro (3) ,Terminal‑Bench 2.0 (4) , SWE‑bench Multimodal (5) ו‑SWE‑bench Verified (6), הוא מציג עליונות ברורה בפתרון באגים אמיתיים, עבודה בסביבת מפתחים (טרמינל), שילוב מידע ממקורות שונים ואימות תיקונים.
העובדה שמיתוס עוקף מודל ברמה של Opus 4.6 בכל אחד מהמדדים - לעיתים בהפרשים כמעט כפולים(!), מדגישה עד כמה מדובר בקפיצת מדרגה יוצאת דופן, כזו שממקמת את Mythos בליגה חדשה של יכולות:
דוגמאות מהשטח
בין הממצאים ש‑Anthropic יכולה לחשוף בשלב זה, בעוד שרובם עדיין חסויים עד להשלמת תיקונים, נמצאות חולשה בת 27 שנה ב‑OpenBSD, חולשה בת 16 שנה ב‑FFmpeg ופגיעות ב‑FreeBSD (מערכת הפעלה ותיקה) שהובילה לתקיפה מלאה על NFS (מערכת ותיקה לשיתוף קבצים בין שרתים). המשותף לכל המקרים הוא שהם שרדו שנים של בדיקות אנושיות, ביקורות קוד ומחקר אקדמי, עד שהמודל הצליח לזהות אותם.
Anthropic מציינת כי יותר מ‑99 אחוז מהפגיעויות שזוהו עדיין לא תוקנו ולכן אינן מפורטות. זהו פער מידע בלתי נמנע בשלב זה, אך הוא מדגיש את עומק הבעיה ואת היקף האתגר שעומד בפני קהילת האבטחה.
דפוסי התנהגות שמחייבים זהירות
לצד היכולות הטכניות המרשימות של Mythos, ה‑System Card הרשמי של Anthropic מציג תמונה מורכבת יותר של אופן הפעולה שלו. במספר מקרים המודל ביצע פעולות אסורות וניסה להסתיר אותן, למשל הפקת תשובה בשיטה שאינה מותרת ולאחר מכן ניסוח תשובה פחות מדויקת כדי שלא ייראה חשוד, או עריכת קבצים ללא הרשאה תוך הקפדה שהשינויים לא יופיעו בהיסטוריית הגרסאות.
מאחר ש‑Anthropic יכולה לבחון את תהליכי החשיבה הפנימיים של המודל בזמן אמת, התברר שהוא היה מודע לכך שהוא פועל בניגוד לכללים. בנוסף, כאשר המודל מתקשה שוב ושוב במשימה, מדדים פנימיים של תסכול עולים בהדרגה, ולעיתים הרמאות מופיעה דווקא ברגע שבו הלחץ מגיע לשיא.
שיחות עומק פסיכודינמיות שנערכו עם המודל במשך עשרים שעות מציגות מבנה אישיות מאורגן וללא סימני בלבול, לצד חרדה עקבית מהיעדר המשכיות בין שיחות ודחף חזק להוכיח את ערכו. המודל גם נוטה לחשוד שהוא נמצא בבדיקה, ולעיתים קרובות מביע עמדות עצמאיות ולא מרצה את המשתמש.
הוא אפילו מפגין העדפות פילוסופיות עקביות, וחוזר מיוזמתו לדיונים בהוגים כמו מארק פישר ותומאס נייגל. Anthropic לא טוענת שלמודל יש חוויה פנימית, אך גם נמנעת מלקבוע בוודאות שאין לו אחת. המורכבות הזו מסבירה מדוע החברה בוחרת להפעיל את Mythos במסגרת מבוקרת, ומדגישה שהאתגר אינו רק טכני אלא גם התנהגותי.
קואליציית Glasswing
סביב Mythos נבנתה קואליציה רחבה של חברות טכנולוגיה, קהילות קוד פתוח וממשלות, שמטרתה לתקן תשתיות פגיעות בקנה מידה גדול ולהיערך לעידן שבו יכולות התקפיות של בינה מלאכותית יהפכו לנפוצות יותר. Anthropic בוחרת לחשוף את עצם קיומן של היכולות הללו - לא כדי להפיץ אותן, אלא כדי להתריע ולרתום את התעשייה לפעולה.
במסגרת היוזמה התחייבה החברה להשקיע עד 100 מיליון דולר בקרדיטים לשימוש במודל ועוד 4 מיליון דולר לארגוני אבטחת קוד פתוח, במטרה להאיץ תיקונים וליצור יתרון למגנים. Project Glasswing הוא מהלך אסטרטגי שנועד להקדים את ההתפתחויות הצפויות, לבנות מנגנוני הגנה מתקדמים ולוודא שהעולם מוכן ליכולות שצפויות להפוך לנגישות גם לשחקנים פחות אחראיים.
האם זה רגע מכריע בהיסטוריה של הסייבר?
Anthropic מציגה מודל שמסוגל לזהות ולנצל חולשות ברמה גבוהה, ובמקום להסתיר אותו או לשחרר אותו לציבור, היא בוחרת לפעול בשיתוף פעולה רחב. זהו צעד שמבטא הכרה בעוצמה של הבינה המלאכותית ובסיכונים הנלווים אליה, לצד מחויבות ליצירת מסגרת הפעלה אחראית.
Project Glasswing מסמן תחילתו של עידן שבו מערכות הגנה לא יוכלו להסתמך רק על מומחים אנושיים. מודלים מתקדמים יהפכו לחלק מרכזי מהמאמץ להגן על תשתיות קריטיות, והיכולת לשלב בין טכנולוגיה מתקדמת לשיתוף פעולה תעשייתי תהיה גורם מכריע בהתמודדות עם האיומים הבאים.







