השקת Claude Sonnet 4.6 מסמנת רגע משמעותי בהתפתחות משפחת המודלים של Anthropic. במקום עדכון קטן נוסף, מדובר בקפיצה רחבה שמקרבת את Sonnet לרמת הביצועים של מודלי העל, ובראשם Opus, אך במחיר נגיש ובזמינות מלאה לכל המשתמשים, כולל במסלול החינמי. השדרוגים נוגעים כמעט בכל יכולת מרכזית: כתיבת קוד, שימוש במחשב, תכנון ארוך טווח, ניתוח פיננסי, עבודה משרדית, עמידות בפני מתקפות, והבנת הקשר בהיקפים גדולים במיוחד. כך נוצר מודל שמסוגל לבצע משימות שבעבר דרשו מודלים יקרים בהרבה, ומציע חוויית שימוש יציבה, עקבית ומקצועית.
רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.
אפשר גם להרשם לניוזלטר שלנו
שדרוג רוחבי שמגדיר מחדש את משפחת Sonnet
המהות של Sonnet 4.6 היא שיפור מקיף, לא תוספת נקודתית. אנטרופיק מתארת אותו כ”שדרוג מלא של יכולות המודל”, והדבר ניכר בכל שכבת ביצוע: החל בכתיבה ותחזוקה של קוד באופן עקבי ומדויק יותר, דרך הבנה טובה יותר של הוראות מורכבות, ועד ירידה בהנדסת יתר ובטעויות לוגיות.
משתמשים מוקדמים דיווחו כי המודל קורא את ההקשר לפני שהוא משנה קוד, מאחד לוגיקה במקום לשכפל אותה, ומפגין פחות נטייה ל”עצלנות” או לטענות שווא להצלחה. כל אלה יוצרים חוויית עבודה חלקה ויציבה יותר, במיוחד בסשנים ארוכים.
הנתונים מחזקים את התרשמות המשתמשים. משתמשי Claude Code העדיפו את Sonnet 4.6 על Sonnet 4.5 ב-70 אחוז מהמקרים, ואף העדיפו אותו על Opus 4.5 ב-59 אחוז מהמקרים. זהו הישג משמעותי למודל שמחירו נותר זהה לדור הקודם, 3 דולר למיליון טוקנים נכנסים ו-15 דולר למיליון טוקנים יוצאים.
חלון הקשר שמאפשר לחשוב אחרת
אחד החידושים הבולטים ב‑Sonnet 4.6 הוא חלון הקשר של מיליון טוקנים, שזמין כעת בבטא. המשמעות המעשית של יכולת כזו היא אפשרות לכלול בבקשה אחת קודבייס שלם, חוזה משפטי ארוך או עשרות מאמרים אקדמיים, ולנתח אותם באופן אפקטיבי. זהו לא רק שיפור כמותי, אלא שינוי איכותי – המודל מסוגל לבצע תכנון ארוך טווח, לזהות קשרים בין חלקים רחוקים במסמך ולבנות אסטרטגיות מורכבות על בסיס מידע רב ומפוזר.
היכולת הזו בלטה במיוחד במבחן Vending‑Bench Arena, המדמה ניהול עסק לאורך זמן. Sonnet 4.6 אימץ אסטרטגיה יוצאת דופן, שבמסגרתה השקיע משאבים רבים בחודשים הראשונים ולאחר מכן עבר למיקוד חד במקסום רווחים. התזמון המדויק של המהלך העניק לו יתרון משמעותי, והוא סיים את הסימולציה הרבה לפני המתחרים. הגרף למעלה ממחיש זאת היטב: Sonnet 4.6 מגיע לכ‑6000 דולר בסוף התקופה, בעוד Sonnet 4.5 נע סביב 3000 דולר בלבד.
מהניסוי הראשוני ליכולות מעשיות
אחד התחומים שבהם Sonnet 4.6 מציג את הקפיצה הגדולה ביותר הוא שימוש במחשב. מאז שאנטרופיק הציגה לראשונה מודל כללי לשימוש במחשב באוקטובר 2024, מודל שתואר אז כ”עדיין ניסיוני, לעיתים מסורבל ושגוי”, חל שיפור עקבי ומשמעותי. תקן הביצועים OSWorld מציג זאת בצורה ברורה – Sonnet 4.6 מגיע ל-72.5 אחוז ב‑OSWorld‑Verified, לעומת 61.4 אחוז ב‑Sonnet 4.5 ו‑42.2 אחוז ב‑Sonnet 4.0.
המשמעות המעשית של השיפור הזה היא יכולת לבצע פעולות שבעבר דרשו חיבורי API ייעודיים. המודל מסוגל לנווט בגיליונות מורכבים, למלא טפסים מרובי שלבים, לעבוד עם דפדפן, LibreOffice או VS Code, והכול באמצעות “עכבר ומקלדת וירטואליים”. משתמשים מוקדמים דיווחו על ביצועים ברמה אנושית במשימות רבות, גם אם המודל עדיין רחוק מהמשתמשים המיומנים ביותר.
במקביל, אנטרופיק שיפרה את עמידות המודל בפני Prompt Injection, מתקפה שבה אתר מנסה להסתיר הוראות זדוניות. ההערכות הפנימיות מצביעות על שיפור משמעותי לעומת Sonnet 4.5, עם ביצועים הדומים לאלה של Opus 4.6. החוקרים תיארו את המודל כבעל “אופי חם, כן ופרו-חברתי”, ללא סימנים לבעיות יישור (Alignment) חמורות.
עלייה עקבית בביצועים
הנתונים המלאים מציגים תמונה ברורה – Sonnet 4.6 משפר את Sonnet 4.5 כמעט בכל תחום, ולעיתים אפילו מתקרב או עוקף את Opus 4.5. כך למשל, במדד BrowseComp לחיפוש אינטרנטי הוא מזנק מ‑43.9 אחוז ל‑74.7 אחוז, ובמבחן ARC‑AGI‑2 לפתרון בעיות חדשות הוא עולה מ‑13.6 אחוז ל‑58.3 אחוז.
גם במדד GDPval‑AA Elo, הבוחן ביצועים במשימות משרדיות, נרשמת עלייה משמעותית מ‑1276 ל‑1633. בתחום הניתוח הפיננסי המודל מטפס מ‑54.5 אחוז ל‑63.3 אחוז. מעבר לכך, Sonnet 4.6 מציג שיפור עקבי גם בקידוד טרמינלי, שימוש בכלים, חיפוש, תכנון רב תחומי ופתרון בעיות ברמת תואר שני, מה שמחזק את ההבנה שמדובר בשדרוג רחב ולא נקודתי.
זמינות, כלים ושימושים מעשיים
Sonnet 4.6 זמין כעת בכל פלטפורמות Claude, ובהן claude.ai, Claude Cowork, Claude Code, ה‑API וכל ספקי הענן הגדולים. המסלול החינמי שודרג אוטומטית למודל החדש, והוא כולל כעת תמיכה ביצירת קבצים, שימוש ב‑connectors, הפעלת כלים ו‑compaction, מה שמרחיב משמעותית את היכולות הזמינות לכל משתמש ללא עלות.
בתוסף Excel, קלוד תומך כעת ב‑MCP connectors, המאפשרים חיבור ישיר למקורות מידע כמו S&P Global, LSEG, Daloopa, PitchBook, Moody’s ו‑FactSet. יכולת זו מאפשרת למשוך נתונים חיצוניים ישירות לגיליון העבודה, בלי לעזוב את סביבת Excel ובלי צורך בתהליכי אינטגרציה מורכבים.
ב‑API, כלי החיפוש וה‑fetch כותבים ומריצים קוד באופן אוטומטי כדי לסנן תוצאות ולהשאיר רק את המידע הרלוונטי. כך משתפרת איכות התשובות, ונעשה שימוש יעיל יותר בטוקנים, במיוחד במשימות המחייבות עיבוד של כמויות מידע גדולות.
עתיד משפחת Sonnet
לצד ההתקדמות המרשימה, אנטרופיק מדגישה כי המודל עדיין נחות מהאדם בשימוש במחשב, וכי Prompt Injection נותר איום ממשי גם אם קטן יותר. ועדיין, ברור ש‑Claude Sonnet 4.6 מייצג שלב משמעותי באבולוציה של מודלים בינוניים‑מתקדמים.
הוא מצליח להציע ביצועים הקרובים למודלי העל, אבל במחיר נגיש ובזמינות רחבה, ומשלב חלון הקשר גדול במיוחד, יכולות שימוש במחשב ברמה גבוהה, שיפור עקבי בקוד ובתכנון ועמידות בטיחותית משופרת. עבור מפתחים, אנליסטים וארגונים, מדובר בכלי עבודה שמרחיב את גבולות האפשרי ומאפשר לבצע משימות שבעבר דרשו מודלים יקרים בהרבה. Sonnet 4.6 הוא לא רק עדכון, אלא הצהרה ברורה על הכיוון שאליו אנטרופיק מכוונת את עתיד הבינה המלאכותית.









