אנטרופיק השיקה את מודל הדגל החדש שלה, Claude Opus 4.5. המודל מציג ירידת מחיר חדה של 67 אחוז בהשוואה ל-Opus 4.1, שיפור משמעותי ביכולות קוד עם תוצאות מובילות בבנצ’מרקים, ואינטגרציות חדשות לדפדפן Chrome ול-Excel. לצד השדרוגים בביצועים, המודל מציג גם התקדמות בתחום הבטיחות עם עמידות משופרת וירידה בהתנהגויות לא רצויות. ההשקה מגיעה ימים בודדים אחרי GPT-5.1 של OpenAI ומיד אחרי Gemini 3 של Google, מה שמדגיש עד כמה התחרות בשוק מודלי השפה צמודה וצפופה. בסקירה הזו תקבלו תמונה מלאה על Opus 4.5: איפה הוא עומד מול מודלים אחרים, איך הוא מתפקד בביצועי קוד ושימושי מחשב, מה הוא יודע לעשות בפועל, כמה הוא עולה, עד כמה הוא בטוח, ולמי הוא מתאים.
רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.
אפשר גם להרשם לניוזלטר שלנו
המחיר הוא הסיפור הגדול
Opus 4.5 מתומחר ב-5 דולר למיליון טוקנים נכנסים ו-25 דולר למיליון טוקנים יוצאים, ירידה של 67 אחוז לעומת Opus 4.1 שעלה 15 ו-75 דולר בהתאמה.
מה זה אומר בפועל? טוקן הוא יחידת הטקסט שהמודל מעבד. בממוצע, מיליון טוקנים שווים לכ-750 אלף מילים באנגלית. עבור מפתחים שמריצים משימות קידוד יומיומיות, העלות ירדה מסדר גודל של עשרות דולרים ביום לכמה דולרים בודדים. היכולת הזו שהייתה נגישה בעיקר לארגונים גדולים הופכת מציאותית גם עבור צוותים קטנים וסטארטאפים.
שלושה מודלים, שלושה שימושים
אנטרופיק ממשיכה עם גישה של משפחת מודלים משלימים ולא מסתמכת על מודל אחד לכל המשימות.
Opus 4.5
המודל המתקדם ביותר. מיועד למשימות שמצריכות עומק מקסימלי כמו פרויקטי קוד מורכבים, סוכנים אוטונומיים וניתוח מסמכים ארוכים. למרות ירידת המחיר הדרמטית, Opus נשאר המודל היקר במשפחת 4.5, משום שהוא מספק את העומק והדיוק הגבוהים ביותר.
Sonnet 4.5
מודל העבודה היומיומי של המשפחה הוא Sonnet 4.5. הוא מספק את האיזון הטוב ביותר בין ביצועים, מהירות ועלות. לרוב המשימות השוטפות זו הבחירה המתאימה.
Haiku 4.5
המודל המהיר והחסכוני של המשפחה הוא Haiku 4.5. הוא מתאים לתעבורה גבוהה, תגובות מיידיות ומשימות פשוטות בהיקף גדול.
הבחירה בין השלושה משפיעה ישירות על היעילות ועל העלויות. שימוש ב-Haiku למשימות בסיסיות במקום ב-Opus יכול לחסוך עד פי חמש בעלויות בלי לפגוע בתוצאה. לרוב המשתמשים Sonnet יספיק. Opus רלוונטי כשהדיוק הוא גורם קריטי.
מה מספרים המספרים?
Opus 4.5 מציג קפיצה משמעותית ביכולות הנדסת תוכנה. בבנצ’מארק SWE-bench Verified, שמודד פתרון באגים אמיתי מתוך פרויקטי GitHub, המודל הגיע ל-80.9 אחוז והפך לראשון שחוצה את רף השמונים. לשם השוואה, GPT-5.1 Codex Max עומד על 77.9 אחוז, Sonnet 4.5 על 77.2 אחוז ו-Gemini 3 Pro על 76.2 אחוז.
מעבר לדיוק עצמו, Opus 4.5 מפגין יתרון ביעילות. בבדיקות effort controls הוא השיג דיוק גבוה יותר בכל רמות המאמץ, תוך הפקת פחות טוקני פלט בהשוואה לדורות קודמים. המשמעות היא שהמודל יודע לבצע תהליכי חשיבה מורכבים בצורה חסכונית יותר, וזה קריטי כשעובדים בהיקפים גדולים.
במבחן נוסף, Aider Polyglot, שמודד יכולת פתרון בעיות קידוד בסביבות מגוונות, Opus 4.5 הגיע ל-89.4 אחוז. Sonnet 4.5 מגיע ל-78.8 אחוז, כך שנוצר פער ברור בין הדגמים.
גם בתחום העבודה עם מחשב, הכולל שימוש בדפדפן, אפליקציות וממשקי מערכת, Opus 4.5 מציג שיא חדש של 66.3 אחוז בבנצ’מארק OSWorld (אפשר לראות בטבלה למעלה). המבחן הזה בודק עד כמה מודל שפה מסוגל לתפעל מחשב אמיתי, וזה תחום שהופך במהירות לרכיב מרכזי ביכולות של מודלים מתקדמים.
גם ביכולת לשמור על רצף לאורך זמן Opus 4.5 מציג יתרון ברור. עבודה אמיתית עם מודלים מתקדמים כוללת לא רק פתרון בעיות נקודתיות, אלא משימות ארוכות שמצריכות עקביות, הבנה מתמשכת ויכולת לחזור לפרטים קודמים בלי לאבד כיוון. בבנצ’מרק Vending-Bench, שבודק קוהרנטיות לטווח ארוך במשימות מורכבות ורב שלביות, Opus 4.5 מוביל בפער משמעותי על Sonnet 4.5.
מפרט טכני
Opus 4.5 מגיע עם חלון הקשר של 200 אלף טוקנים וגבול פלט של 64 אלף טוקנים. ה-reliable knowledge cutoff שלו הוא מרץ 2025, כלומר על מידע עד לתאריך הזה ניתן לסמוך באופן עקבי יותר, ומעבר לכך הידע חלקי.
לדברי דיאן נא פן (Dianne Na Penn), ראש תחום ניהול מוצר למחקר באנטרופיק, הגדלת חלון ההקשר לבדה אינה מספיקה. היכולת לזהות אילו פרטים חשובים להחזיק בזיכרון, ואילו כדאי לבדוק מחדש בזמן אמת, היא שמאפשרת למודל להתמודד עם משימות מורכבות לאורך זמן בלי לאבד את הרצף.
בטיחות והתנהגות: הפער שמבליט את Opus 4.5
אחד השינויים הבולטים ב-Opus 4.5 אינו רק בביצועים או ביעילות, אלא ברמת הבטיחות שהוא מציג. בעולם שבו מודלים משולבים במערכות ליבה, כלי קוד, תהליכים עסקיים וממשקי משתמש, עמידות למתקפות והפחתת התנהגויות לא רצויות הופכות לקריטיות כמו מהירות או דיוק.
עמידות למתקפות Prompt Injection
Opus 4.5 מציג את שיעור ההצלחה הנמוך ביותר למתקפות Prompt Injection בהשוואה ל-GPT-5.1 ו-Gemini 3. זהו מדד חשוב, משום שמתקפות כאלה יכולות לגרום למודל להתעלם מהוראות, לחשוף מידע או לבצע פעולות לא רצויות. הנתונים מראים פער ברור בין המודלים, כאשר Opus 4.5 מצמצם משמעותית את הסיכון להתנהגות כזו.
התנהגות לא רצויה: ירידה משמעותית
גם במדד התנהגות מדאיגה Opus 4.5 מפגין את התוצאות הנמוכות ביותר, כלומר רמה נמוכה יותר של תגובות שעלולות להתפרש כבעייתיות או לא בטוחות. זהו חיזוק נוסף לכך שהמודל מתוכנן לא רק לביצועים, אלא גם ליציבות, אמינות והתאמה לסביבות רגישות.
אינטגרציות ויכולות חדשות
צ’אט ללא הגבלה
Opus 4.5 מגיע עם מנגנון דחיסת הקשר שמסכם את חלקי השיחה הישנים בצורה חכמה ושומר את המידע הרלוונטי בלבד. המשמעות היא שהמשתמש יכול לקיים שיחה ארוכה מאוד, לבנות תוכניות מורכבות או לעבוד עם מסמכים גדולים, בלי להיתקל בהודעה שהחלון מלא. זה מאפשר סוף סוף עבודה רציפה בפרויקטים ארוכים, גם ללא תכנון מוקדם של מבנה השיחה.
Claude for Chrome
התוסף לדפדפן פתוח לכל משתמשי Max ומאפשר למודל לראות את הטאבים הפתוחים. זה מאפשר לבצע משימות כמו קריאה וניתוח של דפים, השוואת תוכן, מילוי טפסים וביצוע פעולות מבוססות דפדפן. במקום להעתיק טקסט מהדפדפן לתוך הצ’אט, המודל פשוט רואה את המסך ועובד עליו ישירות.
Claude for Excel
האינטגרציה החדשה מאפשרת למודל לעבוד בתוך Excel עצמו. הוא יכול לנתח גיליונות, לבנות מודלים, להפיק נוסחאות מורכבות או ליצור אוטומציות שמזרזות עבודה חוזרת. זה כלי פרקטי במיוחד לניתוחים פיננסיים, דוחות תפעוליים וטיוב נתונים. השירות נמצא בבטא למנויי Max, Team ו-Enterprise.
Claude Code בדסקטופ
האפליקציה מאפשרת להריץ כמה סשנים במקביל, כך שאפשר לעבוד על כמה פרויקטים בשיחה אחת בצורה מופרדת. מצב Plan Mode עבר שדרוג משמעותי, והוא בונה תוכנית עבודה מפורטת לפני שהמודל ניגש לכתיבת קוד בפועל. זה מפחית טעויות, מייצר שקיפות ומאפשר שליטה טובה יותר בתהליך הפיתוח.
זמינות
Opus 4.5 זמין דרך ה-API של אנטרופיק ובפלטפורמות ענן מרכזיות כמו Amazon Bedrock, Google Cloud Vertex AI ו-Microsoft Azure במסגרת שותפות חדשה עם Microsoft ו-NVIDIA. בנוסף, המודל זמין למנויי Pro, Max, Team ו-Enterprise, והוא משולב כברירת מחדל בחלק מהיכולות החדשות כמו Claude Code ובכלי העבודה שמגיעים עם Anthropic for Teams.
כך נראה Opus 4.5 בפעולה
פתרון פאזלים באמצעות כלים חיצוניים
בסרטון הראשון מודגם כיצד Opus 4.5 פותר משחק פאזלים מורכב שלב אחר שלב. המודל משתמש בשתי יכולות חדשות: חיפוש כלים בתוך ספריית כלים גדולה וקריאה תכנותית לכלים חיצוניים. השילוב הזה מאפשר לו לנווט, לבחור פעולות, לשרשר צעדים ולבצע משימה מורכבת בלי התערבות אנושית. זו הוכחה ליכולת של המודל לבצע פעולות בעולם אמיתי, לא רק לייצר טקסט.
משימות משרדיות אמיתיות: מצגות, אקסלים וחוזים
בסרטון השני ניתן לראות הדגמה של Opus 4.5 מבצע עבודה משרדית מלאה: בניית דקים עסקיים, עיבוד וטרנספורמציה של נתונים בגיליונות, ועריכת חוזים כולל redlining. אלה תוצרים שהמודל לא רק מייצר, אלא גם מגיש כקבצים להורדה ולעבודה מיידית. זו המחשה ברורה לכיוון שאליו אנטרופיק מכוונת: מודל שאפשר להשתמש בו לצרכים יומיומיים בארגון, לא רק לניסויים.
לסיכום, Opus 4.5 הוא לא רק שדרוג טכני. הוא מודל שאפשר להכניס לשגרת עבודה אמיתית. ירידת המחיר של 67 אחוז, יחד עם האינטגרציות החדשות לדפדפן ול-Excel, הופכות יכולות שבעבר היו שמורות לפרויקטים ייעודיים לכלי שניתן להשתמש בו ביום יום, גם בצוותים קטנים.
עבור ארגונים, המסר של אנטרופיק ברור. השאלה כבר אינה האם להשתמש ב-AI מתקדם, אלא איך לבנות שילוב נכון בין מודלים שונים, לאילו משימות להפעיל כל אחד, ומהי נקודת האיזון בין עלות ליכולת. זו רמת בשלות שהשוק חיכה לה זמן רב, והיא מראה עד כמה המודלים המתקדמים עוברים מפיילוט לכלי עבודה מרכזי.














