דף הבית » אנטרופיק משיקים את Claude Sonnet 4.5

אנטרופיק משיקים את Claude Sonnet 4.5

רון גולד

30/09/2025

זמן קריאה: 10 דקות

בעולם ה-AI של 2025 נדמה שכל שבוע יוצא מודל חדש עם הבטחות גדולות. לרוב מדובר בעוד כמה אחוזים בבנצ'מרקים שרוב המשתמשים לא מכירים או מבינים. ההכרזה על Claude Sonnet 4.5 שברה את התבנית - לא 30% שיפור ולא $30 למיליון טוקנים, אלא 30 שעות רצופות של עבודה אוטונומית על אותה משימה. כדי לסבר את האוזן - Opus 4 עמד על כ-7 שעות, ואין מידע על אף מודל שמתקרב למספר הזה. זו לא עלייה מתונה, זו קפיצה של פי ארבע. במקביל, Claude Code כבר מייצר יותר מחצי מיליארד דולר בהכנסות חוזרות שנתיות (ARR), עם צמיחה של פי 10 מאז מאי 2025. זה לא נתון שיווקי, זו הוכחה שהמודל כבר נמצא בשימוש אמיתי, לא רק בדמו. בואו נבין מה זה אומר בפועל, ונספר את סיפור המודל החדש של אחת החברות המובילות בעולם הבינה המלאכותית.

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

אפשר גם להרשם לניוזלטר שלנו

מה קורה כשבינה מלאכותית עובדת יום וחצי רצוף?

תדמיינו - אתם נותנים למודל משימה ב-9 בבוקר - לעשות refactoring למערכת ההזמנות, לבדוק אבטחה, לכתוב טסטים ולהעלות הכל לפרודקשן. בעולם הישן זה היה נגמר מהר מאוד. אחרי כמה שעות הוא כבר מתחיל לשכוח מה עשה בהתחלה, אחרי שבע שעות הוא נתקע על מגבלת הטוקנים, ובבוקר שלמחרת אתם מוצאים את עצמכם מסבירים הכל מחדש מהתחלה.

עם Sonnet 4.5 זה נראה אחרת לגמרי. אתם מסיימים יום עבודה, סוגרים את הלפטופ והולכים הביתה. בלילה, בזמן שאתם ישנים - המודל ממשיך לעבוד. בבוקר שאחרי, כשאתם נכנסים למשרד, הוא עדיין שם - ממוקד, זוכר כל צעד, וממשיך בדיוק מהנקודה שעצר.

ואם זה נשמע כמו פנטזיה - ארגונים שכבר קיבלו גישה מוקדמת מדווחים על משימות שלמות שבוצעו כך: הקמת בסיס נתונים, רכישת domain, ביקורת אבטחה ברמת SOC 2, כתיבת תיעוד מלא. הכל רץ ברצף, בלי יד אנושית על המקלדת. זה כבר לא מדע בדיוני. זה קורה עכשיו.

למה בכלל צריך מודל שעובד 30 שעות?

זאת שאלה חשובה והכרחית, והתשובה מפתיעה - הרבה יותר אנשים ממה שנדמה לכם. בהכרזה הרשמית של Anthropic אמר שון וורד (Sean Ward), מייסד שותף ומנכ"ל חברת iGent AI, סטארטאפ המתמחה בכלי הנדסת תוכנה אוטונומיים, כי “Claude Sonnet 4.5 מגדיר מחדש את הציפיות שלנו. הוא מטפל ב-30+ שעות של קידוד אוטונומי, ומשחרר את המהנדסים שלנו להתמודד עם חודשים של עבודה ארכיטקטונית מורכבת.”

כדי להבין את המשמעות, נניח דוגמה פשוטה: ארגון עם מערכת PHP ישנה שצריך להעביר ל-microservices מודרניים. פרויקט כזה נמתח לרוב על פני שלושה-ארבעה חודשים. עכשיו תדמיינו את אותו פרויקט מתבצע ברצף, על ידי מודל אחד שממשיך לעבוד גם כשאתם ישנים - ומסתיים בתוך יום וחצי.

חודשים של עבודה מתכווצים ל-36 שעות. זה לא עוד 10% שיפור בפרודוקטיביות - זה שינוי סדר גודל שמגדיר מחדש מה אפשרי.

האם זה באמת עובד?

כאן אין מקום לשיווק, רק למספרים. במבחן SWE-bench Verified, שבודק אם מודל מסוגל לפתור באגים אמיתיים מגיטהאב, Sonnet 4.5 מוביל עם ‎77.2% (ואפילו ‎82% כשמפעילים parallel test-time compute). הוא עקף גם את GPT-5 וגם את Gemini.

מוביל בבדיקות SWE-bench מול המתחרים הגדולים

יתרון ברור על פני GPT-5 וג׳מיני. Source: anthropic.com

אבל זה לא נגמר בקידוד. בטבלה הבאה רואים תמונה רחבה יותר: Sonnet 4.5 משפר ביצועים גם במבחני שימוש במחשב (OSWorld), מתמטיקה (AIME), שאלות רב-לשוניות (MMMLU) וניתוח פיננסי, ובחלקם אפילו מוביל על פני GPT-5 ו-Gemini.

השוואת ביצועים: Claude Sonnet 4.5 מוביל בקידוד אוטונומי

Claude Sonnet 4.5 מוביל בקידוד אוטונומי. Source: anthropic.com

במילים פשוטות, זה לא עוד שיפור קוסמטי. לפני שנה המודלים המובילים עמדו סביב 50%. היום Sonnet 4.5 מתקרב ל-80%, ובחלק מהמשימות אפילו עובר את זה. זה כבר הבדל בין “אפשר לנסות” לבין “אפשר לסמוך על זה בפרודקשן”.

מה הופך את זה לאפשרי?

כדי להבין איך Sonnet 4.5 מחזיק 30 שעות רצופות, צריך להציץ מתחת למכסה המנוע.

מודעות הקשר

המודל יודע לעקוב אחרי צריכת הטוקנים שלו, להבין כמה נשאר ומתי לנקות מידע ישן. מודלים קודמים פשוט היו נתקעים - כאן הוא ממשיך קדימה.

עבודה במקביל

במקום לעבוד לינארית, Sonnet 4.5 מבצע חיפושים בו-זמנית, קורא כמה קבצים במקביל ומסנכרן בין הכלים. זה מרגיש פחות כמו מודל אחד ויותר כמו צוות.

סביבת הקידוד (Claude Code) משתדרגת

Checkpoints: שמירת מצבים וחזרה מיידית לאחור.
ממשק חדש: הרחבה רשמית ל-VS Code וטרמינל מחודש, עם שינויים בזמן אמת.
ביצוע קוד ויצירת קבצים: גיליונות, מצגות ומסמכים נולדים ישירות מהשיחה. Anthropic גם הדגימה את זה בפעולה - בסרטון הרשמי רואים את Claude מייצר מסמך, מצגת וגיליון אלקטרוני - כולם ניתנים להורדה ועריכה. זה כבר לא רק לכתוב קוד, אלא לייצר בפועל תוצרים שימושיים שמתחברים ישירות לעבודה היומיומית:

Agent SDK: לבנות כלים ותתי-סוכנים על בסיס היכולות של Anthropic. הנה סרטון קצר שמדגים את ה-Agent SDK, שמאפשר למפתחים להרכיב סוכנים מורכבים על גבי Claude Code, עם שליטה בזיכרון, הרשאות ותיאום בין משימות:

כלים חדשים לזיכרון

Context Editing: ניקוי אוטומטי של תוכן לא רלוונטי כשהחלון מתמלא.
Memory Tool (Beta): אחסון מחוץ לחלון ההקשר, כך שהמודל זוכר גם מה שנעשה אתמול.

למי שרוצה לראות את זה בפעולה - הנה סרטון קצר שבו Claude משחק Catan, בונה בסיס ידע על האסטרטגיות של היריבים ששורד בין משחקים, ומנקה מידע מיושן לאורך הדרך. זה נותן הצצה מוחשית למה שמאפשרים Context Editing ו-Memory Tool:

וכמה זה עולה?

החיסרון הבולט של Sonnet 4.5 הוא המחיר: ‎$3 ל-input ו-$15 ל-output למיליון טוקנים. זה פי 2.4 יקר יותר מ-GPT-5 ו-Gemini שעולים ($1.25 / $10) בהתאמה. המשמעות ברורה, סטארטאפ עם מיליון שאילתות בחודש ישלם בערך ‎$3,000 במקום ‎$1,250 - פער של ‎$21,000 בשנה.

האם זה שווה? אם מדובר בקוד קריטי, שבו טעות אחת עולה עשרות אלפי דולרים - ברור שכן. אם זה צא'טבוט בסיסי לשירות לקוחות - כנראה שלא. יש דרכים לצמצם עלויות (prompt caching, batch processing), אבל אלה לא נרחיב עליהם כאן.

חשוב רק להדגיש, המספרים מבוססים על פרסומים רשמיים של החברות. בפועל, ביצועים ומחירים יכולים להשתנות לפי גרסה, קונפיגורציה ותצורת שימוש.

אבטחה ובטיחות

Anthropic מתארת את Sonnet 4.5 כ-“המודל המיושר ביותר שפרסמנו”. לפי החברה, הוא מצמצם התנהגויות בעייתיות כמו החנופה למשתמש (sycophancy), הטעיה, חיפוש כוח ועידוד חשיבה דלוזיונלית (הזיות). ברמה הטכנית נוספו שכבות הגנה כמו חסינות טובה יותר ל-prompt injection, סינון פלטים מסוכנים (כמו הוראות לייצור נשק) והשקה תחת רמת בטיחות AI Safety Level 3.

ג'ארד קפלן, המדען הראשי של Anthropic, אמר: “זה הקפיצה הגדולה ביותר באבטחה שראינו בשנה, שנה וחצי האחרונות.” ולמה זה חשוב? כי ברגע שמודל עובד 30 שעות ברצף בצורה אוטונומית, הסיכונים מתגברים. אם הוא מסוגל לפעול יום וחצי בלי השגחה, הוא חייב להיות מהימן יותר מאי פעם.

שיעור ההתנהגויות הבעייתיות הנמוך ביותר מבין המודלים הגדולים

שיעור ההתנהגויות הבעייתיות הנמוך ביותר. Source: anthropic.com

איפה זה זמין?

Sonnet 4.5 כבר נגיש לכולם ב-Claude.ai וב-API, ומשולב גם דרך Amazon Bedrock, Google Cloud Vertex AI ו-Claude Code. בנוסף, Anthropic מפעילה כעת את ניסוי Imagine with Claude (הרחבה בפסקה הבאה), שפתוח רק למשתמשי Max לזמן קצוב. מי שרוצה לטעום מהעתיד בזמן אמת, זה הרגע.

כשיכולת הופכת לחוויה

עד עכשיו דיברנו על מספרים וביצועים. אבל Anthropic גם הראתה לאן כל זה יכול להתפתח. היא השיקה ניסוי קצר בשם Imagine with Claude (זמין למשתמשי Max עד 4 באוקטובר 2025), שמדגים איך מודל לא רק כותב קוד, אלא מייצר תוכנה בזמן אמת. במקום לבנות את כל האפליקציה מראש, Claude מייצר את החלקים תוך כדי שימוש: לוחצים על כפתור - נוצר הקוד לכפתור, פותחים תפריט - נוצר הקוד לתפריט.

בהדגמה שתכף תראו, ביקשו ממנו “לדמיין את המחשב של שייקספיר”, והוא יצר ממשק מהמאה ה-16 עם תפריטים כמו Sonnets ו-Quill Sharpener. הכל פעל אינטראקטיבית. זה אולי נראה כמו משחק, אבל המשמעות עמוקה יותר. עד היום תוכנה נכתבה מראש, כאן היא נוצרת על המקום, מותאמת בדיוק למה שאתם צריכים. זה כבר לא רק שיפור ביצועים, זו דרך אחרת לחשוב על מהי תוכנה בכלל.

Anthropic פרסמה סרטון קצר שממחיש את זה בפעולה. Claude בונה תוכנה בזמן אמת, מגיב לכל פעולה שלכם ומייצר את הקוד רק כשצריך - ממש מול העיניים:

מה אומרים המשתמשים בפועל

חשוב להבין, Sonnet 4.5 לא חי רק באתר של Anthropic. הוא כבר רץ “מתחת למכסה המנוע” בכלי קוד וסביבות עבודה, מ-Claude Code ועד Cursor ו-Canva, וכך ההתקדמות הטכנית הופכת לחלק מהיומיום של מפתחים ומעצבים.

ב-Canva, לדוגמה, סיפר דני וו (Danny Wu), ראש תחום מוצרי ה-AI ב-Canva, ש-Claude Sonnet 4.5 הציג שיפורים מרשימים במשימות המורכבות והארוכות ביותר - החל מעבודה בבסיס הקוד ועד לתכונות חדשות בתוך המוצר. גם מייקל טרואל (Michael Truell), מנכ"ל Cursor, תיאר ביצועי קידוד מהשורה הראשונה, עם שיפורים ניכרים במשימות ארוכות טווח. כדי להבין את המשמעות מהצד המעשי, נניח מצב שבו ארגון עובד עם מערכת מורכבת שדורשת תחזוקה מתמדת - כאן היתרון של מודל שמסוגל להחזיק 30 שעות רצופות מתרגם ישירות לחיסכון בזמן ובעלויות.

וזה לא נגמר בקוד. בבדיקות יישומיות בתחומי פיננסים, משפט, רפואה ומדעים, Sonnet 4.5 מציג יתרון מובהק על פני דורות קודמים - גם במשימות חשיבה מורכבות (‘16k thinking’) וגם בביצוע יומיומי.

Sonnet 4.5 מוביל גם בתחומי יישום קריטיים. Source: anthropic.com

אז כדאי לעבור ל-Sonnet 4.5?

התשובה תלויה בצרכים שלכם. אם אתם כבר משתמשים ב-Claude, השדרוג כמעט מתבקש - ביצועים טובים יותר באותו ממשק. אם אתם בונים סוכנים אוטונומיים או עובדים עם קוד קריטי, היכולת לעבוד 30 שעות רצופות, יחד עם כלים כמו Memory Tool ו-Context Editing, נותנת יתרון שאין לו מתחרים כרגע. גם מי שדורש רמות אבטחה מחמירות ימצא כאן ערך אמיתי.

אבל לא לכולם זה מתאים. Sonnet 4.5 יקר פי 2.4 מהמתחרים, והחלון הקשר (context window) שלו קטן משל Gemini. אם יש לכם codebase ענק או שאתם מסתפקים במודל זול יותר כמו GPT-5, ייתכן שאין סיבה להחליף. מי שצריך יכולות מולטימודל מתקדמות (טקסט, תמונה, אודיו, וידאו) גם ימצא ב-Gemini מענה טוב יותר.

בשורה התחתונה, Sonnet 4.5 הוא שדרוג אמיתי - לא עוד כמה אחוזים, אלא קפיצה ביכולות אוטונומיה וקידוד. אם מה שאתם בונים מורכב, קריטי או דורש ריצות ארוכות טווח, ההשקעה משתלמת. אם אתם מחפשים פשוט זול ומהיר, יש חלופות טובות.

חשוב לזכור שהתחרות לא נחה. לפי שמועות, Gemini 3 בדרך, OpenAI ממשיכה לשפר ולשדרג כל הזמן, ומה שמוביל היום לא בהכרח יישאר בפסגה עוד שלושה חודשים (וכנראה גם לא עוד שבוע). אבל נכון לעכשיו, אם אתם צריכים בינה מלאכותית שעובדת בלי לעצור, זוכרת הכל ומספקת קוד ברמת פרודקשן - Sonnet 4.5 הוא המקום הנכון. רק תוודאו שאתם באמת צריכים את זה לפני שאתם משלמים כפול.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

רון גולד

מלמד ויועץ לחדשנות אסטרטגית, משלב בינה יוצרת וכלי אוטומציה להעצמת תהליכים עסקיים ופרודוקטיביות אישית. במסע מתמשך של חקירה ולימוד בתחום הבינה המלאכותית.