תוצאות נוספות...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
× Send

Claude Opus 4.7 עם עדכון משמעותי ליכולות קוד, ראייה וזיכרון

Claude Opus 4.7
תוכן עניינים

Opus 4.7 הוא העדכון החדש למודל הדגל של Anthropic. הוא לא משנה את כללי המשחק, אבל כן מוסיף יכולות שמרגישות כמו התקדמות אמיתית: עבודה רציפה לאורך זמן, הבנה טובה יותר של תמונות, זיכרון שמחזיק לאורך סשנים ארוכים וכלים שמאפשרים למודל לא רק לכתוב קוד אלא גם לבדוק את עצמו. העדכון מתאים למשתמשים שרוצים מודל יציב ומדויק יותר בלי להעמיק בהגדרות טכניות, ובמקביל נותן למפתחים את השליטה הדרושה כדי לשלב אותו במערכות קיימות.

 

אנטרופיק משיקה את קלוד אופוס 4.7

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

האתגרים של הדור הקודם

מודלים קודמים, ובמיוחד מודל הדגל האחרון (opus 4.6) ידעו לכתוב קוד טוב, אבל כשהעבודה נמשכה לאורך זמן הם נטו לאבד יציבות. משימות ארוכות כמו ניתוח קוד מורכב או פתרון בעיות רב שלביות הסתיימו לפעמים בתוצאה חלקית או שגויה.

 

גם יכולות הראייה היו מוגבלות: צילומי מסך צפופים, דיאגרמות טכניות או מסמכים סרוקים דרשו מהמשתמש לפשט את התמונה או להסביר אותה במילים.

 

בנוסף, אפילו פרומפטים מכוילים היטב (כאלה שנוסחו בקפידה) לא תמיד התנהגו באופן עקבי, משום שהמודלים פירשו הוראות בצורה חופשית מדי.

 

 

השוואה רוחבית של Opus 4.7 מול גרסאות קודמות ומודלים מתחרים

השוואה רוחבית של Opus 4.7 מול גרסאות קודמות ומודלים מתחרים | Anthropic

מה חדש ב- Opus 4.7

אוטונומיה ארוכה ויכולת בדיקה עצמית

Opus 4.7 יודע לתכנן משימות ארוכות ולשמור על קו מחשבה יציב לאורך זמן. הוא גם בודק את עצמו לפני שהוא מחזיר תשובה. יכולת הבדיקה העצמית פירושה שהמודל עובר על הלוגיקה שלו, מחפש טעויות ומתקן אותן. זה לא מחליף בקרה אנושית, אבל כן מפחית טעויות מפתיעות ומעלה את רמת האמינות.

 

Opus 4.7 שומר על יתרון ככל שרמת המאמץ והטוקנים עולה

Opus 4.7 שומר על יתרון ככל שרמת המאמץ והטוקנים עולה | Anthropic

ראייה ברזולוציה גבוהה

המודל יכול לעבד תמונות ברזולוציה של עד 3.75 מגה פיקסל. בפועל זה אומר שהוא רואה הרבה יותר פרטים. היכולת הזו מאפשרת לו להבין צילומי מסך צפופים, דיאגרמות טכניות, עיצובים מורכבים, מסמכים סרוקים ואפילו מבנים כימיים. חברת XBOW דיווחה על שיפור משמעותי בדיוק הוויזואלי, מ-54.5 אחוז ל-98.5 אחוז.




 

שיפור ביכולות ניווט ויזואלי, במיוחד ברזולוציה גבוהה ובשימוש בכלים

שיפור ביכולות ניווט ויזואלי, במיוחד ברזולוציה גבוהה ובשימוש בכלים | Anthropic

זיכרון מבוסס קבצים

Opus 4.7 משתמש טוב יותר בזיכרון מבוסס קבצים. הוא זוכר הערות ומידע לאורך זמן, גם בין סשנים שונים, ולכן המשתמש לא צריך לחזור על כל פרט בכל פנייה מחדש.

 

שיפור ביכולות חשיבה לאורך הקשר ארוך במשימות גרף מורכבות

שיפור ביכולות חשיבה לאורך הקשר ארוך במשימות גרף מורכבות | Anthropic

עמידה מדויקת בהוראות

המודל מפרש הוראות בצורה מדויקת יותר. זה משפר עקביות ואמינות, אבל דורש לעיתים התאמה מחדש של פרומפטים קיימים, במיוחד כאלה שנוסחו בצורה עדינה או תלויה בהתנהגות קודמת של המודל.

כלים חדשים ב‑Claude Code

Opus 4.7 מוסיף ל‑Claude Code סט כלים שמטרתו להפוך עבודה עם קוד למשימה ברורה ויעילה יותר. הכלים האלה מאפשרים למודל לקבל החלטות בעצמו, לסכם התקדמות, להציג רק את מה שחשוב ולבצע ביקורת קוד מעמיקה. גם משתמשים שאינם טכניים יכולים להבין אותם, ובמקביל מי שמכיר פקודות סלאש ימצא אותן משולבות בצורה טבעית.

Auto Mode

מצב שבו המודל מחליט לבד אילו פעולות בטוחות להריץ ואילו דורשות אישור. זה חוסך זמן ומפחית את הצורך לאשר כל פעולה ידנית.

פחות אישורים מיותרים

הפקודה less-permission-prompts/ סורקת את היסטוריית העבודה ומוסיפה לרשימת המותר את הפעולות שכבר אישרתם בעבר. התוצאה היא פחות הפרעות וזרימה חלקה יותר.

תצוגה ממוקדת

הפקודה focus/ מציגה רק את התוצר הסופי ומסתירה את שלבי הביניים - שימושי כשצריך לראות את התוצאה בלי הרעש שמסביב.

ביקורת קוד מעמיקה

הפקודה ultrareview/ מפעילה סשן ביקורת קוד שמדמה מבקר אנושי קפדן. היא מסמנת בעיות לוגיות, חוסר עקביות ונקודות לשיפור.

 Opus 4.7 במספרים

Opus 4.7 מציג שיפור עקבי ברוב הבנצ'מרקים, במיוחד במשימות קוד מורכבות. בנצ'מרקים הם מבחנים סטנדרטיים שמודדים יכולות של מודלים בתחומים שונים, כמו פתרון בעיות תכנות, הבנת סביבות עבודה או ניתוח מידע. לצד ההתקדמות, יש גם תחומים שבהם הביצועים פחות טובים, ולכן חשוב להבין את התמונה המלאה לפני מיגרציה (מעבר מגרסה אחת של המודל לגרסה חדשה).

 

Opus 4.7 משפר ביצועים בבנצ'מרקי קוד מורכבים לעומת 4.6

Opus 4.7 משפר ביצועים בבנצ'מרקי קוד מורכבים לעומת 4.6 | Anthropic

שיפורים בולטים

Opus 4.7 מציג קפיצה ברורה ביכולות הקוד, הניתוח וההבנה הלוגית. בבנצ'מרק SWE bench Pro הוא מטפס מ-53.4 אחוז ב-4.6 ל-64.3 אחוז, שיפור שממחיש את היכולת שלו להתמודד עם תיקוני באגים מורכבים. בגרסת SWE bench Verified הוא מגיע ל-87.6 אחוז, נתון שממקם אותו כאחד המודלים המדויקים ביותר במשימות קוד מאומתות.

 

גם ב-CursorBench הוא שומר על יציבות גבוהה עם 70 אחוז, וב-MCP Atlas הוא עולה ל-77.3 אחוז, מה שמראה שיפור ביכולות שימוש בכלים בקנה מידה רחב.

 

ב-OSWorld Verified הוא מגיע ל-78 אחוז, עדות ליכולת טובה יותר לבצע פעולות מורכבות בסביבות מחשב אמיתיות. ובקצה העליון של היכולות האקדמיות, GPQA Diamond מציב את Opus 4.7 על 94.2 אחוז - רמת דיוק שממחישה את העומק הלוגי והיכולת להתמודד עם שאלות ברמת תואר שני ומעלה.

 

Opus 4.7 מציג קפיצה ביכולות ניתוח וידע כלליות

Opus 4.7 מציג קפיצה ביכולות ניתוח וידע כלליות | Anthropic

 

בנוסף, חברת Rakuten דיווחה כי בבנצ'מרק הפנימי שלהם המודל פתר פי שלושה משימות פרודקשן לעומת גרסאות קודמות.

מגבלות

לצד השיפור הרחב ביכולות, יש גם תחומים שבהם Opus 4.7 מציג נסיגה או פער מול מודלים אחרים. בבנצ'מרק BrowseComp, שמודד את היכולת של סוכנים לבצע חיפוש וניתוח מידע ברשת, המודל יורד בכארבע נקודות לעומת Opus 4.6 - שינוי שמורגש במיוחד אצל צוותים שמריצים סוכני מחקר כבדים.

 

גם ב-Terminal Bench 2.0, מבחן שמדמה עבודה רציפה בטרמינל, Opus 4.7 מגיע ל-69.4 אחוז, נתון נמוך מהתוצאה של GPT 5.4 שמגיע ל-75.1 אחוז. עבור משתמשים שמסתמכים על משימות טרמינל מורכבות, זה פער שצריך לקחת בחשבון לפני מעבר לגרסה החדשה.

השוואה ל- Mythos Preview

Mythos Preview עדיין מוביל ברוב הבנצ'מרקים, אך אינו זמין לציבור הרחב. Anthropic ציינה כי Opus 4.7 עבר הפחתה מכוונת ביכולות סייבר כדי לבדוק מנגנוני הגנה חדשים, ולכן חלק מהפערים צפויים.

אבטחה, מידע למשתמש המתקדם ו- Cyber Verification Program

Opus 4.7 כולל מנגנוני אבטחה שמטרתם למנוע שימוש לרעה. המודל חוסם באופן אוטומטי בקשות שנראות מסוכנות, גם אם המשתמש התכוון אליהן בהקשר לגיטימי. עבור צוותים שעוסקים במחקר אבטחה או בדיקות חדירות, זה עלול ליצור חיכוך.

 

כדי להתמודד עם זה, Anthropic מפעילה תוכנית ייעודית למקצועני אבטחה, שמאפשרת להם לעבוד עם המודל תחת תנאים מבוקרים וללא חסימות מיותרות.

Tokenizer inflation

בגרסה הזו אותו טקסט עשוי לעלות יותר טוקנים מאשר בעבר, בדרך כלל בין 1.0 ל- 1.35 יותר. טוקנים הם יחידות טקסט קטנות שהמודל משתמש בהן כדי לעבד מידע, ולכן עלייה במספר הטוקנים משפיעה על עלות השימוש. ברמות מאמץ גבוהות המודל גם מייצר יותר טוקנים בפלט, מה שמגדיל את הצריכה הכוללת.

המלצות מיגרציה

מיגרציה היא תהליך המעבר מגרסה ישנה של המודל לגרסה חדשה. זה כולל בדיקה שהמערכת, הקוד והפרומפטים ממשיכים לעבוד כרגיל גם אחרי השדרוג.

 

כדי לבצע מיגרציה חלקה ל- Opus 4.7 מומלץ:

  • להריץ מדידות על תעבורה אמיתית כדי להבין את השפעת עליית הטוקנים.

  • לבצע רגרסיה לפרומפטים ולוודא שהם עדיין מניבים את התוצאות הרצויות.

  • להשתמש ב- effort control כדי לשלוט בעומק החשיבה של המודל.

  • להגדיר task budgets שמגבילים את כמות העבודה שהמודל מבצע בכל משימה.

  • להשיק rollout מדורג, כלומר להפעיל את הגרסה החדשה בהדרגה ולשמור אפשרות לחזור אחורה במקרה הצורך.

Claude Design: יצירה דרך שיחה

לצד Opus 4.7 Anthropic השיקה את Claude Design, כלי שמאפשר ליצור עיצובים, מצגות, דפי מוצר ואבי טיפוס פשוט על ידי שיחה. המשתמש מתאר מה הוא רוצה, ו- Claude מייצר גרסה ראשונית שאפשר לשפר דרך שיחה, הוספת הערות או עריכה ישירה על המסך.

 

לאחר שהעיצוב מוכן אפשר לייצא אותו ל Canva, לקובץ PDF או PPTX, או להעביר אותו ישירות ל Claude Code להמשך פיתוח. הכלי גם יודע לקרוא את קבצי העיצוב והקוד של הצוות, לבנות מהם ספריית עיצוב פנימית וליישם אותה אוטומטית על כל פרויקט חדש, כך שהתוצרים נשארים עקביים עם המותג.

 

Claude Design זמין בשלב research preview למשתמשי Pro, Max, Team ו- Enterprise. להשקה הזו נייחד מדריך נפרד שייצא בקרוב.

 




מחיר וזמינות

המחיר של Opus 4.7 נשאר זהה לגרסה הקודמת: 5 דולר למיליון טוקנים בקלט ו- 25 דולר למיליון טוקנים בפלט. המודל זמין תחת המזהה claude-opus-4-7.

 

Opus 4.7 זמין לשימוש ב- Claude.ai, ב- Claude Code, דרך Anthropic API, ובפלטפורמות Bedrock, Vertex AI ו- Microsoft Foundry.

עדכון משמעותי, אבל לא לכל אחד

Opus 4.7 מביא שיפור עקבי ביכולות קוד, ראייה וזיכרון, לצד כלים שמיועדים לעבודה ארוכה ורב שלבית. הנתונים מצביעים על מודל חזק יותר מ- Opus 4.6 בתחומים רבים, אך לא בכל מדד, והוא כולל שינויים תפעוליים שמחייבים בדיקה לפני מיגרציה. עבור משתמשים שמפתחים סוכנים, מבצעים ביקורת קוד או יוצרים תוצרים מקצועיים, זה בהחלט עדכון משמעותי.

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

רוצים הרצאה או ייעוץ של רון גולד?
השאירו פרטים ונשמח לחזור אליכם עם המידע הרלוונטי
אולי יעניין אותך גם...
guest
0 תגובות
Inline Feedbacks
צפה בכל התגובות
Let's update

רוצים לקבל עדכונים על כל מה שחדש ומעניין בעולם ה-AI? הרשמו לניוזלטר שלנו!

אירועי AI קרובים

תפריט נגישות

תוצאות נוספות...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors