תוצאות נוספות...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
× Send

פחות דיבורים ויותר עבודה: מה באמת חדש ב‑GPT‑5.5

GPT‑5.5
תוכן עניינים

המודל החדש של OpenAI מסמן מעבר חד מצ'אטבוט שמגיב לטקסט לסוכן עבודה אמיתי, כזה שמבין מטרות מורכבות, מפעיל כלים, בודק את עצמו ומסיים משימות מקצה לקצה. הוא מקבל מטרה, מפרק אותה למשימות, מפעיל תוכנות, מתקן טעויות תוך כדי תנועה, וממשיך עד שהעבודה הושלמה. זה שינוי מהותי שמרחיב את תפקיד ה‑AI: לא רק מודל שיחה, אלא מערכת ביצועית שמסוגלת לעבוד בעולם דיגיטלי אמיתי. OpenAI בחרה לפתוח את ההכרזה דווקא עם Codex ולא עם ChatGPT - בחירה שמבהירה היטב את הכיוון החדש. GPT‑5.5 זמין כבר היום ב‑ChatGPT וב‑Codex, והוא מוצג כ"מחלקה חדשה של אינטליגנציה לעבודה אמיתית". הוא נבנה כדי לבצע משימות מורכבות: לכתוב ולדבג קוד, לבצע מחקר עומק ברשת, לנתח נתונים, לבנות מסמכים, לערוך טבלאות, לשלוט בדפדפן ולהפעיל אפליקציות מקומיות. הוא לא מחכה לפקודה הבאה - הוא מתקדם עד שהמטרה הושגה.

 

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

הבעיה ש‑GPT‑5.5 מנסה לפתור

המודלים הקודמים של OpenAI כבר היו חזקים מאוד. GPT‑5.3 ו‑GPT‑5.4 ידעו לכתוב קוד מצוין, לפתור בעיות מורכבות ולהחזיק שיחה טבעית. אבל הם עדיין היו מוגבלים לסביבת טקסט. הם לא תמיד ידעו לבדוק את עצמם, לא תמיד הצליחו להחזיק תהליך ארוך, ולעיתים נזקקו להכוונה מדויקת מדי. GPT‑5.5 מנסה לסגור את הפער הזה ולהפוך את המודל לסוכן שמבין מטרה, מפעיל כלים, ומתקדם באופן עצמאי בלי שצריך להחזיק לו את היד.

איך זה עובד בפועל?

החידוש הגדול של GPT‑5.5 הוא שילוב של שלוש יכולות שמאפשרות לו לעבוד בעולם אמיתי, לא רק בתוך חלון טקסט.

 

היכולת הראשונה היא שליטה במחשב ובדפדפן. המודל יודע ללחוץ, להקליד, לנווט, לפתוח קבצים, לערוך מסמכים, לבדוק טבלאות ולהריץ בדיקות ממש כמו משתמש אנושי.

 

במבחן OSWorld, שמודד יכולת "נהיגה" במחשב, GPT‑5.5 הגיע ל‑78.7 אחוז - מעל קו הבסיס האנושי של 72.4 אחוז. זה נתון שממחיש עד כמה המודל כבר לא מוגבל לטקסט בלבד.

 

הגרף המצורף מציג בצורה ברורה את השדרוג המשמעותי הזה. לא רק שהוא שומר על מהירות זהה לדור הקודם, הוא גם מדויק יותר ויציב יותר במשימות שמדמות שימוש אמיתי במחשב. ב‑OSWorld‑Verified, שמודד יכולת שליטה במחשב, GPT‑5.5 משיג תוצאות גבוהות יותר בכל רמות המורכבות. ב‑Tau2‑bench Telecom, שמודד דיוק במשימות ניתוח טקסט מורכבות, הוא מציג עקביות גבוהה יותר לאורך כל טווח הטוקנים:

 

GPT‑5.5 מציג שיפור עקבי בשליטה במחשב ובדיוק אנליטי

GPT‑5.5 מציג שיפור עקבי בשליטה במחשב ובדיוק אנליטי | OpenAI




 

היכולת השנייה היא Auto‑review - בדיקה עצמית בזמן אמת. המודל לא מסתפק בתשובה ראשונה. הוא מאתר בעיות, מתקן, וממשיך. זהו שינוי מהותי שמאפשר לו לעבוד לאורך זמן ולתקן טעויות לפני שהן מתגלגלות לפתרון שגוי.

 

כאן נכנסת לתמונה היכולת השלישית: יעילות טוקנים גבוהה בהרבה. GPT‑5.5 מבצע את אותן משימות עם פחות טוקנים ולעיתים בפחות סיבובים. למרות שהמודל יקר יותר ב‑API, הוא מפצה על כך בכך שהוא פשוט עובד בצורה נקייה יותר. OpenAI מציינת שהמודל שומר על זמן תגובה זהה ל‑GPT‑5.4, אך משתמש בפחות טוקנים לאותה משימה - שילוב נדיר של מהירות ויעילות.

 

 

מה חדש ב‑Codex

כאן נמצא הלב של השדרוג. GPT‑5.5 יודע לעבוד ישירות מול מסמכי Docs, Sheets ו‑Slides, לנתח PDF, להריץ בדיקות קוד אוטומטיות, לתמוך ב‑LaTeX (תקן לכתיבה מקצועית של נוסחאות ומסמכים טכניים), ולבצע פרויקטים מתמשכים לאורך זמן. הוא מרגיש פחות שביר, פחות "ממציא", ויותר כמו מהנדס שמבין את המערכת ומקבל החלטות. גם בעבודה עם Swift ואפליקציות Mac ניכר שיפור, בעיקר ביציבות וביכולת להתמודד עם פרטים קטנים ומעצבנים שמאפיינים פיתוח מקומי.

 

המודל גם תומך ב-computer use, יכולת נפרדת מהדפדפן, שמאפשרת לו לבצע פעולות מערכת מלאות. זה צעד נוסף בדרך למודל שמסוגל לבצע עבודה אמיתית על מחשב אמיתי.

הבנצ'מרקים וטבלת ההשוואה הרחבה בין המודלים

 

השוואת ביצועים רוחבית: GPT‑5.5 מוביל ברוב הקטגוריות, אך לא בכולן

השוואת ביצועים רוחבית: GPT‑5.5 מוביל ברוב הקטגוריות, אך לא בכולן | OpenAI

 

ב‑Terminal‑Bench 2.0 (משימות אמיתיות בתוך סביבת טרמינל) הוא מציג קפיצה משמעותית ל‑82.7 אחוז, מעל Opus 4.7 ו‑Gemini 3.1 Pro. גם ב‑OSWorld‑Verified וב‑Toolathlon (בנצ'מרק שמודד עד כמה מודל מסוגל לבצע משימות מורכבות באמצעות כלים חיצוניים) הוא שומר על יתרון יציב.

 

יחד עם זאת, במבחני קוד אחרים שלא מופיעים בטבלה, כמו SweBench Pro, מודלים כמו Opus 4.7 עדיין מציגים יתרון. זו לא תחרות של “מודל מנצח”, אלא של מודל יציב יותר, יעיל יותר, ומסוגל להתמודד עם מגוון רחב יותר של משימות.

 

הגרף המצורף מציג את אחד המדדים החשובים ביותר בהשקה: היכולת של המודל לבצע משימות מקצועיות ברמה שמתקרבת, ולעיתים עוברת מומחים אנושיים. GPT‑5.5 מגיע ל‑84.9 אחוז (ניצחונות + תיקו), הגבוה ביותר מבין כל המודלים שנבדקו. זה נתון שממחיש את היכולת של המודל לעבוד כ"סוכן" ולא רק כמודל שיחה:

 

GPT‑5.5 מוביל את מבחן GDP‑Val עם 84.9%

GPT‑5.5 מוביל את מבחן GDP‑Val עם 84.9% | OpenAI

 

המודל תומך בחלון הקשר של עד 400 אלף טוקנים, ומציע גם Fast Mode שמספק תגובות מהירות יותר במחיר גבוה יותר. ב‑API המחיר גבוה פי שניים מהדור הקודם, אך היעילות הטוקנית מפצה על כך במקרים רבים.

 

הגרף המצורף מציג מדד רוחבי שמעריך את היכולת של מודלים לבצע ניתוחים מורכבים לאורך משימות ארוכות. GPT‑5.5 מוביל באופן ברור על פני GPT‑5.4, Claude Opus 4.7 ו‑Gemini 3.1 Pro, גם כשהמשימות דורשות נפח טוקנים גדול. זוהי המחשה מצוינת לטענה שהשדרוג ב‑GPT‑5.5 הוא לא רק “עמוק” אלא “רוחבי”: יציבות, עקביות ויכולת להחזיק תהליכים ארוכים:

 

GPT‑5.5 מוביל במדד ה‑Artificial Analysis Intelligence

GPT‑5.5 מוביל במדד ומציג יציבות גבוהה לאורך משימות ארוכות | OpenAI

 

בסרטון המצורף מוצגת סקירה תמציתית וברורה של GPT‑5.5 שמתמקדת ביכולות החדשות שלו כסוכן עבודה. הוא עובר על הבנצ'מרקים המרכזיים, מסביר כיצד המודל שומר על מהירות זהה לדור הקודם תוך שימוש בפחות טוקנים, ומדגים שליטה במחשב, עבודה בדפדפן, בניית משחקים פשוטים, ניתוח נתונים מורכבים ויכולות קודקס מתקדמות. הסרטון מספק מבט מהיר אבל מקיף על השדרוגים המשמעותיים של המודל החדש כולל המחירים המעודכנים, חלון ההקשר המורחב, רמות המאמץ (effort levels) וההבדלים מול GPT‑5.4:

 

עיצוב שמבין הקשר

אחד השדרוגים המפתיעים נמצא דווקא בתחום העיצוב. GPT‑5.5 עדיין לא מעצב מאפס, אבל הוא מצטיין בהמשך עיצוב קיים. כשנותנים לו Figma או UI קיים, הוא מצליח לשמור על סגנון, היררכיה ועקביות. השילוב עם ChatGPT Images 2.0 משנה את התמונה עם האפשרות לייצר מוקאפים שהמודל מממש אותם בקוד. זו זרימת עבודה חדשה שמפחיתה את החולשה ההיסטורית של מודלים של OpenAI בתחום העיצוב.

אבטחה שמגיעה מהשטח

כאן מגיע אחד החידושים החשובים ביותר. GPT‑5.5 מצטיין בבדיקות אבטחה ומוצא פרצות אמיתיות בקוד. כאן חשוב לציין את עבודתו של מאט שומר (Matt Shumer), אחד מהבודקים החיצוניים הבולטים של מודלי GPT. שומר עבד עם GPT‑5.5 לאורך תקופה, בחן אותו על קוד אמיתי, ניהל תהליכי פיתוח מלאים, ופרסם סקירה מקיפה על החוויה שלו. הוא מדווח שהמודל מצא בעיות אבטחה שמודלים אחרים, כולל Opus, פספסו.

 

זה מידע שמגיע מניסיון שטח אמיתי, לא מהדגמות שיווקיות, והוא מחזק את התחושה ש‑GPT‑5.5 הופך את בדיקות האבטחה לכלי יומיומי ולא לתהליך נדיר.

איפה זה עומד מול Claude 4.7

במבחני קוד מסוימים, במיוחד מול SweBench Pro, Claude 4.7 עדיין מוביל. אבל חלק מהפער נובע לא מהמודל עצמו אלא מהחומרה שמסביבו: Claude Code הוא כיום סוכן בשל יותר, עם מנגנוני תזמור (אורקסטרציה) פנימיים שמנהלים תהליכים ארוכים בצורה חלקה.

 

GPT‑5.5, לעומת זאת, מצטיין במהירות, ביעילות טוקנים וביכולת לעבוד עם כלים אמיתיים. הוא פחות מבריק בעיצוב מאפס, אבל חזק יותר בביצוע, באבטחה ובמשימות מרובות שלבים. זו לא תחרות של "מי יותר חכם", אלא של "מי בנוי טוב יותר למשימה מסוימת".

 

GPT‑5.5 לא מרגיש כמו קפיצה דרמטית, אלא כמו התייצבות. הוא לא ממציא יכולות שלא ראינו, אלא הופך אותן ליציבות, מהירות, זולות ויעילות יותר. הוא מרחיב את הרצפה, לא את התקרה. הוא הופך את מה שכבר היה אפשרי למשהו שאפשר לסמוך עליו. זה עדכון שמרגיש פחות כמו מהפכה ויותר כמו התבגרות של מהפכת הסוכנים: פחות דיבורים, יותר עבודה.

זמינות ומחירים

GPT‑5.5 זמין כבר היום למשתמשי ChatGPT Plus, Pro, Business ו‑Enterprise, והוא נגיש גם דרך Codex למפתחים. ב‑API המודל מתומחר ב‑5 דולר למיליון טוקנים בקלט ו‑25 דולר למיליון טוקנים בפלט. המחיר זהה ל‑GPT‑5.4, אך יעילות הטוקנים הגבוהה של GPT‑5.5 הופכת את העלות בפועל לנמוכה יותר במשימות ארוכות. בנוסף מוצע Fast Mode, שמספק זמן תגובה מהיר יותר במחיר של 7.5 דולר לקלט ו‑37.5 דולר לפלט למיליון טוקנים. 




כלי עבודה אמיתי

GPT‑5.5 הוא מודל שמרגיש פחות כמו צעצוע ניסיוני ויותר כמו כלי עבודה אמיתי. הוא לא מושלם, לא מנצח בכל בנצ'מרק, ולא מחליף חשיבה אנושית. אבל הוא סוכן עבודה מהיר, יעיל, יציב, וכזה שמסוגל לבצע משימות מורכבות מקצה לקצה. זה לא עדכון שמטריף את הדמיון - זה עדכון שמתחיל לשנות את סגנון העבודה עם המודל.

 

בעמוד ההשקה הרשמי של OpenAI מציגים את GPT‑5.5 דרך הדגמות חיות, בנצ'מרקים מלאים וניתוח מפורט של היכולות החדשות של המודל כסוכן עבודה. זה מקור מצוין למי שרוצה להעמיק בהכרזה המקורית ולראות את הדוגמאות שהובילו את השדרוג.

 

ולמי שרוצה ממש להרחיב וללמוד, הסקירה של Matt Shumer מציגה מבט מעמיק ובלתי אמצעי על GPT‑5.5 מתוך עבודה ממושכת עם המודל בסביבות פיתוח אמיתיות. שומר בחן את המודל לאורך זמן, הריץ עליו פרויקטים מלאים, בדק את יכולות ההנדסה, העיצוב והאבטחה שלו, ופרסם ניתוח מפורט שמדגיש את המקומות שבהם GPT‑5.5 מצטיין ואת המקומות שבהם הוא עדיין פחות בשל. זו סקירה שמביאה ניסיון שטח אמיתי, לא הדגמות שיווקיות, והיא משלימה את התמונה לגבי מה המודל יודע לעשות בעולם האמיתי.

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

רוצים הרצאה או ייעוץ של רון גולד?
השאירו פרטים ונשמח לחזור אליכם עם המידע הרלוונטי
אולי יעניין אותך גם...
guest
0 תגובות
Inline Feedbacks
צפה בכל התגובות
Let's update

רוצים לקבל עדכונים על כל מה שחדש ומעניין בעולם ה-AI? הרשמו לניוזלטר שלנו!

אירועי AI קרובים

תפריט נגישות

תוצאות נוספות...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors