יש רגעים בעולם הבינה המלאכותית שבהם ברור שמשהו משמעותי משתנה. ההשקה של GPT‑5.4 היא אחד מהרגעים האלה. לא בגלל הדגמות נוצצות או סיסמאות שיווקיות, אלא בגלל תחושה שחוזרת אצל מי שכבר עבדו איתו: המודל פשוט עובד טוב יותר. הוא מהיר יותר, מדויק יותר ובעיקר יציב, כזה שאפשר לסמוך עליו. OpenAI השיקה שני דגמים, GPT‑5.4 Thinking ו-GPT‑5.4 Pro, ושניהם יחד מציבים רף חדש. Matt Shumer, אחד הבטא טסטרים הבולטים, כתב שזו הפעם הראשונה שבה הוא כמעט לא משתמש בגרסת ה-Pro, משום שגם הגרסה הסטנדרטית מספקת תוצאות ברמה שלא ראה קודם. “המודל הכי טוב בעולם, בפער”, הוא אומר, והדבר תואם את מה שמדווחים רבים אחרים. הפעם, בניגוד להשקות קודמות, יש גם נתונים שמחזקים את התחושה הזו ומראים עד כמה השינוי רחב.
רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.
אפשר גם להרשם לניוזלטר שלנו
למה בכלל היה צריך שינוי?
כדי להבין את המשמעות של GPT‑5.4, צריך לזכור מה חסם את הדורות הקודמים. המודלים ידעו לכתוב, להסביר ולנתח, אבל לא תמיד הצליחו לבצע משימות אמיתיות מקצה לקצה. הם יכלו להבריק במשימה אחת ולהתבלבל בבאה אחריה. reasoning עמוק היה מדויק, אך לעיתים איטי מדי.
נוסף על כך, נוצר פער בין היכולת לכתוב קוד לבין היכולת לבצע פעולות בעולם הדיגיטלי, כמו ניווט בממשקי מחשב, עבודה עם דפדפן או שימוש בכלים חיצוניים. הפער הזה הפך למשמעותי ככל שחברות ניסו לבנות סוכנים ואוטומציות. במצב כזה היה ברור שהמודלים צריכים לעבור שינוי - לא רק לתאר פתרון, אלא גם לבצע אותו בפועל. GPT‑5.4 פותח בדיוק כדי לענות על הצורך הזה.
מה GPT‑5.4 מביא לשולחן
GPT‑5.4 הוא מודל שנבנה לעבודה אמיתית. הוא יודע להפעיל סוכנים, לכתוב קוד, לגלוש ברשת, להשתמש במחשב ולבצע תהליכים מרובי שלבים, והכול במהירות גבוהה יותר, בדיוק רב יותר ועם פחות טעויות. הנתונים מהבלוג הרשמי של OpenAI מציגים קפיצה רחבה ומרשימה ביכולות, לא שיפור נקודתי.
ביצועים במשימות מקצועיות
ב-GDPval, מבחן שמדמה עבודה של 44 מקצועות שונים, GPT‑5.4 מגיע ל-83 אחוז הצלחה, לעומת 70.9 אחוז בדור הקודם. הגרף המצורף מטה מדגים זאת היטב: גם GPT‑5.4 וגם גרסת ה-Pro שלו עוברים את רף הביצועים של מומחים אנושיים.
מעבר לכך, המודל מצטיין במיוחד במשימות משרדיות יומיומיות. הוא מגיע ל-87.3 אחוז הצלחה במשימות אקסל שמדמות אנליסט בנקאות השקעות, מייצר מצגות ש-68 אחוז מהשופטים האנושיים העדיפו על פני GPT‑5.2, ומפיק מסמכים מדויקים יותר עם פחות טעויות עובדתיות. זה שיפור שמרגישים בשימוש יומיומי רגיל, לא רק בבנצ'מרקים.
בפועל, GPT‑5.4 מבין טבלאות מורכבות, בונה נוסחאות בצורה מדויקת, מנתח נתונים רב-שלביים ומציע תובנות עסקיות ברמת עומק שהייתה שמורה עד היום לכלים ייעודיים או למומחים אנושיים. הוא גם שומר על עקביות לאורך משימות ארוכות, דבר שהיה אתגר משמעותי בדורות קודמים. השילוב הזה הופך אותו לכלי עבודה אמיתי, כזה שמפחית חיכוך ומקצר תהליכים במקום להוסיף עוד שכבת תיווך.
המודל שמפעיל את המחשב בשבילכם
אחת הקפיצות הבולטות ביותר היא ביכולות המחשב. GPT‑5.4 הוא המודל הראשון של OpenAI שמסוגל להפעיל מחשב באופן טבעי: ללחוץ על כפתורים, להקליד, לנווט בממשקים, לבצע פעולות מורכבות דרך Playwright (כלי אוטומציה לדפדפנים) ולהבין צילומי מסך. במבחן שמודד שימוש אמיתי במחשב, הוא מגיע ל-75 אחוז הצלחה ועוקף גם בני אדם.
יכולות ראייה מתקדמות
GPT‑5.4 תומך בתמונות ברזולוציה של עד 10.24 מיליון פיקסלים, מציג שיפור ביכולת לאתר פרטים קטנים ובדיוק הלחיצה על ממשקים, ומבין טוב יותר מסמכים מורכבים. ב-MMMU Pro, מבחן הבנה חזותית מתקדם, הוא מגיע ל-81.2 אחוז לעומת 79.5 אחוז בדור הקודם. ב-OmniDocBench, מבחן הבנת מסמכים, הוא מפחית את שיעור השגיאות באופן משמעותי. גם כאן, הגרף מציג את השיפור בצורה ברורה.
Tool Search
אחד החידושים הבולטים ב‑GPT‑5.4 הוא מנגנון Tool Search, שמאפשר למודל לאתר את הכלים הדרושים לו בזמן אמת במקום לקבל את כולם מראש. הגישה הזו מפחיתה ב‑47 אחוז את כמות הטוקנים הנדרשת לביצוע משימות, משפרת את מהירות העבודה ומאפשרת למודל להתמודד בקלות עם מערכות גדולות ומורכבות של כלים. זהו שינוי תשתיתי משמעותי, שמאפשר לבנות סוכנים מתקדמים יותר בעלות נמוכה יותר וביעילות גבוהה יותר.
Opus 4.6 vs GPT 5.4 (High) (1/9)
prompt: Build a single-file HTML/CSS/JS (no libs) demo that uses SVG to simulate a plant growing: stem extends, leaves sprout + unfurl with springy/windy “physics”, then seamlessly loops forever.
For the initial impressions I'm really… pic.twitter.com/p6LAki0JUV
— Dev Ed (@developedbyed) March 6, 2026
שכבה עמוקה יותר של הגנה
OpenAI מקדישה חלק משמעותי לנושא הבטיחות, וב-GPT‑5.4 מוצגים כמה חידושים בולטים. המודל מסווג כבעל יכולות סייבר גבוהות, ולכן מופעלים עליו מנגנוני הגנה מחמירים יותר מאשר בדורות קודמים. אחד התחומים שנבדקו הוא היכולת של המודל להסתיר את שרשרת החשיבה שלו, במסגרת מבחן CoT Controllability.
הממצאים מראים ש-GPT‑5.4 Thinking מתקשה להסתיר את תהליך החשיבה הפנימי שלו, תכונה שנחשבת חיובית בהקשר של בטיחות, משום שהיא מאפשרת ניטור שקוף וברור יותר של אופן קבלת ההחלטות.
בנוסף לכך, OpenAI מציגה מערך מחוזק של מנגנוני חסימה: ניטור מתקדם, בקרות גישה הדוקות יותר, חסימה אסינכרונית לבקשות בעלות פוטנציאל סיכון, והפחתה ניכרת של טעויות עובדתיות. לפי הבלוג, GPT‑5.4 מפחית טעויות עובדתיות ב-33 אחוז לעומת GPT‑5.2, שיפור משמעותי במיוחד במשימות מקצועיות שבהן דיוק הוא תנאי בסיסי.
תמחור וזמינות
Open AI מפרטים בצורה ברורה את זמינות הדגמים ואת מודל התמחור שלהם. GPT‑5.4 Thinking זמין למשתמשי Plus, Team ו‑Pro, בעוד GPT‑5.4 Pro מוצע למשתמשי Pro ו‑Enterprise. במקביל, GPT‑5.2 Thinking יישאר זמין למשך שלושה חודשים נוספים בלבד, ולאחר מכן יוסר מהמערכת. ב‑Codex, GPT‑5.4 כולל תמיכה ניסיונית בחלון הקשר של מיליון טוקנים, יכולת שמאפשרת לנתח קוד ארוך במיוחד או מסמכים מורכבים בצורה רציפה.
ב‑API, התמחור של GPT‑5.4 עומד על 2.50 דולר למיליון טוקנים בקלט ו‑15 דולר למיליון טוקנים בפלט. גרסת ה‑Pro מתומחרת ב‑30 דולר למיליון טוקנים בקלט ו‑180 דולר למיליון טוקנים בפלט. למרות המחיר הגבוה יותר, OpenAI מציינת שהמודל יעיל משמעותית, ולכן בפועל נדרש פחות שימוש בטוקנים כדי להשלים משימות מורכבות. היעילות הזו מאזנת חלק מהעלייה בעלות ומאפשרת למשתמשים לקבל יותר תמורה מכל בקשה.
See what developers are building with GPT-5.4.
Our developer app showcase highlights examples across coding, computer use, tool use, and professional workflows.https://t.co/wh3G8odTlM pic.twitter.com/KYzRxqDKmH
— OpenAI Developers (@OpenAIDevs) March 5, 2026
מודל שמגדיר מחדש את הציפיות (ואת מאזן הכוחות)
GPT‑5.4 הוא לא עוד שדרוג, אלא ציון דרך שמסמן מעבר לעידן שבו בינה מלאכותית לא רק מייעצת אלא גם מבצעת. השילוב בין ביצועים גבוהים, מהירות, עקביות ויכולות פעולה מעשיות הופך אותו לכלי תפעולי של ממש. הוא מצטיין במשימות מקצועיות, מפעיל מחשבים, מבין תמונות ומסמכים, משתמש בכלים בצורה יעילה ומציג שיפורים משמעותיים בבטיחות. זה מודל שמחזיר את OpenAI לקדמת הבמה, אחרי תקופה שבה המתחרות - גוגל ואנטרופיק - תפסו את מרכז תשומת הלב עם השקות מרשימות משלהן.













