תוצאות נוספות...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
× Send

האם GPT‑5.4 הוא מודל ה-AI הטוב בשוק כיום?

OpenAI משיקה את GPT 5.4
תוכן עניינים

יש רגעים בעולם הבינה המלאכותית שבהם ברור שמשהו משמעותי משתנה. ההשקה של GPT‑5.4 היא אחד מהרגעים האלה. לא בגלל הדגמות נוצצות או סיסמאות שיווקיות, אלא בגלל תחושה שחוזרת אצל מי שכבר עבדו איתו: המודל פשוט עובד טוב יותר. הוא מהיר יותר, מדויק יותר ובעיקר יציב, כזה שאפשר לסמוך עליו. OpenAI השיקה שני דגמים, GPT‑5.4 Thinking ו-GPT‑5.4 Pro, ושניהם יחד מציבים רף חדש. Matt Shumer, אחד הבטא טסטרים הבולטים, כתב שזו הפעם הראשונה שבה הוא כמעט לא משתמש בגרסת ה-Pro, משום שגם הגרסה הסטנדרטית מספקת תוצאות ברמה שלא ראה קודם. “המודל הכי טוב בעולם, בפער”, הוא אומר, והדבר תואם את מה שמדווחים רבים אחרים. הפעם, בניגוד להשקות קודמות, יש גם נתונים שמחזקים את התחושה הזו ומראים עד כמה השינוי רחב.

 

 
הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

למה בכלל היה צריך שינוי?

כדי להבין את המשמעות של GPT‑5.4, צריך לזכור מה חסם את הדורות הקודמים. המודלים ידעו לכתוב, להסביר ולנתח, אבל לא תמיד הצליחו לבצע משימות אמיתיות מקצה לקצה. הם יכלו להבריק במשימה אחת ולהתבלבל בבאה אחריה. reasoning עמוק היה מדויק, אך לעיתים איטי מדי.

 

נוסף על כך, נוצר פער בין היכולת לכתוב קוד לבין היכולת לבצע פעולות בעולם הדיגיטלי, כמו ניווט בממשקי מחשב, עבודה עם דפדפן או שימוש בכלים חיצוניים. הפער הזה הפך למשמעותי ככל שחברות ניסו לבנות סוכנים ואוטומציות. במצב כזה היה ברור שהמודלים צריכים לעבור שינוי - לא רק לתאר פתרון, אלא גם לבצע אותו בפועל. GPT‑5.4 פותח בדיוק כדי לענות על הצורך הזה.

 

סם אלטמן מסכם את המסר המרכזי של OpenAI לגבי GPT‑5.4

סם אלטמן מסכם את המסר המרכזי של OpenAI לגבי GPT‑5.4

מה GPT‑5.4 מביא לשולחן

GPT‑5.4 הוא מודל שנבנה לעבודה אמיתית. הוא יודע להפעיל סוכנים, לכתוב קוד, לגלוש ברשת, להשתמש במחשב ולבצע תהליכים מרובי שלבים, והכול במהירות גבוהה יותר, בדיוק רב יותר ועם פחות טעויות. הנתונים מהבלוג הרשמי של OpenAI מציגים קפיצה רחבה ומרשימה ביכולות, לא שיפור נקודתי.

 

הפעלת המודל החדש עם יכולת חשיבה סטנדרט/מורחב

הפעלת המודל החדש עם יכולות חשיבה (סטנדרטי/מורחב)

ביצועים במשימות מקצועיות

ב-GDPval, מבחן שמדמה עבודה של 44 מקצועות שונים, GPT‑5.4 מגיע ל-83 אחוז הצלחה, לעומת 70.9 אחוז בדור הקודם. הגרף המצורף מטה מדגים זאת היטב: גם GPT‑5.4 וגם גרסת ה-Pro שלו עוברים את רף הביצועים של מומחים אנושיים.

 

GPT‑5.4 מצטיין במשימות ידע מקצועיות

GPT‑5.4 מצטיין במשימות ידע מקצועיות | OpenAI

 




מעבר לכך, המודל מצטיין במיוחד במשימות משרדיות יומיומיות. הוא מגיע ל-87.3 אחוז הצלחה במשימות אקסל שמדמות אנליסט בנקאות השקעות, מייצר מצגות ש-68 אחוז מהשופטים האנושיים העדיפו על פני GPT‑5.2, ומפיק מסמכים מדויקים יותר עם פחות טעויות עובדתיות. זה שיפור שמרגישים בשימוש יומיומי רגיל, לא רק בבנצ'מרקים.

 

מבצע ניתוחים באקסל ברמה שמקרבת אותו לעבודה של אנליסט אמיתי

מבצע ניתוחים באקסל ברמה שמקרבת אותו לעבודה של אנליסט אמיתי

 

בפועל, GPT‑5.4 מבין טבלאות מורכבות, בונה נוסחאות בצורה מדויקת, מנתח נתונים רב-שלביים ומציע תובנות עסקיות ברמת עומק שהייתה שמורה עד היום לכלים ייעודיים או למומחים אנושיים. הוא גם שומר על עקביות לאורך משימות ארוכות, דבר שהיה אתגר משמעותי בדורות קודמים. השילוב הזה הופך אותו לכלי עבודה אמיתי, כזה שמפחית חיכוך ומקצר תהליכים במקום להוסיף עוד שכבת תיווך.

המודל שמפעיל את המחשב בשבילכם

אחת הקפיצות הבולטות ביותר היא ביכולות המחשב. GPT‑5.4 הוא המודל הראשון של OpenAI שמסוגל להפעיל מחשב באופן טבעי: ללחוץ על כפתורים, להקליד, לנווט בממשקים, לבצע פעולות מורכבות דרך Playwright (כלי אוטומציה לדפדפנים) ולהבין צילומי מסך. במבחן שמודד שימוש אמיתי במחשב, הוא מגיע ל-75 אחוז הצלחה ועוקף גם בני אדם.

 

יעילות של GPT‑5.4 בקוד ובביצוע משימות הנדסיות

יעילות של GPT‑5.4 בקוד ובביצוע משימות הנדסיות | OpenAI

יכולות ראייה מתקדמות

GPT‑5.4 תומך בתמונות ברזולוציה של עד 10.24 מיליון פיקסלים, מציג שיפור ביכולת לאתר פרטים קטנים ובדיוק הלחיצה על ממשקים, ומבין טוב יותר מסמכים מורכבים. ב-MMMU Pro, מבחן הבנה חזותית מתקדם, הוא מגיע ל-81.2 אחוז לעומת 79.5 אחוז בדור הקודם. ב-OmniDocBench, מבחן הבנת מסמכים, הוא מפחית את שיעור השגיאות באופן משמעותי. גם כאן, הגרף מציג את השיפור בצורה ברורה.

 

השוואת ביצועים בראייה ובהבנת מסמכים

השוואת ביצועים בראייה ובהבנת מסמכים | OpenAI

Tool Search

אחד החידושים הבולטים ב‑GPT‑5.4 הוא מנגנון Tool Search, שמאפשר למודל לאתר את הכלים הדרושים לו בזמן אמת במקום לקבל את כולם מראש. הגישה הזו מפחיתה ב‑47 אחוז את כמות הטוקנים הנדרשת לביצוע משימות, משפרת את מהירות העבודה ומאפשרת למודל להתמודד בקלות עם מערכות גדולות ומורכבות של כלים. זהו שינוי תשתיתי משמעותי, שמאפשר לבנות סוכנים מתקדמים יותר בעלות נמוכה יותר וביעילות גבוהה יותר.

 

שכבה עמוקה יותר של הגנה

OpenAI מקדישה חלק משמעותי לנושא הבטיחות, וב-GPT‑5.4 מוצגים כמה חידושים בולטים. המודל מסווג כבעל יכולות סייבר גבוהות, ולכן מופעלים עליו מנגנוני הגנה מחמירים יותר מאשר בדורות קודמים. אחד התחומים שנבדקו הוא היכולת של המודל להסתיר את שרשרת החשיבה שלו, במסגרת מבחן CoT Controllability.

 

הממצאים מראים ש-GPT‑5.4 Thinking מתקשה להסתיר את תהליך החשיבה הפנימי שלו, תכונה שנחשבת חיובית בהקשר של בטיחות, משום שהיא מאפשרת ניטור שקוף וברור יותר של אופן קבלת ההחלטות.

 

בנוסף לכך, OpenAI מציגה מערך מחוזק של מנגנוני חסימה: ניטור מתקדם, בקרות גישה הדוקות יותר, חסימה אסינכרונית לבקשות בעלות פוטנציאל סיכון, והפחתה ניכרת של טעויות עובדתיות. לפי הבלוג, GPT‑5.4 מפחית טעויות עובדתיות ב-33 אחוז לעומת GPT‑5.2, שיפור משמעותי במיוחד במשימות מקצועיות שבהן דיוק הוא תנאי בסיסי.

 

מאט שומר, אחד הבטא טסטרים הבולטים של OpenAI, משתף בציוץ חוויית שימוש יוצאת דופן ב‑GPT‑5.4

מאט שומר משתף בציוץ חוויית שימוש יוצאת דופן ב‑GPT‑5.4

תמחור וזמינות

Open AI מפרטים בצורה ברורה את זמינות הדגמים ואת מודל התמחור שלהם. GPT‑5.4 Thinking זמין למשתמשי Plus, Team ו‑Pro, בעוד GPT‑5.4 Pro מוצע למשתמשי Pro ו‑Enterprise. במקביל, GPT‑5.2 Thinking יישאר זמין למשך שלושה חודשים נוספים בלבד, ולאחר מכן יוסר מהמערכת. ב‑Codex, GPT‑5.4 כולל תמיכה ניסיונית בחלון הקשר של מיליון טוקנים, יכולת שמאפשרת לנתח קוד ארוך במיוחד או מסמכים מורכבים בצורה רציפה.

 

ב‑API, התמחור של GPT‑5.4 עומד על 2.50 דולר למיליון טוקנים בקלט ו‑15 דולר למיליון טוקנים בפלט. גרסת ה‑Pro מתומחרת ב‑30 דולר למיליון טוקנים בקלט ו‑180 דולר למיליון טוקנים בפלט. למרות המחיר הגבוה יותר, OpenAI מציינת שהמודל יעיל משמעותית, ולכן בפועל נדרש פחות שימוש בטוקנים כדי להשלים משימות מורכבות. היעילות הזו מאזנת חלק מהעלייה בעלות ומאפשרת למשתמשים לקבל יותר תמורה מכל בקשה.

 

 

מודל שמגדיר מחדש את הציפיות (ואת מאזן הכוחות)

GPT‑5.4 הוא לא עוד שדרוג, אלא ציון דרך שמסמן מעבר לעידן שבו בינה מלאכותית לא רק מייעצת אלא גם מבצעת. השילוב בין ביצועים גבוהים, מהירות, עקביות ויכולות פעולה מעשיות הופך אותו לכלי תפעולי של ממש. הוא מצטיין במשימות מקצועיות, מפעיל מחשבים, מבין תמונות ומסמכים, משתמש בכלים בצורה יעילה ומציג שיפורים משמעותיים בבטיחות. זה מודל שמחזיר את OpenAI לקדמת הבמה, אחרי תקופה שבה המתחרות - גוגל ואנטרופיק - תפסו את מרכז תשומת הלב עם השקות מרשימות משלהן.

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

רוצים הרצאה או ייעוץ של רון גולד?
השאירו פרטים ונשמח לחזור אליכם עם המידע הרלוונטי
אולי יעניין אותך גם...
guest
0 תגובות
Inline Feedbacks
צפה בכל התגובות
Let's update

רוצים לקבל עדכונים על כל מה שחדש ומעניין בעולם ה-AI? הרשמו לניוזלטר שלנו!

אירועי AI קרובים

תפריט נגישות

תוצאות נוספות...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors