OpenAI הכריזה אתמול (10 ביוני) על o3-pro – גרסה חדשה ומשודרגת של המודל המתקדם שלה. o3-pro נבנה כדי להתמודד עם בעיות מורכבות במיוחד – בתחומים כמו מתמטיקה, מדעים ותכנות – תוך הקפדה על אמינות ודיוק בתשובות, גם אם זה דורש יותר זמן חישוב.
רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.
אפשר גם להרשם לניוזלטר שלנו
מה זה o3-pro ולמה הוא שונה?
o3-pro הוא הדגם החדש ביותר בסדרת המודלים “החושבים” של OpenAI, שממשיכים את הקו של o1-pro. הוא נבנה מתוך מטרה אחת ברורה: לספק תשובות מדויקות, שקולות ומבוססות גם כשהשאלה מורכבת במיוחד. במקום לספק תגובה מיידית, o3-pro פועל בגישה שונה – הוא עובד שלב אחר שלב, מפרק את הבעיה, בודק הנחות ומגיע לתשובה בצורה שקולה. בעידן שבו רוב המודלים מתמקדים במהירות, o3-pro בולט דווקא בזה שהוא לוקח את הזמן כדי לחשוב לעומק – מה שהופך אותו לכלי מדויק ואמין יותר עבור משימות שדורשות ניתוח רציני.
למי o3-pro זמין – וכמה זה עולה?
מודל o3-pro זמין כבר עכשיו עבור חלק מהמשתמשים:
-
משתמשי ChatGPT Pro ו-Team: כבר היום תוכלו לבחור ב-o3-pro מתוך תפריט המודלים – ללא עלות נוספת.
-
משתמשי Enterprise ו-Edu: יקבלו גישה במהלך השבוע הקרוב.
-
מפתחים (API): המודל זמין גם ב-API, במחיר של $20 למיליון טוקנים של קלט ו-$80 למיליון טוקנים של פלט.
מדובר בהוזלה משמעותית לעומת o1-pro, שעלה קודם לכן $60 לקלט ו-$120 לפלט.
עד כמה o3-pro מדויק ומה זה אומר בפועל?
כדי להבין את ההבדל ש-o3-pro מביא איתו, צריך להסתכל לא רק על תחושת השימוש, אלא על המספרים. OpenAI הריצה את המודל החדש בסדרה של מבחנים תובעניים במיוחד, שבודקים לא רק אם המודל יודע את התשובה, אלא אם הוא יכול לספק אותה שוב ושוב באמינות מלאה.
במבחן שנקרא “4 מתוך 4”, המודל צריך לענות נכון לא רק פעם אחת – אלא ארבע פעמים רצוף, על אותה שאלה, בניסוחים שונים. זו דרך לבחון עד כמה התשובות שלו יציבות, מדויקות ולא אקראיות.
התוצאות מרשימות: במתמטיקה תחרותית, o3-pro הגיע ל-90% הצלחה – לעומת 80% בלבד בדגמים הקודמים (o1-pro וגם o3 הרגיל). גם במדע ברמת דוקטורט (GPQA), הוא מוביל עם 76%, בהשוואה ל-74% של o1-pro ו-67% של o3. ובתחום התכנות התחרותי, הפער אפילו גדול יותר: הציון של o3-pro במודל הדירוג של Codeforces טיפס ל-2301, לעומת 2011 של o3 הרגיל ו-1423 בלבד של o1-pro.
אבל זה לא הכול. כדי לבדוק כמה טוב המודל בפעם הראשונה, נבחן גם מדד שנקרא pass@1 – כלומר, האם התשובה הראשונה שהמודל נותן היא נכונה. גם כאן, o3-pro הראה שיפור בכל תחום: 93% הצלחה במתמטיקה (לעומת 86% ב-o1-pro), 84% במדעים (לעומת 79%), ואפילו 2748 נקודות ב-Codeforces – נתון שמציב אותו ברמת “מתחרה עילית” בתחרויות תכנות.
ולבסוף, הניסוי החשוב מכל – השוואה מול בני אדם. OpenAI ביקשה ממומחים אנושיים להכריע בין תשובות שנכתבו על ידי o3-pro לעומת תשובות של o3 הרגיל, בלי לדעת מי כתב מה. התוצאה? o3-pro נבחר כעדיף ברוב המוחלט של המקרים: 66.7% בכתיבה אישית, 64.9% בניתוח מדעי, 62.7% בתכנות, ו-64.3% בניתוח נתונים. מדובר בשיפור מדיד, אמיתי – שמבסס את o3-pro כמודל שמגיע לביצועים שמתחרים (ואפילו עוקפים) מומחים אנושיים בתחומם.
מה הכלים ש-o3-pro מביא איתו?
מעבר ליכולות החשיבה המעמיקות שלו, o3-pro מצטיין גם ביכולת להתחבר לעולם החיצון. הוא לא רק עונה על שאלות – הוא גם יודע לחפש, לקרוא, לנתח ולהריץ קוד בזמן אמת. כשהמודל צריך מידע מעודכן, הוא פשוט שולח שאילתת חיפוש לרשת. כששולחים לו קובץ PDF, גיליון Excel או מסמך Word – הוא קורא, מבין, ומסכם את העיקר. אפשר גם לשלוח לו תמונה, והוא יודע לזהות מה רואים בה ולהגיב בהתאם.
למתכנתים הוא מציע סביבת הרצה לקטעי קוד ב-Python – כולל הדגמות, בדיקות ודוחות גרף. ולמשתמשים עם זיכרון פעיל, הוא אפילו זוכר פרטים חשובים מהעבר – ויודע להשתמש בהם כדי לתת תשובות מותאמות אישית יותר. בקיצור, זה לא רק מודל טקסט – זה עוזר אישי עם כישורים רחבים, שחושב כמו חוקר, קורא כמו אנליסט, ומגיב כמו מפתח תוכנה.
מתי כדאי להשתמש ב-o3-pro – ומתי לא?
o3-pro הוא לא המודל שתריצו בשביל שיחה קלילה או בדיחה אקראית. הוא נועד לרגעים שבהם אתם אומרים לעצמכם: “אני חייב תשובה מדויקת – ושווה לי לחכות בשבילה.” אם אתם עובדים על בעיה מתמטית מורכבת, נתקעים בשורת קוד מתוחכמת, מנסים להבין מאמר מדעי עמוס או כותבים טקסט שצריך להיות מדויק עד רמת הפסיק – זה הרגע לשלוף את o3-pro.
אבל אם כל מה שאתם צריכים זה לבדוק עובדה פשוטה, לתרגם משפט, לכתוב מייל קצר או ליצור תמונה – עדיף לבחור במודל מהיר יותר כמו GPT-4o, שפועל ברגע ומחזיר תשובות כמעט מיידית. במילים אחרות: כשאיכות קובעת – לכו על o3-pro. כשמהירות קובעת – עדיף להישאר עם הכלים המהירים.
מה המגבלות של o3-pro כרגע?
למרות היתרונות המרשימים שלו, חשוב לדעת ש-o3-pro עדיין לא מתאים לכל שימוש, ויש כמה מגבלות טכניות שכדאי לקחת בחשבון.
-
זמני תגובה ארוכים יותר – o3-pro עובד לאט יותר ממודלים אחרים, כי הוא מתוכנן “לחשוב לעומק”. זה לא באג – זו תכונה. אבל זה אומר שתצטרכו להמתין לפעמים דקה או שתיים לתשובה.
-
אין יצירת תמונות – המודל הזה לא תומך ביצירת תמונות. אם אתם רוצים לייצר ויזואליים – השתמשו ב-GPT-4o או o4-mini.
-
Canvas לא נתמך – נכון לעכשיו, לא ניתן להריץ את o3-pro בסביבת Canvas.
-
צ’אטים זמניים מושבתים זמנית – OpenAI מציינת שיש תקלה זמנית בממשק זה, כך שהשימוש בו מושעה עד להודעה חדשה.
אלה לא בהכרח בעיות מהותיות, אבל הן חשובות אם אתם מתכננים שימוש תפעולי במודל – במיוחד אם אתם עובדים עם תהליכי אוטומציה או על דדליין.
השורה התחתונה
o3-pro הוא לא מודל לכל משימה – והוא גם לא מתיימר להיות כזה. אבל כשדיוק, עומק ואמינות הם תנאי סף – זה הכלי הכי טוב ש-OpenAI מציעה כרגע. אם אתם כותבים טקסט רגיש, פותרים בעיה מורכבת, בודקים נתונים חשובים או פשוט רוצים לוודא שהתשובה שקיבלתם מחזיקה מים גם אחרי קריאה שנייה – זה הזמן להפעיל את o3-pro. לשאלות פשוטות, תגובות מהירות או משימות גרפיות – יש כלים אחרים, מהירים וזמינים יותר. אבל כשאתם רוצים להיות בטוחים, באמת בטוחים, שהוא מבין את השאלה עד הסוף, ומחזיר לכם את התשובה הכי שקולה שאפשר? זה הרגע לבחור במודל o3-pro.