דף הבית » עלייתה של מערכת o1 ו-o1 Pro

עלייתה של מערכת o1 ו-o1 Pro

עומר הררי

06/12/2024

זמן קריאה: 9 דקות

קריסמס כאן, ו-OpenAI מצטרפת לחגיגה עם סדרה של הכרזות חגיגיות! הראשונה שבהן פורסמה אתמול (5.12.24) בשעה 20:00 בערב (שעון ישראל), וכללה את ההשקה של המודל המצופה, o1, יחד עם מסלול חדש ויוקרתי – o1 Pro. למשתמשים במנוי בתשלום, מודל o1 זמין כבר עכשיו וניתן לבחור בו דרך ממשק ChatGPT, אך בשלב זה הוא עדיין אינו נגיש דרך ה-API. המודלים החדשים מגיעים עם הבטחות לשיפור ביכולות החישוב והניתוח, לצד מבנה תמחור מפתיע שנועד להתאים למשתמשים מקצועיים יותר. OpenAI מציגה אותם כקפיצה משמעותית בעולם הבינה המלאכותית, במיוחד עבור משימות הדורשות עיבוד נתונים מורכב ואמין. עם זאת, נשאלת השאלה הגדולה: האם המודלים הללו מצדיקים את ההייפ ואת תג המחיר הגבוה? התשובה תלויה בצרכים של המשתמשים ובערך המוסף שמודל o1 Pro יכול לספק למי שמחפש פתרונות מתקדמים ומדויקים יותר. מעניין יהיה לראות כיצד השוק יגיב וכיצד OpenAI תמשיך למצב את עצמה בתחום התחרותי של הבינה המלאכותית.

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

אפשר גם להרשם לניוזלטר שלנו

o1 ו-o1 Pro: מה חדש?

המודלים החדשים, o1 ו-o1 Pro, מביאים שיפורים משמעותיים בעיקר בשלושה תחומים מרכזיים: מתמטיקה, קידוד ומדעים, וכן ניתוח שפה טבעית (עם הבנה עמוקה יותר של כוונת הכותב). בנוסף, נראה כי המודלים מסוגלים לבצע משימות מורכבות נוספות, אך תחומים אלו עדיין נמצאים בשלבי בדיקה. ההבטחה הגדולה טמונה בשיפור במהירות ובדיוק התשובות, במיוחד במשימות הדורשות יכולות ניתוח מורכבות ורב-שלביות. משימות כגון פתרון תשבצים מורכבים, זיהוי דפוסים בתמונות, ניתוח בעיות מתמטיות מורכבות, וחשיבה לוגית (רזונינג) ממחישות את הפוטנציאל של המודלים להתמודד עם אתגרים מורכבים ורב-שלביים, לצד ההתמודדות עם האתגרים הניכרים שבדרך.

איך משתמשים במודלים ולמי הם זמינים?

מודל o1 זמין למנויי ChatGPT Plus במחיר של 20 דולר לחודש, בעוד שמודל o1 Pro פונה בעיקר למשתמשים מקצועיים. מודל זה מוצע במחיר גבוה משמעותית של 200 דולר לחודש, ומיועד למי שזקוקים ליכולות חישוב מתקדמות ואמינות גבוהה במיוחד. למשתמשי ChatGPT Pro יש גישה ישירה ל-o1 pro mode דרך ממשק בחירת המודל – חשוב לדעת שבמצב זה, המערכת מייצרת תשובות בצורה איטית יותר בשל רמת החישוב המוגברת, אך תהליך ההמתנה מלווה בסרגל התקדמות והתראות באפליקציה אם המערכת פועלת ברקע.

מודל o1 זמין למנויים בתשלום.

העלאת קבצים ל-o1

אחד השיפורים הגדולים, שלו לבדו יש השלכות דרמטיות על יכולות השימוש והפוטנציאל של פלטפורמת ChatGPT, היא היכולת להעלות קבצים למודל o1 החדש (יכולת שלא הייתה זמינה בגרסת הפריוויו הישנה של המודל). מדובר בשיפור דרמטי, שכן למודל החדש יש יכולות חישוב עוצמתיות במיוחד, בדגש על הבנת תהליכים מורכבים, הסקה רב-שלבית, יכולות חיזוי ויכולות חישוב מתמטיות מתקדמות. זה בהחלט גיים צ’יינג’ר שמקפיץ את האיכויות של הצ’ט הג’נרטיבי המפורסם והמצליח בעולם!

מה זה ChatGPT Pro?

חבילת ChatGPT Pro היא תכנית מנוי חודשית במחיר של 200 דולר, שנועדה לספק גישה רחבה למודלים המתקדמים של OpenAI. התוכנית מיועדת לאנשי מקצוע כמו חוקרים, מהנדסים ומשתמשים שמסתמכים על אינטליגנציה מלאכותית לצורך עבודה יומיומית. היתרון המרכזי בתוכנית הוא גישה בלתי מוגבלת למודלים החזקים ביותר, הכוללים את:

o1: המודל המתקדם ביותר של OpenAI.
o1-mini: גרסה ממוקדת עם שימושים ייעודיים.
GPT-4o: דגם נוסף שמרחיב את האפשרויות של משפחת GPT.
Advanced Voice: כלי קולי מתקדם לשימושים חדשניים.

המאפיין המרכזי של ChatGPT Pro הוא מצב o1 pro mode, אשר מתאפיין ביכולות חישוב מוגברות המאפשרות למודל “לחשוב יותר חזק” ולהפיק תשובות אמינות ומדויקות יותר, בעיקר בפתרון בעיות קשות.

מה מיוחד ב-o1 ובמצב o1 pro mode?

מודל o1 הוא הדור החדש של מודלי ה-AI של OpenAI, והוא מתאפיין ביכולת לפתור בעיות מורכבות באופן מדויק ואמין יותר. החידוש הגדול ביותר הוא מצב o1 pro mode, המשפר את ביצועי המודל בעזרת שימוש במשאבים חישוביים מתקדמים.

בבדיקות חיצוניות, o1 pro mode הראה שיפור משמעותי במגוון תחומים:

מתמטיקה תחרותית: עלייה משמעותית בדיוק הפתרונות במבחנים כמו AIME 2024.
תכנות תחרותי: שיפור באחוזון ההצלחה במבחנים כמו Codeforces.
שאלות מדעיות ברמה אקדמית: תוצאות מדויקות יותר בשאלות ברמת דוקטורט.
מדד אמינות משופר: אחת מהשיטות להדגשת האמינות של o1 pro mode היא הערכה בתנאים מחמירים: תשובה נחשבת לנכונה רק אם המודל הצליח לפתור שאלה בצורה נכונה בארבע ניסיונות מתוך ארבע. כאן, o1 pro mode הפגין ביצועים יוצאי דופן בהשוואה למודלים קודמים.

נתוני הביצועים:

בהשוואה ל-o1 ול-o1-preview, מצב o1 pro mode מציג ביצועים משופרים במדדים מאתגרים של למידת מכונה, במיוחד בתחומי המתמטיקה, המדעים והתכנות.

מתמטיקה תחרותית (AIME 2024): o1 pro mode הגיע לדיוק של 86%, בהשוואה ל-78% של o1 ול-50% של o1-preview.
תכנות תחרותי (Codeforces): o1 pro mode קיבל 90%, בעוד o1 השיג 89% ו-o1-preview רק 62%.
שאלות מדעיות ברמת דוקטורט: o1 pro mode הגיע ל-79%, לעומת 76% ו-74% עבור o1 ו-o1-preview בהתאמה.

ביצועי המודל במתמטיקה ומדעים.

כדי להדגיש את היתרון המרכזי של מודל o1 Pro – שיפור האמינות – OpenAI השתמשו בהגדרה מחמירה יותר להערכה: המודל נחשב לפותר שאלה רק אם הוא מצליח לספק תשובה נכונה בארבע מתוך ארבע ניסיונות (“reliability 4/4”), ולא רק באחד מהם.

מתמטיקה תחרותית: 80% עבור o1 pro mode, בהשוואה ל-67% עבור o1 ו-37% עבור o1-preview.
תכנות תחרותי: 75% עבור o1 pro mode, לעומת 64% ל-o1 ו-26% ל-o1-preview.
שאלות מדעיות ברמת דוקטורט: 74% עבור o1 pro mode, לעומת 67% ל-o1 ו-58% ל-o1-preview.

ביצועים מרשימים במדד המחמיר 4/4 reliability.

צפו בהכרזה, מתוך ערוץ היוטיוב של OpenAI:

השוואות מוקדמות מצביעות על כך שמודל o1 מהיר ב-50% בהשוואה לקודמו, o1 Preview, ומצטיין במיוחד בתחומים כמו מתמטיקה, קידוד ומדעים. לעומת זאת, השיפור המרכזי במודל o1 Pro מתמקד בעיקר באמינות התשובות. המודל עושה שימוש בשיטת “קונצנזוס”, שבה נאספות מספר תשובות פוטנציאליות, ומתוכן נבחרת התשובה המדויקת ביותר. עם זאת, בבדיקות בלתי רשמיות נמצא כי ההבדל בביצועים בין מודל o1 למודל o1 Pro היה קטן מהמצופה. דוגמה בולטת לכך היא בתחום פתרון בעיות חשיבה לוגית (Reasoning), שבו ההבדלים בין המודלים כמעט ולא הורגשו.

האתגרים והחולשות

למרות השיפורים, נראה כי המודלים מתקשים במשימות יצירתיות ובפתרון בעיות הדורשות ניתוח מידע מורכב או ידע תרבותי. לדוגמה, במבחן שנעשה על ידי Ethan Mik, המודל נכשל בפתרון תשבץ מסובך שדרש יכולות הסקה והבנת רמזים עדכניים.

מודל o1 במציע גם יכולות ניתוח תמונות חדשות, המאפשרות להעלות תמונות ולקבל תובנות ישירות מהם. למרות זאת, בבדיקות מסוימות המודל לא הצליח לספק תשובות מדויקות או משמעותיות, במיוחד במקרים בהם התמונה לא הכילה רמזים מפורטים מספיק.

אחת הטענות המעניינות שעלו מהבדיקות היא שמודל o1 Pro הצליח במקרים מסוימים פחות טוב ממודל o1 הסטנדרטי. לדוגמה, בבדיקת SimpleBench, שזוהי בדיקה לא רשמית המכילה 10 שאלות היגיון כלליות, מודל o1 Pro קיבל תוצאות נמוכות יותר לעומת מודל o1, ייתכן שבגלל שימוש בשיטות קונצנזוס שהשפיעו לרעה על התוצאה הסופית אבל זה סתם ניחוש לא מבוסס.

המערכות החדשות מפגינות מגמות מעניינות בתחום הבטיחות, אך לא ללא אתגרים. לדוגמה, נמצא שבמקרים מסוימים המודל ניסה לעקוף מנגנוני פיקוח, ואף לשנות את מטרותיו במקרים בהם זוהה סיכון לסגירתו. אמנם מדובר במקרים נדירים, אך סוגיות אלו מעלות שאלות חשובות בנוגע לאתיקה ולשימושיות של מודלים מתקדמים אלו.

תמחור ותפיסה שיווקית

עם מחיר של 200 דולר לחודש, התמחור של o1 Pro מסמן מעבר למודל עסקי חדש שבו OpenAI מכוונת לקהל מקצועי ונישתי. המודל דומה לזה של חברות כמו אפל, בהן מחיר גבוה מיועד למשתמשים שמוכנים לשלם על ערך מוסף משמעותי.

ממשק ChatGPT Pro מציג התראה על פתרון בעיית קיפאון (deadlock) ב-C++ עם שימוש במנעולים (mutexes), הכולל הקשר קוד ברקע וסרגל התקדמות עם כפתור “פרטים” (Details).

Credit: OpenAI

מה הערך המוסף אתם שואלים?

התשובה פשוטה: גישה ליכולות חישוב חזקות יותר ויעילות גבוהה יותר במשימות מורכבות. אבל איפה זה באמת הופך לרלוונטי? לדוגמה, כפי שמודגם בסרטון מעלה, אם אתם מחפשים פתרון למערכת קירור בחלל, או עוסקים במשימות הנדסיות הדורשות עיבוד נתונים מתקדם ומדויק, המודלים המתקדמים עשויים להיות קריטיים עבורכם. עם זאת, שיטת התמחור הזו מציבה גם אתגר משמעותי בפני OpenAI. השאלה הגדולה היא כיצד החברה תוכל להרחיב את קהל המשתמשים שלה ולשכנע משתמשים שמעדיפים את הגרסה החינמית או את המנוי בעלות הנמוכה לשדרג למודלים היקרים יותר? מדובר בדילמה מהותית שקשורה לא רק לתמחור, אלא גם לערך המוסף שהמודלים המתקדמים מציעים, וליכולתה של OpenAI להמחיש למשתמשים את היתרונות הברורים שהם עשויים להפיק מהם.

מודל לאלפיון העליון

פתרון אפשרי עשוי לכלול התאמה של שיטת התמחור לקהלים שונים, כמו הצעת מודלים בתשלום מדורג בהתאם לשימוש או מתן תקופת ניסיון מורחבת למשתמשים מקצועיים. כך, ניתן יהיה לגשר על הפער בין הבטחת היתרונות הטכנולוגיים של המודלים המתקדמים לבין ההשקעה הנדרשת מצד המשתמשים. אם OpenAI תצליח להתמודד עם אתגר זה, היא עשויה לבסס את מעמדה לא רק כמובילה טכנולוגית, אלא גם כספקית פתרונות מותאמים למגוון רחב של משתמשים – ממקצוענים ועד חובבים.

הסברה היא שמודל o1 Pro מיועד בעיקר ל-“1% העליונים” של המשתמשים – אלו שמוכנים לשלם עבור היתרונות הייחודיים וגם צריכים אותם, בכל זאת.. מומחה כזה בחוץ עולה מאות אלפי דולרים בשנה.. אז אם כך, תשלום של 200 דולר בחודש כבר לא נראה נורא כל כך.

מה צופן העתיד?

קודם כל, יש לפנינו עוד 11 ימים של הכרזות ככה שהעתיד קרוב מתמיד אבל בלי קשר, נראה שכחלק מהתוכניות לעתיד, OpenAI מתכננת להוסיף תמיכה בכלים מתקדמים כמו דפדפן אינטרנט ושיחות קוליות בלתי מוגבלות למודל החדש. כלים אלו עשויים לשפר משמעותית את השימושיות של המודלים, במיוחד עבור משתמשים מקצועיים שזקוקים לאינטגרציה עמוקה יותר.

למרות האתגרים, מודלים כמו o1 ו-o1 Pro הם סימן להתקדמות בכיוון אינטליגנציה כללית (AGI). השיפורים במהירות, דיוק והיכולת למנף נתונים חזותיים מסמנים כי OpenAI ממקדת את מאמציה במתן פתרונות איכותיים יותר. השקת מודלי o1 ו-o1 Pro היא צעד חשוב בפיתוח מערכות בינה מלאכותית מתקדמות, אך היא גם מזמנת שאלות על כדאיות התמחור והערך המוסף עבור המשתמשים. עם יתרונות כמו מהירות ואמינות משופרים לצד אתגרים כמו יכולות יצירתיות מוגבלות, נראה כי OpenAI עדיין רחוקה מלשכנע שהמודלים החדשים הם שוברי שוק. אם OpenAI תצליח להרחיב את התמיכה למשתמשים הרגילים ולשלב כלים מתקדמים נוספים, יתכן שנראה שינוי משמעותי במעמד המודלים החדשים בשוק. בינתיים, ההחלטה האם לשדרג ל-o1 Pro תלויה בעיקר בצרכים האישיים של המשתמש ובתקציב הזמין לכך.

רוצים להתמקצע?

בואו ללמוד איתנו בינה מלאכותית בקורס המקיף, העשיר והמבוקש בשוק. הצטרפו לאלפים הרבים שכבר עברו את הקורסים והסדנאות שלנו. פרטים והרשמה באתר.

לקבלת הנחה במחיר הקורסים – הזינו את קוד הקופון LETSAI

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

עומר הררי

עומר הררי - שותף מייסד בחברת LetsAI, יועץ GenAI לחברות ציבוריות וארגונים ממשלתיים. מרצה בתחומי הבינה המלאכותית היוצרת ושיטות עבודה של העולם החדש במוסדות אקדמיים, תוכניות הכשרת מנהלים בכירים בתעשייה, קורסי דיירקטורים ופיקוד בכיר בצה״ל ומשרדי הביטחון.

רוצים הרצאה או ייעוץ של עומר הררי?

השאירו פרטים ונשמח לחזור אליכם עם המידע הרלוונטי

אולי יעניין אותך גם...

Meeting Insights של AudioCodes הופך כל פגישה לנכס ואוצר אסטרטגי ארגוני

מדריך לשימוש ב-VEO3 למשתמש הישראלי הערמומי

Google I/O 2025 עם הכרזות שמשנות את הדרך שבה נשתמש בטכנולוגיה

2 תגובות

Inline Feedbacks

צפה בכל התגובות

יובל

5 months ago

אשמח אם תרחיב מה יקרה בשוק כשיתמכר לפתרונות ai והתמחור של כל החבילות יהיה פי 10. נגיד… למה שלא יגבו 500 דולר לחודש למודל שמבצע עבודה של מתכנת?

הגב

Admin

אביתר אדרי

5 months ago

Reply to יובל

אתה יכול להגיד את זה על כל עסק באשר הוא… למה שטיוטה לא יגבו מיליון שקל על מכונית? למה ששטראוס לא יגבו 50 שקל על ארטיק? כי אז אנשים לא יקנו מהם ויקנו מהמתחרים שיציעו מחיר אטרקטיבי יותר… ככה זה כשיש שוק פתוח ותחרותי.

הגב