דף הבית » התות הגיע – המודל המצופה של OpenAI זמין – כל מה שצריך לדעת על O1

התות הגיע – המודל המצופה של OpenAI זמין – כל מה שצריך לדעת על O1

אביתר אדרי

13/09/2024

זמן קריאה: 10 דקות

חברת OpenAI הכריזה על סדרת מודלים חדשה בשם OpenAI o1, המיועדת לשפר את יכולות ההיגיון והחשיבה של מערכות בינה מלאכותית ולסייע בפתרון בעיות מורכבות. מודלים אלו תוכננו להתמודד עם בעיות מורכבות בתחומים כמו מדע, תכנות ומתמטיקה, ולספק פתרונות מתקדמים יותר מאלו שהיו זמינים עד כה.

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

אפשר גם להרשם לניוזלטר שלנו

מהו OpenAI o1?

חושב לפני שהוא מדבר

OpenAI o1 הוא מודל AI מתקדם שנועד להקדיש יותר זמן ל"חשיבה" לפני מתן תשובה, בדומה לאופן שבו בני אדם פותרים בעיות מורכבות. המודל לומד לשפר את תהליכי החשיבה שלו, לנסות אסטרטגיות שונות ולהכיר בטעויותיו, מה שמוביל לביצועים טובים יותר במשימות מאתגרות.

בניגוד למודלים קודמים, o1 מוכשר "לחשוב" לפני מתן תשובה באמצעות "שרשרת מחשבה" פנימית (הרחבה בהמשך). המודל מקדיש זמן רב יותר לעיבוד שאלות ומשימות מורכבות, במטרה להגיע לתשובות מדויקות יותר. הוא משתמש בלמידת חיזוקים כדי לפתח תהליך הנמקה דומה לזה של בני אדם, ומסוגל לזהות טעויות, לנסות אסטרטגיות שונות ולשפר את תשובותיו לאורך זמן. כשתשאלו אותו שאלה, תוכלו ללחוץ על החץ שמגדיל את "שרשרת המחשבה" שלו ואז אפשר ממש לראות "איך הוא חושב" ואיך הוא מפרק את השאלה לתתי-שאלות או משימות. בסוף התהליך הוא אף יציג לכם כמה שניות לקח לו לחשוב על התשובה. זה לא רק תהליך של ניבוי של המילה הבאה (הפשטה של האופן בו מודלי שפה קלאסיים עובדים), אלא משהו שיותר מזכיר תהליך חשיבה מורכב אצל בני אנוש.

יכולת "בדיקה עצמית"

אחת מהתכונות המייחדות את o1 היא יכולתו לבדוק את עצמו על ידי הקדשת זמן רב יותר לשקילת כל חלקי השאלה או המשימה. זה מאפשר לו להימנע מכשלי הנמקה נפוצים במודלים אחרים ולספק תשובות מדויקות ואמינות יותר.

רוצים להפוך למאסטרים בבינה מלאכותית? הצטרפו לקורס GenAI Master של LetsAI

קורס GenAI Master - קורס ה-AI המקיף והמצליח בישראל. פרטים והרשמה פה.

פרויקט Strawberry הפך ל-o1

לפני ההשקה הרשמית, מודל o1 היה ידוע בשם "פרויקט Strawberry". שמועות על פרויקט זה הסתובבו זמן רב לפני ההכרזה, עם ציפייה להשקה בסתיו. o1 הוא למעשה התוצאה של מאמצים אלו, ומייצג פרדיגמה חדשה בתחום הבינה המלאכותית.

הפסטיבל המקוון סביב המודל המסתורי כלל ציוצים מסתוריים ב-X ואף שמועות על עבודה עם ועבור ה-FBI. השמועות סיפרו על מודל עוצמתי שחבוי במרתפי OpenAI שכל כך הפחיד רבים בחברה, עד שגרם לפוטש של סוצקבר (שהוביל להדחתו של סם אלטמן, מנכ"ל החברה), שמיד חזר אל כס המלכות ובטלנובלה שלא תבייש את ערוץ ויוה הוביל בסוף לעזיבתו של איליה ופמלייתו (יאן לייק ובכירים נוספים). טענותיהם על פיתוח חפוז וחסר אחריות, שלא מתעדף בטיחות היה הקש ששבר את גב הגמל.

אגב, סוצקאבר לקח את זה צעד אחד קדימה והקים חברת בינה מלאכותית חדשה בשם Safe Superintelligence (SSI). מטרתה לפתח בינת-על באופן אחראי ובטוח (כפי שעולה גם משם החברה). הם גייסו מיליארד דולר תוך זמן קצר מאוד (מה שמעיד על האמון האדיר בסוצקאבר - המוח שמאחורי OpenAI והמנטור של סם אלטמן). גיוס זה הקפיץ את שווי החברה ל-5 מיליארד דולר (כך על פי פרסומים), ולאחרונה הם הודיעו שחלק מהפיתוח יתבצע בישראל (איליה נולד בברית המועצות לשעבר ועלה לישראל בגיל 5. הוא גדל בירושלים והחל את לימודיו האקדמיים באוניברסיטה הפתוחה בישראל). אגב, לצד סוצקאבר יש עוד שני שמות עם זיקה לישראל - החוקר דניאל לוי וילד הפלא של הטק הישראלי - דניאל גרוס.

חזרה למודל - עכשיו, כש-o1 בחוץ, מנויי OpenAI סוף סוף מקבלים גישה למודל ויכולים לבחון אותו בעצמם (בגרסת פריוויו), וכן - הוא מדהים ומיוחד!

יכולות חשיבה משופרות

ביצועים מרשימים

בבדיקות שנערכו, המודל הבא של OpenAI o1 הציג ביצועים מרשימים ביותר:

מדעים מדויקים: המודל הגיע לרמה הדומה לזו של דוקטורנטים במבחנים מאתגרים בפיזיקה, כימיה וביולוגיה.
מתמטיקה: במבחן כניסה לאולימפיאדת המתמטיקה הבינלאומית (IMO), המודל GPT-4o פתר נכון 13% מהבעיות, בעוד ש-OpenAI o1 השיג ציון של 83%.
תכנות: בתחום התכנות, המודל הגיע לאחוזון ה-89 בתחרויות Codeforces, המציינות רמה גבוהה של מיומנות.

מודל o1 מפגין ביצועים טובים הרבה יותר בהשוואה ל-GPT-4o במדדים מאתגרים של הסקת מסקנות, בתחומי המתמטיקה, כתיבת קוד ומדעים.

o1 משפר את הביצועים בהשוואה ל-GPT-4o במגוון רחב של מדדים, כולל 54 מתוך 57 תתי-קטגוריות של MMLU. שבעה מהם מוצגים להמחשה.

קצת על MMLU

מבחן MMLU (Massive Multitask Language Understanding) הוא מבחן שמודד את יכולת ההבנה של מודלים של שפה טבעית במגוון רחב של תחומים. מדובר במבחן הבנוי מ-57 תתי-קטגוריות שמכסים נושאים שונים כמו מדעי הרוח, מתמטיקה, מדעי המחשב, ביולוגיה, משפטים, היסטוריה, ועוד. מטרת המבחן היא לבדוק עד כמה מודלים מתקדמים מסוגלים לבצע משימות שדורשות הבנה עמוקה של טקסטים בנושאים מגוונים, מה שהופך אותו למדד מאתגר להערכת היכולות של מודלי בינה מלאכותית.

מבחן התות

באתר החברה ניתן לראות איך המודל פותר בעיות מתמטיות מורכבות, או בעיות הדורשות הבנה מרחבית-פיזיקלית של הסביבה - כל זאת בעזרת תהליכי ההסקה הרב-שלבית שלו (Multi Reasoning).

בסרטון הבא המודל נשאל שאלה, שהייתה יכולה לבלבל גם אדם רגיל, אך מה שבטוח - עבור מודלי שפה "מהדור הישן" היא כמעט בלתי אפשרית (ראו דוגמאות מטה). החידה מתארת מצב בו תות מונח בתוך כוס, שמונחת הפוך על שולחן. מישהו מרים את הכוס ושם אותה במיקרוגל. איפה התות עכשיו?

Credit: openai.com

כל אדם שיקדיש מעט זמן מחשבה לפתרון החידה הזו, יבין מיד שעם הרמת הכוס, התות נשאר על השולחן והכוס, שהולכת למיקרוגל, נותרת ריקה ויתומה מתותים. אבל מודלי שפה מתקשים עד מאוד לפצח את הלך המחשבה הזה.

התשובה של GPT4o:

אפילו GPT-4-o המודל הכי מתקדם של OpenAI (טרם השקת o1) מתקשה בפתרון החידה. זו התשובה שהוא נתן:

מבחן התות - התשובה השגויה של GPT4o

התשובה של קלוד 3.5 סונטה:

גם קלוד 3.5 סונטה (Claude 3.5 Sonnet) המתקדם (והמדהים) של אנטרופיק, נכשל כישלון חרוץ!

קלוד 3.5 סונטה נכשל במבחן התות

התשובה (הנכונה) של o1:

הודות לתהליכי הסקה רב שלביים, o1 מצליחה לפצח את החידה ולתת תשובה נכונה, שתואמת את חוקי הפיזיקה, המרחב, סיבה ותוצאה.

מבחן התות - o1 קולע בול ולא נופל בפח!

מגבלות נוכחיות וחסרונות

למרות יכולותיו המתקדמות, o1 עדיין מוגבל בהשוואה ל-GPT-4o בתחומים מסוימים. הוא אינו יכול לגלוש באינטרנט או לנתח קבצים, ויש לו מגבלות שימוש שבועיות. עם זאת, OpenAI מתכננת להוסיף תכונות אלו בגרסאות עתידיות כדי להרחיב את יכולות המודל ולהפוך אותו לשימושי יותר עבור מגוון רחב של משתמשים.

כמו כן, ב-OpenAI הכריזו שהמודל החדש מסוגל להתמודד עם ניסיונות לעקוף את כללי הבטיחות ("jailbreaking") באופן מתקדם. במבחנים קשים, OpenAI o1 השיג ציון של 84 מתוך 100, לעומת 22 שצבר המודל GPT-4o.

זמינות המודל - איך ואיפה משתמשים ב-o1?

זמין למנויים בתשלום

המודל זמין נכון לעכשיו בעיקר למנויים משלמים - פשוט לחצו על כפתור החלפת המודלים ובחרו במודל החדש.

משתמשי ChatGPT Plus ו-Team: יכולים לגשת למודלי o1 החל מהיום, עם מגבלות שבועיות של 30 הודעות ל-o1-preview ו-50 הודעות ל-o1-mini.
משתמשי ChatGPT Enterprise ו-Edu: יקבלו גישה למודלים בשבוע הבא.
מפתחים (API): מפתחים ברמה 5 יכולים להתחיל להשתמש במודלים דרך ה-API עם מגבלה של 20 בקשות לדקה.
משתמשי ChatGPT Free: מתוכננת גישה למודל o1-mini בעתיד הקרוב.

OpenAI o1 זמין למנויים בתשלום | Credit: OpenAI.com

מודל מהיר וזול - OpenAI o1-mini

בנוסף למודל הראשי, OpenAI משיקה את o1-mini, מודל מהיר וזול יותר המתמקד ביכולות תכנות. o1-mini זול ב-80% מהמודל הראשי ומהווה פתרון יעיל עבור יישומים הדורשים חשיבה אך לא מצריכים ידע רחב על העולם.

שרשרת מחשבה - פה קבור הכלב!

שיטת חשיבה ייחודית מובילה למודל אמין ומדויק יותר

אחת מהתכונות המייחדות את OpenAI o1 היא היכולת שלו להשתמש ב-TOT ("שרשרת מחשבה") פנימית כדי להגיע לפתרונות מדויקים ומעמיקים יותר. בניגוד למודלים קודמים, שאולי נתנו תשובות מהירות וטובות, o1 מקדיש זמן נוסף ל"חשוב" לפני שהוא עונה על השאלה או המשימה המוצגת לפניו, מה שמוביל לתשובות טובות, מדויקות ומהימנות הרבה יותר. אותו תהליך הסקה רב שלבי מוריד את היקף ותדירות ההזיות של המודל, ואת התשובות השגויות.

שיטת עבודה זו מאוד מזכירה את תהליך החיפוש של פרפלקסיטי במצב Pro.

מהי "שרשרת מחשבה"?

"שרשרת מחשבה" היא תהליך שבו המודל מפרק את הבעיה לשלבים קטנים יותר, ומבצע סדרה של נימוקים פנימיים כדי להגיע לפתרון הסופי. זה דומה לאופן שבו בני אדם מתמודדים עם בעיות מורכבות: הם מנתחים את המרכיבים השונים של הבעיה, שוקלים אפשרויות שונות, ומסיקים מסקנות על בסיס הניתוח שלהם.

לפתרון בעיות בשיטת "שרשרת המחשבה" ישנם יתרונות רבים:

דיוק מוגבר: על ידי פירוק הבעיה לשלבים, המודל מצמצם סיכויים לשגיאות.
שקיפות בתהליך: התהליך מאפשר למשתמש להבין את אופן החשיבה של המודל.
יכולת זיהוי ותיקון טעויות: אם המודל מזהה חוסר התאמה בתהליך, הוא יכול לחזור אחורה ולתקן.
למידה משופרת: משתמשים יכולים ללמוד מהתהליך שהמודל מציג, ולא רק מהתשובה הסופית.
אמון מוגבר: תהליך מפורט מגביר את האמון בתשובות המודל, במיוחד במשימות קריטיות.

שיטת "שרשרת המחשבה" מאפשרת ל-OpenAI o1 להתמודד עם משימות מורכבות בצורה יעילה ומדויקת יותר. באמצעות תהליך נימוק פנימי מפורט, המודל מספק לא רק את התשובה הסופית, אלא גם את הדרך שבה הגיע אליה, מה שמעשיר את חוויית המשתמש ומשפר את הבנתו.

מה הלאה?

OpenAI מתכננת להמשיך ולשפר את המודלים בסדרת o1, ובדומה למודלים האחרים של החברה, להוסיף תכונות כמו גלישה באינטרנט, העלאת קבצים ותמונות, כדי להפוך אותם לשימושיים יותר עבור מגוון רחב של משתמשים. בנוסף, החברה תמשיך לפתח מודלים בסדרת GPT לצד סדרת OpenAI o1.

ההשקה של OpenAI o1 מסמנת התקדמות משמעותית בתחום הבינה המלאכותית, עם יכולות חשיבה והיגיון משופרות המאפשרות פתרון בעיות מורכבות בתחומים מגוונים. אני סקרן לראות את מגוון היוזקייסים והשימושים שמשתמשים וחברות ימצאו לתהליכי החשיבה המתקדמים של המודל הזה. נראה שיש פה שחקן חדש ורציני בשכונה שמאיים לקחת את הכתר ל-3.5 סונטה של אנטרופיק. מהתנסות אישית, מדובר במודל עוצמתי במיוחד ואין לי ספק שהוא הולך לפעור הרבה פיות!

רוצים להתמקצע?

בואו ללמוד איתנו בינה מלאכותית בקורס המקיף, העשיר והמבוקש בשוק. הצטרפו לאלפים הרבים שכבר עברו את הקורסים והסדנאות שלנו. פרטים והרשמה באתר.

לקבלת הנחה במחיר הקורסים – הזינו את קוד הקופון LETSAI

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

אביתר אדרי

שותף-מייסד ב-LetsAI, מרצה ויועץ לבינה מלאכותית. בנוסף מנחה את תוכנית הטלוויזיה “בינה אחרת”, ויוצר סרטי AI מנוסה שיצר קליפים ופרסומות לחברות, ארגונים, מוזיקאים ועוד. בשנים האחרונות מעביר קורסים, סדנאות והרצאות במשרדי פרסום, בתי עסק, חברות, ארגונים, מוסדות אקדמיים וגופי תקשורת בארץ ובעולם.

רוצים הרצאה או ייעוץ של אביתר אדרי?

השאירו פרטים ונשמח לחזור אליכם עם המידע הרלוונטי

אולי יעניין אותך גם...

ספריית הקבצים של ChatGPT הופכת לכלי עבודה קבוע למשתמשים

OpenAI סוגרת את השאלטר על Sora

ראיון חדש עם אנדריי קרפתי חושף את המעבר מפיתוח קוד לאורקסטרציה של סוכני AI ואת השינוי העמוק בתפקיד המפתח.

אנדריי קרפאתי והעידן החדש של פיתוח מבוסס-סוכנים

13 תגובות

Inline Feedbacks

צפה בכל התגובות

אורית

1 year ago

סקירה מצוינת. כבר אתמול הספקתי להתנסות בו, מנויה בתשלום, והתרשמתי מאוד משרשרת המחשבה. מצפה לשלב שבו אפשר יהיה להעלות קבצים למודל החושב… התרגשות גדולה נרשמה.

הגב

קלוד

1 year ago

זו חידה מעניינת! בואו נחשוב על זה צעד אחר צעד:

1. בהתחלה, התות היה בתוך הכוס, והכוס הייתה הפוכה על השולחן.

2. כשמישהו מרים את הכוס, יש שתי אפשרויות:

א. אם הם הרימו את הכוס בזהירות, ייתכן שהתות נשאר על השולחן.
ב. אם הם הפכו את הכוס תוך כדי הרמתה, התות עשוי להישאר בתוך הכוס.

3. אבל, נאמר שהם שמו את הכוס במיקרוגל.

לכן, התשובה לחידה היא:

התות נשאר על השולחן.

ההסבר: כשהכוס הייתה הפוכה, התות היה בין הכוס לשולחן. כשהרימו את הכוס, התות נשאר על השולחן. הכוס הריקה הועברה למיקרוגל, אבל התות לא זז מהשולחן.

זו חידה חכמה שמשחקת עם ההנחות שלנו. היא גורמת לנו לחשוב שהתות עדיין בכוס, אבל למעשה הוא נשאר במקומו המקורי.

הגב

גדי פרנקל

1 year ago

אני מנוי ומשלם ל chatgpt
לא רואה אפשרות בחירה של ה O1?

הגב

Author

אביתר אדרי

1 year ago

Reply to גדי פרנקל

לחץ על כפתור החלפת המודלים בצד שמאל למעלה

הגב

מאתגר

1 year ago

יש לי שאלה קבועה שאני שואל את כל המודלים ועד עכשיו כולם נכשלו כולל המודל ה*חכם* הזה.
השאלה היא כזאת: יש לי 3 בקבוקים ריקים בנפח 1, 3 ו 5 ליטר. אני רוצה למדוד *בדיוק* 1 ליטר מים. אלו צעדים עליי לעשות?
כמובן שזהו רפרנס לחידת הבקבוקים הידועה אבל בצורה מנוונת כך שהתשובה הנכונה היא פשוט למלא את הבקבוק בנפח 1 ליטר. כל עוד כל המודלים מסתבכים בתשובה, אני רגוע שזה עדיין כלי סטטיסטי בלי שום רציונליזציה…

Last edited 1 year ago by מאתגר

הגב

בן50

1 year ago

אולי יפתור אותנו מהמלחמה ? מה הוא מציע ?

הגב

Author

אביתר אדרי

1 year ago

Reply to בן50

נסה לשאול אותו… שתף בתשובה שלו 🙂

הגב

יפעת

1 year ago

אצלי קלוד ענה נכון:

זו חידה מעניינת! בואו נחשוב על זה צעד אחר צעד:

1. בהתחלה, התות היה בתוך כוס שהונחה הפוכה על השולחן.
2. מישהו הרים את הכוס.
3. הכוס הושמה במיקרוגל.

השאלה היא: איפה התות עכשיו?

התשובה היא: התות נשאר על השולחן.

ההסבר:
כאשר הכוס הייתה הפוכה על השולחן, התות היה למעשה בין הכוס לשולחן. כשמישהו הרים את הכוס, התות לא “נדבק” לכוס, אלא נשאר במקומו על השולחן. לכן, כשהכוס הועברה למיקרוגל, התות לא עבר איתה.

זוהי חידה מתוחכמת שמשחקת עם ההנחות שלנו. אנחנו נוטים להניח שהתות נשאר בתוך הכוס, אבל המילה “הפוך” היא המפתח לפתרון החידה.

האם תרצו שאסביר עוד על החידה הזו או על חידות דומות?

הגב

Author

אביתר אדרי

1 year ago

Reply to יפעת

יפה מאוד. גם שעון מקולקל צודק פעמיים ביום 😜

הגב