תוצאות נוספות...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
× Send

התות הגיע – המודל המצופה של OpenAI זמין – כל מה שצריך לדעת על O1

OpenAI o1
תוכן עניינים

חברת OpenAI הכריזה על סדרת מודלים חדשה בשם OpenAI o1, המיועדת לשפר את יכולות ההיגיון והחשיבה של מערכות בינה מלאכותית ולסייע בפתרון בעיות מורכבות. מודלים אלו תוכננו להתמודד עם בעיות מורכבות בתחומים כמו מדע, תכנות ומתמטיקה, ולספק פתרונות מתקדמים יותר מאלו שהיו זמינים עד כה.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

מהו OpenAI o1?

חושב לפני שהוא מדבר

OpenAI o1 הוא מודל AI מתקדם שנועד להקדיש יותר זמן ל”חשיבה” לפני מתן תשובה, בדומה לאופן שבו בני אדם פותרים בעיות מורכבות. המודל לומד לשפר את תהליכי החשיבה שלו, לנסות אסטרטגיות שונות ולהכיר בטעויותיו, מה שמוביל לביצועים טובים יותר במשימות מאתגרות.

 

בניגוד למודלים קודמים, o1 מוכשר “לחשוב” לפני מתן תשובה באמצעות “שרשרת מחשבה” פנימית (הרחבה בהמשך). המודל מקדיש זמן רב יותר לעיבוד שאלות ומשימות מורכבות, במטרה להגיע לתשובות מדויקות יותר. הוא משתמש בלמידת חיזוקים כדי לפתח תהליך הנמקה דומה לזה של בני אדם, ומסוגל לזהות טעויות, לנסות אסטרטגיות שונות ולשפר את תשובותיו לאורך זמן. כשתשאלו אותו שאלה, תוכלו ללחוץ על החץ שמגדיל את “שרשרת המחשבה” שלו ואז אפשר ממש לראות “איך הוא חושב” ואיך הוא מפרק את השאלה לתתי-שאלות או משימות. בסוף התהליך הוא אף יציג לכם כמה שניות לקח לו לחשוב על התשובה. זה לא רק תהליך של ניבוי של המילה הבאה (הפשטה של האופן בו מודלי שפה קלאסיים עובדים), אלא משהו שיותר מזכיר תהליך חשיבה מורכב אצל בני אנוש.

 

יכולת “בדיקה עצמית”

אחת מהתכונות המייחדות את o1 היא יכולתו לבדוק את עצמו על ידי הקדשת זמן רב יותר לשקילת כל חלקי השאלה או המשימה. זה מאפשר לו להימנע מכשלי הנמקה נפוצים במודלים אחרים ולספק תשובות מדויקות ואמינות יותר.

 

רוצים להפוך למאסטרים בבינה מלאכותית? הצטרפו לקורס GenAI Master של LetsAI

קורס GenAI Master

קורס GenAI Master – קורס ה-AI המקיף והמצליח בישראל. פרטים והרשמה פה.

 

פרויקט Strawberry הפך ל-o1

לפני ההשקה הרשמית, מודל o1 היה ידוע בשם פרויקט Strawberry. שמועות על פרויקט זה הסתובבו זמן רב לפני ההכרזה, עם ציפייה להשקה בסתיו. o1 הוא למעשה התוצאה של מאמצים אלו, ומייצג פרדיגמה חדשה בתחום הבינה המלאכותית.

הפסטיבל המקוון סביב המודל המסתורי כלל ציוצים מסתוריים ב-X ואף שמועות על עבודה עם ועבור ה-FBI. השמועות סיפרו על מודל עוצמתי שחבוי במרתפי OpenAI שכל כך הפחיד רבים בחברה, עד שגרם לפוטש של סוצקבר (שהוביל להדחתו של סם אלטמן, מנכ”ל החברה), שמיד חזר אל כס המלכות ובטלנובלה שלא תבייש את ערוץ ויוה הוביל בסוף לעזיבתו של איליה ופמלייתו (יאן לייק ובכירים נוספים). טענותיהם על פיתוח חפוז וחסר אחריות, שלא מתעדף בטיחות היה הקש ששבר את גב הגמל.

 

אגב, סוצקאבר לקח את זה צעד אחד קדימה והקים חברת בינה מלאכותית חדשה בשם Safe Superintelligence (SSI). מטרתה לפתח בינת-על באופן אחראי ובטוח (כפי שעולה גם משם החברה). הם גייסו מיליארד דולר תוך זמן קצר מאוד (מה שמעיד על האמון האדיר בסוצקאבר – המוח שמאחורי OpenAI והמנטור של סם אלטמן). גיוס זה הקפיץ את שווי החברה ל-5 מיליארד דולר (כך על פי פרסומים), ולאחרונה הם הודיעו שחלק מהפיתוח יתבצע בישראל (איליה נולד בברית המועצות לשעבר ועלה לישראל בגיל 5. הוא גדל בירושלים והחל את לימודיו האקדמיים באוניברסיטה הפתוחה בישראל). אגב, לצד סוצקאבר יש עוד שני שמות עם זיקה לישראל – החוקר דניאל לוי וילד הפלא של הטק הישראלי – דניאל גרוס.

 

חזרה למודל – עכשיו, כש-o1 בחוץ, מנויי OpenAI סוף סוף מקבלים גישה למודל ויכולים לבחון אותו בעצמם (בגרסת פריוויו), וכן – הוא מדהים ומיוחד!

 

יכולות חשיבה משופרות

ביצועים מרשימים

בבדיקות שנערכו, המודל הבא של OpenAI o1 הציג ביצועים מרשימים ביותר:

  • מדעים מדויקים: המודל הגיע לרמה הדומה לזו של דוקטורנטים במבחנים מאתגרים בפיזיקה, כימיה וביולוגיה.
  • מתמטיקה: במבחן כניסה לאולימפיאדת המתמטיקה הבינלאומית (IMO), המודל GPT-4o פתר נכון 13% מהבעיות, בעוד ש-OpenAI o1 השיג ציון של 83%.
  • תכנות: בתחום התכנות, המודל הגיע לאחוזון ה-89 בתחרויות Codeforces, המציינות רמה גבוהה של מיומנות.

 

ביצועים של o1 של OpenAI

מודל o1 מפגין ביצועים טובים הרבה יותר בהשוואה ל-GPT-4o במדדים מאתגרים של הסקת מסקנות, בתחומי המתמטיקה, כתיבת קוד ומדעים.

הביצועים של OpenAI o1

o1 משפר את הביצועים בהשוואה ל-GPT-4o במגוון רחב של מדדים, כולל 54 מתוך 57 תתי-קטגוריות של MMLU. שבעה מהם מוצגים להמחשה.

 

קצת על MMLU

מבחן MMLU (Massive Multitask Language Understanding) הוא מבחן שמודד את יכולת ההבנה של מודלים של שפה טבעית במגוון רחב של תחומים. מדובר במבחן הבנוי מ-57 תתי-קטגוריות שמכסים נושאים שונים כמו מדעי הרוח, מתמטיקה, מדעי המחשב, ביולוגיה, משפטים, היסטוריה, ועוד. מטרת המבחן היא לבדוק עד כמה מודלים מתקדמים מסוגלים לבצע משימות שדורשות הבנה עמוקה של טקסטים בנושאים מגוונים, מה שהופך אותו למדד מאתגר להערכת היכולות של מודלי בינה מלאכותית.

 

מבחן התות

באתר החברה ניתן לראות איך המודל פותר בעיות מתמטיות מורכבות, או בעיות הדורשות הבנה מרחבית-פיזיקלית של הסביבה – כל זאת בעזרת תהליכי ההסקה הרב-שלבית שלו (Multi Reasoning).

 

בסרטון הבא המודל נשאל שאלה, שהייתה יכולה לבלבל גם אדם רגיל, אך מה שבטוח – עבור מודלי שפה “מהדור הישן” היא כמעט בלתי אפשרית (ראו דוגמאות מטה). החידה מתארת מצב בו תות מונח בתוך כוס, שמונחת הפוך על שולחן. מישהו מרים את הכוס ושם אותה במיקרוגל. איפה התות עכשיו? 

 

Credit: openai.com

 

כל אדם שיקדיש מעט זמן מחשבה לפתרון החידה הזו, יבין מיד שעם הרמת הכוס, התות נשאר על השולחן והכוס, שהולכת למיקרוגל, נותרת ריקה ויתומה מתותים. אבל מודלי שפה מתקשים עד מאוד לפצח את הלך המחשבה הזה. 

 

התשובה של GPT4o:

אפילו GPT-4-o המודל הכי מתקדם של OpenAI (טרם השקת o1) מתקשה בפתרון החידה. זו התשובה שהוא נתן:

 

מבחן התות - התשובה של GPT4o

מבחן התות – התשובה השגויה של GPT4o

 

התשובה של קלוד 3.5 סונטה:

גם קלוד 3.5 סונטה (Claude 3.5 Sonnet) המתקדם (והמדהים) של אנטרופיק, נכשל כישלון חרוץ!

 

קלוד 3.5 סונטה נכשל במבחן התות

קלוד 3.5 סונטה נכשל במבחן התות

 

התשובה (הנכונה) של o1:

הודות לתהליכי הסקה רב שלביים, o1 מצליחה לפצח את החידה ולתת תשובה נכונה, שתואמת את חוקי הפיזיקה, המרחב, סיבה ותוצאה.

 

מבחן התות - o1 קולע בול ולא נופל בפח!

מבחן התות – o1 קולע בול ולא נופל בפח!

 

 

מגבלות נוכחיות וחסרונות

למרות יכולותיו המתקדמות, o1 עדיין מוגבל בהשוואה ל-GPT-4o בתחומים מסוימים. הוא אינו יכול לגלוש באינטרנט או לנתח קבצים, ויש לו מגבלות שימוש שבועיות. עם זאת, OpenAI מתכננת להוסיף תכונות אלו בגרסאות עתידיות כדי להרחיב את יכולות המודל ולהפוך אותו לשימושי יותר עבור מגוון רחב של משתמשים.

 

כמו כן, ב-OpenAI הכריזו שהמודל החדש מסוגל להתמודד עם ניסיונות לעקוף את כללי הבטיחות (“jailbreaking”) באופן מתקדם. במבחנים קשים, OpenAI o1 השיג ציון של 84 מתוך 100, לעומת 22 שצבר המודל GPT-4o.

 

זמינות המודל – איך ואיפה משתמשים ב-o1?

זמין למנויים בתשלום

המודל זמין נכון לעכשיו בעיקר למנויים משלמים – פשוט לחצו על כפתור החלפת המודלים ובחרו במודל החדש.

  • משתמשי ChatGPT Plus ו-Team: יכולים לגשת למודלי o1 החל מהיום, עם מגבלות שבועיות של 30 הודעות ל-o1-preview ו-50 הודעות ל-o1-mini.
  • משתמשי ChatGPT Enterprise ו-Edu: יקבלו גישה למודלים בשבוע הבא.
  • מפתחים (API): מפתחים ברמה 5 יכולים להתחיל להשתמש במודלים דרך ה-API עם מגבלה של 20 בקשות לדקה.
  • משתמשי ChatGPT Free: מתוכננת גישה למודל o1-mini בעתיד הקרוב.

 

OpenAI o1

OpenAI o1 זמין למנויים בתשלום | Credit: OpenAI.com

 

מודל מהיר וזול – OpenAI o1-mini

בנוסף למודל הראשי, OpenAI משיקה את o1-mini, מודל מהיר וזול יותר המתמקד ביכולות תכנות. o1-mini זול ב-80% מהמודל הראשי ומהווה פתרון יעיל עבור יישומים הדורשים חשיבה אך לא מצריכים ידע רחב על העולם.

 

שרשרת מחשבה – פה קבור הכלב!

שיטת חשיבה ייחודית מובילה למודל אמין ומדויק יותר

אחת מהתכונות המייחדות את OpenAI o1 היא היכולת שלו להשתמש ב-TOT (“שרשרת מחשבה”) פנימית כדי להגיע לפתרונות מדויקים ומעמיקים יותר. בניגוד למודלים קודמים, שאולי נתנו תשובות מהירות וטובות, o1 מקדיש זמן נוסף ל”חשוב” לפני שהוא עונה על השאלה או המשימה המוצגת לפניו, מה שמוביל לתשובות טובות, מדויקות ומהימנות הרבה יותר. אותו תהליך הסקה רב שלבי מוריד את היקף ותדירות ההזיות של המודל, ואת התשובות השגויות.

 

שיטת עבודה זו מאוד מזכירה את תהליך החיפוש של פרפלקסיטי במצב Pro. 

 

מהי “שרשרת מחשבה”?

“שרשרת מחשבה” היא תהליך שבו המודל מפרק את הבעיה לשלבים קטנים יותר, ומבצע סדרה של נימוקים פנימיים כדי להגיע לפתרון הסופי. זה דומה לאופן שבו בני אדם מתמודדים עם בעיות מורכבות: הם מנתחים את המרכיבים השונים של הבעיה, שוקלים אפשרויות שונות, ומסיקים מסקנות על בסיס הניתוח שלהם.

 

לפתרון בעיות בשיטת “שרשרת המחשבה” ישנם יתרונות רבים:

  • דיוק מוגבר: על ידי פירוק הבעיה לשלבים, המודל מצמצם סיכויים לשגיאות.
  • שקיפות בתהליך: התהליך מאפשר למשתמש להבין את אופן החשיבה של המודל.
  • יכולת זיהוי ותיקון טעויות: אם המודל מזהה חוסר התאמה בתהליך, הוא יכול לחזור אחורה ולתקן.
  • למידה משופרת: משתמשים יכולים ללמוד מהתהליך שהמודל מציג, ולא רק מהתשובה הסופית.
  • אמון מוגבר: תהליך מפורט מגביר את האמון בתשובות המודל, במיוחד במשימות קריטיות.

 

שיטת “שרשרת המחשבה” מאפשרת ל-OpenAI o1 להתמודד עם משימות מורכבות בצורה יעילה ומדויקת יותר. באמצעות תהליך נימוק פנימי מפורט, המודל מספק לא רק את התשובה הסופית, אלא גם את הדרך שבה הגיע אליה, מה שמעשיר את חוויית המשתמש ומשפר את הבנתו.

 

מה הלאה?

OpenAI מתכננת להמשיך ולשפר את המודלים בסדרת o1, ובדומה למודלים האחרים של החברה, להוסיף תכונות כמו גלישה באינטרנט, העלאת קבצים ותמונות, כדי להפוך אותם לשימושיים יותר עבור מגוון רחב של משתמשים. בנוסף, החברה תמשיך לפתח מודלים בסדרת GPT לצד סדרת OpenAI o1.

 

ההשקה של OpenAI o1 מסמנת התקדמות משמעותית בתחום הבינה המלאכותית, עם יכולות חשיבה והיגיון משופרות המאפשרות פתרון בעיות מורכבות בתחומים מגוונים. אני סקרן לראות את מגוון היוזקייסים והשימושים שמשתמשים וחברות ימצאו לתהליכי החשיבה המתקדמים של המודל הזה. נראה שיש פה שחקן חדש ורציני בשכונה שמאיים לקחת את הכתר ל-3.5 סונטה של אנטרופיק. מהתנסות אישית, מדובר במודל עוצמתי במיוחד ואין לי ספק שהוא הולך לפעור הרבה פיות!

 

רוצים להתמקצע?

בואו ללמוד איתנו בינה מלאכותית בקורס המקיף, העשיר והמבוקש בשוק. הצטרפו לאלפים הרבים שכבר עברו את הקורסים והסדנאות שלנו. פרטים והרשמה באתר.

לקבלת הנחה במחיר הקורסים – הזינו את קוד הקופון LETSAI
הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

רוצים הרצאה או ייעוץ של אביתר אדרי?
השאירו פרטים ונשמח לחזור אליכם עם המידע הרלוונטי
אולי יעניין אותך גם...
guest
13 תגובות
Inline Feedbacks
צפה בכל התגובות
אורית
אורית
19 days ago

סקירה מצוינת. כבר אתמול הספקתי להתנסות בו, מנויה בתשלום, והתרשמתי מאוד משרשרת המחשבה. מצפה לשלב שבו אפשר יהיה להעלות קבצים למודל החושב… התרגשות גדולה נרשמה.

קלוד
קלוד
19 days ago

זו חידה מעניינת! בואו נחשוב על זה צעד אחר צעד:

1. בהתחלה, התות היה בתוך הכוס, והכוס הייתה הפוכה על השולחן.

2. כשמישהו מרים את הכוס, יש שתי אפשרויות:

א. אם הם הרימו את הכוס בזהירות, ייתכן שהתות נשאר על השולחן.
ב. אם הם הפכו את הכוס תוך כדי הרמתה, התות עשוי להישאר בתוך הכוס.

3. אבל, נאמר שהם שמו את הכוס במיקרוגל.

לכן, התשובה לחידה היא:

התות נשאר על השולחן.

ההסבר: כשהכוס הייתה הפוכה, התות היה בין הכוס לשולחן. כשהרימו את הכוס, התות נשאר על השולחן. הכוס הריקה הועברה למיקרוגל, אבל התות לא זז מהשולחן.

זו חידה חכמה שמשחקת עם ההנחות שלנו. היא גורמת לנו לחשוב שהתות עדיין בכוס, אבל למעשה הוא נשאר במקומו המקורי.

גדי פרנקל
גדי פרנקל
19 days ago

אני מנוי ומשלם ל chatgpt
לא רואה אפשרות בחירה של ה O1?

מאתגר
מאתגר
18 days ago

יש לי שאלה קבועה שאני שואל את כל המודלים ועד עכשיו כולם נכשלו כולל המודל ה*חכם* הזה.
השאלה היא כזאת: יש לי 3 בקבוקים ריקים בנפח 1, 3 ו 5 ליטר. אני רוצה למדוד *בדיוק* 1 ליטר מים. אלו צעדים עליי לעשות?
כמובן שזהו רפרנס לחידת הבקבוקים הידועה אבל בצורה מנוונת כך שהתשובה הנכונה היא פשוט למלא את הבקבוק בנפח 1 ליטר. כל עוד כל המודלים מסתבכים בתשובה, אני רגוע שזה עדיין כלי סטטיסטי בלי שום רציונליזציה…

Last edited 18 days ago by מאתגר
בן50
בן50
18 days ago

אולי יפתור אותנו מהמלחמה ? מה הוא מציע ?

יפעת
יפעת
17 days ago

אצלי קלוד ענה נכון:

זו חידה מעניינת! בואו נחשוב על זה צעד אחר צעד:

1. בהתחלה, התות היה בתוך כוס שהונחה הפוכה על השולחן.
2. מישהו הרים את הכוס.
3. הכוס הושמה במיקרוגל.

השאלה היא: איפה התות עכשיו?

התשובה היא: התות נשאר על השולחן.

ההסבר:
כאשר הכוס הייתה הפוכה על השולחן, התות היה למעשה בין הכוס לשולחן. כשמישהו הרים את הכוס, התות לא “נדבק” לכוס, אלא נשאר במקומו על השולחן. לכן, כשהכוס הועברה למיקרוגל, התות לא עבר איתה.

זוהי חידה מתוחכמת שמשחקת עם ההנחות שלנו. אנחנו נוטים להניח שהתות נשאר בתוך הכוס, אבל המילה “הפוך” היא המפתח לפתרון החידה.

האם תרצו שאסביר עוד על החידה הזו או על חידות דומות?

אמיר
אמיר
17 days ago

פרפלקסיטי פתר את התשובה בקלות, התות על השולחן, וחינמי!

משה
משה
17 days ago

שאלתי עכשיו את GPT 4O את השאלה עם התות והוא ענה תשובה נכונה. פעמיים.

תפריט נגישות

תוצאות נוספות...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors

התות הגיע – המודל המצופה של OpenAI זמין – כל מה שצריך לדעת על O1