דמיינו מרוץ סוסים סוער ומרגש, שבו המתחרים לא דוהרים על ארבע פרסות אלא עם אלגוריתמים בוערים: o1 בצד אחד של המסלול ו-DeepSeek בצד השני. הקהל מרותק, והמסלול מתפרש על פני שתי שאלות בגרות מאתגרות בפיזיקה – כולל ניתוח גרפים, ביצוע חישובים מורכבים וסעיפי חשיבה מסדר גבוה שמנסים להפיל אפילו את הרוכבים המנוסים ביותר.
רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.
אפשר גם להרשם לניוזלטר שלנו
המרוץ יוצא לדרך – השאלה הראשונה
שני הסוסים (או במקרה שלנו, שני המודלים) מזנקים כמטאור והופכים את השאלה הראשונה לרכיבת ראווה. גרפים? חישובים? אין בעיה. o1, עם רגליים בטוחות, לא רק פותר נכונה – הוא גם מניף את הדגל הדידקטי ומלווה את התשובות בהסברים מפורטים על החוקים הפיזיקליים. ממש נראה שהוא נולד למקצוע ההוראה, מחלק עצות וטיפים פדגוגיים למען כל המורים הצופים מהיציע . DeepSeek עוקב מקרוב וביציבות, מספק תשובות נבונות ומדויקות, אבל ללא הפעלולים הפדגוגיים ש-o1 מציג בהתלהבות. בכל זאת, הוא לא נופל מהסוס – ועד כה, העסק נראה צמוד.
רגע השיא – השאלה השנייה
אחרי העצירה הקלה בנקודת הביניים, חוזרים לריצה. השאלה השנייה מורכבת יותר, מציגה גרפים מורכבים יותר ודורשת לא רק חישובים אלא גם נימוקים שמערבים חשיבה מסדר גבוה. 01 דוהר קדימה כצפוי, ו-DeepSeek נצמד, לא מרפה. הסעיפים הראשונים עוברים חלק: שניהם מנתחים, מחשבים, ואפילו משגרים הסברים מלומדים. הקהל עומד על רגליו בתדהמה, כי זה לא סתם מרוץ־דמה .
הפער מתגלה – הסעיף האחרון
ואז מתקרב הסעיף האחרון, שדורש תעוזת חשיבה וביסוס מדויק באמצעות חוקי הפיזיקה והיגיון. לפתעDeepSeek מהסס, מגמגם – וה– תשובה שלו קצת מתפזרת ואופס! טעות. o1, לעומתו, ממשיך בקצב יציב ווכובש את הדרך בתשובה מפורטת. נראה ש-DeepSeek מאבד אחיזה ונותן ל-o1 להוביל בפער קטן אך מורגש.
המהפך – לימוד מטעויות
אבל רגע, כאן מגיעה הפתעה: במקום להתרסק אל מחוץ למסלול, DeepSeek מקבל “תיקון כיוון” קצר(ממני) – ושניות ספורות אחר כך, הוא כבר מחשב מסלול מחדש, מתקן את הטעות, ורוכש את התובנה החסרה. הצופים ביציע לא מאמינים: האם ייתכן שכל מה שנדרש כדי לחזור למרוץ הוא כמה מילים של הכוונה מהמדריך DeepSeek? מתעשת וחוזר לדהור, חוצה את קו הסיום ללא עיכובים נוספים, ומוכיח שגם אם הוא חווה מעידה רגעית, יכולת הלמידה שלו מרשימה במיוחד.
אז האם הם כבר מושלמים? עדיין לא. אבל אם בשנתיים בלבד הם כבר הצליחו לעבור כברת דרך כזו, אין ספק שבקרוב הם יסגרו כל פינה, בכל שאלה ובכל מבחן. מי ייקח את הדו-קרב הסופי? נאלץ לחכות לגרסה הבאה – הרמז? זה כנראה קרוב יותר ממה שחשבנו.
תשובתו של GPT o1
תשובתו של DeepSeek