גוגל הכריזה לאחרונה על Deep Think – מנוע reasoning חדש בתוך גרסת Gemini 2.5 Ultra. לטענת החברה, זה לא עוד עדכון, אלא קפיצה אבולוציונית בתחום הבינה המלאכותית. מערכת שיודעת לחשוב לעומק, לשקול כמה חלופות בו-זמנית, ללמוד מטעויות, ולפתור בעיות בצורה שמזכירה תהליך אנושי של ממש. לראשונה, מודל בינה מלאכותית לא רק שולף את התשובה הסבירה ביותר, אלא מתלבט, בונה כמה כיווני פתרון, משווה ביניהם ומזקק מהם תשובה מורכבת, שקולה ומדויקת יותר. במילים אחרות: Deep Think לא רק משפר ביצועים – אלא משנה את הדרך בה מחשבים חושבים.
רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.
אפשר גם להרשם לניוזלטר שלנו
מה זה בעצם Deep Think?
מדובר במנגנון reasoning חדש, שמעניק ל-Gemini 2.5 יכולת לעבור מ”זרימה ישירה של טקסט” לחשיבה מקבילה:
-
המערכת בוחנת פתרונות מרובים.
-
מזהה סתירות וטעויות.
-
משלבת בין גישות שונות.
-
ולומדת מתוך הניסיון שלה עצמה.
כל זה מתרחש במהלך הפקת התשובה, מה שמוביל לתגובות מדויקות, עמוקות ויצירתיות יותר, במיוחד במשימות מורכבות כמו קידוד, מתמטיקה ותכנון לוגי.
ביצועים פורצי דרך
גוגל הציגה את Deep Think תוך הצגת תוצאות שוברות שיאים בבנצ’מרקים רשמיים. להלן כמה מההישגים הבולטים:
-
LiveCodeBench V6: פתרון אתגרי תכנות בזמן אמת, עם 87.6% הצלחה – הרבה מעל רוב המודלים הקיימים, כולל OpenAI o3 ו־Grok 4.
-
Humanity’s Last Exam: מבחן מאתגר הכולל שאלות בתחומים כמו לוגיקה, מתמטיקה, מדעים ותכנון אסטרטגי. Deep Think הגיע ל־34.8% הצלחה – הגבוה ביותר שנמדד במבחן זה עד כה.
-
IMO 2025: המודל פתר בהצלחה 60.7% מהשאלות שנלקחו מאולימפיאדת המתמטיקה הבינלאומית – רמת ביצוע שגבוהה משמעותית מהציון שזיכה במדליית ארד בשנים האחרונות (45.2%).
-
AIME 2025: מבחן מתמטיקה אמריקאי ברמה גבוהה. Deep Think זכה בציון כמעט מושלם: 99.2% הצלחה.
הנה גרפים השוואתיים של ביצועי Gemini 2.5 Deep Think מול גרסת Gemini 2.5 Pro והמתחרים OpenAI o3 ו־Grok 4, בארבעה מבחנים רשמיים:
ומה זה בעצם אומר?
הפערים בין Deep Think לגרסאות קודמות, וגם למתחרים, אינם רק הבדלים במספרים. הם מספרים סיפור של שינוי גישה עמוק, כמעט תפיסתי. כך למשל, במבחן IMO, גרסת Gemini Pro השיגה 31.6%, בעוד ש־Deep Think הגיע ל־60.7% – כמעט כפול. במבחני חשיבה נוספים כמו AIME ו־LiveCodeBench, הפערים אינם מקריים אלא מצביעים על קפיצה שלא נמדדה קודם במודלים ציבוריים.
אבל ייתכן שהשאלה האמיתית איננה עד כמה Deep Think מצליח, אלא איך הוא מצליח. Deep Think לא פועל כמו autocomplete משוכלל. הוא שואל את עצמו שאלות, בונה כיווני פתרון, לומד מטעויות, ומתנהג כמו מי שבאמת חושב. לא מודל שמנחש, אלא כזה שמבין.
מגוון של יכולות מרשימות
מעבר ליכולות המתמטיות והלוגיות, Deep Think מציג גם כישורים בתחומים יצירתיים וטכניים:
-
עיצוב גרפי ואמנות ויזואלית – כולל voxel art, עיצוב אתרים והפקת ויזואלים חדשניים.
-
שילוב בין כלים – כולל הרצת קוד, חיפוש באינטרנט (Search), והפקת תשובות עם הפניות חכמות.
-
למידה משולבת – המערכת לומדת מהפלט הקודם של עצמה, מבצעת איטרציות פנימיות, ומשפרת את התשובה לפני שמוצגת למשתמש.
במילים אחרות, המערכת לא רק “עונה” טוב יותר. היא חושבת אחרת – גם בתחום הוויזואלי.
בדוגמה הויזואלית המצורפת, אפשר לראות שלוש תוצאות שונות על אותו פרומפט (הנחיה). המשתמש ביקש לבנות סצנת voxel של פגודה בגינה פורחת. בעוד Gemini Flash ו־Gemini Pro יצרו מבנים בסיסיים למדי, Deep Think הפיק תוצאה מורכבת בהרבה: מבנה בן קומות רבות, סימטריה, עצי דובדבן תלת-ממדיים ובריכת מים – הכל בתוך קובץ HTML יחיד להפעלה מיידית. התמונה ממחישה את השוני בגישה – לא רק ביצוע, אלא הבנה אמנותית ופרשנות עיצובית.
זמינות, מחיר ומגבלות
נכון להיום, Deep Think זמין רק במסגרת מנוי Google One AI Premium (Ultra), שמחירו 249.99 דולר לחודש (כ־950 ש”ח). החבילה כוללת גם:
-
30TB אחסון בגוגל.
-
גישה ל־Gemini 2.5 Ultra.
-
YouTube Premium.
-
ומספר תכונות מתקדמות נוספות.
עם זאת, ישנה מגבלה ברורה: ניתן להשתמש ב־Deep Think רק בכ־5 פרומפטים ביום, במודל של rolling window. זמני התגובה נעים בין חצי דקה למספר דקות, תלוי במורכבות המשימה. לכן, זהו כלי שמתאים כיום בעיקר לחוקרים, מהנדסי תוכנה, מוסדות אקדמיים וארגוני R&D, ולא למשתמש יומיומי או מזדמן.
לסיכום, גוגל עדיין לא הכריזה מתי Deep Think יהיה זמין גם למשתמשי Gemini Pro או דרך API חיצוני, אך לפי הדיווחים, המנוע כבר נבחן אצל שותפים אסטרטגיים. ברגע שייפתח לשימוש רחב, נוכל לראות אותו משולב באפליקציות, מערכות שירות, פיתוח תוכנה ואתרי אינטרנט. השאלות שמונחות על השולחן כבר לא טכניות, הן מהותיות: האם זו תחילתה של בינה מלאכותית שאפשר לסמוך על שיקול הדעת שלה? האם בעתיד נבנה עליה מערכות חינוך, אסטרטגיה או רפואה?
אין עדיין תשובות חד-משמעיות. אבל הכיוון ברור: Deep Think הוא לא עוד פיצ’ר. זו התחלה של מודל שחושב, ולא רק מגיב. גוגל לא רק שדרגה את הביצועים של המודל שלה, היא שינתה את חוקי המשחק. Deep Think מציב רף חדש – לא במהירות, לא בכמות ידע, אלא ביכולת לחשוב לעומק. אם אתם עוסקים בפיתוח, מחקר, אקדמיה או בינה מלאכותית – זהו כלי שחובה להכיר.