גוגל השיקה את Gemini 3.1 Pro עם נתון אחד שמסביר את גודל המהלך: ציון של שבעים ושבע נקודה אחת אחוז במבחן ARC‑AGI‑2, מבחן שבודק את היכולת לפתור דפוסי לוגיקה חדשים שלא הופיעו באימון. זה שיפור של יותר מפי שניים מהגרסה הקודמת, והוא מסמן שינוי כיוון ברור ממודל שמספק תשובות למערכת שמבצעת משימות מורכבות מקצה לקצה.
רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.
אפשר גם להרשם לניוזלטר שלנו
מה עומד מאחורי המהלך
ההשקה הנוכחית היא לא עוד עדכון גרסה. גוגל מנסה להגדיר מחדש את תפקיד המודלים שלה: לא כלי שיחה, אלא תשתית לסוכני עבודה, מערכות שמבינות משימה, מפרקות אותה לשלבים ומבצעות אותה בפועל.
הבלוג הרשמי של החברה מדגיש זאת במפורש: ״3.1Pro is designed for tasks where a simple answer isn’t enough״. זו אמירה שממקמת את המודל בלב המאמץ של גוגל לחזור לעמדה תחרותית, במיוחד מול מודלים שמצטיינים בשיחה אך פחות בביצוע.
קפיצה ביכולות ההסקה
הציון במבחן ARC‑AGI‑2 אינו רק הישג טכני. זהו מדד ליכולת לפתור בעיות מופשטות, משימות שבהן אין תשובה מוכנה שאפשר לשלוף מהאימון.
במבחנים נוספים, כמו Terminal‑Bench ו‑BrowseComp, המודל מציג שיפור עקבי ביכולות תכנון, חיפוש, קידוד וביצוע. המשמעות היא פחות ניסוי וטעייה ויותר פתרונות שמבינים את מבנה הבעיה.
סוכנים שמבצעים משימות שלמות
אחד הדגשים המרכזיים בהשקה הוא היכולת של המודל לבצע רצפי עבודה מלאים, כאלה שמתחילים בהבנת המשימה ומסתיימים במוצר עובד.
Gemini 3.1 Pro יודע לתכנן את השלבים, לכתוב את הקוד הדרוש, לחבר ממשקי API, לבנות את הממשק ולבדוק את התוצאה עד שהיא עומדת בדרישות.
בדוגמה הרשמית, הוא בנה דאשבורד חי למעקב אחרי תחנת החלל הבינלאומית, כולל אינטגרציה למקור נתונים בזמן אמת. זה שינוי מהותי – לא עוד בקשה לקטע קוד נקודתי, אלא יכולת לבנות מערכת שלמה.
הנה דוגמה שבה המודל בונה מערכת חיה מאפס – כולל החיבור לנתוני חלל בזמן אמת:
קוד, סימולציות ומה שביניהם
Gemini 3.1 Pro מציג יכולות קידוד שממקמות אותו ככלי פיתוח של ממש. הוא יודע לבנות סימולציות תלת-ממד אינטראקטיביות, ליצור אפליקציות ווב שלמות ולתאם בין קוד צד לקוח וצד שרת תוך טיפול בזרימות נתונים מורכבות.
במבחני קוד כמו SWE‑Bench Verified ו‑SciCode הוא מציג שיפור מדוד לעומת הדור הקודם. עבור מפתחים זה מתורגם לפחות זמן על חיבורים טכניים, ועבור מנהלי מוצר זו הזדמנות להראות רעיון חי ולא רק מסמך.
הנה דוגמה שבה המודל הופך מוטיבים ספרותיים לעיצוב וקוד שמבטאים את האווירה של היצירה:
SVG מונפש בלחיצת טקסט
אחד החידושים הבולטים הוא היכולת לייצר קוד SVG נקי ומונפש ישירות מטקסט. המודל מבין היררכיה ויזואלית, תנועה וקומפוזיציה, ומפיק קבצים שמוכנים להטמעה באתר בלי צורך בעיבוד נוסף.
התוצאה היא קיצור משמעותי של הדרך בין רעיון לעיצוב אינטראקטיבי, תהליך שבדרך כלל דורש מעצב, מפתח ולפחות גרסה אחת בדרך.
הנה דוגמאות בהן המודל הופך טקסט לאנימציית SVG להטמעה בכל אתר:
Gemini 3.1 Pro be like pic.twitter.com/ZwCauGxLar
— Google (@Google) February 19, 2026
זמינות רחבה – אבל ב‑Preview
המודל זמין כבר עכשיו ב‑Preview, צעד שמאפשר לגוגל לאסוף פידבק ולחדד את היכולות לפני השקה מלאה. הוא נגיש למפתחים דרך Google AI Studio, ה‑Gemini CLI ופלטפורמת Antigravity, לארגונים דרך Vertex AI, ולמשתמשים פרטיים באפליקציית Gemini וב‑NotebookLM עבור מנויי Pro ו‑Ultra.
הבלוג הרשמי מדגיש שהגרסה הזו נועדה לאמת את השיפורים לפני הפצה רחבה, מה שמבהיר שהיכולות מרשימות, אבל עדיין אינן מוצר סופי.
מי מרוויח מהיכולות החדשות
למרות ההישגים, גוגל מקפידה להבהיר שהמודל הזה הוא ממש לא AGI, לא מציע זיכרון מתמשך ארוך טווח, לא פועל באוטונומיה מלאה ולא מבוסס על שינוי ארכיטקטוני מהותי. ההדגשה הזו משקפת זהירות, אולי גם ניסיון להימנע מהבטחות יתר שנשמעו בהשקות קודמות. ובכל זאת, מדובר במודל מתקדם מאוד שמסוגל לשפר משמעותית את העבודה של מי שנשען עליו.
עבור מפתחים, הוא מקצר את הדרך בין רעיון ל‑MVP ומספק קוד יציב שמרכיב מערכות שלמות במקום קטעים מבודדים. מנהלי מוצר נהנים מיכולת להציג רעיונות חיים ולבנות אבטיפוס במהירות, מה שמאיץ תהליכי אפיון. ארגונים מרוויחים מהחיבור העמוק לאקו־סיסטם של גוגל קלאוד ומהתקדמות ברורה לכיוון סוכני עבודה שמבצעים תהליכים מורכבים מקצה לקצה.
הנה עוד דוגמה מגניבה שבה המודל מייצר סימולציה תלת-ממדית אינטראקטיבית שמגיבה לתנועות המשתמש ולצליל:
פחות שיחה, יותר עשייה
Gemini 3.1 Pro מסמן בבירור את הכיוון שאליו גוגל מכוונת את הדור הבא של מודלי ה‑AI. מעבר ממערכות שמגיבות לטקסט למערכות שמבצעות משימות מורכבות מקצה לקצה. הוא מציג שיפור מדיד ביכולות ההסקה, התקדמות משמעותית במנגנוני הסוכנים, קפיצה ביכולות הקוד – כולל בניית אפליקציות, סימולציות וממשקים חיים – וחידושים ויזואליים שמצמצמים את המרחק בין רעיון לעיצוב.
זה מודל שמרגיש פחות כמו צ’אטבוט ויותר כמו שכבת ביצוע חכמה, כזו שמסוגלת לקחת בקשה מופשטת ולהפוך אותה למוצר עובד.










