תוצאות נוספות...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
× Send

בניית הדור הבא של סוכנים פיזיים עם ג’מיני רובוטיקס – ER 1.5

תוכן עניינים

רובוטים שמתחילים לחשוב לפני שהם פועלים – זה כבר לא חזון עתידי אלא מציאות. גוגל DeepMind השיקה את Gemini Robotics-ER 1.5, מודל חשיבה גופנית (embodied reasoning) חדש, שמיועד לשמש כמוח ברמה גבוהה לרובוטים. לראשונה, מפתחים יכולים לעבוד עם מערכת שמאפשרת למכונות להבין הקשר, לנמק ולפעול בעולם הפיזי כמו שותפים אמיתיים, לא רק כזרועות שמבצעות פקודות. כבר היום ניתן לגשת אליו דרך Google AI Studio ו-Gemini API.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה הופך את זה לייחודי

רובוטים קלאסיים עובדים לפי תסריטים קבועים מראש – להזיז קופסה, להבריג בורג, לשאוב רצפה. הבעיה? העולם האמיתי לא מתנהל לפי תסריט. כאן נכנס Gemini Robotics-ER 1.5 מבית גוגל DeepMind – הוא יודע לפרק משימות מורכבות, לחפש באינטרנט בזמן אמת (למשל כללי מיחזור מקומיים), ולהתאים את הפעולה לסיטואציה המשתנה. במילים פשוטות, זהו מעבר מרובוטים שמבצעים פקודות “על אוטומט” לרובוטים שמבינים הקשר, מתמודדים עם הפתעות, ואפילו מסבירים את תהליך החשיבה שלהם.

 

הנה גרף שמציג השוואה בין דגמי Gemini Robotics לדגמים אחרים (כולל GPT-5) על שני צירים: יכולות חשיבה גופנית (Embodied Reasoning) מול רב-שימושיות (Generality). Gemini Robotics-ER 1.5 ממוקם גבוה יותר משמעותית מהגרסה הקודמת (1.0) ומציג שיפור ניכר גם בהשוואה למודלים לשפה כללית:

 

הקפיצה של Gemini Robotics-ER 1.5 ביחס לדורות קודמים

הקפיצה ביחס לדורות קודמים. Source: googleblog.com

שלוש יכולות ליבה

חשיבה מרחבית חכמה ומהירה

המודל מזהה חפצים בדיוק גבוה, מבין משקל, גודל ויכולת אחיזה, ומגיב בזמן אמת לסביבה משתנה. התוצאה: רובוט שלא רק “רואה” אלא גם מבין מה אפשר לעשות עם מה שהוא רואה.

תזמור התנהגויות מורכבות

המערכת מפרקת הוראות לשלבים, מפעילה כלים דיגיטליים, ומנהלת את ההתקדמות. כך היא יכולה לסדר שולחן לפי תמונה או להכין קפה – מהבנת המצב ועד ביצוע מדויק.

תקציב חשיבה גמיש

למפתחים יש שליטה בכמה זמן המודל “חושב” לפני פעולה. משימות פשוטות זוכות לתגובה מהירה, משימות מורכבות מקבלות תכנון עמוק יותר.

 

התמונה המצורפת מציגה את המערכת בפעולה: המשתמש מבקש מהמכונה למיין פריטים לפחים הנכונים, והרובוט נעזר בהנחיות מקומיות (כמו חוקי מיחזור בסן פרנסיסקו), חושב, מחפש מידע רלוונטי, מתכנן ומבצע. התרשים מימין מסביר איך המודל מתפקד כמתזמר (Orchestrator): חשיבה ← שימוש בכלים ← תכנון ← ביצוע. זה ממחיש בצורה ברורה את המעבר מרובוט שמבצע פקודות לרובוט שמבין וגם יודע להסביר את תהליך החשיבה שלו:

 

 

רובוט שמבין ומנמק

כך פועל רובוט שמבין ומנמק. Source: googleblog.com

 

הגרף הראשון מראה איך ביצועי המודל משתפרים ככל שמגדילים את “תקציב החשיבה” (Thought Token Budget). במשימות שונות – הבנת תמונה, וידאו, הצבעה ושאלות – ככל שהמודל מקבל יותר זמן לחשוב, כך עולה אחוז ההצלחה. המשמעות ברורה: ניתן לכוונן את המודל לפי הצורך – תגובה מיידית או תכנון מעמיק למשימות מורכבות:

 

יותר זמן לחשוב – ביצועים טובים יותר

יותר זמן לחשוב = ביצועים טובים יותר. Source: googleblog.com

 

בגרף הנוסף אפשר לראות את רמת הדיוק הממוצעת של מודלים שונים במשימות “הצבעה” (pointing benchmarks). Gemini Robotics-ER 1.5 מוביל בצורה ברורה, ומשאיר מאחור גם את דגמי GPT וגם את גרסאות Gemini הקודמות. המשמעות – לא רק יכולת תיאורטית, אלא ביצועים מוכחים בשטח:

 

Gemini Robotics-ER 1.5 מציב סטנדרט חדש של דיוק

Gemini Robotics-ER 1.5 מציב סטנדרט חדש של דיוק. Source: googleblog.com

דוגמאות אמיתיות שמיושמות בשטח

מיון פסולת

המודל יודע לזהות חומרים, להבין תקנות מקומיות ולהסתגל לזרמי פסולת משתנים. כיום, עד 30% מהחומרים הניתנים למיחזור מגיעים למזבלה רק בגלל טעויות מיון – טכנולוגיה כזו יכולה לצמצם את ההפסד הזה, לחסוך עלויות ולתרום ישירות לסביבה.

למידה חוצת-גופים

מיומנות שנלמדה על רובוט אחד (למשל זרוע תעשייתית) יכולה לעבור לרובוט אחר בלי הגדרה מחדש. המשמעות? חיסכון עצום בזמן פיתוח ובהוצאות הטמעה, ויכולת לשכפל פתרונות מהר הרבה יותר.

הבנה זמנית וסיבתית

המודל לא רק רואה – הוא מבין רצף. הוא יודע לתאר פעולות של רובוטים אחרים, לזהות קשרי סיבה ותוצאה, וללמוד מהדגמות כמעט כמו בני אדם. עבור התעשייה זה פותח דלת לרובוטים שממשיכים להשתפר עם כל אינטראקציה.

 

בתמונה המצורפת ניתן לראות איך Gemini Robotics-ER 1.5 מזהה מגוון חפצים על שולחן – מפחית אלומיניום ועד ענבים ופלפל חריף – וגם מקשר אותם ליעד הנכון (פח מיחזור, פח קומפוסט וכו’). זו המחשה מצוינת ליכולת של המודל לא רק “לראות” אלא גם לפרש את המשמעות של מה שהוא רואה:

 

ראייה מרחבית והבנת הקשר בזמן אמת

ראייה מרחבית והבנת הקשר בזמן אמת. Source: googleblog.com

בטיחות כבסיס

אחת השאלות הראשונות שכל תעשייה שואלת היא: איך נוודא שהרובוטים פועלים בבטחה? ב-Gemini Robotics-ER 1.5 הבטיחות לא נוספה בדיעבד, היא מובנית בארכיטקטורה.

  • בטיחות סמנטית – המודל מבין הקשר ומסרב למשימות מסוכנות או מזיקות.

  • מודעות פיזית – הרובוט יודע לזהות את המגבלות שלו (כמו משקל או טווח תנועה) ולא לנסות פעולות בלתי אפשריות.

גוגל קוראת לזה “גישה של גבינה שוויצרית” – כמה שכבות הגנה שמכסות זו את זו, יחד עם נהלי בטיחות תעשייתיים רגילים. המשמעות היא רמת אמינות גבוהה יותר והפחתת סיכונים משפטיים ותפעוליים.

 

למה זה משנה לתעשייה

ניהול פסולת, לוגיסטיקה ומחסנים – אלו תחומים שכבר היום סובלים ממחסור בכוח אדם ומהצורך בייעול מתמיד. כאן נכנס Gemini Robotics-ER 1.5: הוא לא רק חוסך זמן וכסף, אלא גם יוצר שקיפות מלאה. כל שלב בתהליך החשיבה והביצוע מתועד, כך שאפשר לעקוב, לאמת וללמוד מכל פעולה. בעולמות שבהם רגולציה, אחריות תאגידית ודרישות שקיפות הופכות קריטיות, זו לא רק תוספת נוחה, אלא יתרון תחרותי ממשי.

אתגרים בדרך

לצד ההבטחות, יש גם חסמים אמיתיים. המודל דורש כוח חישוב משמעותי, שילוב עם חומרה וחיישנים מתקדמים, והשקעה ראשונית לא קטנה. מתקנים קטנים עלולים להתקשות לעמוד בעלויות, מה שעלול להעמיק את הפער בין ארגונים גדולים לקטנים. בנוסף, האמינות בתנאים לא צפויים עדיין דורשת שיפור. העולם האמיתי מלא במקרי קצה, ודווקא שם נמדדת היכולת של רובוטים לתפקד באמת.

 

מכוונים לעתיד רובוטי

חשוב להבין, זה לא עוד עדכון טכנולוגי, אלא צעד משמעותי לעבר רובוטים כלליים – כאלה שלא רק מבצעים, אלא גם מבינים ומתקשרים עם העולם. בהתחלה נראה אותם בעיקר בסביבות מובנות כמו מפעלים, מחסנים ומתקני מיחזור. אבל בעתיד הלא רחוק הם ייכנסו גם לתחומי בריאות, אירוח, שירותים ציבוריים, ואולי אפילו לבתים שלנו. השאלה המרכזית כבר אינה האם זה יקרה, אלא כמה מהר זה יקרה, ואילו תעשיות יהיו הראשונות לאמץ ולהוביל את השינוי.

 

 

לסיכום, Gemini Robotics-ER 1.5 הוא לא עוד מודל AI, הוא פלטפורמה לרובוטים שחושבים, מנמקים ומסתגלים לעולם מורכב. הערך האמיתי טמון בשיתוף פעולה חדש בין אדם למכונה – הרובוטים יקחו על עצמם את המשימות החזרתיות, המסוכנות והמדויקות, ואנחנו נתרכז ביצירתיות, שיפוט ובקרה. ההצלחה לא תגיע מעצם הטכנולוגיה, אלא מהדרך שבה מפתחים וארגונים ישכילו ליישם אותה – בזהירות, בבטיחות ובחשיבה אתית. אם זה יקרה, נעבור מעידן של מכונות “אוטומטיות” לעידן של סוכנים פיזיים חכמים באמת – שותפים אמיתיים לפתרון בעיות בעולם האמיתי.

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

רוצים הרצאה או ייעוץ של רון גולד?
השאירו פרטים ונשמח לחזור אליכם עם המידע הרלוונטי
אולי יעניין אותך גם...
guest
0 תגובות
Inline Feedbacks
צפה בכל התגובות
Let's update

רוצים לקבל עדכונים על כל מה שחדש ומעניין בעולם ה-AI? הרשמו לניוזלטר שלנו!

אירועי AI קרובים

תפריט נגישות

תוצאות נוספות...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors