גוגל משיקה שלושה מודלים חדשים במשפחת Gemini 2.0. המודלים – Flash, Pro Experimental ו-Flash-Lite – מציגים יכולות מתקדמות ומנסים לתת פייט מול פרץ המודלים הסופר חכמים שיוצאים לשוק בקצב מטורף. מה שמייחד את ההכרזה הזו הוא הגישה החדשנית של גוגל – במקום להתמקד במודל אחד חזק, החברה מציעה מגוון פתרונות המותאמים לצרכים שונים – החל ממודל חסכוני למשימות בסיסיות, דרך מודל כללי רב-עוצמה, ועד למודל מתקדם במיוחד למשימות מורכבות. במאמר זה נסקור את שלושת המודלים החדשים של Gemini 2.0 יחד עם מודל החשיבה שהושק לא מזמן, נבחן את היכולות, המחירים והזמינות של כל אחד מהם, ונראה כיצד הם משתלבים בנוף המתפתח של עולם הבינה המלאכותית.
Gemini 2.0 is now available to everyone. ✨
⚡ Start using an updated 2.0 Flash in @Google AI Studio, @GoogleCloud’s #VertexAI and in @GeminiApp.
We’re also introducing:
🔵 2.0 Pro Experimental, which excels at coding.
🔵 2.0 Flash-Lite, our most cost-efficient model yet.
🔵… pic.twitter.com/KbqlteWjSk— Google DeepMind (@GoogleDeepMind) February 5, 2025
רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.
אפשר גם להרשם לניוזלטר שלנו
המהפכה החדשה של Gemini
גוגל ממשיכה את המהפכה בעולם הבינה המלאכותית עם השקת הדור החדש של משפחת Gemini 2.0. בעוד שהדור הקודם כבר הציב סטנדרטים גבוהים בתחום, המודלים החדשים מביאים עמם קפיצת מדרגה משמעותית המשלבת מהירות, יעילות ויכולות מתקדמות. החזון של גוגל להנגיש בינה מלאכותית חכמה ויעילה לכולם מתבטא בכל אחד מהמודלים החדשים. רק כדי לעשות סדר, ההשקה כוללת שלושה מודלים חדשים הזמינים כעת למשתמשים ועוד מודל שכבר הושק לפני כשבועיים. בראש הרשימה נמצא Gemini 2.0 Flash, המודל הבסיסי החדש שזמין לכולם. לצדו, Gemini 2.0 Flash-Lite Preview שהושק ב-5 בפברואר, מציע פתרון חסכוני ויעיל במיוחד. המודל השלישי הוא Gemini 2.0 Pro Experimental, גם הוא מה-5 בפברואר, המיועד למשימות מורכבות וביצועי קידוד מתקדמים. לבסוף, Gemini 2.0 Flash Thinking Experimental, שהושק כבר ב-21 בינואר, מביא יכולות חשיבה מתקדמות בשילוב עם מהירות גבוהה. כל המודלים מסומנים כחדשים (NEW) בממשק המשתמש, מה שמעיד על העדכניות שלהם ועל המאמץ המתמשך של גוגל לשפר ולהרחיב את יכולות הבינה המלאכותית שלה.
Gemini 2.0 Flash – המודל הבסיסי החדש של גוגל
Gemini 2.0 Flash, הוא המודל הבסיסי החדש במשפחת Gemini 2.0. המודל זמין באופן מלא דרך ה-API של Gemini ב- Google AI Studio ו- Vertex AI תחת השם “gemini-2.0-flash”, וכן לכל המשתמשים באפליקציית Gemini בדסקטופ ובמובייל.
יכולות טכניות
המודל מצטיין בחלון הקשר של מיליון טוקנים ותמיכה מלאה בקלט מולטימודלי, המאפשרים עיבוד והבנה של טקסט, תמונות, וידאו ואודיו. בקרוב יתווספו יכולות יצירת תמונות והמרת טקסט לדיבור. המודל אופטימלי למשימות בקנה מידה גדול הודות לזמני תגובה נמוכים וביצועים משופרים לעומת הדור הקודם.
מחירים וזמינות
- קלט טקסט/תמונה: 10 סנט למיליון טוקנים
- קלט אודיו: 70 סנט למיליון טוקנים
- פלט טקסט: 40 סנט למיליון טוקנים
שימושים מרכזיים
המודל מיועד למגוון רחב של משימות, כולל עיבוד טקסט בהיקף גדול, ניתוח תמונות, עיבוד שפה טבעית ומשימות מולטימודליות. האופטימיזציה לביצועים גבוהים וזמני תגובה נמוכים הופכת אותו לאידיאלי לשימוש בסביבות פיתוח ויישומים מסחריים.
Gemini 2.0 Pro Experimental
Gemini 2.0 Pro Experimental, מייצג את פסגת היכולות של גוגל בתחום הבינה המלאכותית. המודל זמין דרך Google AI Studio, Vertex AI ולמנויי Gemini Advanced שמשלמים 19.99$ לחודש.
יכולות טכניות מתקדמות
המודל מצטיין בחלון הקשר של 2 מיליון טוקנים דרך ה-API (מוגבל למיליון טוקנים באפליקציה), ומציג את ביצועי הקידוד הטובים ביותר שגוגל השיגה עד כה. הוא כולל אינטגרציה מובנית עם Google Search וכלי קוד, ומציע תמיכה רב-לשונית מתקדמת עם יכולת זיכרון משופרת בשיחות. חשוב לציין שכאשר המודל יצא מגרסת הניסוי, גוגל צפויה לפרסם את מחירי ה-API הרשמיים לשימוש לפי צריכה (Pay-as-you-go).
אבטחה ופרטיות
המודל משלב טכניקות למידת חיזוק חדשות לביקורת עצמית, הגנה משופרת מפני התקפות הזרקת פרומפט, ומנגנוני אבטחה מתקדמים להגנה על מידע רגיש.
זמינות והגבלות
- זמין בגרסת ניסוי (Experimental)
- הזמינות משתנה לפי מכשיר, מדינה ושפה
- חלק מהתכונות עדיין אינן זמינות בשלב הניסיוני
שימושים עיקריים
מיועד במיוחד למשימות מורכבות כמו פיתוח קוד, ניתוח נתונים מתקדם, ויצירת תוכן ברמה גבוהה, תוך שמירה על זמני תגובה מהירים ואינטראקציה טבעית.
Gemini 2.0 Flash-Lite
Gemini 2.0 Flash-Lite, מייצג את המודל החסכוני ביותר במשפחת Gemini. המודל זמין כעת בגרסת Preview ב-Google AI Studio ו-Vertex AI.
יכולות טכניות
המודל מציע חלון הקשר של מיליון טוקנים ותמיכה מלאה בקלט מולטימודלי, בדומה ל-2.0 Flash הרגיל. הוא משיג ביצועים משופרים לעומת Gemini 1.5 Flash במרבית המדדים, תוך שמירה על זמני תגובה מהירים.
מחירים
- קלט (טקסט, תמונות, וידאו): 7.5 סנט למיליון טוקנים
- פלט טקסט: 30 סנט למיליון טוקנים
- קלט: 3.75 סנט למיליון טוקנים (מחירי Batch API)
- פלט: 15 סנט למיליון טוקנים (מחירי Batch API)
יעילות כלכלית
דוגמה ליעילות הכלכלית של Gemini 2.0 Flash-Lite היא היכולת שלו לייצר כתוביות (captions) ל-40,000 תמונות בעלות כוללת של פחות מדולר אחד. כשמפרקים את המספרים, מדובר בעלות מדהימה של פחות מ-0.0025 סנט לתמונה בודדת. התהליך כולל שני שלבים: ראשית, עיבוד התמונה כקלט בעלות של 7.5 סנט למיליון טוקנים, ולאחר מכן יצירת הטקסט כפלט בעלות של 30 סנט למיליון טוקנים. כשמשווים זאת לעלויות המקובלות בשוק עבור משימות דומות, או לעלות העסקת אדם ליצירת captions, היעילות הכלכלית של המודל הופכת ברורה עוד יותר. זוהי דוגמה מצוינת לאופן שבו המודל החדש של גוגל מאפשר לארגונים לבצע משימות בקנה מידה גדול בעלות נמוכה במיוחד, מה שפותח אפשרויות חדשות לאוטומציה ועיבוד מידע המוני.
שימושים מרכזיים
כפי שראינו מהדוגמה, המודל מיועד במיוחד למשימות בסיסיות הדורשות עיבוד של כמויות גדולות של מידע, ומציע את היחס הטוב ביותר בין ביצועים לעלות במשפחת Gemini. אידיאלי לארגונים המחפשים פתרון AI יעיל וחסכוני למשימות בקנה מידה גדול.
Gemini 2.0 Flash Thinking Experimental
Gemini 2.0 Flash Thinking Experimental, שהושק כבר ב- 21 בינואר השנה, הוא המודל הסופר-חכם במשפחת Gemini, מודל מולטימודלי עם חלון הקשר של מליון טוקנים המשלב את המהירות של Flash עם יכולות חשיבה מתקדמות. המודל זמין כעת בחינם דרך תפריט בחירת המודלים באפליקציית Gemini, הן בגרסת הדסקטופ והן במובייל. הייחוד שלו מתבטא בשקיפות מלאה של תהליך החשיבה – המודל מציג בזמן אמת כיצד הוא מנתח בעיות ומגיע למסקנות. החידוש המשמעותי במודל זה הוא גרסה מיוחדת המשתלבת עם אפליקציות מרכזיות של גוגל. האינטגרציה עם YouTube מאפשרת חיפוש וניתוח תוכן וידאו, החיבור ל-Google Search מספק גישה למידע עדכני, וההתממשקות עם Google Maps מאפשרת ניווט וניתוח מידע גיאוגרפי. חשוב לציין שמדובר בגרסה ניסיונית (Experimental), ולכן התכונות והביצועים עשויים להשתנות. בנוסף, הזמינות של חלק מהתכונות המתקדמות עשויה להיות מוגבלת בהתאם למיקום גיאוגרפי ולשפה.
השוואה בין המודלים של ג׳מיני
אמנם זו השוואה פנימית, ונכון יהיה לראות בקרוב השוואת ביצועים ויכולות מול מודלים אחרים בשוק, ועדיין זו טבלת השוואה מקיפה של משפחת מודלי Gemini, שמציגה את התפתחות הביצועים המרשימה בין הדורות השונים. הטבלה משווה בין חמישה מודלים של ג׳מיני ומתמקדת ב-12 תחומי יכולת מרכזיים, החל מהבנה כללית ועד ליכולות וידאו, כאשר בכל קטגוריה נמדדים הביצועים באחוזי דיוק. הנתונים מראים שיפור עקבי בביצועים בין הדורות, כאשר Gemini 2.0 Pro מוביל ברוב המדדים, במיוחד במתמטיקה (91.8%), הבנה רב-לשונית (86.5%) ויכולות חשיבה כלליות (79.1%):
הטבלה המסכמת מציגה השוואה מקיפה בין שלושת המודלים החדשים של Gemini 2.0 וממחישה את השימושים השונים והיכולות של כל מודל:
השקת משפחת מודלי Gemini 2.0 מסמנת נקודת מפנה משמעותית בעולם הבינה המלאכותית. עם שלושה מודלים חדשים המציעים יכולות מתקדמות בטווחי מחירים שונים, גוגל מוכיחה שהעתיד של AI נגיש יותר מתמיד. ה-Flash מביא ביצועים מרשימים למשימות יומיומיות, ה-Pro Experimental דוחף את גבולות האפשר עם חלון הקשר ענק של 2 מיליון טוקנים, וה-Flash-Lite מציע פתרון חסכוני שלא מתפשר על איכות. עם זאת, האתגר האמיתי יהיה ביישום היומיומי של היכולות האלה – כיצד ארגונים ומפתחים ינצלו את הכלים החדשים לפתרון בעיות אמיתיות ויצירת ערך משמעותי. בעוד שהמרוץ לפיתוח AI חזק יותר נמשך, ההכרזה של גוגל מדגישה מגמה חשובה: הצורך באיזון בין עוצמה, נגישות ויעילות כלכלית. עם שילוב זה של חדשנות טכנולוגית ומחשבה על המשתמש הסופי, Gemini 2.0 מסמן את המשך העידן שבו טכנולוגיה מתקדמת הופכת לכלי שימושי ונגיש לכולם. לעוד פיתוחים וכלים של גוגל תחת Gemini 2.0, כנסו כאן.
הוא מראה שגיאה כשאני מעוניין לצור איתו תמונות…
נכון לעכשיו, Gemini 2.0 עדיין לא תומך ביצירת תמונות, אבל גוגל הודיעה שזה יתווסף בקרוב. כנראה שזה הסיבה לשגיאה שאתה רואה 😃