בעוד שוק הבינה המלאכותית מתעדכן בקצב מהיר, גוגל פרסמה גרסאות Preview חדשות לשני מודלים פופולריים שלה – Gemini 2.5 Flash ו-Flash-Lite. בניגוד לעדכונים קודמים שהתמקדו בעיקר בביצועים גולמיים, הפעם המיקוד הוא ביעילות: תשובות קצרות ומדויקות יותר, שיפור ביכולות סוכנים אוטונומיים וחיסכון בטוקני פלט שמפחית את עלות השימוש בפועל. המהלך הזה נועד לחזק את מעמד גוגל בשוק תחרותי שבו כל שיפור קטן עשוי להשפיע על בחירות המפתחים והחברות.
רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.
אפשר גם להרשם לניוזלטר שלנו
מה בעצם השתנה?
Flash Lite
ב-Flash Lite, גוגל מבטיחה מודל פחות “פטפטן”, כזה שלא יכביר במילים אלא יספק תשובות תמציתיות יותר. בעולם שבו כל מילה מתורגמת לטוקן שעולה כסף, זה לא רק עניין של סגנון אלא גם של עלות. בנוסף, המודל יודע להתמודד טוב יותר עם משימות אייג׳נטיות – סוכנים אוטונומיים שמבצעים פעולות רצופות לאורך זמן – ונוסף לכך קיבל שדרוגים ביכולות עיבוד תמונה ואודיו.
Flash
בגרסה המלאה של Flash הדגש הוא על שני תחומים מרכזיים: עמידות גבוהה יותר להוראות מערכת מורכבות (system prompts – ההנחיות שקובעות את אופי ותפקוד המודל), ושימוש יעיל יותר בטוקנים. המשמעות עבור המשתמשים היא קיצור זמני תגובה והפחתת עלויות תפעול.
בגרף שפרסמה גוגל ניתן לראות את ההשוואה בין הגרסאות היציבות לגרסאות ה-Preview של ספטמבר 2025. השדרוגים מתבטאים גם בעלייה במדד הביצועים וגם בירידה בזמן התגובה מקצה לקצה:
עדות מהשטח
כדי לחזק את ההכרזה, גוגל הציגה חוות דעת מחברת Manus, המתמחה בפיתוח סוכנים אוטונומיים. ב-Manus דיווחו כי בבדיקות פנימיות שביצעו נרשמה קפיצה של כ־15 אחוזים בביצועי המודל במשימות מורכבות ארוכות טווח. לדבריהם, השילוב בין מהירות לאינטליגנציה לצד עלות תפעול נמוכה מאפשר לחברה להרחיב את פעילותה בקצב שלא התאפשר בעבר.
המשמעות רחבה יותר מההצלחה של Manus בלבד. בעולם שבו ארגונים בוחנים כל שיפור קטן בביצועים, שדרוג דו-ספרתי נחשב להוכחה לכך שהמודלים החדשים של גוגל אינם רק “ניסיוניים”, אלא מסוגלים לשרת גם מערכות מסחריות מורכבות ולספק יתרון תחרותי אמיתי.
ומה לגבי המחיר?
בגזרת המחירים אין הפתעות: התמחור של Flash ו-Flash Lite נותר ללא שינוי. Flash Lite ממשיך להיות המודל הזול במשפחה, עם 0.10 דולר למיליון טוקני קלט ו-0.40 דולר לפלט, לעומת Flash המלא, שמחירו גבוה פי כמה. ההבדל הזה לא נולד בעדכון הנוכחי, אך השדרוגים ביעילות הטוקנים עשויים להפוך את הפער למשמעותי עוד יותר בפועל.
בדיקות של חברת Artificial Analysis מצביעות על שיפור משמעותי ביעילות טוקני הפלט. בגרסאות ה-Preview של ספטמבר 2025 נמדדה ירידה של כמעט פי שניים במספר הטוקנים – חיסכון שמתורגם ישירות לעלות:
למפתחים ולחברות זה אומר דבר פשוט – מי שמחפש פתרון זול לעיבוד כמויות גדולות של טקסט, יקבל ערך גבוה יותר ב-Lite. מי שזקוק ליכולות מתקדמות בסביבות מורכבות, ימצא אותן ב-Flash במחיר גבוה יותר, אך עם תמיכה טובה יותר במשימות מרובות שלבים.
איך מתחילים?
הגרסאות החדשות זמינות בשתי דרכים – דרך Google AI Studio, פלטפורמת הניסוי החינמית של גוגל המאפשרת למפתחים לבדוק את המודלים עם מגבלות שימוש, ודרך Vertex AI ב-Google Cloud – שירות ארגוני בתשלום שמיועד לשילוב המודלים כחלק מתשתיות ייצור. כך מפתחים יכולים להתחיל בקלות בבדיקות מהירות, ובהמשך לשלב את המודלים במערכות רחבות היקף.
למה זה עדכון חשוב?
העדכון הנוכחי אינו רק שיפור נקודתי, אלא חלק ממגמה רחבה יותר בשוק ה-AI. פחות דגש על “מי הכי חזק” ויותר על שילוב נכון של מהירות, איכות ועלות. בסופו של דבר, לא המודל המרשים ביותר ייקבע את השימוש בפועל, אלא זה שמציע את היחס המשתלם ביותר בין ביצועים לעלות.
עבור מפתחים, המשמעות ברורה:
-
Flash Lite מתאים לפרויקטים עתירי שיחות או תרגום, שבהם תגובה מהירה ועלות נמוכה הם הקריטריונים המרכזיים.
-
Flash נועד לסביבות מורכבות יותר, שבהן יש צורך בסוכנים מתקדמים ובניהול תהליכים מרובי שלבים – גם במחיר גבוה יותר.
לסיכום, גוגל מבהירה שהגרסאות החדשות הן עדיין במעמד Preview, ולכן לא מיועדות בשלב זה לשימוש יציב בפרודקשן. המטרה היא לאפשר למפתחים להתנסות, לזהות יתרונות וחסרונות, ולהחזיר פידבק שישפיע על ההפצות הבאות.
מעבר לכך, המהלך משקף כיוון ברור – לא עוד מרדף אחרי מודלים “חזקים” בלבד, אלא ניסיון למצוא את נקודת האיזון שבין יכולת טכנית, חוויית שימוש ועלות. עבור מפתחים ועסקים, זו בדיוק השאלה שתכריע אילו מודלים ישתלבו במערכות אמיתיות ואילו יישארו בגדר הדגמה.