שבוע נוסף עבר ואני רוצה לשתף אתכם בכל מה שקרה בעולם ה-AI בשבוע שעבר. תמצאו פה מודל שפה חדש ומסקרן, מודל וידאו מהיר במיוחד, מבט על ביצת ה-AI ומה שמתרחש ב-OpenAI, גוגל ואנטרופיק. אפילו אילון מאסק יקפוץ לביקור. קדימה – בואו נצלול פנימה…
רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.
אפשר גם להרשם לניוזלטר שלנו
מודל Flux – האיכות הגבוהה שכולם מדברים עליה
השבוע המשיך מודל התמונה האיכותי Flux להפציץ ביכולותיו המרשימות. מעבר ליכולת המדהימה של אימון מודל אישי ועריכה (Inpaint), נוספו גם אמצעי שליטה מתקדמים כמו ControlNet. במאמר הבא דורי אדר עשה השוואה מעניינת בינו ובין מידג’רני V6 כדי לנסות ולהכריע מי המלך החדש. התוצאות מפתיעות. ככל שהזמן עובר משתחררים עוד ועוד יכולות עבור המודל המרהיב הזה. עבדכם הנאמן אימן את המודל על תמונות שלו והתוצאות אמינות באופן די מפחיד… התהליך לא מאוד מסובך אבל דורש מעט התעסקות ויש הדרכה טובה של מאט וולף ביוטיוב.
שבטע שעבר אביתר אדרי פרסם בקהילות שלנו על דרך נוספת לאמן מודלים עם Flux. זה מה שהוא כתב:
“בוני המודלים באשר הם – האם ידעתם שב”אסטריה” (Astria) תמצאו גם את Flux! מה שיאפשר לכם לבנות מודלים פסיכיים של עצמכם ולשתול את עצמכם בשלל סיטואציות הזויות. מזכיר שיש לנו קורס בניית מודלים (עם לאונרדו ואסטריה), והוא נכלל כיחידת תוכן גם בתוך הקורס המקיף (ניתן לרכוש אותו בנפרד או כחלק מהמקיף). ופלוס נוסף – כל משתתפי הקורסים שלנו מקבלים קרדיטים חינם ל-Astria (חברה ישראלית מצוינת ומחולל תמונות מבוסס סטייבל).”
מהירות היא שם המשחק! GEN-3 Alpha Turbo
מודל הוידאו GEN-3 Alpha המדהים מגיע במהדורת Turbo שמאפשרת לג’נרט סרטונים קצרים מאוד מהר (יחסית), וגם במחיר זול יותר ואפילו נגיש לכולם. אגב, המודל זמין גם למי שלא משלם (בכמות מוגבלת כמובן). זו חתיכת פריצת דרך כי האיכות פה הייתה חלום עד לפני חודש, ועכשיו זה ממש בהישג יד. אבל חייבים לסייג – תחום הוידאו עדיין תחום קשה, יש המון בעיות בחלק גדול מהיצירות וצריך הרבה סבלנות ושקידה – מי שיש לו את זה, מוציא תוצרים מטורפים. אה כן – וצריך גם חוש יצירתי ודמיון מפותח. לא יזיק. אם אתם רוצים לראות איך הכל מתחבר, ממליץ לכם לצפות בוובינר יצירת סרטים עם AI בהנחיית אביתר אדרי וגיא גוטמן.
פה תמצאו סקירה מקיפה על Gen3 alpha – האח הגדול של ג’ן 3 אלפא טורבו.
הרמס (Hermes 3) – מודל שפה פתוח שעושה רושם
השבוע יצא מודל שפה חדש בשם Hermes 3, המגיע גם בתצורת 405B פרמטרים. מתברר שהמודל הזה מסתדר מצוין גם עם השפה העברית, מה שהופך אותו לשחקן חדש ומעניין בזירה.
קוד וקלוד
קלוד (Claude) ממשיך לככב כהתמכרות מספר אחת. מי שמבין את העוצמה נשאב פנימה. הוא מוכיח את עצמו ככלי עוצמתי ושימושי עבור כל מי שיודע לנצל את כוחותיו, בדגש על מפתחים ויוצרי תוכן. אגב, אם פספסתם את הוובינר המטריף שלנו על קלוד, בהשתתפות עומר הררי, שחר גולן, תום הגלעדי ואביתר אדרי – צפו בו… לא תתאכזבו! הוא ייתן לכם המון רעיונות לקחת את הכלי המטורף הזה 10 צעדים קדימה.
ובאותה נשימה – הנה כמה שימושים לא שגרתיים שאפשר לעשות עם קלוד ושסביר שלא חשבתם שהוא יכול לבצע. למשל – עיצוב מסמכים בקלות ובמהירות, וללא שום צורך בתוכנות עיצוב כמו קאנבה או אינדיזיין. הכל במדריך הקצרצר הבא שהעלאתי לאתר לפני יומיים:
אגב, אנטרופיק הוסיפו פיצ׳ר מדהים וחדש לקלוד, שרלוונטי בעיקר למפתחים. יכולת זיכרון מטמון (Prompt caching) לפרומפטים ארוכים במיוחד (או לידע מוקדם שמכניסים למודל בתוך הקונטקסט… איך שתרצו להסתכל על זה). זו אמנם יכולת שגוגל כבר הביאו לפני זמן מה לג׳מיני אבל כולנו אוהבים יותר את קלוד, וזה חתיכת חסכון כספי ליישומים מסוימים.
קצת יותר בהרחבה: הפיצ’ר מאפשר למפתחים לשמור בזיכרון מטמון הקשר שנמצא בשימוש תכוף בין קריאות API. היכולת הזו מפחיתה עלויות עד 90% ומשפרת זמני תגובה עד 85% עבור פרומפטים ארוכים. היא זמינה כעת בבטא עבור המודלים Claude 3.5 Sonnet ו-Claude 3 Haiku, עם תמיכה עתידית ב-Claude 3 Opus. למי זה יכול להתאים?
- סוכני שיחה עם הוראות ארוכות או מסמכי הוראות שמועלים לפלטפורמה.
- עוזרי קידוד עם גישה לבסיס קוד מסוכם.
- עיבוד מסמכים גדולים.
- מסמכי הוראות מפורטים וארוכים לטובת Fine Tune של התגובות של קלוד.
- שיפור ביצועים בתרחישים הכוללים מספר סבבים של שימוש בכלים ושינויים איטרטיביים, כאשר כל שלב בדרך כלל דורש קריאה חדשה ל-API.
- אינטראקציה עם ספרים, מאמרים ותוכן ארוך אחר (בקונטקסט גדול במיוחד).
סונו: גידול מרשים ללא חדשנות
למרות שסונו (Suno) לא שיחררו שום דבר חדש השבוע, הם הוכרזו כסטארטאפ שצומח הכי מהר בתחום ה-AI. זה תואר מרשים בהחלט, וכנראה מבשר על העתיד הצפוי להם. והנה עוד כמה נתונים מעניינים על מחולל המוזיקה המדהים הזה. הפלטפורמה של סונו שימשה כ-12 מיליון משתמשים בפחות משנה מאז היווסדה. במקביל, החברה גייסה 125 מיליון דולר בסבב מימון, מה שהעלה את שווי החברה ל-500 מיליון דולר! סונו מתכוונת להשתמש בהון שגייסה לטובת האצת פיתוח המוצרים שלה, הרחבת צוות העובדים (כולל יוצרי מוזיקה, חובבי מוזיקה וטכנולוגים), והמשך פיתוח הטכנולוגיה והמודלים של החברה.
רוצים הצצה מרתקת אל מאחורי הקלעים של סונו? במאמר שעלה אצלנו בפברואר ראיין ארז רובינשטיין את קינן פרייברג – מייסד שותף בסונו.
ארז רובינשטיין מראיין את קינן פרייברג – מייסד שותף בסונו (Suno)
ומה עם סם אלטמן ו-OpenAI? יותר ציפיות מתוצאות
השבוע, למרות הציפיות הרבות, OpenAI לא סיפקו שום דבר מרגש במיוחד. היה הייפ סביב נושא התותים, אך בינתיים לא הגיעו תוצאות מיוחדות. אם אתם לא בלופ ועדיין לא מבינים מה הקשר בין תותים, צירוף האותיות והתווים Q ו-*, ציוצים בטוויטר וסנאי – ממליץ לכם לקרוא את המאמר המרתק של עומר הררי, שעוסק בחרושת השמועות על המודל המפלצתי שאלטמן בונה במרתפי החברה.
גוגל: חידושים בתחום החומרה והתוכנה
גוגל דווקא כן שיחררו כל מיני דברים מעניינים. הם הציגו את יכולות ה-AI במכשיר החדש שלהם ״פיקסל 9״. תוכלו לדבר עם ג’מיניי ישירות דרך המכשיר הנייד ולבקש ממנו לעזור לכם לעשות שופינג, ליצור תמונות, ואף לכתוב מיילים (אפילו בסגנון שייקספיר אם מסיבה לא ברורה זה משהו שתרצו לעשות). יכולות עיבוד התמונה והוידאו של המכשיר יוכלו להמליץ לכם על מתכונים, לאור המוצרים הזמינים במקרר שלכם (האם יצא טעים או לא – על אחריותכם בלבד). יכולות חיפוש מתקדמות ואינטואיטיביות, מצלמה מתקדמת עם יכולות אינפיינטינג וריטוש תמונות מובנות. שכחתם להוסיף את החברה לתמונה שבדיוק הלך לשירותים? פיצ’ר חדש יאפשר לכם להוסיף אנשים לתמונות גם לאחר שהתמונה צולמה.
החברה גם השקיעה בסרטון השקה מבדר במיוחד – ממליץ לכם לצפות בו.
האם באמת כל ההבטחות “מחזיקות מים”? עם המוניטין של גוגל אין לדעת, אבל דבר אחד בטוח – הם יודעים לייצר טלפונים חכמים מצוינים, כך שיש מצב שה”פיקסל 9″ יהיה אחלה סמארטפון.
גוגל גם שיחררו לעולם (בארה״ב כרגע) את מודל התמונה הלא פראייר שלהם Imagen 3. בסרטון הזה תוכלו לראות דוגמאות לתוצרים של המודל המעניין הזה, וגם הצצה לאופן בו הוא עובד.
פה תמצאו עוד מידע על Imagen3, ואם יש לכם VPN, תוכלו להתנסות בו באתר הבא (שכן הוא לא זמין בישראל בעת הזו).
גוגל גם הנחיתו מחירים ל Gemini Flash וסה״כ ממשיכים להרביץ עבודה (אם כי נהנים ממוניטין נמוך עדיין). במרוץ ה-AI לגוגל יצא שם רע, אבל הם עושים מאמצים כבירים כדי לשחרר טכנולוגיות חדשות ומוצרים מעניינים. אני מוכן לתת להם צ’אנס.
אילון מאסק והבלאגן של גרוק 2
כרגיל, אילון מאסק מצליח לעשות בלגן – הפעם מדובר בשחרור מודל גרוק 2 (למשלמים) ברשת X (לא להתבלבל עם Groq – זה משהו אחר). המודל מייצר תכנים ללא צנזורה ואף תמונות המבוססות על Flux.
ואם כבר מדברים (שוב) על Flux, שימו לב לתמונה הבאה: קפצתי לביקור מול נחל ערוגות – תצפית מאזור פני קדם. טוב נו… לא באמת. נראה לכם שמישהו יכול לצאת מהבית בימים טרופים אלה?! מזל שיש את Flux.