ב־12.6.24 הכריזה חברת Leonardo AI על השקת המודל החדש שלה, “פניקס”, אשר מבטיח לחולל שינוי משמעותי בתחום יצירת התמונות בעזרת בינה מלאכותית. המודל החדש זמין כעת לכל המשתמשים דרך כלי Image Gen V2. פשוט פתחו את התפריט המוגדר מראש, בחרו בפריסט של “פניקס” והתחילו ליצור עם המודל החדש. אבל רגע… מה כל כך מיוחד בו?
רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.
אפשר גם להרשם לניוזלטר שלנו
מה מיוחד בפניקס?
לפני הכול חשוב לציין שלא מדובר בעוד מודל המבוסס על סטייבל דיפיוז’ן כמו כל שאר המודלים של לאונרדו. מחלקת הפיתוח של החברה עמלה על המודל ופיתחה אותו בעצמה – הוא מתבסס על ארכיטקטורה ייחודית שפותחה בלאונרדו (וכאמור – לא על סטייבל). מעבר לכך (או אולי בשל כך), יש לו ‘הבנה’ טובה יותר של פרומפטים (מה שהיה חסר מאוד במודלים של סטייבל שדרשו תיאורים מילוליים מפורטים ומדויקים), ולא פחות חשוב – הוא יכול לג’נרט טקסט!
להלן עיקרי החידושים:
- בהירות גדולה יותר בהבנה של פרומפטים: אחד היתרונות הבולטים של “פניקס” הוא היכולת שלו לפרש בצורה טובה ובהירה את הפרומפטים של המשתמשים גם אם הם דלים יחסית או קצרים. המודל מצטיין בהבנת הפקודות וביישומן באופן עקבי ומדויק.
- יכולת לג’נרט בהצלחה טקסט: לאחר שדאלי3, אידאוגרם ומידג’רני (החל בגרסה 6) שדרגו את המודלים שלהם ואפשרו ג’ינרוט טקסט, עכשיו גם לאונרדו יכול! המודל מסוגל לייצר טקסט ברור ומדויק, ולכן הוא מתאים במיוחד לשימוש בכרזות, בפוסטרים ובלוגואים (כמובן רק באנגלית ולא בעברית). פשוט רשמו לו מה אתם רוצים שיהיה כתוב בתמונה, למשל: בחורה ישראלית צעירה בנמל יפו מחזיקה שלט שעליו כתוב: “שלום ישראל”, או קצת יותר באריכות:
A young woman with sun-kissed skin and bright, inquisitive eyes, standing in front of the vibrant backdrop of Tel Aviv’s Jaffa Port, holding a handmade cardboard sign that reads “Hello, Israel!” in bold, multicolored letters, photography style reminiscent of iconic National Geographic covers, warm, golden light casting a flattering glow, with hints of blue from the Mediterranean Sea and earthy tones from the ancient port’s stone walls, capturing the essence of wanderlust and adventure, with a sprinkle of Israeli flair and a sense of hope.
- איכות תמונה משופרת: המודל מפגין ביצועים טובים מאוד – צבעים חיים יותר, פרטים חדים יותר ואסתטיות כללית משופרת בתמונות.
- עריכת תמונות: לראשונה אנחנו מקבלים ב”פניקס” יכולות עריכה בעזרת פקודות ישירות מתוך ממשק המחולל (ולא דרך הקנבס של לאונרדו), וזה מאפשר למשתמשים לבצע שינויים מהירים וקלים ולהגיע לתוצאות מדויקות בזמן קצר. מדהים! לחיצה על אייקון העיפרון המופיע לאחר שהתמונה מוכנה, מאפשרת להזין הנחיות טקסט וכן בקשות לשינויים. ראו סרטון מטה.
Modify your creations with simple text commands.
Changing colors, adding new elements, we make it really easy. 🏀
Try our new Phoenix model and AI Edit! 👉 https://t.co/5ILYaLkesN pic.twitter.com/cDQgqylJfS
— Leonardo.Ai (@LeonardoAi_) June 18, 2024
למשל, בתמונה מטה ביקשתי מלאונרדו ליצור רובוט לבן. לאחר מכן ביקשתי ממנו למחוק מאפיינים אנושיים (כמו עיניים) מפניו של הרובוט ולשנות את הצבע שלו לאדום. את הבקשה הזנתי ממש כמו שמדברים לצ’טבוטים ולא כמו שלרוב נהוג להנדס פרומפטים במחוללי תמונות. זה מזכיר יותר את השיחות עם Dall-e3 בתוך ChatGPT ופחות את הנדסת הפרומפטים בלאונרדו או מידג’רני.
למי המודל החדש זמין?
פניקס זמין גם בחבילה החינמית וכמובן גם למנויים משלמים. העובדה שהוא זמין בחבילה החינמית היא יתרון רציני, שכן המודלים שיש בחבילה החינמית נחותים בהרבה לאלו שיש למי שמחזיק במנוי. לעומת זאת – פניקס מפגין ביצועים ברמה מאוד גבוה, מה שהופך אותו למודל המועדף והמומלץ לשימוש בחבילה החינמית. העובדה שאפשר לג’נרט בו טקסט ולבצע שינויים עם הנחיות טקסטואליות הופך אותו לשימושי ביותר עבור משתמשים מתחיל ומקצוענים כאחד.
מה פחות טוב?
חשוב לציין שאף על פי שמדובר במודל מצוין, נכון לעכשיו עדיין חסרים בו כמה פיצ’רים חשובים כמו Image Guidance (ממשק עריכת התמונות, קונטרול נט וסטייל רפרנס), Elements (היכולת להחיל מרקמים וטקסטורות ממאגר האלמנטים המובנה של לאונרדו) והפייפליין של Photoreal (פיצ’ר אהוב ושימושי במיוחד שמקפיץ כל תמונה לשמיים ומפיק תמונות גדולות ואיכותיות בהרבה).
אבל הסירו דאגה מליבכם, החברה מרגיעה ומספרת שהם עובדים על שילוב פיצ’רים אלו במודל החדש ושהכול יגיע בקרוב. אז קצת סבלנות ותהיה לנו פה פצצה של ייצור תמונות בקלות, במהירות ועם ורסטיליות מרשימה.
מסקנות ותובנות
ראשית, זה כיף לראות את הדרך שלאונרדו עושה (ועשתה) בשנים האחרונות. ממחולל תמונות בינוני מינוס למפלצת AI שנותנת פייט גם למידג’ני (ובהצלחה רבה).
שנית, אני שמח לראות שהחברה מתחילה לפתח מודלים משלה ומפסיקה את התלות בסטייבל. זה מעיד על חברה עם חזון שלא מפחדת להשקיע משאבים ולקחת סיכונים. לאונרדו תמיד הייתה ידועה כחברה שלא מפסיקה לשחרר חידושים, שיפורים וכלים חדשים, ואני שמח לראות שהמסורת הזאת לא נפסקת ואף תופסת תאוצה.
שלישית (ואולי הכי חשוב), בסופו של יום פניקס הוא מודל לא רע בכלל! התוצרים שלו טובים, הוא יודע לג’נרט טקסט, יש לו יכולות עריכה מובנות, וכל אלו הופכים אותו למודל שממש כיף לעבוד איתו! הוא מציג שיפורים טכנולוגיים משמעותיים בתחומי האיכות, הדיוק והשליטה היצירתית.