כל פריים בקליפ הזה נולד מתוך פרומפט. הדמויות, הנופים, התנועה, הקאטים - שום מצלמה לא הופעלה ושום סט לא נבנה. מאור אדרי לקח ארבעה כלי AI שונים, נתן לכל אחד מהם תפקיד מדויק בשרשרת ההפקה, וחיבר ביניהם לכדי תוצר אחד שלם. זה לא קסם של כפתור אחד, אלא עבודת הרכבה. ודווקא בגלל זה כדאי להבין איך היא עבדה.
במשך שנים ההפרדה בין מי שיכול להפיק קליפ למי שלא הייתה עניין של תקציב וציוד. צריך מצלמה, צריך לוקיישן, צריך תאורה, צריך אנשים. היום ההפרדה הזו מוחלפת בהפרדה אחרת, עדינה יותר: בין מי שיודע להפעיל כלי בודד למי שיודע לתזמר כמה כלים יחד. הקליפ של מאור אדרי הוא דוגמה טובה להבדל הזה, כי הוא לא נבנה מכלי אחד אלא מארבעה, וכל אחד מהם נבחר בגלל מה שהוא עושה הכי טוב.
נוי פדלון- ואלס, קליפ שנבנה כולו מ- AI
שלב ראשון: לבנות את הדמויות והעולם
לפני שיש תנועה, צריך שיהיה מה שזז. השלב הראשון בכל הפקה ויזואלית הוא הקמת הדמויות והפריימים הראשונים, ולכאן מאור גייס שני כלים שונים ליצירת התמונות והדמויות: GPT Image 2 ו-Nano Banana Pro.
נאנו בננה פרו (Nano Banana Pro) הוא שמו המוכר של מודל הדימוי של גוגל, Gemini 3 Pro Image. מה שהופך אותו מתאים במיוחד להפקה כזו הוא היכולת לשמור על עקביות של דמות - אותם תווי פנים, אותו לבוש, אותם פרטים - לאורך תמונות שונות. בהפקת קליפ, שבה אותה דמות חוזרת בעשרות שוטים, העקביות הזו היא לא מותרות אלא תנאי בסיסי. בלעדיה הצופים מרגישים שמשהו מתחלף בלי לדעת לומר מה.
לצידו נכנס GPT Image 2, מודל הדימוי של OpenAI, שמביא איתו רגישות שונה לפרומפט ולסגנון. השימוש בשני מודלים במקביל הוא בחירה מודעת: כל מודל מצטיין בדברים אחרים, וכשבונים עולם ויזואלי שלם נוח לשלוף מכל אחד את מה שהוא עושה הכי יפה. בשלב הזה נולדים הנכסים הסטטיים - הדמויות והפריימים שישמשו בהמשך כעוגן לכל מה שיבוא אחריהם.
שלב שני: לבנות עולם שבו הכל קורה
דמות בלי סביבה היא חצי תמונה. את הלוקיישנים מאור בנה ב-Higgsfield Cinema Studio, סביבת הפקה שתוכננה סביב היגיון של צילום אמיתי ולא של ג'נרוט אקראי. במקום לייצר תנועה מקרית, הכלי מדמה מערכות מצלמה, עדשות והתנהגות תאורה, ומאפשר ליוצר לשלוט בעומק שדה, באורך מוקד ובמיקום מקור האור.
ההיגיון הזה חשוב במיוחד כשמדובר בלוקיישנים. סביבה קולנועית טובה היא לא רק רקע יפה, אלא מרחב עקבי שדמות יכולה לנוע בתוכו מבלי שהפרטים יקרסו בין שוט לשוט. Cinema Studio נבנה בדיוק כדי לתת את התחושה שהתמונה צולמה על ידי צוות עם מצלמה פיזית, ולא חושבה על ידי תוכנה. כך נוצר העולם שבתוכו הדמויות שכבר קיימות יכולות לפעול.
שלב שלישי: להזיז הכל
כאן מגיע הרגע שבו תמונה הופכת לסרט. בכל אחד מהשוטים בקליפ מאור השתמש באופן בלעדי ב-Seedance 2.0, מודל הווידאו של בייטדאנס (Bytedance), באיכות 1080P. הבחירה לעבוד עם מודל אחד ויחיד לכל הווידאו אינה מקרית, והיא נוגעת לבעיה המוכרת ביותר בווידאו מבוסס AI.
למה עקביות קובעת הכל
הבעיה הגדולה של וידאו AI מאז ומתמיד הייתה הסחף: פנים שמשתנות בין פריימים, לבוש שמתחלף, סגנון שזז. Seedance 2.0 בנוי במיוחד סביב שמירה על עקביות של פנים, לבוש, טקסט וסביבה לאורך כל הסרטון, והוא תומך בסיפור רב-שוטים שבו דמות נשארת זהה מהפריים הראשון ועד האחרון. כשכל השוטים יוצאים מאותו מודל, הסיכוי שהקליפ ירגיש כמו יחידה אחת גדל משמעותית.
איכות 1080P היא החלטה, לא ברירת מחדל
הבחירה ב-1080P גם היא נקודה ששווה לעצור עליה. ב-Seedance 2.0, רזולוציית 1080P במצב הסטנדרטי היא מה שמספק פלט חד ומוכן להפקה, להבדיל ממצבים מהירים יותר שמיועדים לבדיקת רעיונות. במילים אחרות, מי שבוחר 1080P מאותת שהוא לא מתנסה אלא מפיק. זו ההחלטה שמפרידה בין סקיצה לבין תוצר סופי.
ההרכבה היא העבודה האמיתית
אם מסתכלים על השרשרת כולה, מתחיל להתבהר עיקרון. כל כלי כאן ממלא תפקיד שהוא הכי טוב בו: שני מודלי דימוי לבניית הדמויות והפריימים, סביבת הפקה קולנועית ללוקיישנים, ומודל וידאו יחיד שמחזיק את כל התנועה תחת אותו קו ויזואלי. אף אחד מהכלים לא נועד לעשות את הכל לבד, והניסיון להעמיס עליו יותר מדי הוא בדיוק מה שמייצר את התוצאות החובבניות שכולנו מזהים מרחוק.
מה שמאור אדרי עשה כאן הוא פחות "להפעיל AI" ויותר לנהל פס ייצור. הוא חילק את ההפקה לשלבים, התאים לכל שלב את הכלי הנכון, ודאג שהמעברים ביניהם יישמרו עקביים. זו מיומנות שדומה הרבה יותר לעבודת במאי או מפיק מאשר לעבודת טכנאי, וזה אולי הדבר המעניין ביותר בכל הסיפור.
השאלה שנשארת פתוחה היא לא האם אפשר ליצור קליפ שלם בלי מצלמה - את זה כבר ברור שאפשר. השאלה היא מה הופך תוצר כזה למשהו ששווה לצפות בו, וכאן התשובה מפתיעה בכמה שהיא ישנה: לא הכלי, אלא מי שמחזיק את כל החוטים ויודע לאן הוא מוביל אותם. הטכנולוגיה השתנתה לגמרי, אבל ההבדל בין יצירה טובה לבינונית נשאר בדיוק במקום שבו הוא תמיד היה.










