הנפשת ודיבוב אווטרים | Let's AI בינה מלאכותית

האם הוליווד ניצבת בפני עידן חדש של כוכבים סינתטיים?

מערכת האתר — Fri, 10 Oct 2025 07:58:29 +0000

שחקנית בינה מלאכותית ראשונה בדרך לחוזה ייצוג בהוליווד. אחרי עשרות שנים של דמויות ממוחשבות, אפקטים דיגיטליים ושחקנים שהוחזרו לימי נעוריהם באמצעות CGI (Computer Generated Imagery), מגיעה שחקנית שלא נולדה כלל. לא שדרוג טכנולוגי, אלא נקודת מפנה תרבותית – רגע שבו המציאות הקולנועית והבינה המלאכותית מתמזגות לראשונה באמת.

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

אפשר גם להרשם לניוזלטר שלנו

טילי נורווד והשפעתה על הוליווד

טילי נורווד (Tilly Norwood) היא השחקנית הראשונה שנוצרה כולה בבינה מלאכותית – לא כפיל דיגיטלי ולא דמות שנבנתה על בסיס אדם אמיתי. מאחוריה עומדת חברת הכישרונות החדשה Xicoia, שהציגה אותה לראשונה בכנס Zurich Summit בשוויץ. על פי דיווחים ב-Deadline וב-Variety, סוכנויות כישרונות מהגדולות בהוליווד כבר מנהלות מגעים להחתים אותה, או, ליתר דיוק, את יוצריה, על חוזה ייצוג רשמי.

אלא שההתלהבות הטכנולוגית לוותה בגל התנגדות כמעט מיידי. בתוך שעות מפרסום הידיעה, החלו שחקנים אמיתיים להביע זעם ברשתות החברתיות. השחקנית מליסה בררה (Melissa Barrera) קראה לחרם על כל סוכן שיחתים את טילי, קירסי קלמונס (Kiersey Clemons) דרשה לחשוף את שמות המעורבים, וג’נה לי גרין (Jenna Leigh Green) פנתה פומבית לארגון SAG-AFTRA (איגוד השחקנים האמריקאי) בשאלה: “מה תעשו בעניין הזה?”.

האיגוד הוא אחד הגופים החזקים ביותר בתעשיית הבידור בארצות הברית. הוא מייצג למעלה מ-160 אלף אנשי מקצוע – שחקנים, מדובבים, מגישי טלוויזיה ורדיו, שדרנים ועוד. תפקידו להגן על זכויות היוצרים והעובדים בתעשייה, לנהל מו״מ על שכר, תמלוגים ותנאי עבודה, ולפקח על שימוש בליקויים דיגיטליים, כמו Deepfakes או דמויות שנוצרו בבינה מלאכותית.

בשנה האחרונה SAG-AFTRA הפך לדמות מרכזית בדיון סביב AI בהוליווד, במיוחד אחרי השביתה הגדולה של השחקנים ב-2023, שבה אחת הסוגיות המרכזיות הייתה בדיוק זה – החשש שהאולפנים ישתמשו בבינה מלאכותית כדי להחליף או לשכפל שחקנים אמיתיים בלי הסכמתם או ללא תגמול הולם.

היא לא קיימת – אבל אולי היא תזכה באוסקר הבא?

הטכנולוגיה מאחורי טילי

טילי נורווד איננה העתק של שחקנית אמיתית, אלא דמות סינתטית מקורית שנוצרה מאפס. פניה, קולה ותנועותיה עוצבו על בסיס אלפי דגימות חזותיות וקוליות, שעובדו באמצעות מודלים גנרטיביים מתקדמים, אותם מנגנונים שמאפשרים למכונות ליצור תוכן חדש על בסיס דפוסים של נתונים קיימים. לדברי חברת Xicoia, טילי מסוגלת לשחק, לאלתר, לשוחח עם מעריצים בזמן אמת, ולהתפתח מדמות אחת לאחרת, ממש כמו שחקנית אנושית, רק ללא מגבלות של גיל, עייפות או זמינות.

הופעת הבכורה בציריך

בכנס Zurich Summit הוצגו ראיונות וקטעי וידאו שבהם טילי שוחחה עם מנחים ונראתה טבעית לחלוטין. היא שמרה על קשר עין, הגיבה לשאלות בזמן אמת ואף הפגינה הומור. כמה מהנוכחים הודו לאחר מכן כי “שכחו לרגע שהיא בכלל לא קיימת” – עדות לכך שהקו בין מציאות לבינה מלאכותית נעשה דק במיוחד.

חדשנות או איום קיומי?

בעוד שחלק מיוצרי הקולנוע רואים במהלך הזה פריצת דרך אמנותית, רבים אחרים – שחקנים, במאים ואיגודים מקצועיים – מזהירים מפני השלכות עמוקות על עתיד המקצוע. השאלות שמרחפות מעל הוליווד אינן רק טכניות, אלא מהותיות:

למי שייכת דמות שנוצרה ממאות פנים אמיתיים?
מי זכאי לתמלוגים כשדמות כזו מופיעה שוב ושוב בפרויקטים שונים?
ומה יעלה בגורל הגיוון הייצוגי על המסך, אם ניתן “לאמן” דמות אחת ולשכפל אותה לנצח?

החשש המרכזי הוא שהקולנוע יאבד את אנושיותו, את הרעב, הפגיעות והקסם האנושי שמהם נולדו ההופעות הגדולות באמת.

בצד השני של המתרס ניצבים האולפנים וחלק מהיוצרים, הרואים במהלך הזה לא איום אלא מהפכה הכרחית. לדבריהם, שחקניות בינה מלאכותית מייצגות קפיצת מדרגה טכנולוגית שתאפשר הפקות יעילות, בטוחות וזולות יותר: אין לוחות זמנים נוקשים, אין פציעות על הסט, אין מחסומי שפה, והביצועים ניתנים לכיוונון אינסופי. תומכים רבים טוענים כי השאלה היא כבר לא האם נשתמש בדמויות כאלה – אלא כיצד נעשה זאת באחריות.

מה המשמעות הרחבה יותר?

הדיון סביב טילי נורווד הוא לא רק טכנולוגי,הוא קודם כל תרבותי. הוא נוגע בליבה של השאלה מהי יצירתיות אנושית, ומה נותר ממנה כשמכונה לומדת לחקות אותה בצורה מושלמת. האם משחק הוא ביטוי אמיתי של רגש, או רק אשליה משכנעת שלו? האם חשוב לנו לדעת שהדמות על המסך באמת חשה משהו, או די בכך שהיא גורמת לנו להרגיש? וכשדמות יכולה להשתנות בלחיצת כפתור, מה נותר מהחוויות האנושיות שעליהן נבנה הקולנוע?

לא מעט פרשנים כבר השוו את הרגע הזה ל”מהפכת נאפסטר” של תחילת שנות ה-2000, כשעולם המוזיקה נאלץ להמציא את עצמו מחדש מול הדיגיטציה. גם כאן, הוליווד ניצבת מול אתגר דומה – להגדיר מחדש מהו שחקן, מי הבעלים של דמות, ואיך מאזנים בין זכויות אדם לבין זכויות אלגוריתם.

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס יצירת סרטים עם AI

הבחירה הבאה של הוליווד

ארגון SAG-AFTRA הודיע כי הוא עוקב מקרוב אחר ההתפתחויות, בעוד סוכנויות הכישרונות הגדולות בהוליווד מנסות להבין אם מדובר בהזדמנות עסקית פורצת דרך, או בקו אדום ציבורי שאסור לחצות. אם טילי אכן תוחתם ותזכה בתפקידים אמיתיים, והקהל יקבל אותה כדמות לגיטימית, כללי המשחק עלולים להשתנות בן לילה.

כך או כך, הגבול בין אדם למכונה כבר כמעט ואינו קיים. הופעתה של טילי נורווד אינה התחלה, אלא המשך טבעי למגמה רחבה בעולמות הווידאו והאווטארים. כלים כמו Sora 2 של OpenAI, מערכות יצירת אווטארים מתקדמות כמו HeyGen ,D-ID ו-Synthesia, ועוד מגוון רחב של כלים, מייצרים תוצרים שקשה יותר ויותר להבחין אם הדמויות בהן אמיתיות או לא.

בעולם שבו כל אחד יכול לעצב ולביים דמות מציאותית בלחיצת כפתור, הוליווד כבר לא שולטת באופן בלעדי בנראטיב של דמיון וייצוג, והשאלה שצריך לשאול היא לא רק אם נזהה שהשחקנים על המסך אינם אמיתיים, אלא האם זה בכלל יפריע לנו? הוליווד אולי משקפת את הפנטזיות שלנו, אבל ברגע הזה היא גם מציבה לנו מראה – עד כמה אנחנו באמת מוכנים לוותר על האנושיות בשם היצירתיות?

הפוסט האם הוליווד ניצבת בפני עידן חדש של כוכבים סינתטיים? הופיע ראשון בLet's AI בינה מלאכותית

D-ID רוכשת את Simpleshow במרוץ לאווטארים העסקיים

מערכת האתר — Thu, 25 Sep 2025 07:15:21 +0000

חברת D-ID הישראלית, שהפכה בשנים האחרונות לשחקנית בולטת בתחום האווטארים האינטראקטיביים, הודיעה על עסקת רכישה אסטרטגית של Simpleshow הגרמנית. המהלך נועד לחזק את מעמדה בשוק התקשורת הארגונית הדיגיטלית – תחום מתפתח שבו סטנדרטים חדשים עדיין מתגבשים והתחרות מתעצמת.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

היסודות והמניעים לעסקה

D-ID, שמפתחת אווטארים אינטראקטיביים בעלי יכולות שיחה טבעיות, הודיעה החודש כי תרכוש את Simpleshow, חלוצה ביצירת סרטוני הסברה ארגוניים מבוססי בינה מלאכותית. היקף העסקה לא נמסר רשמית, אך לפי פרסום ב-CTech הוא מוערך בכ-60 מיליון דולר. השלמת המיזוג צפויה ברבעון הרביעי של 2025, בכפוף לאישור רגולטורי.

מבחינת היקף כוח האדם, לפי TechCrunch החברה המאוחדת תפעל עם כ-140 עובדים בשלושה מרכזים – ישראל, ברלין וארה”ב. גם אם המספרים המדויקים משתנים בין פרסומים, הכיוון ברור: D-ID עוברת קפיצה תפעולית מסטארטאפ רזה לפעילות תאגידית בקנה מידה גדול.

מה מרוויחה D-ID מהרכישה

הנכס המרכזי הוא לא רק טכנולוגיה אלא גם גישה ללקוחות ארגוניים גדולים. Simpleshow מביאה איתה מעל 1,500 לקוחות אנטרפרייז, מאות מהם חברות Fortune, לרבות שמות כמו מיקרוסופט, מקדונלד’ס, eBay ו-BMW. זו מקפצה מיידית עבור D-ID לעבודה בהיקפי אנטרפרייז שבדרך כלל דורשים שנות חדירה ארוכות.

מבחינה מוצרית, השילוב בין טכנולוגיות הזמן-אמת של D-ID לבין פלטפורמת ההסברה של Simpleshow מאפשר לבנות “עובדים דיגיטליים” – נציגי מכירות, מדריכים או עוזרי HR שמנהלים שיחות והדרכות אינטראקטיביות בזמן אמת. האתגר הוא להוכיח שזה לא רק דמו נוצץ, אלא כלי עבודה שמייצר ערך מדיד בארגונים.

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס בינה מלאכותית במשרד

להפוך את התקשורת הארגונית לדיגיטלית ואישית

מנכ”ל D-ID, גיל פרי: “המטרה שלנו היא להפוך את התקשורת הארגונית ליותר אנושית, נגישה ויעילה. החיבור בין טכנולוגיות שתי החברות מציב אותנו בחזית שוק האווטארים האינטראקטיביים ומשדרג משמעותית את הערך שנציע ללקוחות”. החזון נשען על צורך אמיתי בארגונים גלובליים – להנגיש ידע והדרכות בקנה מידה גבוה תוך חוויות אישיות. השאלה הפתוחה היא האם אווטארים יהפכו לכלי יומיומי בעולמות L&D, תמיכת לקוחות ומכירות, או שיישארו פתרון נקודתי.

Simpleshow, שצמחה מסוכנות תוכן לפלטפורמת SaaS בינלאומית, מביאה ניסיון בחדירה לארגונים גדולים ומספקת ל-D-ID תשתית ייצור, פריסה ותפעול בהיקף גלובלי. יחד עם זאת, עם לקוחות גדולים מגיעות גם ציפיות גבוהות למדדים עסקיים, אבטחת מידע ואינטגרציה מהירה.

אתגרי השוק והתחרות

D-ID מתחרה בשוק שבו הקו בין חדשנות להייפ דק. מולה ניצבות חברות כמו Synthesia, שגייסה בינואר 2025 עוד 180 מיליון דולר, ו-Soul Machines, וכן ענקיות כמו גוגל ומקינזי שמפתחות פתרונות אווטאר לארגונים כחלק ממערכי מוצר רחבים יותר. התחזיות לשוק נעות סביב קצב צמיחה שנתי מואץ של כ-30 עד 40 אחוז, אך המשמעות הפרקטית היא אחת – צריך להראות שימושיות אמיתית, סקייל ואינטגרציה ולא רק טכנולוגיה מרשימה.

כיצד הרכישה עשויה להשפיע על הענף

אם המיזוג יצליח, שילוב האווטארים של D-ID עם תשתית ההסברה של Simpleshow יכול לשנות את הדרך שבה ארגונים מדריכים עובדים ומדברים עם לקוחות – ממדריכים דיגיטליים שמנהלים שיחה אישית ועד מערכי הדרכה אוטומטיים בקנה מידה עולמי. ההצלחה אינה מובטחת – מיזוגים בינלאומיים מורכבים נכשלו בעבר, והמעבר מדגמות לכלים שמספקים ערך יומיומי הוא מבחן קשה. הקרב האמיתי יוכרע ביכולת של החברה המאוחדת להטמיע “עובדים דיגיטליים” בשגרה הארגונית ולהראות ROI ברור מול מתחרות עתירות משאבים.

הפוסט D-ID רוכשת את Simpleshow במרוץ לאווטארים העסקיים הופיע ראשון בLet's AI בינה מלאכותית

מדריך ליצירת אווטאר מדבר ב‑Higgsfield Speak

מערכת האתר — Tue, 17 Jun 2025 05:20:27 +0000

בואו נדבר תכלס – ליצור סרטון טוב לוקח זמן, דורש להצטלם שוב ושוב, לערוך, לתקן טעויות, ולהוציא כסף על קריינות בשפות שונות. כאן Higgsfield נכנסת לתמונה: עם אווטרים מדברים, כל תמונה – הפנים שלכם, דמות מצוירת או אפילו סמל מותג – הופכת לדמות וירטואלית שמדברת, מביעה רגש ומעבירה את המסר בדיוק כמו שתכננתם. בלי מצלמה, בלי לחץ, ובלי צוות הפקה שגוזל שעות וכסף.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

רקע על Higgsfield

Higgsfield היא פלטפורמה אמריקאית שהוקמה בסן פרנסיסקו ב-2023 במטרה לשבור את הגבולות של יצירת וידאו דיגיטלי. עם טכנולוגיה מבוססת GenAI מתקדמת ומימון צמיחה מרשים, Higgsfield נותנת לכל יוצר, מאמן פרילנסר ועד צוותי שיווק ותוכן בארגונים, את היכולת להפיק וידאו ברמה קולנועית בלחיצת כפתור, ללא צורך בציוד צילום או בידע טכני כבד.

באחרונה הראינו איך כל אחד יכול להפוך תמונה פשוטה לסרטון קצר ב-Higgsfield עם תנועות מצלמה דרמטיות, אפקטים חזותיים מרשימים ותחושת עומק אמיתית – כולל טיפים מעשיים לשליטה בזוויות הצילום. בנוסף, יש לכם גם מדריך על Higgsfield Ads, שמאפשר להפיק פרסומות חכמות ואוטומטיות תוך דקות. עכשיו הגיע התור של תכונת Higgsfield Avatars – שמכניסה גם את הפנים והקול שלכם לתמונה, ונותנת לכם שליטה מלאה על הופעה וירטואלית, מדברת ומשכנעת.

מה זה Higgsfield Speak?

Higgsfield Speak הוא שירות AI מתקדם שמקבל כל תמונה, בין אם זו הפנים שלכם, דמות מצוירת או חיית מחמד, ומנפיש אותה כך שתדבר בטבעיות, תשדר רגש ותגיב בצורה קולנועית. עם סנכרון שפתיים מדויק, הבעות פנים חלקות ושילוב תנועות מצלמה ו-VFX, הכל נעשה בענן – ללא התקנות מורכבות, ללא צורך בציוד צילום, וללא צוות הפקה.

מה אפשר לעשות עם זה?

ליצור סרטוני וידאו מקצועיים מבלי להצטלם בכלל.

להעביר מסרים בשפות שונות – עם דמות אחת שמבצעת את אותו טקסט במספר שפות בקלות.

להחיות טקסטים כתובים ולהפוך אותם למצגת וידאו עם שפת גוף, הבעות פנים ודיבור טבעי.

להפיק סרטוני הסברה, תכנים חינוכיים, שיעורים מקוונים ופרסומות ברשתות חברתיות – תוך חיסכון בזמן ובכסף.

לשדרג תקשורת פנים-ארגונית בעזרת הודעות וידאו מותאמות אישית במקום מיילים יבשים.

להגדיל קצב פרסום וידאו קבוע מבלי לשבור את הראש על יום צילום וצוות הפקה.

איך זה עובד בפועל – שלב אחרי שלב

1. פותחים חשבון: נרשמים באתר עם חשבון הגוגל שלכם ובוחרים באפשרות של Speak בסרגל העליון.

מבט מהיר על הממשק והסגנונות

2. מבט מהיר על הממשק והסגנונות: תוכלו לראות דמויות וסגנונות מוכנים מראש – לחצו Recreate כדי להתחיל להפוך אותם לגרסה האישית שלכם. תוכלו לבחור פורמט תוכן (פודקאסט, וידאו-בלוג, הרצאה וכו’), רקע, תנועות מצלמה ואפקטים נלווים – ואפשר גם לשחק עם כמה שילובים.

3. בוחרים תנועה (Motion) ומעלים תמונה: בחרו Motion מתאים, העלו תמונה ברורה פונה קדימה – או השתמשו באווטאר מובנה מהמערכת.

4. מוסיפים קול: אפשר לבחור קריינות AI אוטומטית ממגוון רחב של קולות שתקריין את הטקסט בצורה רגשית – או להעלות קובץ קול שלכם לסנכרון מדויק. יש אופציה גם לבחור סאונד מלווה לסרטון ממגוון אפשרויות מערכת.

5. כותבים את הטקסט: כתבו טקסט קצר עד 200 מילים, בשפה טבעית ועם נימה רגשית – זה יבטיח דיבור משכנע יותר. אפשר לכתוב בכל שפה שנתמכת.

6. יוצרים ומורידים: לחצו Generate, המתינו מספר דקות בהתאם לאורך הווידאו – והורידו את הסרטון המוכן לשיתוף מיידי.

איך ליצור אווטאר מדבר בהיגספילד?

רוצים שהאווטאר שלכם ידבר בעברית? פשוט תקליטו את הטקסט בקול שלכם (או תייצרו קול בעברית בכלי TTS חיצוני), תעלו את קובץ האודיו ל‑Higgsfield והמערכת תסנכרן את השפתיים וההבעות בדיוק לקול שהבאתם.

כמה זה עולה?

קודם כל, יש אפשרות להתנסות חינמית והיא מאפשרת לנסות את Higgsfield Speak בלי להתחייב! Higgsfield מציעה חבילת ניסיון חינמית שמגיעה עם קרדיטים ראשוניים ליצירת שני סרטונים קצרים, כולל גישה מלאה לפיצ’רים כמו תנועות מצלמה, VFX והאווטרים המדברים עצמם. יתכן שתקבלתו תוצר עם סימן מים (לא תמיד), ובכל מקרה, ההפקה מתבצעת בענן – כך שתוכלו להרגיש את הכוח של הכלי ולבדוק אם הוא מתאים לצרכים שלכם לפני קנייה.

למי שניסה והתלהב – Higgsfield מציעה שלוש תוכניות חודשיות במחירים נוחים, לפי היקף השימוש:

9 דולר לחודש (Basic): כולל 150 קרדיטים בחודש (0.30 דולר לכל 5 קרדיטים), לשימוש בסיסי עם גישה למודל Lite.
29 דולר לחודש (Pro): כולל 600 קרדיטים בחודש (0.24 דולר לכל 5 קרדיטים), מאפשר עד 3 משימות במקביל, גישה למודל Turbo ותכונות נוספות כמו Higgsfield Speak.
79 דולר לחודש (Ultimate): כולל 1500 קרדיטים בחודש (0.23 דולר לכל 5 קרדיטים) ועוד 200 קרדיטים נוספים בחודש הראשון. מתאים לפרויקטים גדולים עם עד 4 משימות במקביל, גישה מוקדמת לפיצ’רים חדשים ושימוש מלא ב-Higgsfield Speak.

כל סרטון אווטאר מדבר צורך בממוצע 20-50 קרדיטים, תלוי באורך ובמורכבות, והקול מבוסס ה-AI עולה קרדיט אחד נוסף. שימו לב: הקרדיטים שלא מנוצלים במהלך החודש מתאפסים עם תחילת מחזור החיוב הבא. מי שצריך יותר – יכול לשדרג או לרכוש חבילות קרדיטים נוספות בכל רגע.

מחירים וקרדיטים (נכון ל-17 ביוני 2025)

כמה טיפים להפקה טובה

השתמשו בתמונה איכותית, מוארת וברורה – זה הבסיס לאווטר ריאליסטי ומשכנע.

כתבו טקסטים בסגנון דיבורי, טבעי ומלא רגש – ככל שהטקסט חי יותר, כך ההנפשה משכנעת יותר.

נסו כמה סגנונות וידאו ותנועות מצלמה – זה יעזור לכם למצוא את השילוב שהכי מתאים לסוג התוכן שלכם.

התחילו בפרויקטים קצרים ופשוטים – כך תבינו מהר איך הכלי מתנהג ותוכלו להרחיב בהדרגה לפרויקטים מורכבים יותר.

אתגרים ומגבלות שכדאי להכיר

למרות שהמערכת של Higgsfield Speak מציעה דרך מהירה ונוחה להפיק סרטונים קצרים ומרשימים, חשוב לדעת מראש שיש כמה מגבלות טבעיות: ברוב החבילות ובמיוחד בגרסה החינמית, הסרטונים מוגבלים באורך ונעים סביב כמה שניות בלבד, כך שהתוצאה מתאימה יותר לסצנות קצרות ולא לסרטונים ארוכים. הרזולוציה בדרך כלל מגיעה ב‑720p, מה שאומר שבצפייה על מסכים גדולים במיוחד ייתכן והווידאו ירגיש מעט רך או פחות חד. גם איכות התמונה המקורית משחקת תפקיד – תמונה מטושטשת או עם רקע עמוס עלולה לפגוע בריאליזם של ההנפשה. בסופו של דבר, Higgsfield לא מחליפה הפקה קולנועית מלאה, אלא מאפשרת להפיק במהירות תוצאה טובה מאוד לפרויקטים קצרים, תכנים לרשתות ולשימוש יומיומי – ובזה הכוח הגדול שלה.

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס יצירת סרטים עם AI

Higgsfield Speak הופך את מה שפעם דרש ציוד צילום, צוות הפקה ותקציב כבד – לפעולה פשוטה: מעלים תמונה, כותבים כמה שורות, והדמות הדיגיטלית שלכם מדברת, מביעה רגש ומשדרת מקצועיות. כל זה קורה בענן, במהירות ובקלות, ומאפשר ליצור תוכן איכותי בכל קנה מידה – לבד, בלי בזבוז זמן ובלי לשבור את התקציב. נסו, שחקו עם הסגנונות ותראו איך זה עובד בשבילכם.

הפוסט מדריך ליצירת אווטאר מדבר ב‑Higgsfield Speak הופיע ראשון בLet's AI בינה מלאכותית

הכירו את Speech-02 מבית MiniMax – טכנולוגיית טקסט-לדיבור איכותית בעברית

שחר גולן — Tue, 20 May 2025 12:51:40 +0000

האם סוף סוף יש פתרון לקול טבעי בעברית דרך בינה מלאכותית? מי שניסה בעבר להמיר טקסט בעברית לקול מכיר את התחושה: תוצאה רובוטית, הגייה משובשת, ולפעמים אפילו גיחוך. במשך שנים זה היה אתגר אמיתי – במיוחד עבור יוצרים, מפתחים, ומי שרצה לייצר תוכן בעברית שנשמע מקצועי. כעת, מודל חדש של טקסט-לדיבור מצליח לראשונה להישמע… פשוט טוב. זה עדיין לא מושלם, אבל זו קפיצת מדרגה אמיתית לדוברי עברית.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

הכירו את Speech-02 מבית MiniMax

חברת MiniMax הסינית, שהתפרסמה בעיקר בזכות מודל הווידאו המתקדם שלה וחלון ההקשר החריג של 4 מיליון טוקנים, השיקה לאחרונה את Speech-02 – מודל חדש לטקסט-לדיבור שמדגים ביצועים מרשימים במגוון שפות, כולל תוצאות מפתיעות גם בעברית. במבחנים עיוורים שבוצעו במסגרת פלטפורמת Hugging Face TTS Arena, משתמשים דירגו את דגימות הדיבור של המודל מעל אלו של ElevenLabs ושל OpenAI.

המודל החדש מגיע בשתי גרסאות, Speech-02-HD – מיועד למצבים שבהם האיכות היא קריטית: קריינות לסרטונים, פודקאסטים, סרטוני הדרכה, או כל פרויקט מוקלט שבו הקול צריך להישמע טבעי, חלק ומדויק ככל האפשר. ויש את Speech-02-Turbo – מותאם לשימושים בזמן אמת: בוטים קוליים, מוקדי שירות אוטומטיים, או אפליקציות שצריכות להשיב במהירות ובזרימה קולית סבירה – גם אם באיכות מעט נמוכה יותר.

אם אתם יוצרים תוכן מוקלט שבו איכות הקול היא קריטית – בחרו ב-HD וקחו בחשבון את זמן העיבוד הארוך יותר. אם אתם זקוקים לתגובה מהירה בזמן אמת – Turbo הוא הבחירה הנכונה.

איך עושים את זה?

הפלטפורמה הקולית של MiniMax, בתוך Hailuo AI, מאפשרת לשכפל את הקול שלכם ולהקליט טקסטים בקלות. כך תעשו את זה:

1. היכנסו ל: hailuoai.video והרשמו עם חשבון הגוגל שלכם או עם מייל וסיסמה.

2. עברו ללשונית AUDIO – כאן תעברו לממשק האודיו של Minimax. בתוך הממשק לחצו על VOICES ואז Create your voice clone.

3. כאן יש שלושה שלבים: בשלב ראשון (Step 1) תעלו קובץ קול באורך של 30–60 שניות (בקול שלכם כמובן), בשלב השני (Step 2) תנו שם לקובץ הקול שלכם ובשלב השלישי (Step 3) – שלב בחירת השפה – בחרו ערבית או יוונית (בהמשך נסביר למה).

4. לחצו על CONVERT והמתינו כ-2 דקות לסיום תהליך השכפול.

השלבים להפקת שכפול קול

לאחר שהסתיים תהליך השכפול, לחצו על USE ליד שם הקול שנוצר, הזינו טקסט בעברית בתוך החלון של Speech Synthesis (בלי ניקוד – שעלול לשבש את התוצאה), שימו לב על איזה מודל אתם (קחו בחשבון שמודל ה- Turbo מג׳נרט הרבה יותר מהר ממודל ה- HD), הפעילו את הטוגל Long Text בצד שמאל למטה של החלון ולבסוף לחתו לחצו Generate.

חשוב! המערכת מגדירה מבטא לפי השפה שנבחרה – אבל אם תבחרו Accent = Auto, היא תשתמש במבטא המקורי שהופק מההקלטה שלכם. ככה תשמרו על קול שנשמע באמת כמוכם – גם בעברית.

ההגדרה הזו משפיעה באופן ישיר על איך הקול ישמע, ובמקרה של טקסטים בעברית זה יכול לעשות את ההבדל בין קול טבעי לבין קול “שבור”.

ולמה לבחור דווקא ערבית או יוונית?

נכון להיום, עברית עדיין לא נתמכת רשמית בפלטפורמה. עם זאת, משתמשים שיתפו שהזנת טקסטים בעברית תוך בחירה בשפות אחרות (בעיקר ערבית ויוונית) הניבה תוצאות טובות – לפעמים מפתיעות באיכותן. מדובר לא בבחירה לשונית מדעית, אלא בתוצאה של ניסוי וטעייה: השפות הללו מאפשרות למודל “לזרום” עם עברית בצורה סבירה יחסית, תוך שמירה על טון ומבנה משפט תקינים. זוהי לא תמיכה רשמית, אלא פתרון מעשי למי שרוצה לבדוק איך המודל מתמודד עם עברית כבר עכשיו.

מה היתרונות המרכזיים?

פלטפורמת האודיו מבית MiniMax לא בולטת רק באיכות הקול המרשימה, אלא גם בפשטות השימוש ובשליטה המלאה שהיא מציעה. תוך דקות ספורות, אפשר לשכפל קול אישי מהקלטה קצרה ולכוונן אותו בדיוק לפי הצרכים שלכם: לשנות את מהירות הדיבור, להגביה או להנמיך את הטון, להוסיף אפקטים – והכול בלי צורך בידע טכני או תוכנה מורכבת.

גם אם ההקלטה הראשונית כוללת רעשי רקע, הפלטפורמה יודעת לנקות אותם ולהפיק קול ברור. ניתן ליצור עד שלושה קולות שונים לכל משתמש, גם בחשבון חינמי, ולהשתמש בקרדיטים ראשונים להתנסות – בלי התחייבות.

דברים שחייבים לדעת

פרטיות

Hailuo מופעלת על ידי חברה סינית, ונכון להיום לא פורסמו פרטים ברורים על אופן השימוש בהקלטות קול שמועלות לפלטפורמה. אין התחייבות לכך שהקלטות לא ישמשו לאימון עתידי של המודל. אם פרטיות הקול שלכם חשובה לכם – כדאי לקחת זאת בחשבון לפני ההעלאה.

המוצר עדיין בשלבי הבשלה

למרות ההתרגשות סביב האיכות, חשוב לזכור שמדובר במוצר שעדיין מתפתח. ייתכנו שיבושי הגייה, אינטונציה שאינה עקבית, ולעיתים תצטרכו לנסות כמה פעמים עד שתגיעו לתוצאה מספקת. לפעמים זה נשמע נהדר ולפעמים פחות.

הממשק באנגלית

המערכת מיועדת לשוק הגלובלי ואין בה תמיכה רשמית בעברית – לא בטקסטים ולא בממשק. עם זאת, השימוש עצמו אינטואיטיבי יחסית, ואפשר להתמצא גם בלי שליטה מלאה באנגלית.

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס מקיף לבינה מלאכותית - GenAI Master

זוהי אחת הפעמים הבודדות שבהן אפשר לומר בכנות: כן, אפשר לייצר קול בעברית שנשמע טבעי, איכותי – ואפילו מרשים. האם זו מהפכה מושלמת? ממש לא. אבל זו בהחלט קפיצת מדרגה לדוברי עברית שרצו פתרון שלא נשמע כמו רובוט משנות ה־90. אם אתם יוצרים תוכן, בונים מוצר, מדמיינים עוזר אישי, או סתם סקרנים – שווה לבדוק.

הפוסט הכירו את Speech-02 מבית MiniMax – טכנולוגיית טקסט-לדיבור איכותית בעברית הופיע ראשון בLet's AI בינה מלאכותית

עתיד הפרסומות והקליפים נמצא ב-AI

אביתר אדרי — Thu, 15 May 2025 11:20:21 +0000

יוצרי תוכן, משווקים, פרסומאים ואנשי קריאייטיב מכל התחומים מגלים לאחרונה שאפשר להפיק סרטונים מקצועיים, קליפים מרהיבים ופרסומות מדויקות – וכל זאת מבלי להוריד מצלמה אחת מהמדף. לא מדובר בקסם, אלא בתוצאה של שילוב מדויק בין יצירתיות אנושית לכלים של בינה מלאכותית. בעידן שבו העלות של הפקה מסורתית מרקיעה שחקים, האפשרויות שפותחות מערכות AI הופכות לא רק לאטרקטיביות, אלא לעיתים לאלטרנטיבה היחידה שפשוט משתלמת.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

מהפכת התוכן הוויזואלי: כש-AI פוגש את תעשיית ההפקות

עבור חברות מסחריות, מוזיקאים, משרדי פרסום ואמנים מכל הסוגים, הדילמה הכלכלית ברורה: האם לשלם מאות אלפי שקלים על יום צילום, לוקיישנים, תאורה, שחקנים ואנשי צוות, או להפיק את אותו התוצר בעזרת טכנולוגיות AI מתקדמות, תמורת שבריר מהמחיר? כשמכניסים למשוואה גם את יתרונות הגמישות, הנגישות והיכולת לייצר תוצאה ויזואלית ברמה גבוהה כמעט מיידית – התשובה ברורה למדי. הפקה מסורתית של סרטון פרסומת או קליפ מוזיקלי היא משימה לוגיסטית מורכבת, יקרה ולעיתים גם מתסכלת. צריך לגייס תסריטאי, במאי, שחקנים, מאפרים, תאורנים, צלמים, עורכים – והכול לפי תקציב שלא תמיד מאפשר תמרון. בנוסף, כל שינוי קטן בתסריט או בקונספט עלול לגרור עלויות כבדות ולוח זמנים מתארך.

למעשה, שילוב כלים גנרטיביים מאפשר היום לייצר תסריטים בעזרת מודלי שפה, לעצב דמויות עקביות עם מחוללי תמונות או כלים לבניית לורות (LoRA), ליצור שחקנים מלאכותיים באמצעות אווטארים דיגיטליים ולעשות ליפסינק (Lipsync), לבנות סצנות שלמות עם מחוללי וידאו, לבצע עריכה חכמה ולהוסיף פסקול בהתאמה אישית – והכול באינטגרציה חלקה אחת. כיום, בזכות ההתפתחות של מערכות AI גנרטיביות, אפשר לדלג על מרבית השלבים הללו. בעזרת הבינה המלאכותית ניתן להפיק סרטון ברמה מקצועית, בפחות זמן, בפחות כסף ועם שליטה יצירתית מלאה.

עלות מול תועלת: למה זה פשוט משתלם

מי שעבד בעבר על סט צילומים יודע שהפקה קולנועית או פרסומית יכולה להגיע לעשרות ולעיתים גם למאות אלפי שקלים. כאשר האפשרות האלטרנטיבית היא כלי בינה מלאכותית שיכולים לייצר תוצאה קרובה – ולעיתים אף עדיפה – בעלות של אלפי שקלים בודדים, התשובה כמעט ברורה מאליה.

חיסכון בכוח אדם: אין צורך בגיוס צוותים גדולים, בשכירת ציוד יקר, בלוקיישנים מורכבים או בניהול פרויקטים מתישים.
גמישות יצירתית מוחלטת: אפשר “לצלם” על הירח, להחיות דמויות בדיוניות, לשלב סצנות אקסטרים ולהשיג תוצאה שתואמת בדיוק את הדמיון.
מהירות תגובה: הסרטון יכול להיות באוויר תוך ימים או שבועות, ולא תוך חודשים. שינוי בתסריט? זה לוקח דקות, לא שעות. תיקונים בפוסט?! כמה קליקים ואתם אחרי זה.

גם אתם תוכלו ליצור קליפים כאלה!

שליטה בכל שלבי ההפקה הדיגיטלית

ההבדל המהותי בין חובב למקצוען טמון ביכולת לשלוט בכל שלבי ההפקה, החל מהרעיון הראשוני ועד לקובץ הסופי. יצירת סרטון AI איכותי איננה רק עניין של לחיצה על כפתור, אלא של הבנת הפוטנציאל של כל כלי, שימוש נכון בפרומפטים, אינטגרציה בין פלטפורמות, ויכולת לנהל את התהליך בצורה אסטרטגית.

שלבי ההפקה כוללים:

כתיבת תסריט וסטוריבורד: באמצעות כלים כמו ChatGPT של OpenAI או קלוד (Claude) של אנטרופיק (Anthropic).
יצירת דימויים: עם מחוללים כמו מידג’רני (Midjourney), מודל התמונה 4o של OpenAI או אידאוגרם (Ideogram).
בניית דמויות אווטאר: כלים כמו הייג’ן (Heygen) או D-ID מאפשרים יצירת שחקני AI עם קול, תנועה והבעה.
הנפשה ווידאו: כלים כמו ראנווי (Runway), לומה (Luma Dream Machine), סורה (Sora), קלינג הסינית (Kling) ואחרים, מייצרים וידאו עם AI, מאפשרים להנפיש תמונות סטטיות ועוד הרבה מעבר.
עריכת פסקול: שילוב של כלי סאונד כמו סונו (Suno) ואחרים, מאפשרים לבנות פסקול מותאם עם AI, ואפילו ליצור אפקטים קוליים.

יצירת סרטים עם AI – אתם חייבים לשלוט בכל עולמות הבינה היוצרת (Generative AI).

הקורס שמחבר את כל הנקודות

כדי להפוך ליוצר תוכן מקצועי בעולם החדש, נדרש לא רק ידע בכלים – אלא שיטה. זו בדיוק המטרה של הקורס ליצירת סרטים, פרסומות וקליפים עם AI מבית LetsAI: לא עוד קורס תיאורטי, אלא מסלול מעשי שמחבר את כל היכולות הנדרשות לעשייה מקצועית בפועל.

לפרטים על קורס יצירת פרסומות, קליפים וסרטים עם AI, לחצו פה.

מה כולל הקורס?

שיעורים בלייב זום עם מרצים מהתעשייה: אחת לשבוע, שיעורי זום עם מומחי AI, אשפי בינה יוצרת, יוצרים, עורכים ובמאים בעלי ניסיון אמיתי. הנה טעימה מהדמויות שהתארחו אצלנו ב-LetsAI: הפזמונאי וזוכה האירוויזיון דורון מדלי, מתן כהן גרומי (Founding Creative Director ב-Pika), התסריטאי והבמאי ערן ב.י. ועוד.
קבוצת תמיכה סגורה: ליווי וחניכה שוטפים בקהילה פעילה – למידת עמיתים במיטבה, לצד מענה מקצועי מצד המתרגלים המקצועיים שלנו, מנחי הקורס ומומחי GenAI.
מעל 100 שיעורים מוקלטים: כל תכני הקורס זמינים באתר ייעודי, שמתעדכן על פי ההתפתחויות.
מאגר בוטים וכלי AI לשימושכם: גישה חופשית לבוטים מקצועיים, פרומפטרים וכלים טכנולוגיים שמסייעים בתהליך היצירה והלמידה, ומלווים אתכם 24/7.
וובינרים שבועיים: חשיפה קבועה לכלים חדשים, טכניקות מתקדמות וסשנים עם מומחים מתחומים שונים.
מדריכים כתובים: מדריכים לכל הכלים המובילים בתעשייה, שמתעדכנים באופן שוטף ויומיומי, כולל דוגמאות יישומיות.
סביבת למידה מתקדמת: פלטפורמה חיה, משתנה ודינמית – שמעדכנת אתכם תמיד עם מה שחם באמת. זה לא קורס – זה אקוסיסטם של למידה ויצירה!

הניסיון שמאחורי המילים

הקורס הזה אינו יוזמה מקרית, אלא תוצאה של ניסיון והיכרות מעמיקה עם השוק והתעשייה. כל מה שתלמדו בקורס המדהים הזה הוא תוצר של עבודת שטח אמיתית ושנים של ניסיון בעולמות הפרסום, הטלוויזיה, המוזיקה והבידור. מאחורי LetsAI עומדים אנשים עם ניסיון של עשורים בתעשיית הטלוויזיה, המוזיקה והפרסום. הפקנו קליפים ופרסומות לאמנים ויוצרים מובילים בתעשייה, וכמובן אנחנו מספקים שירותי AI לחברות הגדולות בארץ ובעולם! ההקפדה היא לא רק על איכות התוכן, אלא על חיבור ישיר לשוק ולצרכים האמיתיים של הלקוחות, מה שמבטיח שבוגרי הקורס יוצאים עם סט כלים פרקטי ויכולת להתחרות על פרויקטים רציניים כבר מהיום הראשון.

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס יצירת סרטים עם AI

מתי בפעם האחרונה למדת משהו שבאמת שינה את הקריירה שלך?

בזמן שחלק מהיוצרים עדיין מחכים לאישור תקציב או מחפשים צוותים, אחרים כבר יוצרים סרטוני AI שמכניסים אלפי שקלים לפרויקט, ולעיתים גם עשרות אלפים. שוק התוכן הוויזואלי החדש דורש לא רק כישרון, אלא הבנה טכנולוגית ויכולת להפיק תוצרים בקצב שהעולם דורש. הקורס של LetsAI לא מבטיח לכם הצלחה – אבל הוא נותן את כל הכלים להגיע אליה. מה שתעשו עם זה, תלוי רק בכם. זו ההזדמנות שלכם להפוך את הידע ליוזמה, את היצירתיות לעסק, ואת ה-AI לקריירה חדשה.

אבל אל תקשיבו לנו – הקשיבו להם! מוזמנים להעיף מבט על הביקורות של בוגרי הקורסים שלנו:

משתתפים משתפים

הפוסט עתיד הפרסומות והקליפים נמצא ב-AI הופיע ראשון בLet's AI בינה מלאכותית

יצירת פודקאסט וידאו עם שני דוברים – כך עושים את זה עם HeyGen

אביתר אדרי — Fri, 09 May 2025 08:12:09 +0000

בעולם שבו תוכן הוא מטבע יומיומי, יצירת פודקאסטים איכותיים כבר לא שמורה רק למי שיש לו אולפן, ציוד הקלטה וידע בעריכה. הייג’ן (HeyGen) מציעה דרך חדשנית להפוך כל מסמך או אתר לפודקאסט וידאו מובנה – עם שני דוברים דיגיטליים, אנושיים למראה, שמנהלים שיחה טבעית על התוכן שלכם. אז איך זה עובד, מה היתרונות, מה המגבלות, ולמי זה מתאים?

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

אותה פלטפורמה – יכולות חדשות

אחרי שהראנו איך ליצור סרטון אישי שנראה מקצועי, בלי להסתבך עם מצלמות, ציוד או שעות של עריכה – בעזרת Avatar IV של HeyGen, עכשיו נראה איך ליצור פודקאסט עם שני דוברים דרך אותו ממשק ובאותה פלטפורמה.

איך זה עובד – שלב אחר שלב

1. נכנסים ללשונית LABS לאחר שהתחברתם לחשבון שלכם בפלטפורמה של Heygen

2. בוחרים ב-Video Podcast

3. מעלים קובץ לטקסט (אפשר להעלות מסמך PDF או לינק למסמך ארוך ואז הייג’ן יסכם אותו ויהפוך אותו לפודקאסט, בדומה ל-NotebookLM.

4. לאחר העלאת המסמך, בוחרים את שתי דמויות הדוברים – ניתן לבחור מתוך האווטארים שלהם, או מתוך אווטארים שהמשתמש יצר. בוחרים את ה-Aspect Ratio, משך הסרטון, האם רוצים כתוביות או לא, וכמובן את השפה (וכן – יש גם עברית, אבל חשוב לציין שהייג’ן לא מצטיין בטקס לדיבור בעברית, ולכן בשלב זה לא מומלץ לבחור בעברית וכדאי להתנסות ביצירת פודקאסט באנגלית).

כאמור – בהמשך יהיה אפשר להעלות סרטון, ואז צפוי שיפור בגזרת העברית. לוחצים על Submit וזהו… יש פודקאסט וידאו עם שני דוברים!

איך זה נראה בפועל?

התוצאה מזכירה שיחת זום מוקלטת בין שני מרצים – עם וידאו איכותי, תנועות שפתיים מדויקות, הבעות פנים משתנות, ודינמיקה ביניהם. זה לא פודקאסט רגיל – זה פודקאסט וידאו שנראה כמו סשן מקצועי שהוכן במיוחד לקהל שלכם.

אז מה עדיין חסר?

העלאת קבצי וידאו / קישורי יוטיוב – עדיין לא אפשרי. כלומר, לא ניתן ליצור פודקאסט על בסיס תוכן מסרטון, אלא רק מטקסטים. אבל זה נמצא בפיתוח.
פיצ’רים של פודקאסט מסורתי – אין פתיח מוזיקלי, קריינות מעברים או אפקטים קוליים. אם אתם רגילים לפודקאסטים מורכבים – תצטרכו להוסיף את זה מחוץ ל-HeyGen.
עברית – קיימת, אבל לא בשלה. קריינות נשמעת מעט רובוטית. למי שזה קריטי – אפשר להיכנס ל פלטפורמת ה-Text To Speech של OpenAI כדי להפוך טקסט לדיבור טבעי בקליק עם מודלי האודיו שלהם.

כמה זה יעלה לכם?

השוואה בין Heygen ל-NotebokkLM

טיפים ליצירת פודקאסט מוצלח ב-HeyGen

כדי להוציא את המיטב מהפודקאסט שלכם, התחילו מתוכן חזק – מדריך מקצועי, בלוג מעמיק או סיכום של מחקר מעניין יניבו שיחה בעלת ערך. התאימו את הדמויות לסגנון: בחרו אווטארים פורמליים כשמדובר בתוכן טכני, ודמויות חמימות ונגישות כשאתם פונים לקהל אישי או רחב. ערכו את הדיאלוגים – אל תסתפקו בתסריט הגנרי. הוסיפו שאלות, קונפליקטים קלים או הומור שישאיר את הצופים מרותקים. ואם אתם יוצרים פודקאסט בעברית – מומלץ לכתוב את הטקסט מראש ולהשתמש בשירות טקסט לדיבור איכותי כדי לשמור על רמה מקצועית.

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס מקיף לבינה מלאכותית - GenAI Master

HeyGen מאפשרת לכל אחד להפוך תוכן כתוב לשיחה דינמית בין שני דוברים – בלי מיקרופונים, בלי מצלמות ובלי עריכת וידאו. זה פתרון יעיל למי שרוצה לבלוט בתוכן מקצועי, להעביר רעיונות בצורה נגישה, או פשוט לחסוך זמן ומשאבים. אמנם יש עדיין מגבלות בשפה העברית ובייבוא סרטונים, אבל היכולות הקיימות כבר עכשיו מרשימות ומעשיות. אם יש לכם מסמך מעניין או רעיון שווה – זה הזמן לנסות, לשחק עם האווטארים, ולהפוך טקסט לפודקאסט שמרגיש אנושי.

הפוסט יצירת פודקאסט וידאו עם שני דוברים – כך עושים את זה עם HeyGen הופיע ראשון בLet's AI בינה מלאכותית

HeyGen משיקים דור חדש של אווטארים מבוססי בינה מלאכותית

אביתר אדרי — Thu, 08 May 2025 13:56:40 +0000

רוצים ליצור סרטון אישי שנראה מקצועי, בלי להסתבך עם מצלמות, ציוד או שעות של עריכה? עם Avatar IV של HeyGen, זה אפשרי. כל מה שצריך זו תמונה אחת, והמערכת כבר תדאג להפיק ממנה סרטון וידאו אמיתי ומרשים – תוך שניות. אז אם חיפשתם אווטאר שנראה טבעי, מגיב לקול ולרגש, ויוצר תוצאה מוכנה לצפייה תוך פחות מדקה – זה בדיוק הכלי שחיכיתם לו.

Avatar IV is here and it changes everything.

The most advanced avatar model we’ve ever built.

Upload one photo and a script. That’s it.

Our new audio to expression engine captures your tone, rhythm, and emotion, then generates facial motion so real it feels alive.

And it’s… pic.twitter.com/otp2Avr0CU

— HeyGen (@HeyGen_Official) May 6, 2025

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

רגע, מי זאת HeyGen?

HeyGen, למי שלא מכיר, היא חברת טכנולוגיה אמריקאית שנוסדה בשנת 2020 בלוס אנג’לס, ומתמחה ביצירת אווטארים מבוססי וידאו שמופעלים על ידי בינה מלאכותית. כבר מהיום הראשון היא שמה את ה־AI במרכז, במטרה להפוך את תהליך יצירת הווידאו לפשוט, מהיר ונגיש לכל אחד – גם למי שאין לו שום רקע בצילום, בעריכה או בהפקה.

הפלטפורמה שפיתחה מאפשרת ליצור סרטונים אישיים באיכות גבוהה, שנראים כאילו צולמו באולפן מקצועי. בשנה האחרונה היא ביססה את מעמדה כאחת מהחברות המובילות בתחום הווידאו מבוסס הבינה המלאכותית, בזכות ממשק ידידותי, תוצאות משכנעות במיוחד, וקצב התפתחות טכנולוגי מהיר.

באתר החברה מתארים את Avatar IV או אווטאר 4 בעברית צחה, כ“דגם המתקדם ביותר שיצרנו עד היום”. לטענתם, זה לא עוד כלי אנימציה, אלא מערכת שמצליחה להעביר הבעה – כזו שמבינה טון, קצב ורגש, ומתרגמת אותם בצורה מדויקת לתנועות פנים. והקסם הזה לא מוגבל רק לדמויות אנושיות. גם בעלי חיים, דמויות בדיוניות או אובייקטים מופשטים יכולים לקבל חיים חדשים בתוך כמה שניות.

אז מה בעצם הופך את Avatar IV לכל כך מיוחד?

מדובר בדור חדש של אווטארים מבוססי בינה מלאכותית, שמבינים לא רק את המילים שאתם אומרים, אלא גם את הדרך שבה אתם אומרים אותן. כל מה שצריך כדי להתחיל זה תמונה אחת. לא צריך לצלם וידאו, לא להקליט תנועות, ולא לדעת לערוך. פשוט מעלים תמונה, כותבים טקסט או מעלים קובץ אודיו, והמערכת כבר יודעת לשחזר את הטון, הקצב ואפילו שפת הגוף – בדיוק כמו שאתם הייתם אומרים את זה בעצמכם.

התוצאה היא אווטאר שמסנכרן שפתיים (lip sync), מחקה הבעות פנים, מזיז את הראש, ואפילו מבצע מחוות ידיים קטנות – וכל זה נראה טבעי לחלוטין. אפשר להשתמש בתמונת פורטרט, חצי גוף או גוף מלא, והמערכת יודעת להתאים את עצמה לסוג התמונה. מה שיוצא בסוף הוא סרטון שנראה אמיתי, כאילו באמת עמדתם מול מצלמה – רק שלא הייתם צריכים לעשות שום דבר מכל זה.

can you still tell what’s real?

not anymore.

HeyGen just dropped Avatar IV, it can make anyone talk anything with human like expression and movement

the lines between real and AI is gone

step by step tutorial: pic.twitter.com/EbDCX1xFen

— el.cine (@EHuanglu) May 7, 2025

איך משתמשים?

זה פשוט:

1. נכנסים לפלטפורמה של Heygen ונרשמים דרך חשבון הגוגל שלכם או מייל וסיסמה.

2. במסך הבית בוחרים באפשרות של Photo to video with Avatar IV (מסומן באדום).

בחרו באפשרות של תמונה לוידאו עם Avatar IV

2. מעלים תמונה אחת (או בוחרים מהתמונות דמו – מתחת לריבוע האדום בצד שמאל), מקלידים טקסט לדיבוב, או מעלים הקלטה קולית (ריבוע אדום מימין – בעברית עדיף להעלות הקלטה, כי הטקסט לדיבור בעברית לא משהו).

עורך האווטאר של הייג׳ן לבחירת תמונה וקול

טיפ: אפשר להיכנס ל פלטפורמת ה-Text To Speech של OpenAI כדי להפוך טקסט לדיבור טבעי בקליק עם מודלי האודיו שלהם. כאן תוכלו ליצור את הדיבור בעברית ואז להעלות את ההקלטה הזו להייג’ן. כך תהיה תוצאה הרבה יותר טובה!

פלטפורמת טקסט לדיבור ליצירת קול בעברית

4. בוחרים קול (אם צריך) – כרגיל, ניתן לבחור בתוך הייג’ן מתוך מגוון קולות מוכנים מראש.

תבחרו קול מתאים לאווטאר שלכם

5. לוחצים על Generate – ותוך שניות, הסרטון מוכן.

אז למי זה בכלל מתאים?

למעשה, כמעט לכל מי שרוצה להעביר מסר בצורה אישית, אנושית ומהירה, גם בלי ידע טכני, וגם בלי להסתבך עם הפקות וידאו מסורתיות. אם אתם יוצרים סרטוני הסבר או הדרכה, מציגים מוצר, בונים מצגת או עמוד נחיתה, או סתם רוצים לשלוח ברכה מצולמת ללקוח או לקהל – Avatar IV יכול להפוך את כל זה לקל מתמיד. אפשר להשתמש בו בקמפיינים שיווקיים, בתקשורת עם לקוחות, או אפילו כדי להקליט שיר או ברכת חג. כל מה שצריך זו תמונה אחת ורעיון – והמערכת כבר תדאג לשאר.

They not like us

Kendrick said it. Avatar IV delivered.

Drop your fav Avatar IV creations below pic.twitter.com/EXoFJ3ISUh

— HeyGen (@HeyGen_Official) May 7, 2025

מה חשוב לדעת?

בוא נדבר רגע על תמחור – כי זה משהו שכולנו רוצים להבין לפני שמתחייבים. HeyGen לא מציעה את Avatar IV בחינם, אבל כן מאפשרת התנסות ראשונית בגרסה חינמית מוגבלת. אם תרצו להפיק סרטונים באיכות גבוהה וליהנות מכל האפשרויות המתקדמות, תצטרכו לבחור באחת מהחבילות בתשלום שמתחיל ב-29 דולר לחודש במסלול Creator ו-39 דולר לחודש למשתמש במנוי Team עם התחייבות למינימום שני משתמשים. בסופו של דבר, מדובר בהשקעה משתלמת למי שמחפש פתרון מהיר, מקצועי ונגיש ליצירת וידאו דינמי ואישי – בלי להסתבך עם צילומים או עריכה מסובכת.

עניין חשוב נוסף הוא ש- Avatar IV מיועד בעיקר לסרטונים קצרים באורך של 10 עד 30 שניות, תלוי בסוג המנוי שבוחרים. בשלב הזה, לא ניתן לערוך את הסרטון בתוך המערכת של HeyGen עצמה, כך שהתוצאה מתקבלת כמו שהיא. זה לא הופך את הכלי לפחות מרשים, אבל כן שווה לדעת מראש למה לצפות – ולתכנן את התוכן בהתאם.

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס מקיף לבינה מלאכותית - GenAI Master

לסיכום, בעידן שבו כולם נאבקים על תשומת לב, וידאו אישי הוא דרך חזקה לבלוט, להסביר, להתחבר ולהשאיר רושם. אבל לא לכולם יש זמן, ציוד או ניסיון כדי להפיק סרטון בעצמם. בדיוק בשביל זה נוצר Avatar IV. זהו כלי שעושה את מה שפעם דרש צוות, מצלמה ועורך – עכשיו, מתוך תמונה אחת, ובתוך פחות מדקה. פשוט, מהיר, ונגיש לכל אחד.

הפוסט HeyGen משיקים דור חדש של אווטארים מבוססי בינה מלאכותית הופיע ראשון בLet's AI בינה מלאכותית

חברת D-ID מפטרת רבע מעובדיה ימים ספורים לאחר שותפות עם מיקרוסופט

מערכת האתר — Tue, 11 Mar 2025 07:35:30 +0000

חברת D-ID הישראלית, המתמחה בטכנולוגיית אווטארים אינטראקטיביים מבוססי בינה מלאכותית, הודיעה היום על פיטורים של 22 עובדים, המהווים כרבע מכוח העבודה שלה. מתוך המפוטרים, 19 הם עובדים בישראל ו-3 בחו”ל, מתוך סך של 88 עובדים ברחבי העולם. הפיטורים מגיעים באופן מפתיע רק שבוע לאחר שהחברה הכריזה על שיתוף פעולה אסטרטגי עם מיקרוסופט. בהודעה רשמית, החברה הסבירה כי המהלך נעשה “כחלק ממאמצי החברה להתייעל ולהתכונן לצמיחה מואצת”.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

רקע

D-ID נוסדה בשנת 2017 על ידי גיל פרי, סלע בלונדהיים ואלירן קוטה, יוצאי יחידת 8200 של צה”ל. החברה החלה את דרכה בתחום אבטחת מידע ופיתחה טכנולוגיות שמטרתן להסיר או להסוות מאפיינים מזהים מתמונות ומסרטוני וידאו של אנשים. מאז התפתחה לפלטפורמה מקיפה ליצירת אווטארים מבוססי בינה מלאכותית בזמן אמת.

אווטארים אינטראקטיביים

כיום, D-ID מציעה מגוון פתרונות מתקדמים מבוססי בינה מלאכותית גנרטיבית המתמחים ביצירת אווטארים דיגיטליים אינטראקטיביים ותוכן וידאו. החברה מפעילה פלטפורמה המאפשרת המרה של תמונות סטטיות, טקסט, וידאו ואודיו לדמויות דיגיטליות מציאותיות. בין המוצרים המרכזיים של D-ID ניתן למצוא את Creative Reality Studio ליצירת סרטוני וידאו עם אווטארים מדברים, שירות תרגום וידאו המאפשר תרגום לעד 30 שפות תוך שמירה על סנכרון שפתיים ועקביות קולית, מערכת קמפיינים מותאמים אישית, וכן אווטארים אישיים בשתי רמות – Express ו-Premium+.

בנוסף, החברה מציעה סוכני AI אינטראקטיביים (D-ID Agents) לתמיכת לקוחות והדרכה, וממשקי משתמש טבעיים (NUI) המשלבים זיהוי מחוות, הבעות פנים וקול. הטכנולוגיה של D-ID תומכת ביותר מ-120 שפות ומאפשרת לעסקים לייצר חוויות אינטראקטיביות מותאמות אישית בתחומי השיווק, המכירות, חווית לקוח, למידה ופיתוח, ויצירת תוכן.

המנכ״ל גיל פרי הסביר על החזון של החברה: “אנחנו שואפים למהפכה באופן שבו בני אדם מתקשרים עם ממשקים דיגיטליים. במקום להסתמך על ממשקי משתמש גרפיים מסורתיים, אנחנו חוזים בממשק ממוקד אדם”

הישגים ומימון

עד כה גייסה החברה 48 מיליון דולר, כולל סבב גיוס Series B בסך 25 מיליון דולר במרץ 2022. סבב זה הובל על ידי חברת ההשקעות Macquarie Capital, עם השקעות משמעותיות מ-Pitango, AXA Venture Partners, OurCrowd, OIF, Maverick ו-Marubeni.

יותר מ-250 מיליון סרטוני וידאו נוצרו באמצעות סטודיו השירות העצמי של D-ID ואינטגרציות שונות, ויותר מ-280,000 מפתחים בונים פתרונות באמצעות ה-API של החברה. בין לקוחותיה הבולטים של החברה ניתן למצוא חברות ענק כמו PepsiCo, Fidelity, J.P. Morgan, Softbank, NTT, Deutsche Telekom, PWC, Deloitte, Burda Media, AXA Insurance, ו-Gameloft.

בתחילת 2022, החברה זכתה להכרה כאחת מהחברות החדשניות ביותר באזור EMEA על ידי Fast Company, זכתה בפרס לשימוש הטוב ביותר בבינה מלאכותית בתחרות Digiday Marketing and Advertising Awards Europe, וטכנולוגיית Live Portrait שלה הייתה פיינליסטית בפרס החדשנות היוקרתי SXSW. בשנת 2024 זכתה החברה בפרס ה־Silver המכובד בקטגורית ה־Entertainment & Design Technologies בתחרות פרסי Edison היוקרתית למוצרים החדשים והטובים ביותר, וב־5 פרסים נוספים בתחרות Muse.

שותפות עם מיקרוסופט

בתחילת מרץ 2025, רק שבוע לפני הודעת הפיטורים, הכריזה D-ID על שיתוף פעולה אסטרטגי עם מיקרוסופט. במסגרת השותפות, הטכנולוגיה של D-ID תסייע למשתמשים העסקיים של מיקרוסופט לעבור בצורה חלקה לעתיד מבוסס בינה מלאכותית.

האווטארים האינטראקטיביים של D-ID יכולים להשתלב בכל פעילות סוכן שיחה מקוון, כולל שיווק, מכירות, למידה ותמיכת לקוחות. השותפות תאפשר לעסקים ומפתחים לשלב אווטארים מבוססי בינה מלאכותית ביישומים שלהם, כולל Microsoft Teams ותוכנות מיקרוסופט אחרות.

עתיד החברה

למרות הפיטורים, D-ID ממשיכה לראות עתיד מבטיח בתחום האווטארים המבוססים על בינה מלאכותית. החברה מציעה מגוון פתרונות לעסקים המתמחים בשיווק ומכירות, חווית לקוח, למידה ופיתוח, וכן ליוצרי תוכן ברחבי העולם. בהודעה שפרסמה החברה נמסר: “D-ID מוקירה ומעריכה את תרומתם של העובדים שליוו אותה לאורך הדרך, ומחויבת לסייע להם בצעדיהם הבאים”.

הפיטורים מעלים שאלות לגבי האסטרטגיה העסקית של החברה, במיוחד לאור השותפות החדשה עם מיקרוסופט והצהרותיה על היערכות לצמיחה מואצת. עם זאת, מהלכי התייעלות כאלה אינם נדירים בתעשיית הטכנולוגיה, במיוחד בחברות המתכוננות לשלב הבא בהתפתחותן.

הפוסט חברת D-ID מפטרת רבע מעובדיה ימים ספורים לאחר שותפות עם מיקרוסופט הופיע ראשון בLet's AI בינה מלאכותית

האם AI יהפוך אותנו לדור האחרון שקורא וכותב?

רון גולד — Sun, 23 Feb 2025 15:16:36 +0000

בעוד פחות מעשור, השיחות שלכם עם חברים או עמיתים לעבודה עשויות להתנהל דרך אווטאר דיגיטלי בעל הבעות פנים מציאותיות – בלי להקליד מילה אחת. ויקטור ריפרבלי (Victor Riparbelli), מייסד Synthesia וחלוץ בתחום הבינה המלאכותית, צופה מהפכה בתקשורת האנושית: עולם שבו טקסט יפנה את מקומו לטובת סרטונים שנוצרים ברגע, אווטרים חכמים וממשקים קוליים. בהרצאת TED מרתקת הוא מתאר עתיד שבו הדואר האלקטרוני, ספרי הלימוד ואפילו הודעות הטקסט יוחלפו בתקשורת חזותית ודינמית. האם אנחנו מוכנים לשינוי הזה?

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

הסיפור מאחורי Synthesia: מהמעבדה למהפכה גלובלית

ב-2017, קבוצת חוקרי בינה מלאכותית מאוניברסיטאות קיימברידג’, UCL וסטנפורד – בהובלת היזם הדני ויקטור ריפרבלי – זיהתה פרצה בשוק: יצירת תוכן וידאו הייתה יקרה, איטית ונגישה רק לחברות ענק. החזון? להפוך כל אדם ליוצר סרטונים מקצועי – ללא מצלמה, שחקנים או ידע טכני.

איך הפכה לחד-קרן טכנולוגי?

תוך פחות משמונה שנים, החברה גייסה 180 מיליון דולר בסבב D בינואר 2025 מקרנות מובילות כמו NEA, Atlassian ו-WiL – ושווייה חצה את רף 2.1 מיליארד דולר. המפתח להצלחה: פלטפורמה שמאפשרת ליצור סרטון ב-3 שלבים פשוטים (הזנת טקסט, בחירת אווטר, יצירה) – טכנולוגיה שכבשה 55,000 חברות, כולל ענקיות כמו מיקרוסופט, אמזון ו-Tiffany. ההצלחה נובעת גם מהשקעה בטכנולוגיות מתקדמות כמו ראייה ממוחשבת ושימושים עסקיים רחבים (כמו הדרכות עובדים ושיווק).

בציוץ מטה רואים פוסט שפורסם על ידי חברת Synthesia, שבו מצוין כי עד כה נוצרו באמצעות הפלטפורמה שלה 17.9 מיליון סרטונים, וכל זאת ללא שימוש במצלמות. הפוסט מציין עובדה מעניינת ומשעשעת: אם מישהו יתחיל לצפות בכל הסרטונים שנוצרו היום, הוא יסיים רק בשנת 2126. בנוסף, הציוץ מציג השוואה בין מספר הסרטונים שיצרו משתמשי Synthesia לבין יוצרי תוכן מפורסמים כמו MrBeast (850 סרטונים) ו-PewDiePie (4,800 סרטונים), מה שמדגיש את היקף הייצור העצום של משתמשי הפלטפורמה ביחס ליוצרים פרטיים.

מה הופך את הטכנולוגיה של Synthesia לפורצת דרך?

המערכת של Synthesia מציעה מעל 230 אווטארים ריאליסטיים שיכולים לדבר ב-140 שפות שונות, כולל עברית וסווהילי, תוך שימוש בטכנולוגיית Text-to-Speech מתקדמת. האלגוריתמים שלה לא רק מדובבים טקסט, אלא גם משכפלים טון דיבור, הבעות פנים ותנועות גוף באופן ריאליסטי, מה שמעניק לאווטארים מראה והתנהגות טבעיים. לדוגמה, ניתן להשתמש באווטאר לבוש מדים להדרכת עובדי נמל תעופה, שמדבר במבטא מקומי ומציג רקע מותאם של מסלולי טיסה. עם זאת, למרות הריאליזם המשופר שמציע המודל EXPRESS-1, ישנם מקרים שבהם האווטארים מפגינים רגשות מוגזמים מעט, מה שעלול לעורר תחושת “עמק המוזרות” אצל חלק מהצופים.

הצד האפל – ואיך מתמודדים איתו?

לצד ההצלחה המרשימה, Synthesia מודעת היטב לסיכונים האתיים הכרוכים בטכנולוגיה שלה ופועלת לצמצם אותם. החברה מיישמת מדיניות מחמירה של “AI אחראי”, הכוללת חסימה אוטומטית של יצירת תוכן פוליטי, דתי או כזה שעלול לשמש להפצת דיסאינפורמציה. בנוסף, היא מחייבת הסכמה מפורשת בכתב מכל אדם לפני שיבוט דמותו הדיגיטלית, כדי למנוע שימוש לרעה. בפברואר 2025, החברה זכתה במכרז ממשלתי בבריטניה לתרגום שירותים ציבוריים ל-15 שפות באמצעות סרטוני AI, מה שהפך אותה לספקית רשמית של תוכן וידאו ממשלתי. צעד זה לא רק מחזק את מעמדה כחלוצה טכנולוגית, אלא גם מציב אותה כדוגמה מובילה לשימוש אחראי בבינה מלאכותית.

האם זו רק התחלה?

עם פיילוטים מוצלחים בחברות תעופה כמו Spirit Airlines, רשתות חינוך כמו Bolton College ושירותים ציבוריים בבריטניה, Synthesia מוכיחה שתקשורת ויזואלית אינה טרנד חולף, אלא שפה חדשה שמעצבת מחדש את הדרך בה אנו לומדים, עובדים ומתקשרים. לדוגמה, חברות כמו Zoom הצליחו לחסוך עד 90% מזמן יצירת סרטוני הדרכה באמצעות הפלטפורמה, תוך התאמתם לצרכים מגוונים של עובדים ברחבי העולם. השאלה הגדולה היא: האם נראה בעתיד דמויות דיגיטליות כמו “צ’רצ’יל” או “דה שליזם” מלמדות תלמידים בכיתות וירטואליות? לפי ויקטור ריפרבלי, מנכ”ל החברה, התשובה כבר טמונה בקוד – והפוטנציאל רק מתחיל להתממש.

An avatar that actually looks like your brand?

Yes, please.

With our Avatar Builder, you can easily add logos, customize clothing colors, and make it unmistakably yours pic.twitter.com/M0ek8qSMtm

— Synthesia (@synthesiaIO) February 17, 2025

המוות האיטי של המילה הכתובה

“תארו לעצמכם עולם שבו יצירת סרט הוליוודי אורכת פחות זמן מקריאת ספר,” אומר ויקטור ריפרבלי, מנכ”ל Synthesia, ומציג חזון שמאתגר את מקומה של המילה הכתובה. הטכנולוגיה של Synthesia כבר מאפשרת כיום ליצור סרטוני הדרכה מקצועיים עם דמויות AI מדברות, בלמעלה מ-140 שפות, וכל זה באמצעות הקלדת תסריט בלבד. היתרון המרכזי? מהירות בלתי נתפסת: יצירת סרטון איכותי יכולה להתבצע תוך 10 דקות בלבד – זמן השווה לקריאת פרק בספר.

מעבר לכך, עושר המידע שמועבר בסרטון עולה בהרבה על טקסט: טון דיבור, שפת גוף והבעות פנים מספקים הקשר רגשי ותרבותי שלא ניתן להעביר במילים בלבד. ולבסוף, מיצוג חכם: חברות יכולות להתאים את המסרים שלהן לקהלים שונים באמצעות אווטרים עם מבטא מקומי, לבוש מותאם תרבותית ואפילו הבעות פנים שמדגישות מסרים רגשיים. האם אנו עדים לסופה של המילה הכתובה? לפי ריפרבלי, התשובה ברורה – זו רק ההתחלה.

האווטרים של העתיד

ריפרבלי מדגיש כי האווטרים של Synthesia לא יהיו דמויות קריקטוריות, אלא דמויות ריאליסטיות לחלוטין, הודות ליכולות טכנולוגיות מתקדמות. ראשית, שיבוט קולי מדויק מאפשר לאווטרים לשחזר טון דיבור טבעי, כולל הפסקות דרמטיות ואפילו משחקי מימיקה שמוסיפים עומק ואמינות. שנית, טכנולוגיית זיהוי רגשות בזמן אמת מאפשרת לאווטרים להגיב לקהל: אם המאזין משתעמם או מאבד עניין, האווטאר ישנה את הטון והאינטונציה כדי לשמור על מעורבות.

בנוסף, הפלטפורמה מאפשרת יצירת דמויות חדשות לחלוטין — “שחקנים” וירטואליים עם ביוגרפיה עשירה שיכולים לככב בסדרות או סרטים מותאמים אישית לכל צופה. דוגמה מרתקת לכך היא מורה פרטי דיגיטלי בדמותו של אלברט איינשטיין, שמסביר פיזיקה לילד בשפה פשוטה, תוך שילוב בדיחות מהתרבות המקומית וסיפורים שמותאמים לתחביביו האישיים. הטכנולוגיה הזו לא רק משנה את פני התקשורת, אלא גם פותחת עולם חדש של למידה מותאמת אישית וחווייתית.

המהפכה החברתית

הטכנולוגיה של Synthesia אינה משפיעה רק על תחום המדיה, אלא מחוללת שינוי עמוק גם בחברה כולה. בתחום החינוך, ספרי הלימוד המסורתיים עשויים לפנות את מקומם לסימולציות אינטראקטיביות, שבהן תלמידים יוכלו “לחוות” אירועים היסטוריים כמו קרב ווטרלו במקום לקרוא עליהם בטקסט יבש. במערכת המשפט, עדים יוכלו לשחזר אירועים בתלת-ממד מול חבר מושבעים, מה שיאפשר הבנה מדויקת יותר של נסיבות המקרה. בתחום התרבות, הדור הצעיר עשוי לפתח “אוריינות ויזואלית” חדשה – מיומנות בקריאת רגשות ומסרים דרך מיקרו-הבעות פנים ושפת גוף, במקום להסתמך רק על מילים כתובות. השינויים הללו מצביעים על עולם שבו תקשורת חזותית הופכת לשפה אוניברסלית חדשה, המשנה את הדרך בה אנו לומדים, מבינים ומתקשרים.

הפצצה המוסרית מתקתקת

לצד ההבטחות הגדולות של הטכנולוגיה, ויקטור ריפרבלי מזהיר מפני הסכנות האתיות שעלולות להתלוות למהפכה הזו. אחת הדאגות המרכזיות היא זיופים מסוכנים, כמו דיפייקים שיכולים להציג פוליטיקאים או מנהיגים מבטיחים הבטחות שמעולם לא נאמרו, מה שעלול לערער מערכות דמוקרטיות. בנוסף, ריפרבלי מתריע מפני שחיקת האמון: בעולם שבו כל תוכן ויזואלי או קולי יכול להיות מפוברק, כיצד נוכל להבחין בין אמת לבדיה? סוגיה נוספת היא אי-שוויון טכנולוגי: רק מי שיוכל להרשות לעצמו גישה לאווטארים מתקדמים ולכלים חדשניים יזכה ליתרון משמעותי בתעסוקה ובחברה. ריפרבלי מסכם בשאלה פתוחה ומטרידה: האם המין האנושי מוכן להתמודד עם הכוח העצום שהטכנולוגיה הזו מעניקה לנו? התשובה לכך תלויה במידה רבה בדרך שבה נבחר להשתמש בה.

הטכנולוגיה של Synthesia מסמלת את תחילתו של עידן חדש בתקשורת האנושית, שבו וידאו ואווטארים דיגיטליים עשויים להחליף את המילה הכתובה. בעוד הפלטפורמה מציעה הזדמנויות חסרות תקדים ליצירת תוכן נגיש, מהיר ומותאם אישית, היא גם מעלה שאלות מורכבות על אמינות, אתיקה ושוויון חברתי. ויקטור ריפרבלי צודק כשהוא אומר שזו לא שאלה של “אם” אלא “מתי” – השינוי כבר כאן. השאלה שנותרת פתוחה היא האם נוכל לאמץ את הטכנולוגיה הזו בצורה שתעצים אותנו, או שנמצא את עצמנו תלויים בה באופן מסוכן. בין אם מדובר בדמוקרטיזציה של יצירה או באתגר מוסרי חדש, דבר אחד ברור: העתיד כבר לא ייכתב – הוא ייווצר.

הפוסט האם AI יהפוך אותנו לדור האחרון שקורא וכותב? הופיע ראשון בLet's AI בינה מלאכותית

שיבוט קול בעברית עם Play HT! לא תאמינו כמה זה פשוט וקל (ומפחיד)

שחר גולן — Mon, 23 Sep 2024 07:34:37 +0000

שנה עברה מאז שסיקרתי לראשונה את Play.ht, כלי שבזמנו הציע פתרון מדהים: הזנת טקסט ויצירת קול ריאליסטי במיוחד, בהתאם לדגימת קול קצרה של 30 שניות. השבוע, הכלי קיבל עדכון חשוב ומעניין במיוחד עבורנו – דוברי העברית. מסתבר שהכלי תומך בעברית! כמובן שלא יכולתי להתאפק וניגשתי מיד לבדוק איך זה עובד, והתוצאות לא פחות ממדהימות.

איך עושים Text to Speach בעברית?

לפני שנצלול למסקנות שלי, אני מזמין אתכם לצפות בסרטון החדש שהכנתי על העדכון של Play.ht, ולהתרשם מהיכולות המרשימות בעצמכם:

מה זה Play.ht?

קודם כל בואו נבין מה זה Play.ht. מדובר בכלי שמאפשר לקחת טקסט וליצור ממנו קול מלאכותי שנשמע כל כך ריאליסטי שקשה להבחין שהוא לא אנושי. מה שמדהים בכלי הזה הוא לא רק הריאליזם של הקול, אלא גם המגוון העצום של השפות, המבטים והסגנונות שהמערכת מציעה. עם יותר מ-900 קולות ו-142 שפות שונות, Play.ht יכול להפוך כל טקסט, פשוט או מורכב, ליצירת דיבור מקצועית ומדויקת.

איך Play.ht עובד?

כשהתנסיתי בגרסה הראשונה של הכלי, השתמשתי בדגימת קול של בני פרבר, חבר יקר ומגיש הפודקאסט “פשוט AI”. שיכפלתי את קולו של בני וכתבתי טקסט שהמערכת הפכה לקול שלו, כאילו הוא עצמו מדבר. זה היה פשוט מטורף – כך קיבלתי את קולו של בני מקריא טקסטים חדשים לחלוטין שכתבתי בעצמי. אתם יכולים לצפות בסרטון הישן ולראות איך זה עבד לפני שנה:

כמובן, כל התהליך נעשה באישור מלא של בני, ואני רוצה להדגיש: השימוש בכלי כזה מצריך אחריות. אם אתם משכפלים קול, תמיד יש לוודא שאתם עושים זאת בהסכמת בעל הקול. אין להשתמש בטכנולוגיה הזו כדי לפגוע באחרים.

העדכון החדש – תמיכה בעברית

העדכון המשמעותי שקיבל Play.ht הוא תמיכה בעברית. עד כה, אחד החסמים המשמעותיים היה היכולת לעבוד בעברית, אבל עכשיו המערכת תומכת בשפה בצורה חלקה. ניגשתי לבדוק איך זה עובד – והופתעתי לטובה. הקול שנוצר נשמע טבעי ומותאם בצורה יוצאת דופן לשפה.

רוצים ללמוד איך ליצור זמרי AI מותאמים אישית, איך ליצור מוזיקה עם AI כמו המקצוענים ואך לקחת את המוזיקה שלכם צעד אחד קדימה? הצטרפו לקורס יצירת מוזיקה עם AI של LetsAI וגלו עולם חדש של יצירתיות מתפרצת!

הכלים והפיצ’רים של Play.ht

Play.ht מציעה מגוון כלים ופיצ’רים שמספקים פתרונות מתקדמים ליצירת קול מלאכותי ברמה הגבוהה ביותר. מהיכולת לשכפל קולות ועד התאמה אישית מדויקת של תכונות הקול, הפלטפורמה מספקת מענה לכל סוגי הפרויקטים – מסרטוני שיווק ועד דיבוב למשחקי וידאו. הנה כמה מהכלים והפיצ’רים המרכזיים ש-Play.ht מציעה.

טקסט לדיבור (TTS)

המנוע המרכזי של Play.ht הוא טכנולוגיית טקסט לדיבור (Text-to-Speech – TTS) המבוססת על בינה מלאכותית. עם מעל 900 קולות שונים ב-142 שפות ומבטאים, Play.ht מאפשרת ליצור קולות מציאותיים שנשמעים כאילו הם מוקלטים על ידי אנשים אמיתיים. המערכת תומכת גם בקולות עם אינטונציות שונות ויכולות רגשיות, מה שמאפשר להעניק לקול אופי שמתאים באופן מדויק לפרויקט שלך.

שכפול קול (Voice Cloning)

אחד מהפיצ’רים הייחודיים של Play.ht הוא היכולת לשכפל קולות. באמצעות טכנולוגיה מתקדמת, ניתן ליצור עותק דיגיטלי מדויק של קול של אדם אמיתי, ולהשתמש בו להפקת דיבור חדש. הכלי הזה מושלם עבור יוצרי תוכן שמעוניינים להשתמש בקול קיים בלי להזדקק לאישורים והקלטות חוזרות. חשוב לזכור להשתמש בכלי הזה בצורה אתית, כפי שכבר ציינתי, ולקבל אישור לשכפול קול מבעליו.

עורך טקסט לדיבור עם תצוגה מקדימה

Play.ht מציעה עורך טקסט לדיבור פשוט ונוח לשימוש, שבו ניתן להקליד, להדביק או לייבא טקסט ולהפוך אותו לקובץ קול תוך מספר שניות. אחד מהפיצ’רים הבולטים בעורך הוא האפשרות לתצוגה מקדימה של התוצר, כך שתוכלו להאזין לתוצאה הסופית לפני שתשמרו או תורידו את הקובץ. זהו כלי חשוב למי שרוצה לחדד את הדיבור ולוודא שהקול מתאים בדיוק לציפיות.

תכונות התאמה אישית מתקדמות

Play.ht מספקת כלים להתאמה מדויקת של הקול. ניתן לשנות את מהירות ההקראה, לקבוע טון דיבור, להוסיף הדגשות למילים ספציפיות, ואפילו לשלב הפסקות טבעיות בטקסט כדי להעניק לקול גוון אנושי יותר. הכלי הזה מאפשר ליצור קריינות שמשדרת מקצועיות ואיכות, תוך כדי שמירה על אותנטיות.

Multi-Voice Feature

אחת התכונות המיוחדות של Play.ht היא האפשרות לשלב מספר קולות שונים באותו קובץ שמע. זה מאפשר ליצור דיאלוגים או שיחות בין דמויות שונות בתוך פרויקט אחד, ולשמור על גיוון ושילוב קולני עשיר בתכנים כמו פודקאסטים, סיפורי שמע, או סרטוני הדרכה.

ספריית הגדרות הגייה אישית

באמצעות Play.ht ניתן לקבוע הגייה מדויקת למילים מסוימות, ולשמור את ההגדרות לשימוש חוזר. כלי זה שימושי במיוחד עבור מקרים שבהם יש צורך לשמור על אחידות במושגים טכניים, שמות מותגים, או ביטויים ייחודיים. כך, תוכלו להבטיח שכל הקלטות הקול ישמרו על אותן הגדרות ההגייה בכל פעם.

תמיכה ב-SSML

העורך של Play.ht תומך בתגיות SSML (Speech Synthesis Markup Language), שמאפשרות שליטה מתקדמת עוד יותר על טקסטים. באמצעות SSML ניתן להגדיר אינטונציות, דגשים, הפסקות ומאפיינים נוספים כדי להגיע לתוצאה מדויקת ואיכותית. זהו כלי חשוב למי שזקוק לשליטה מלאה על כל פרט ופרט בהפקת הקול.

שילוב API

Play.ht מציעה גם API מתקדם, המאפשר למפתחים לשלב את טכנולוגיית הקול של Play.ht באפליקציות ופלטפורמות שונות. ה-API מתאים במיוחד לחברות גדולות וסטארט-אפים שרוצים לשלב תכונות דיבור או שכפול קולות בתוך מוצרים דיגיטליים כמו עוזרים קוליים, מערכות IVR, ועוד.

אפשרויות ייצוא

לאחר יצירת הקול, ניתן לייצא את הקובץ בפורמטים שונים, כגון MP3 או WAV. הפורמטים האלה מאפשרים לשמור על איכות גבוהה ולהתאים את הקובץ לשימושים שונים, בין אם מדובר בפודקאסטים, סרטונים או מערכות טלפוניות

שימושים אפשריים ל-Play.ht

Play.ht מציעה פתרון מושלם ליצירת קריינות לסרטונים, פודקאסטים, ספרי שמע, ועוד המון שימושים נוספים. הכלי מתאים במיוחד עבור:

יצירת פודקאסטים וספרי שמע: הפלטפורמה מאפשרת יצירת קולות קריינים מקצועיים לספרים ולפודקאסטים.
קריינות לסרטוני שיווק והדרכה: הכלי מספק קולות ריאליסטיים שמתאימים בדיוק לסרטוני פרסומת או סרטוני הדרכה.
שכפול קולות לדמויות במשחקים: אם אתם יוצרים משחקי וידאו, Play.ht מאפשר לכם ליצור דמויות עם קול ייחודי.
מערכות IVR ועוזרים קוליים: הכלי מתאים גם לשימוש במערכות טלפון אינטראקטיביות או עוזרים קוליים.

כמה זה עולה?

Play.ht מציעה מגוון חבילות מנויים שמותאמות לצרכים שונים, החל ממשתמשים חינמיים ועד לחברות גדולות. כל חבילה מספקת גישה לטכנולוגיית הקול המתקדמת של Play.ht, אך עם תכונות שונות שמתאימות לסוגי שימוש מגוונים. להלן פירוט של כל אחת מהחבילות.

החבילה החינמית

החבילה החינמית של Play.ht מאפשרת למשתמשים להתנסות במערכת בצורה פשוטה ונגישה. בחבילה זו מקבלים 12,500 תווים לחודש ושכפול קול אחד. למרות שמדובר בחבילה בסיסית, היא כוללת גישה מלאה לכל הקולות והשפות שהמערכת מציעה. זהו פתרון מעולה עבור משתמשים שמעוניינים לנסות את הכלי לפני התחייבות לתכנית בתשלום.

חבילת Creator

חבילת ה-Creator מיועדת למשתמשים שמחפשים יותר אפשרויות וגמישות ביצירת תכנים. במחיר של 31.20 דולר לחודש (עם תשלום שנתי של 374.40 דולר), החבילה מספקת 3 מיליון תווים לשנה ו-10 שכפולי קולות. בנוסף, כל משתמש בחבילה זו מקבל גישה מלאה לכל הקולות והשפות, והאפשרות להשתמש בתכנים ללא צורך במתן קרדיט. חבילה זו מתאימה במיוחד ליוצרים שמעוניינים ביכולות מתקדמות יותר ויכולים להפיק תועלת משכפול קולות ותכנים בהיקף רחב יותר.

חבילת Unlimited

החבילה הפופולרית ביותר ב-Play.ht היא חבילת ה-Unlimited, שמספקת אפשרויות בלתי מוגבלות כמעט לכל צורך. בעלות של 29 דולר לחודש (עם תשלום שנתי של 348 דולר), החבילה כוללת שימוש בלתי מוגבל בתווים ובשכפולי קולות, ומספקת גישה לכל הקולות והשפות. בנוסף, משתמשים בחבילה זו מקבלים זכויות שימוש מסחרי בתכנים שהם יוצרים, מה שהופך אותה לאידיאלית עבור עסקים ויוצרים מקצועיים שזקוקים לכמויות גדולות של תוכן קולי ברמה גבוהה.

חבילת Enterprise

לארגונים גדולים ולמשתמשים עם צרכים מורכבים יותר, Play.ht מציעה חבילת Enterprise. חבילה זו מותאמת אישית לצרכי המשתמש, עם אפשרות לשכפול קולות באיכות גבוהה וללא הגבלה. בנוסף, היא כוללת גישה לצוותים, פתרונות אבטחה מתקדמים ותמיכה טכנית מורחבת. חבילת ה-Enterprise מציעה את כל היתרונות של החבילות האחרות, אך עם גמישות רבה יותר בהתאמה לצרכים המסחריים של חברות גדולות ופרויקטים מורכבים.

סיכום

PlayHT ממשיך להוכיח את עצמו ככלי עוצמתי וחיוני ליצירת תוכן קולי. בין אם אתם מחפשים ליצור קריינות מקצועית לסרטונים או לשכפל קול קיים לצרכים יצירתיים – הכלי הזה נותן לכם את הכלים לעשות זאת בקלות ובמהירות. העדכון החדש שמוסיף שיבוט קול בעברית הופך אותו לשימושי במיוחד לקהל הישראלי.

שווה לכם לנסות את הכלי ולראות בעצמכם את היכולות המרשימות שהוא מציע.

הפוסט שיבוט קול בעברית עם Play HT! לא תאמינו כמה זה פשוט וקל (ומפחיד) הופיע ראשון בLet's AI בינה מלאכותית

חברת D-ID משחררת כלי לתרגום סרטונים – קבלו מדריך מקיף

אביתר אדרי — Wed, 21 Aug 2024 15:36:11 +0000

בעידן שבו תקשורת וידאו היא כלי מרכזי להגעה לקהלים גלובליים, האתגרים הנובעים מפערי שפה ותרבות הופכים פחות דרמטיים, הודות לכניסתם של כלי AI חדשים. החדירה לשווקים בינלאומיים מחייבת התאמות ושינויים בשפה ובמסר, מה שעלול להפוך את התהליך למורכב ויקר. עם זאת, התקדמות הבינה המלאכותית הביאה לפיתוח כלים שמאפשרים להנגיש תכני וידאו במספר שפות בקלות וביעילות – קליק אחד ואתם מדברים בשלל שפות שונות, בקול שלכם, ועם סינכרון שפתיים מושלם! אחד מהכלים החדשים שפרצו לשוק Video Translate של חברת D-ID, שהושק בשבוע האחרון. כלי זה מאפשר ליצור סרטונים מתורגמים באיכות גבוהה, ומציע יתרונות משמעותיים: ממשק נוח ואינטואיטיבי, תפעול קל ומהיר ותוצאות אפקטיביות.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

צפו בסרטון השקת המוצר, בו גיל פרי – מנכ”ל D-ID ומייסד-שותף – מציג את יכולותיו המרשימות של הפיצ’ר החדש:

Credit: D-ID

תרגום סרטונים בשפות שונות לא רק שמרחיב את היכולת להגיע לקהלים חדשים, אלא גם מהווה כלי חשוב להסברה בינלאומית. מאז ה”שבעה באוקטובר”, כלים דומים שימשו יוצרים, משפיענים, דמויות ציבוריות ואושיות AI, במלחמת ההסברה של ישראל, כאשר סרטוני הסברה תורגמו לשפות רבות במטרה להעביר את המסרים של ישראל בצורה מדויקת ואפקטיבית.

חשוב לציין כי בשוק קיימים כלים דומים נוספים, כמו Heygen, שהשיקו יכולות תרגום וידאו לפני יותר משנה. עם זאת, Video Translate של D-ID מביא עמו חידושים טכנולוגיים ייחודיים, כמו התאמה מדויקת של הבעות הפנים והקול בשפה המתורגמת, מה שהופך אותו לבחירה מצוינת עבור חברות, יוצרי תוכן ומוסדות המעוניינים להגיע לקהלים ברחבי העולם בצורה אפקטיבית ומקצועית. כמו כן, מדובר בחברה “כחול-לבן” שממשיכה למקם את ישראל כמעצמת בינה מלאכותית, שמחזיקה בארסנל של כלים איכותיים, נוחים ומתקדמים. ואם אפשר לפרגן לחברה ישראלית שעושה עבודה מדהימה בשדה הבינלאומי, אז למה לא?!

במדריך הבא נציג הסבר מקיף על אופן השימוש ב-Video Translate של D-ID, ונדריך אתכם בשלבים ובטכניקות לשימוש מיטבי בכלי.

איך משתמשים בכלי תרגום הסרטונים של D-ID?

לפניכם סרטון הסבר קצר (באנגלית) שידגים לכם צעד אחר צעד, איך להשתמש בכלי החדש:

Credit: D-ID

שלב 1: העלאת הסרטון

הצעד הראשון בעבודה עם Video Translate הוא העלאת הסרטון שברצונכם לתרגם. לשם כך:

היכנסו לפלטפורמת D-ID ובחרו בכלי תרגום הסרטונים.
לחצו על האפשרות להעלאת סרטון.
בחרו את הסרטון מהמחשב שלכם והעלו אותו לפלטפורמה, או גררו ושחררו בחלון הייעודי.

שלב 2: בחירת שפות היעד

לאחר העלאת הסרטון, תופיע רשימת השפות הזמינות לתרגום.

כלי Video Translate מאפשר לתרגם את הסרטון ל-30 שפות שונות, מה שמקל על הפקת גרסאות בשפות שונות בבת אחת.
סמנו את השפות שאליהן תרצו לתרגם את הסרטון.
ניתן לבחור במספר שפות במקביל לצורך תרגום מרובה שפות.

שלב 3: עיבוד הסרטון

ברגע שהשפות נבחרו, המערכת של D-ID תתחיל לעבד את הסרטון:

המערכת תשבט את קול הדובר המקורי לשפות היעד שנבחרו, תוך שמירה על קצב ואינטונציה דומים.
התהליך כולל גם סנכרון תנועות השפתיים (ליפסינק) והתאמת הבעות הפנים, כך שהסרטון ייראה טבעי ואמין בכל שפה.

שלב 4: קבלת התוצאות

לאחר תהליך העיבוד, תקבלו את כל הגרסאות המתורגמות תוך זמן קצר:

כל גרסה תכלול את השפה המתורגמת עם ליפסינק מלא, דבר שמבטיח חוויית צפייה חלקה ואותנטית.
ניתן להוריד את הגרסאות ולשתף אותן בערוצים השונים בהתאם לצורך.

טיפים לצילום וידאו מיטבי לתרגום

כדי להפיק את המיטב מכלי התרגום של D-ID, חשוב להקפיד על מספר הנחיות בעת צילום הווידאו:

אדם אחד בלבד בפריים: ודאו שהדובר הוא האדם היחיד המופיע בפריים, כדי למנוע בלבול בתרגום ובהתאמת סנכרון השפתיים.
כיוון הפנים כלפי המצלמה: הקפידו שהדובר יפנה את פניו ישירות אל המצלמה לאורך כל הסרטון, כך שהפנים יהיו גלויים וברורים בכל רגע נתון.
איכות שמע מיטבית: על מנת להבטיח תרגום מדויק ושיבוט קול איכותי, העלו סרטון שבו השמע ברור ונטול רעשי רקע או מוזיקה מיותרת. מומלץ להקליט לפחות 30 שניות של תוכן למיטוב התוצאה.
אורך הווידאו: דאגו שהסרטון שאותו אתם מעלים יהיה באורך של עד 5 דקות, כך שהתהליך יהיה מהיר ויעיל.
גודל הקובץ: ודאו שהקובץ שהנכם מעלים אינו חורג מ-2GB, כדי להבטיח עיבוד תקין ומהיר של הסרטון.
הכנה מוקדמת: ודאו כי החומר המקורי הוא ברור, עם משפטים קצרים והגייה מדויקת.
ביקורת מקצועית: מומלץ להתייעץ עם מומחים לשפה כדי לבדוק את החומר המקורי ואת התרגום, ולוודא שהתוצאות הסופיות מדויקות ומשקפות את המסר בצורה נכונה.
בדיקת תוצאות: בדקו כל גרסה מתורגמת כדי לוודא שהתרגום מדויק, שהבעות הפנים מתאימות ושאיכות השמע משקפת את המסר הנכון.

הקפדה על הנחיות אלו תבטיח תרגום איכותי, סנכרון מדויק של תנועות השפתיים, ויצירת תוכן מותאם ואפקטיבי לכל שפה.

יתרונות השימוש ב-Video Translate

חיסכון בזמן: הכלי מאפשר תרגום מהיר ויעיל ל-30 שפות שונות בלחיצת כפתור אחת, ובכך חוסך שעות רבות של עבודה ידנית.
איכות גבוהה: שיבוט קול מדויק והתאמת תנועות השפתיים והבעות הפנים מבטיחים תוצאות מקצועיות ואותנטיות, המעניקות לצופה חוויית צפייה טבעית ומשכנעת.
הרחבת קהל היעד: תרגום למספר רב של שפות מאפשר גישה לשווקים חדשים וגדולים יותר, תוך יצירת קשר ישיר עם קהלים מגוונים ברחבי העולם.
שימושיות: הכלי אידיאלי לאנשי שיווק בחברות בינלאומיות, ליוצרי תוכן, ולמוסדות חינוך המעוניינים להנגיש את המסרים שלהם בשפות שונות.

למי הכלי זמין?

כפי שציין תומר צוקר, סמנכ”ל השיווק של D-ID: “לרגל ההשקה, אנחנו מציעים שימוש חינמי במוצר במהלך תקופת ה-Trial וללקוחות שלנו אנחנו פותחים את המוצר לשימוש חופשי עד הודעה חדשה.”

כלומר, הכלי זמין למנויים משלמים ללא עלות נוספות, והשימוש בו בעת הזו פתוח וללא הגבלה. אין צורך בהטענת קרדיטים.

אתגרים ושיקולים בשימוש בתרגום וידאו מבוסס AI

למרות היתרונות המרובים של תרגום וידאו מבוסס AI, קיימים גם אתגרים שיש לקחת בחשבון:

דיוק: מערכת ה-AI עלולה לשגות במקרים של תרגום לא מדויק של מילים דומות בצליל, כמו “I’ll” ו-“eye”, או בהעברת סלנג וניואנסים תרבותיים בצורה נכונה.
השמטות: במקרים מסוימים, ייתכן שהמערכת תיאלץ להשמיט מילים כדי להתאים את אורך הטקסט המתורגם לאורך הסרטון המקורי.
טון דיבור: התאמת הטון לדובר המקורי ולשפה המתורגמת יכולה להיות מאתגרת, במיוחד בשפות שבהן הטון משפיע על המשמעות של המילים, כמו במנדרינית למשל.
מבטא: ייתכן שהמערכת תייצר תוצאה שבה המבטא אינו עקבי או שהשמע מעט מונוטוני.

האם הפיצ’ר עובד גם בעברית?

בקצרה – כן! דיברנו עם ה-CTO של D-ID והוא הסביר לנו שאפשר לקחת סרטון בעברית ואז לתרגם אותו (מוזמנים לראות את הדוגמה מטה בסרטון ששחר גולן יצר). עם זאת, זה עדיין לא מושלם – אם אתם רוצים תוצאות מיטביות, כדאי שסרטון המקור שלכם יהיה באנגלית – מה שיקל על פעולת התרגום לשפות אחרות. לדברי נציגי החברה, אם מכניסים אינפוט באנגלית התוצאה שתתקבל תהיה ברמה הכי גבוהה שיש.

סרטון הדרכה של שחר גולן

צפו בסרטון ההדרכה ששחר גולן יצר על הכלי החדש.

מחסום השפה נפרץ – אבל האם יש חדש תחת השמש?

כלי ה-Video Translate של D-ID מציע שימושי במיוחד להנגשת תוכן וידאו לקהל גלובלי, תוך חיסכון משמעותי בזמן ומשאבים. אמנם זה לא הכלי הראשון שעושה את זה, והטכנולוגיה קיימת כבר זמן מה, אבל הממשק הנוח של D-ID וחוויית השימוש, הופכים אותו לאלטרנטיבה טובה בתחום זה. הכלי יכול לסייע ליוצרים ומשווקים להגיע לקהל רחב יותר ולייצר תכנים מותאמים בשפות שונות בקלות ובמהירות. עם ממשק משתמש ידידותי ותמיכה ב-30 שפות, מדובר בכלי חובה לכל מי שמחפש להרחיב את השפעתו בזירה הבינלאומית.

הכלי מתאים לשימוש במגוון תחומים, כגון חינוך, שיווק, ותקשורת ארגונית, ומאפשר למשתמשים להתאים את התוכן שלהם לשווקים שונים ולתרבות המקומית. Video Translate מאפשר לארגונים להעביר את המסר שלהם בצורה עקבית ואפקטיבית בכל השפות, ובכך להרחיב את טווח ההשפעה ולהגיע לשווקים חדשים במהירות ובעלות נמוכה.

הטכנולוגיה של תרגום וידאו מבוסס AI מתפתחת במהירות, ובמהלך השנים הקרובות נצפה לשיפורים נוספים שיגבירו את הדיוק והאוטומציה של התהליך. ארגונים ויוצרים שיאמצו את הכלי הזה יהיו בעמדה מצוינת לנצל את היתרונות של תקשורת גלובלית ולהתמודד עם האתגרים שבכניסה לשווקים חדשים. Video Translate של D-ID הוא לא רק כלי טכני, אלא גשר לעולם חדש של אפשרויות תקשורת, שמאפשר ליצור חיבור אמיתי עם קהלים ברחבי העולם.

הפוסט חברת D-ID משחררת כלי לתרגום סרטונים – קבלו מדריך מקיף הופיע ראשון בLet's AI בינה מלאכותית

מדריך מקיף לשימוש במחולל הווידאו של פיקה (Pika) באתר הייעודי

אביתר אדרי — Sat, 04 May 2024 16:58:43 +0000

תחום יצירת הווידאו עם בינה מלאכותית הוא תחום לוהט וחדשני. אחת החברות המובילות בתעשייה היא Pika, מתחרה גדולה של סטארט־אפ ה־GenAI ראנוויי (Runway). שורשיה של פיקה בתחרות סרטוני AI שיצרה ראנוויי, אך מאז היא עשתה כברת דרך, וכיום מדובר באחד ממחוללי הווידאו הטובים בעולם שעשה את המעבר מדיסקורד ומציע ממשק אינטרנטי מתקדם העשיר בתכונות ומאפשר למשתמשים ליצור סרטונים מרהיבים באמצעות בינה מלאכותית. עם כלים כמו סנכרון שפתיים ודיבוב (ליפ סינק), הנפשת תמונות סטטיות, בקרה על תנועת המצלמה, הוספת סאונד לסרטונים, אינפיינטינג ואאוטפיינטינג בווידאו, פיקה מעניקה חוויה יצירתית ייחודית לאנשים שרוצים למנף את כוחה של הבינה המלאכותית בפרויקטים מרתקים.

אבל לפני הכול – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכון, חידוש או מידע על כלי חדש שיוצא.

Email

בלחיצה על "הרשמה" אני מאשר/ת את תקנון האתר, מדיניות הפרטיות וקבלת מסרים פרסומיים במייל

ממליצים לכם להצטרף גם לקהילות ה־AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה־AI שלנו? לחצו פה.

קצת על פיקה

תעשיית מחוללי הווידאו היא שוק רותח. אחת המתחרות הכי גדולות של ראנוויי היא פיקה (Pika ai) – חברה שהחלה את דרכה כששתי יוצרות שרצו להשתתף בתחרות ג’ינרוט סרטונים של ראנוויי, החליטו לבסוף להשתמש בכישורים שלהן ולהקים חברה מתחרה. היום שווי השוק של פיקה הוא 300 מיליון דולר (קצת מאחורי ראנוויי, שלה יש שווי שוק של 500 מיליון דולר). פיקה החלה את דרכה כמחולל וידאו חינמי בדיסקורד (ועדיין יש לה גרסה כזו), אך ב־2023 היא השיקה ממשק וובי (אתר אינטנרט ייעודי) מתקדם ועשיר בפיצ’רים. לגרסה זו קוראים Pika 1.0. מהלך זה מיצב אותה כשחקנית מובילה בשוק, שעכשיו יכולה לתת למשתמשים שלה הרבה יותר!

אני אישית ממליץ להשתמש בגרסה שבאתר הייעודי (שכאמור גם בה יש חבילת התנסות חינמית), אבל אם בכל זאת נפשכם חפצה בדיסקורד, בלינק הבא תמצאו מדריך לפיקה בדיסקורד (חינמי וזמין לשימוש לכולם). כדאי לדעת שבדיסקורד יש אפשרות לג’נרט גם טקסט ואפקטים של וידאו בטקסט.

איך נרשמים לאתר של פיקה?

נכנסים לאתר של פיקה בלינק הבא.
לוחצים על כפתור “נסו את פיקה”, Try Pika.
הירשמו בעזרת חשבון הגוגל שלכם או עם הדוא”ל שלכם.

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס יצירת סרטים עם AI

החבילות של פיקה

פיקה מציעה מספר חבילות שונות כדי להתאים למגוון צרכים ורמות שימוש.

החבילה הבסיסית (מנוי BASIC) מציע גישה חינמית לפיקה. החבילה כוללת 250 קרדיטים חינם לתחילת שימוש. 30 קרדיטים נוספים ניתנים מדי יום לאחר שהקרדיטים הראשוניים אזלו.
בעבור 8 דולר לחודש חבילת STANDARD מציעה 700 קרדיטים חודשיים ללא הגבלה על פיצ’ר הליפ סינק (Lip Sync) ואפשרות להורדת הסרטונים שיצרתם ללא חותמת מים נוסף להנחה על רכישת קרדיטים נוספים.
חבילת UNLIMITED תומכת בעבודה ללא הפסקה ועולה 28 דולר לחודש. היא נותנת 2,000 קרדיטים חודשיים.
חבילת Pro תעלה לכם 58 דולר לחודש. החבילה מיועדת לשימוש מסחרי ומציעה גישה מוקדמת לתכונות חדשות וקרדיטים בלתי מוגבלים בקצב יצירה מהיר במיוחד.

שימוש מסחרי: שימו לב שהמסלול היחיד שנותן רישיון לשימוש מסחרי, הוא חבילת Pro שעולה 58 דולר במסלול שנתי או 70 דולר במסלול חודשי (696 דולר או 840 דולר בשנה בהתאמה).

החבילות והמנויים של פיקה – שימו לב להבדל בין חיוב שנתי (למעלה) ובין חיוב חודשי (למטה).

דגש: המחירים המצוינים פה מתייחסים למנוי שנתי. המחיר למנוי חודשי מעט גבוה יותר (בכ־20%). עם זאת אנחנו תמיד ממליצים לעשות מנוי חודשי ולא מנוי שנתי ממספר סיבות:

בעולמות ה־AI לא כדאי להתחייב לכלי כזה או אחר. כל חודש יוצא כלי חדש שיכול לייתר את העבודה בכלי שאתם מנויים לו.
בחבילה שנתית החיוב מתבצע במכה אחת. חבל לשלם עשרות או מאות דולרים בתשלום אחד (אם יכול מאוד להיות שלא תזדקקו לו למשך כל השנה).
חשוב לציין שהמחירים והתנאים יכולים להשתנות. מוזמנים לעיין בעמוד המנויים של פיקה ולקבל מידע על מחירים מדויקים ופירוט החבילות.

פיצ’רים מתקדמים בגרסת הווב של פיקה:

מדריך מקיף לשימוש ב־Pika

איך מתחילים ליצור?

הממשק של פיקה סופר אינטואיטיבי וקל מאוד לעבוד איתו.

מייד לאחר הכניסה הראשונית תוכלו לראות במסך הבית מגוון סרטונים שנוצרו בפיקה.
אם תרחפו עם העכבר מעל סרטון, פיקה יתחיל לנגן אותו. נוסף על כך, תוכלו לראות את הפרומפט שממנו נוצר הסרטון, ואף להעתיק אותו בקלות בלחיצה על כפתור Copy שיופיע כשהעכבר ירחף מעל הפרומפט.
מתחת לכל סרטון יש כפתורי עריכה מתקדמים; נדבר עליהם בהמשך. אבל קודם כל בואו נבין איך יוצרים סרטון מאפס. רדו לתחתית המסך, שם תמצאו תיבת פרומפטים (ראו תמונה מטה).

תיבת הפרומפטים של פיקה

בתיבת הפרומפטים תוכלו לרשום את תיאור הסרטון הרצוי. פשוט תארו במשפטים קצרים וברורים את הסצנה, למשל: “מטוס טס בשמיים כחולים עם עננים לבנים” (A plane flies in a blue sky with white clouds).
בתוך תיבת הפרומפטים תמצאו מספר כפתורים שימושיים שמאפשרים להעלות תמונת או סרטון רפרנס, לייצר סרטון עם סאונד ואפילו כפתור שייצור בשבילכם פרומפט אקראי (מעולה למי שלא יודע איך וממה להתחיל).
ישנו גם כפתור של אפשרויות מתקדמות כמו בקרת מצלמה, שינוי ממדי הסרטון ועוד. נרחיב עליו בהמשך המדריך.

עבודה באתר הייעודי של פיקה – פיצ’רים מתקדמים

מאז שפיקה השיקו את האתר הייעודי שלהם, הפלטפורמה שלהם נעשתה רלוונטית מתמיד. היא מרובה בפיצ’רים מתקדמים כמו:

ליפ סינק (סינכרון שפתיים).
ג’ינרוט סרטונים עם סאונד (פיצ’ר ייחודי ושימושי במיוחד) בעזרת הפעלת כפתור: Sound Effects שבתחתית תיבת הפרומפטים. ראו דוגמה מטה.

בקרת מצלמה מתקדמת (זום אין ואאוט, תנועות מצלמה כמו פאן, טילט וכן הלאה).
הנפשת תמונה סטטית לסרטון.
בחירת ממדי התמונה (Aspect Ratio).
ג’ינרוט סרטונים בקצב פריימים גבוה: 24 פריימים בשנייה.
ג’ינרוט וידאו על בסיס טקסט (Text to Video). ראו דוגמה בסרטון מטה:

ג’ינרוט וידאו על בסיס תמונה (Image to Video).
דוגמה לג’ינרוט סרטון על בסיס תמונת רפרנס ובקרת מצלמה: בסרטון אפשר לראות איך להעלות תמונת רפרנס (אנשים במסיבת חצר), להוסיף פרומפט חיובי שמתאר את תנועת המצלמה ואת ההתרחשות (אנשים מחייכים), וכן פרומפט שלילי (‘מדברים’ Talking כיוון שהיוצר לא רוצה שהם ידברו בסצנה הספציפית הזו). ולבסוף, בקרת מצלמה – זום אאוט.

אפשר אפילו להעלות סרטון כשכבת רפרנס, ממש כמו Gen1 בראנוויי (Video to Video). ראו דוגמה מטה:

שליטה בעוצמת התנועה.
מחולל פרומפטים אקראי (לחצו על אייקון הקוביות ופיקה תמציא לכם פרומפט אקראי).
שימוש במספרי סיד ליצירת המשכיות ועקביות בתוך סדרת תמונות בפרויקט.
כל הפיצ’רים הללו זמינים בממשק סופר נוח, אינטואיטיבי שנותן חווית משתמש נהדרת (ראו תמונה מטה). אפשר להפעיל אותו בלחיצה על כפתור ה־Advanced Options שבתיבת הפרומפטים.

הגדרות נוספות בפיקה

אפשרויות עריכה מתקדמות לעיבוד סרטון לאחר יצירתו

אפשרויות לעריכת סרטון בפיקה לאחר יצירתו

לאחר יצירת סרטון נפתחות אופציות שימושיות נוספות (ראו תמונה מעלה) כמו למשל:

הארכת הסרטון בעוד כמה שניות (Add 4S).
ג’ינרוט מחדש של הסרטון (Retry). זה יוביל ליצירת וריאציה חדשה.
שיתוף הסרטון (הכפתור עם האייקון של החץ).
לחיצה על כפתור ה־Info תאפשר לראות את קצב הפריימים ואת מספר הסיד של הסרטון.
עריכת הפרומפט מחדש בשליחת הסרטון שיצא לכם לג’ינרוט נוסף (עם כפתור Reprompt). זה יאפשר לכם להשתמש בו כסרטון רפרנס ונוסף על כך לרשום פרומפט חדש. התוצאה תהיה סרטון חדש שמושתת גם על הפרומפט החדש וגם על הרפרנס.

צפו בסרטון הבא שממחיש את השימוש בשני הפיצ’רים האלו: Retry ו־Reprompt:

לחיצה על 3 הנקודות בצד תפתח אפשרות לשלוח את הסרטון שלכם לאפסקיילר של פיקה (כלומר פיקה תג’נרט גרסה חדשה ומוגדלת של הסרטון).

פיצ’רים מתקדמים בגרסת הווב של פיקה

לחיצה על כפתור Edit תפתח עוד אפשרויות מתקדמות של עריכה (אינפיינטינג, אאוטפיינטינג ועוד).

אפשרויות נוספות לאחר לחיצה על כפתור Edit בפיקה

לאחר שתלחצו על ‘עריכה’ ייפתח חלון בתחתית המסך ובו מספר אפשרויות כמו הוספת ליפ סינק (דיבוב על בסיס טקסט או קובץ אודיו).

אופצייה נוספת היא הוספה אוטומטית של אפקטים קוליים (Sound Effects) אם לא הוספתם סאונד בשלב הראשוני של ג’ינרוט הסרטון. לחיצה על כפתור זה תאפשר לכם לתאר במילים את הסאונד שאתם רוצים שיתווסף לסרטון, ופיקה תג’נרט גם אותו (בהלימה לסרטון).

לחיצה על כפתור Modify Region תאפשר לכם לבצע אינפיינטינג בתוך הסרטון (כלומר לערוך אזורים ספציפיים ולג’נרט מחדש רק אותם). בחלון שייפתח תוכלו לסמן את האזור הרצוי ואז לתאר במילים מה השינוי הרצוי (למשל להוסיף משקפי שמש ל’בייבי רוס גלר’ ).

אינפיינטינג בסרטון

צפו בסררטון מטה כדי להבין איך פיצ’ר האינפיינטינג עובד:

לחיצה על כפתור Expand Canvas תאפשר לכם לבצע אאוטפיינטינג מעבר לגבולות הפריים (כלומר לג’נרט אזורים מחוץ לממדי הסרטון המקורי). ראו סרטון מטה:

בחלון שיפתח תוכלו לשנות את גודל הסרטון בתוך הפריים ולקבוע אילו אזורים חדשים יג’ונרטו. כמו כן, תוכלו לתאר במילים כיצד ‘להשלים’ את האזורים החסרים. ונוסף על כך, תוכלו לשנות את ממדי הסרטון עצמו (למשל לשנות סרטון 16:9 לסרטון מרובע 1:1 ולהפך).

אאוטפיינטינג בווידאו

המחשה לפיצ’ר האאוטפיינטינג של פיקה:

פיקה או ראנוויי?

גם פיקה וגם ראנוויי (Runway) מנגישים למשתמש ממשקים סופר נוחים, משוכללים ומתקדמים ליצירת לעיבוד סרטונים עם AI. בשני הכלים האלה יש אפשרות לעשות ליפ סינק ושניהם נותנים מוצר דומה מאוד. עם זאת, לפיקה יש דברים שאין בראנוויי. ראשית, יש חבילה חינמית נדיבה; יש אפשרויות אינפיינטינג ואאוטפיינטינג נוחות ביותר; יש אפשרות לג’ינרוט סאונד. שנית, נראה שבפיקה לא מתכוונים להאט או לעצור את קצב שחרור השדרוגים והחידושים בפלטפורמה. מדובר בשני כלים עוצמתיים, ורסטיליים ומתקדמים שכדאי מאוד שיימצאו בתוך ארגז הכלים שלכם, בטח שבטח אם אתם בתחום יצירת סרטים עם AI, יצירת קליפים או ייצור תוכן באופן כללי. אבל בכל מה שקשור לפיקה, אני לא רואה שום סיבה לא להירשם גם למחולל הווידאו המדהים הזה ולהתנסות בו, במיוחד לנוכח הממשק הנוח והקרדיטים שניתנים להתנסות בחינם.

נקודה אחת לרעת פיקה שחשוב לשים לב אליה, היא היעדר הרישיון לשימוש מסחרי בחבילות הבסיסיות. למעשה, אם תרצו לעשות בו שימוש מסחרי תיאלצו להיפרד מ־70 דולר בחודש (בחבילה חודשית), וזה לא מעט בכלל!

ולסיום, שימו לב מה קורה כשכישרון גדול פוגש בטכנולוגיה מתקדמת ומתובל בלא מעט דמיון ויצירתיות. את הסרטון הבא יצר הישראלי מתן כהן גרומי (ה־Founding Creative Director של החברה), והוא ממחיש את העוצמות של מחולל הווידאו הספציפי הזה בפרט אבל גם את הכוח של מחוללי וידאו בכלל. הם מאפשרים לנו לתת דרור לדמיון ולייצר סיפורים שבעבר הפקתם הייתה בגדר חלום רחוק (ויקר). אז שאפו למתן ושאפו לעבודה המדהימה שהוא עושה בפיקה (את רוב הסרטונים של פיקה שיצא לכם לראות, הוא יצר). ועכשיו כל שנותר לכם לעשות, הוא להירשם לפיקה ולהתחיל ליצור. זה כל כך קל וכיף!

יצירת סרטים עם AI

המדריכים שלנו תמיד חינמיים ותמיד ימשיכו להיות חינמיים, אבל אם אתם רוצים להעמיק את הידע שלכם ולהתמקצע, אתם מוזמנים להצטרף לקורס המקיף שלנו ליצירת סרטים עם בינה מלאכותית, עבודה עם מחוללי וידאו ובניית אווטרים דיגיטליים. הוא כולל עשרות שיעורים מוקלטים, מדריכים כתובים, מפגשי לייב זום אחת לשבוע ועוד הרבה דברים טובים. פרטים והרשמה באתר הקורס.

קורס יצירת סרטים עם AI

הפוסט מדריך מקיף לשימוש במחולל הווידאו של פיקה (Pika) באתר הייעודי הופיע ראשון בLet's AI בינה מלאכותית

משרד החוץ האוקראיני מציג: דוברת AI

אביתר אדרי — Thu, 02 May 2024 16:33:32 +0000

ב־1 במאי 2024 הציגה ממשלת אוקראינה את ‘ויקטוריה שי’ (Victoria Shi), דוברת רשמית שאינה בשר ודם. למעשה מדובר באווטר דיגיטלי המבוסס על טכנולגיית בינה מלאכותית. לוויקטוריה מראה אנושי ריאליסטי במיוחד, והיא נשמעת ומתנהגת ממש כמו דוברת אנושית. לפי הפרסום, מטרתה לשמש כדוברת רשמית של משרד החוץ האוקראיני. צעד זה הוא אבן דרך טכנולוגית חדשנית בזירה הדיפלומטית העולמית ובגזרת הנגשת שירותים ומידע בעזרת טכנולוגיות ג’נרטיביות.

אבל לפני הכול – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכון, חידוש או מידע על כלי חדש שיוצא.

Email

בלחיצה על "הרשמה" אני מאשר/ת את תקנון האתר, מדיניות הפרטיות וקבלת מסרים פרסומיים במייל

ממליצים לכם להצטרף גם לקהילות ה־AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה־AI שלנו? לחצו פה.

הציוץ הראשון של ויקטוריה בחשבון ה־X של משרד החוץ האוקראיני

Meet Victoria Shi — a digital representative of the MFA of Ukraine, created using AI to provide timely updates on consular affairs!

For the first time in history, the MFA of Ukraine has presented a digital persona that will officially comment for the media. pic.twitter.com/KTtuCVR1ku

— MFA of Ukraine (@MFA_Ukraine) May 1, 2024

למה צריך דוברת AI?

בעולם שבו אנו עדים למשפיעני AI שמגלגלים מאות אלפי יורו בחודש, לשחקני AI שמככבים בסרטים שמעולם לא צולמו, ולסוכנים ג’נרטיביים שנותנים שירותים או מבצעים פעולות שמייתרות בני אנוש, אין פלא שמדינה שנמצאת במלחמה תבחר בפתרון טכנולוגי נוח, זמין, זול ואיכותי. בשנה האחרונה תעשיית האווטרים הדיגיטליים עשתה קפיצת מדרגה דרמטית. הם נראים ריאליסטיים לגמרי ונשמעים ממש כמו בני אדם רגילים. חברות כמו מיקרוסופט מראות את העתיד – למודלים כמו VASA-1 יש יכולת לשוחח בזמן אמת ללא השהייה או זמן תגובה. שבבי LPU של חברת Groq הם עוד צעד לכיוון הנכון שבו נוכל לדבר עם מכונות, והן גם יענו לנו בזמן אמת. לכל זה תחברו יכולות של אמפתיה ואינטליגנציה רגשית בדומה ליכולות של EVI, הבוט האמפתי הראשון בעולם, ותעטפו הכול בעטיפה יפה בדמות האווטרים הדיגיטליים של Heygen, של D-ID או של Synthesia, והינה – יש לנו פלטפורמת AI שמחקה פעילות אנושית ומתנהלת בעולם בצורה טבעית, ‘אנושית’ ולתועלת האנושות.

החזון שתיארתי מעלה עדיין לא כאן. אבל הוא קרוב; קרוב מאוד. הטכנולוגיה כבר קיימת, צריך רק לחבר אותה. ויקטוריה שי אינה סוכן ג’נרטיבי שאומן על מאגרי ידע ויודע להגיב אינטואיטיבית בזמן אמת לפניות של כתבים או של גורמי חוץ. זו לא מטרתה. אבל היא עושה משהו אחר – היא סמל; היא ייצוג של קדמה, של מערביות ושל נאורות; היא דוגמה לשימוש בטכנולוגיה מיטיבה; היא ייצוגית ומדויקת – אין לה פליטות פה, ואי אפשר להתקיל אותה. וזה מוביל אותי לשאלה הבאה: אז למה צריך את כל זה?

למה צריך סוכני וסייעני AI?

למה צריך משפיעני AI?

למה צריך דוברי AI?

לטענת משרד החוץ האוקראיני, יש בדוברת ג’נרטיבית הרבה תועלת!

השימוש בדוברת AI שמושתתת על אווטר דיגיטלי מבוסס בינה מלאכותית כמו ויקטוריה שי מאפשר לצוותי משרד החוץ לחסוך זמן ומשאבים יקרים. הדוברת הווירטואלית תגיש בצורה מדויקת ואוטומטית את ההודעות והדיווחים שכותבים אנשי צוות משרד החוץ ותשמור על רמה גבוהה ביותר של מקצועיות ואיכות, כך אומרים האוקראינים. דובר אנושי יודע לדבר במספר שפות (במקרה הטוב), אבל ויקטוריה יכולה לדבר במגוון רחב של שפות. והיא תמיד תיראה ותישמע אותו דבר ללא קשר לשפה שבה היא מדברת. היא יכולה גם לדבר מכל לוקיישן. ליוצרים שלה יש שליטה מוחלטת על הפריים, והם יכולים לשנות את הרקע, את הלבוש וכמובן את הטקסט. אפשר ליצור מכל מקום ובכל זמן סרטון הסברה שנראה מצוין, מדברר את המסרים ההסברתיים והדיפלומטיים הרלוונטיים, ונוצר במעט מאוד מאמץ, עלות והשקעה. והאיכות בהחלט מרשימה – ויקטוריה מאופיינת במראה מרשים, מפורט וטבעי במיוחד, המדמה בהצלחה רבה דמות אנושית אמיתית. הממשק הגרפי המתקדם שלה מאפשר תזוזות חלקות ונאמנות למציאות של ידיים וראש, וזה מגביר את החוויה האנושית והמשכנעת שהיא נותנת לצופים.

שפטו בעצמכם – ויקטוריה שי; מתוך ערוץ היוטיוב של משרד החוץ האוקראיני

למה דווקא Victoria Shi?

השם שניתן לדוברת הוא ויקטוריה שי; שמה נגזר משילוב המילים ניצחון ובינה מלאכותית בשפה האוקראינית. היא נוצרה בדמותה ובקולה של הזמרת, כוכבת הריאליטי והשחקנית האוקראינית רוזאלי נומברה (Rosalie Nombre), ילידת העיר דונצק (Donetsk) שבמזרח אוקראינה, עיר שנכון להיום נמצאת בשליטה רוסית. בסרטון שפורסם מספרת ויקטוריה שהיא נוצרה בידי צוות משרד החוץ האוקראיני בעזרת בינה מלאכותית ושהיא אינה אדם אמיתי; שהמראה והקול שאתם רואים ושומעים אינם אמיתיים אלא נוצרו באמצעות AI. היא מספרת שתפקידה, בין השאר, הוא לתת מידע עדכני ומהימן בנושאי הסברה ושירותים קונסולריים לאזרחי אוקראינה השוהים ברחבי העולם. היא תיתן מידע לעיתונאים על אודות פעילות הקונסולים האוקראינים בהגנה על הזכויות ועל ענייניהם של אזרחי אוקראינה ברחבי העולם ובאופן כללי תנסה להיות הפנים והקול של ההסברה האוקראינית כלפי העולם בכלל והמערב בפרט. היתרונות שעולים מהסרטון ברורים!

נגישות וזמינות: הנגשת מידע קונסולרי לציבור הרחב ללא מגבלות זמן ומקום.
מהירות ודיוק: העברת מידע מדויק ועדכני בזמן אמת.
שקיפות: הגברת השקיפות של משרד החוץ בפעולותיו למען אזרחי אוקראינה השוהים ברחבי העולם.
חדשנות: הצגת הפנים החדשות של משרד החוץ תוך כדי שימוש בטכנולוגיות מתקדמות.

הקול הרשמי של משרד החוץ האוקראיני

הרבה נכתב על מלחמת אוקראינה־רוסיה ועוד ייכתב. העימות הצבאי המדמם הזה הוא פצע פתוח ביבשת אירופה שחשבה שעידן המלחמות מאחוריה. גם בגזרת ה־AI והחדשנות הביאה מלחמה זו שלל פיתוחים, שיטות לחימה וכלים: כטב”מים מתאבדים, שימוש נרחב ברחפנים, מערכות AI לפיקוד ולשליטה וכמובן שימוש נרחב בתקשורת ובמדיה החברתית. יש המכנים את המלחמה הזאת ‘מלחמת ה־AI הראשונה’. השקתה של ויקטוריה שי הוא ההמשך של המגמה הזאת – פתרונות טכנולוגיים חכמים ויעילים שעושים מהר, בזול ובקלות את מה שבעבר היה מצריך צוותי הפקה שלמים (במאי, צלם, שחקנית, דוברת, מלבישה, מאפרת, תאורן וכן הלאה). זו דוגמה מצוינת לייעול תהליכים באמצעות טכנולוגיית AI – בינה מלאכותית בשירות הדיפלומטיה וההסברה.

אבטחה, מהימנות ואמינות

בדיוק כפי שקל לייצר אווטר דיגיטלי מדבר, קל גם להעתיק אותו ולזייף אותו. באמצעים יחסית פשוטים (שימוש בקובצי וידאו והקלטות קוליות) אפשר לבנות מודל קול של ויקטוריה ולייצר דמות דיגיטלית זהה שתיראה ותישמע כמוה. כמו במלחמה גם פה יש מרוץ חימוש – לו ירצה הצד השני, הוא יוכל בקלות לייצר תכני פייק ניוז ותעמולה שקרית כדי למצב את דעת הקהל ולשנות תודעה. אני יכול בקלות לדמיין איך סרטון מזויף של ויקטוריה יכול להיעשות ויראלי בתוך שניות; פשוט שותלים לה בפה את הטקסט הלא נכון, והופ – יש לנו משבר דיפלומטי־הסברתי.

כל מה שתיארתי מעלה לא זר או רחוק לצד השני; כן כן רוסיה, אני מסתכל עליך. רוסיה יצאה בעבר עם שלל קמפיינים לשינוי תודעה בקנה מידה נרחב (הבחירות בארצות הברית הן רק קצה הקרחון). כדי להבטיח את אמינות דבריה של ויקטוריה ולמנוע זיופים דיגיטליים מצורף קוד QR לכל סרטון רשמי שלה. הקוד מוביל להצהרות הרשמיות באתר האינטרנט של משרד החוץ האוקראיני. באוקראינה מקווים שכך הציבור יוכל לאמת את המידע שנתנה הדוברת הווירטואלית.

AI בשירות הדיפלומטיה

ויקטוריה שי היא חלק ממהלך כולל של משרד החוץ האוקראיני ליישום טכנולוגיות מתקדמות המבוססות על בינה מלאכותית, שנועדו לחזק את יכולותיו ולקפוץ קפיצת מדרגה טכנולוגית שטרם נראתה בשירות דיפלומטי אחר בעולם. מעבר לכך, היא הצצה לעתיד שבו עוד ועוד ממשלות, ארגונים וחברות ייעזרו בכלי AI כדי לשפר ולייעל את התנהלותם. זוהי מגמה שצפויה להתחזק מאוד, ומי שידע לגרום לבינה המלאכותית לעבוד בשבילו או במקומו, יצליח לנצל את ההזדמנויות שהעולם החדש מציע.

קורס בניית אווטרים ויצירת סרטים עם AI

קורס מקיף שכולל עשרות שיעורים מוקלטים, מדריכים כתובים, מפגשי לייב זום אחת לשבוע – לפרטים ולהרשמה.

קורס בניית אווטרים דיגיטליים ויצירת סרטים עם מחוללי וידאו וכלי GenAI

הפוסט משרד החוץ האוקראיני מציג: דוברת AI הופיע ראשון בLet's AI בינה מלאכותית

חברת D-ID הישראלית זכתה בפרס Silver בתחרות פרסי Edison

אביתר אדרי — Mon, 22 Apr 2024 11:28:54 +0000

חברת D-ID ממשיכה להביא כבוד וגאווה לסצנת ה־AI הישראלית. החברה מישראל זכתה בפרס ה־Silver המכובד בקטגורית ה־Entertainment & Design Technologies בתחרות פרסי Edison היוקרתית למוצרים החדשים והטובים ביותר, וב־5 פרסים נוספים בתחרות Muse. בשיחה עם תומר צוקר, סמנכ״ל השיווק של החברה, דיברנו על הזכיות והפרסים המרשימים ועל הדרך המיוחדת ש־D-ID עושה כבר שנים בתוך שוק הרווי במתחרים. תומר סיפר על תהליכי המיתוג מחדש וגם נתן הצצה לעתיד החברה.

אבל לפני הכול – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכון, חידוש או מידע על כלי חדש שיוצא…

Email

בלחיצה על "הרשמה" אני מאשר/ת את תקנון האתר, מדיניות הפרטיות וקבלת מסרים פרסומיים במייל

ממליצים לכם להצטרף גם לקהילות ה־AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה־AI שלנו? לחצו פה.

D-ID צומחת ומביאה רוח של חדשנות

תומר צוקר, סמנכ״ל שיווק D-ID, מספר על הזכייה בתחרות:

אני נרגש וגאה לשתף ש־D-ID זכתה בפרס ה־Silver המכובד… הסטודיו שלנו, Creative Reality, ניצב בחזית החדשנות העולמית של תעשיית ה־AI; הוא משלב באופן מלא טכנולוגיית Deep_Learning, עם יכולות Text generation ו־Text-to-image generation מבוססות LLM (מודל למידה גדול).

צוקר מוסיף ומספר על הצמיחה הגדולה של החברה ומוצריה: יותר ממיליון הורדות של האפליקציה של D-ID לנייד בתוך 4 חודשים. כל זאת לצד נתוני שימוש מרשימים – מעל 170 מיליון ‘אנשים דיגיטלים’ נוצרו בפלטפורמות של D-ID.

צוקר מוסיף:

הסטודיו שלנו ואפליקציית המובייל שלנו, שזכתה ליותר ממיליון הורדות תוך 4 חודשים (!), מאפשרים לארגונים, עסקים ויוצרי תוכן להמיר בקלות תמונות סטטיות לאווטרים מדברים ב־120 שפות ול־Agents חכמים!

תומר צוקר, סמנכ״ל השיווק של D-ID

סוכני AI – סייענים שעובדים בשבילכם

דבריו של צוקר מכוונים לאחד הפיצ’רים החדשניים והמסקרנים שהשיקה החברה בתחילת השנה – פלטפורמת סוכני ה־AI של D-ID, שמאפשרים ליצור סייענים בלייב סטרים, מדברים בזמן אמת עם המשתמשים ומגיבים בהתאם לדאטה שהוזן להם ושעליו הם אומנו (בד בבד לאפשרות להתממשק עם אתרי אינטרנט חיצוניים).

פה תוכלו לראות דוגמה לסוכן כזה שבניתי לטובת הרצאת ה־AI למנהלים שהעברנו בתחילת השנה.

על הזכייה בפרס Silver בקטגוריית Entertainment & Design Technologies

כך נכתב בעמוד הזוכים של התחרות על הזכייה של D-ID במקום השני בקטגוריית Entertainment & Design Technologies:

הפלטפורמה של D-ID משנה את דרך יצירת התוכן הדיגיטלי. באמצעות עריכה דרך המחשב או בטלפון הנייד, משתמשים יכולים להפיח חיים בתמונות סטטיות ולהנפיש בקלות את תמונת הפנים לאנימציית AI מדברת. בין אם מדובר בדמויות היסטוריות, דמויות בדיוניות או תמונה אישית של המשתמש, הפלטפורמה מציעה כלי יצירתי ומשכנע עבור יוצרי תוכן, שבאמצעותו הם יכולים לספר סיפורים.

D-ID זוכה בפרס סילבר בתחרות אדיסון

על תחרות Edison

תחרות אדיסון היא תחרות גלובלית מכובדת ומוערכת שמוקירה חדשנות ופיתוח של מוצרים ושירותים חדשים. התחרות נערכת מדי שנה וההשראה לה (כמו גם שמה) נובעים מהממציא והיזם האמריקאי המפורסם תומס אדיסון. התחרות האחרונה התקיימה בין ה־17 ל־19 באפריל 2024 בפורט מיירס פלורידה. באירוע הוצגו מוצרים חדשים וחדשניים מרחבי העולם. תחרות אדיסון מעודדת את רוח החדשנות, היצירתיות והיזמות ומעודדת את המשכיותה. רוח זאת אפיינה את אדיסון וצוותו במנלו פארק (כך לדברי מארגני התחרות).

5 פרסים בתחרות הקריאטיב של MUSE

נוסף לפרס בתחרות אדיסון קטפה D-ID עוד 5 פרסים בקטגוריות שונות בתחרות הקריאטיב היוקרתית של MUSE ל־2024.

D-ID קוטפת פרסים בתחרות MUSE

בתחום אפליקציות המובייל האפליקציה Creative Reality Studio Mobile App של D-ID זכתה בפרס הפלטינה בקטגוריית הצילום והווידאו וכן בפרס הפלטינה בקטגוריית ה־Workflow והפרודוקטיביות.

בתחום סרטוני הווידאו סרטון ההשקה של D-ID שחשף את NUI (Natural User Interface) – הגישה המהפכנית של D-ID לממשק אדם־מכונה – זכה בפרס הזהב בקטגוריית המיתוג!

קמפיין המיתוג מחדש של D-ID זכה להכרה בזכיית המותג NUI בפרס הזהב בקטגוריית ה־Integrated Marketing לתחום המיתוג מחדש.

המחויבות של D-ID לאחריות חברתית ולתחום ה־Impact זכתה להכרה בזכיית פרויקט Sophia Bot למניעת אלימות במשפחה ופרויקט הנצחת מרד גטו ורשה בשיתוף עם March of the Living (מצעד החיים הבין־לאומי) בפרס הזהב בקטגוריית אחריות חברתית (פרו בונו).

תומר צוקר מספר על הזכיות המרגשות:

הפרסים הללו הם ביטוי מרגש לחזון שלנו לשנות את האופן שבו בני אדם מקיימים אינטרקצייה עם טכנולוגיה ולפרוץ את גבולות החדשנות בתחום ה־AI!

ומה בעתיד?

כששאלתי את תומר אם יש צפי לחידושים נוספים או לכלים ופיצ’רים ש־D-ID מתכוונת להשיק בזמן הקרוב, הוא סיפר שהם מכינים הרבה הפתעות מעניינות שיושקו בחודשים הקרובים. הוא אומר שהעולם של ה־Agents צובר תאוצה מדהימה!

כשנשאל על הזכיות המרשימות ועל הזהות המיתוגית של D-ID, הוא השיב:

מאד גאה במהלכים האלה. המיתוג מחדש היה תהליך עמוק ואסטרטגי שזיקק את הזהות שלנו כחברה ואת הצעת הערך שלנו. הזהות הוויזואלית שלנו מאוד מובחנת ושונה מהמתחרים, ויש מאחוריה סיפור שלם. יצרנו קטגוריה חדשה בשם NUI (Natural User Interface) עם חזון גדול לשנות את הדרך שבה בני אדם יוצרים אינטראקצייה עם כל דבר דיגיטלי. Agents (סוכני AI) הם המימוש הראשון של הגישה הזאת.

איך משתמשים ב־D-ID

אם עדיין לא התנסיתם ב־D-ID, אז רוצו לעשות את זה. פה תמצאו מדריך מקיף לשימוש בכלי. כדאי גם לדעת שיש לכם חבילה חינמית נדיבה (14 יום ניסיון) וגישה לטכנולוגיות המתקדמות של החברה (סוכני AI ויצירת אווטרים מדברים).

השימוש בכלי סופר פשוט:

כנסו לאתר של D-ID, הירשמו ופתחו חשבון (יש חבילה חינמית של 14 יום).
בחרו את הדמות של האווטר שלכם מהמגוון הרחב של D-ID. אם לא מצאתם משהו מתאים, יש לכם אפשרות לג’נרט אווטר ישירות בממשק של D-ID או פשוט להעלות תמונה שיצרתם במחולל תמונות אחר.
הזינו את הטקסט לדיבוב הדמות (אפילו בעברית). אגב, אם יש בעיות של הגייה בעברית, מומלץ להוסיף ניקוד או לכתוב ב’עברית־אנגלית’ (כלומר Shalom במקום ‘שלום’).
בחרו קול ממבחר הקולות העשיר (יותר מ־100 שפות).
אפשר להעלות גם הקלטה קולית או להקליט ישירות בממשק D-ID.
אם אתם לא יודעים מה לומר, אפשר לתת למחולל הטקסטים של D-ID ליצור את הטקסט בשבילכם. פשוט רשמו כמה מילים או משפט ובקשו מ-D-ID ליצור ממנו תסריט.
לבסוף, לחצו על Generate ובתוך כדקה יהיה לכם סרטון מוכן שבו D-ID ינפיש את התמונה שלכם ויזיז את תנועות השפתיים, הגבות ומחוות הפנים בהתאם לטקסט או להקלטה הקולית שהעליתם.

הסרטון הבא מציג את השימוש באפליקציה של D-ID לנייד, שזמינה גם למשתמשי אנדרואיד וגם למשתמשי IOS:

בסופו של יום יש לי הרבה מה לומר על D-ID. קודם כל מדובר בחברה ישראלית; זה לא מובן מאליו ומבחינתי זו גאווה לאומית שמדינה קטנה כמו שלנו מצליחה לייצא לעולם טכנולוגיות מהפכניות. זה משהו שראוי לדבר עליו ולגמרי מגיע להם הפירגון! אבל אני לא אוהב אותם בגלל שהם ‘כחול־לבן’; אני אוהב אותם בגלל שהם טובים! הם היו אחת מחברות ה־GenAI המסחריות הראשונות שהשיקה פתרון לדיבוב ולהנפשת דמויות סטטיות (מה שמכונה ‘ראשים מדברים’), ועד היום הם עושים את זה ממש טוב. יש להם תחרות רצינית בשוק (חברות כמו הייג’ן (Heygen) מאיימות לנגוס להם בנתח השוק, ולאחרונה חברות כמו פיקה (Pika) וראנוויי (Runway) שיחררו פיצ’רים של ליפ סינק שחולשים על זירה דומה).

למרות כל הכתוב לעיל, בתור יוצר פעמים רבות מצאתי שלאחר השוואה בין כל הכלים האלה (והאמינו לי שעשיתי את ההשוואות הללו לפרויקטים מסחריים אין־ספור פעמים, שכן יש לי מנוי לכל כלי בעולם בערך ), בסוף אני תמיד חוזר ל־D-ID. בסופו של יום, האופן שהפלטפורמה שלהם מצליחה להנפיש שפתיים ותנועות ראש, נראה (לדעתי) הכי מוצלח וטבעי (בטח בכל מה שקשור לדיבוב טקסט או להקלטה קולית בעברית).

הפוסט חברת D-ID הישראלית זכתה בפרס Silver בתחרות פרסי Edison הופיע ראשון בLet's AI בינה מלאכותית

VASA-1 – מיקרוסופט נכנסת לשוק הדיפ־פייק ומכריזה על מודל ליפ סינק חדש ומרשים

אביתר אדרי — Fri, 19 Apr 2024 11:38:35 +0000

אין ספק שמפרוץ מהפכת ה־Gen AI, סף הריגוש שלנו עלה, והיום קשה יותר להפתיע אותנו. אנחנו כבר מורגלים בהשקות ובהכרזות על כלים ומודלים המדהימים ביכולותיהם ובפוטנציאל שלהם, ולרוב גם על כאלה שמעלים חששות רבים בנוגע להשלכות השימוש בטכנולוגיות ג’נרטיביות. דיפ־פייק ו־AI בווידאו הם שניים מהתחומים הכי נפיצים בעולם הבינה המלאכותית כיום (וגם הכי מסוכנים). אומנם מדובר בפלא של ממש – טכנולוגיות AI מרשימות שקל להתלהב מהן, אבל מצד שני הן טומנות בחובן סיכונים רבים בקנה מידה נרחב ביותר. על אף העובדה שאנחנו מוצפים בחידושים, מדי פעם מגיע כלי חדש שמרים את הרף וגורם לנו שוב להתרגש ולהתפעל. VASA-1 של מיקרוסופט הוא אחד כזה – מודל ליפ סינק (Lip Sync) ליצירת סרטונים מדובבים בזמן אמת שמפיק תוצאות מטריפות אפילו על בסיס תמונת פנים סטטית אחת. הינה כל מה שחשוב לדעת על המודל החדש.

אבל לפני הכול – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכונים, חידושים או מידעים על כלים חדש שיוצאים.

Email

בלחיצה על "הרשמה" אני מאשר/ת את תקנון האתר, מדיניות הפרטיות וקבלת מסרים פרסומיים במייל

ממליצים לכם להצטרף גם לקהילות ה־AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה־AI שלנו? לחצו פה.

לפני הכול פשוט צפו בסרטון הבא – זה באמת משהו שאסור לפספס!

המסע של מיקרוסופט לטופ של תעשיית ה־AI

מיקרוסופט לא מפסיקה להפתיע! כחברה שהצליחה להמציא את עצמה מחדש בתהליך שעברה מתאגיד עולמי אדיר אך מנומנם לחברה חדשנית ומהפכנית (הרבה הודות להשקעה הנכבדת ב־OpenAI), היא הצליחה למצב את עצמה בטופ של תעשיית ה־AI העולמית. עם מוצרים כמו Copilot וכמובן המוצרים של ‘האחות הקטנה־גדולה’ OpenAI (ChatGPT ,Dall-E3 ו־Sora) היא יצרה לעצמה ארסנל מרשים מאוד. אסופת כלים ג’נרטיביים שממציאים מחדש את התעשייה ואת העולם שבו אנחנו חיים. יחד שתי החברות הללו מכתיבות את הקצב ומציבות את הרף לתעשייה.

מה כל כך מיוחד ב־VASA-1

הנפשת ודיבוב דמות בהתבסס על תמונה בודדת

אתמול (18.4.24) הטילה מיקרוסופט פצצה נוספת שמציגה ביצועים גבוהים במיוחד (מה שמפליא הוא שתוצאות אלה מושגות גם לנוכח הזנת אינפוטים מועטים ודלים). הפצצה הזאת היא מודל בינה מלאכותית חדש ועוצמתי המכונה VASA-1 ומפיק סרטוני דיפ־פייק (DeepFake) מציאותיים להפליא של פנים מדברות (מה שמכונה בתעשייה: ‘ראשים מדברים’, ‘Talking Heads’). הסרטונים הללו מופקים מתמונת פנים יחידה בשילוב קטע קול או טקסט. וכל זה קורה בזמן אמת!

אבל זה לא נגמר פה – למודל יכולות מרשימות לייצר הבעות פנים אנושיות וטבעיות בעזרת ממשק שמאפשר לשנות את זווית הפנים ואפילו את מנעד הרגשות שהן יביעו.

VASA-01 | credit: Microsoft

שליטה מדויקת ומגוונת באאוטפוט

המודל שמיקרוסופט מציגים בעמוד ההכרזה של הכלי מפגין יכולות מדויקות להפליא לסנכרון שפתיים לשמע, וזה מבטיח יצירת סרטון עקבי, רציף ובעל מראה טבעי (ראו דוגמאות בסרטון מעלה). הוא מצליח לקלוט ולשחזר הבעות פנים מגוונות, רגשות שונים, מחוות טבעיות ותנועות ראש אמיתיות. המשתמש יכול לשלוט בפרמטרים כמו כיוון המבט העיקרי, מרחק הראש בפריים ואפקטים רגשיים ספציפיים.

רזולוציה וקצב פריימים גבוה לצד השהייה נמוכה – פוטנציאל גבוה!

VASA-1 תומך ביצירה בזמן אמת של סרטונים באיכות גבוהה (512×512 פיקסלים) בקצב של עד 45 פריימים לשנייה (במצב האופליין) ו־40 פריימים לשנייה במצב של און ליין סטרימינג עם השהיה התחלתית מזערית בלבד – רק 170 מילי־שניות (בניסוי שנעשה במחשב שולחני עם כרטיס גרפי NVIDIA RTX 4090 יחיד). פרט זה חשוב במיוחד כיוון שהוא מאפשר ליצור סוכני AI ג’נרטיביים שמגיבים בזמן אמת, ומראה אנושי טבעי לאינפוטים של משתמשים אנושיים. דמיינו סוכני מכירות ג’נרטיביים, מוקדני AI בשירות לקוחות מקוון, פסיכולוגים ג’נרטיביים חכמים ועוד אינספור שימושים פונקציונליים שכלי כזה יכול להציע. יש לציין כי המודל נועד למחקר בלבד והחברה אינה מתכוונת לשחרר מוצר או API בשלב זה בשל גישת האחריות החברתית שלה.

שליטה בהיבטי הייצור

מודל הדיפוזיה של VASA-1 מקבל אותות אופציונליים כתנאי כמו כיוון המבט העיקרי של העין, מרחק הראש ומחוות רגשיות. ועכשיו בעברית – משמעות הדבר שהמשתמש יכול לשלוט בפרמטרים אלה ולקבל תוצאות שונות – לדוגמה לשנות את כיוון המבט של הדמות לצדדים או כלפי מעלה, להגדיל או להקטין את המרחק של הראש בפריים או ליצור הבעות רגש ספציפיות כמו אדישות, שמחה, זעם או הפתעה. המודל מצליח לייצר תנועה טבעית שמשמרת מראה עקבי, גם אל מול שינוי בזווית הראש או שינוי בדינמיקת הפנים. המשתמש יכול לשלוט ידנית בנתונים אלה בעזרת סליידרים שמאפשרים שליטה וכוונון נפרדים של התכונות השונות בתוכן המיוצר.

אאוטפוטים מגוונים ויצירתיים

המודל מציג ביצועים מרשימים גם אם הוא מקבל תמונות או קבצי אודיו שחורגים מטווח הנתונים שעליו אומן, כמו למשל תמונות אומנותיות (ראו את הדוגמה עם המונה ליזה בסרטון מעלה), קלטי שירה ואפילו דיבור בשפות שונות שאינן אנגלית (אין לנו מידע בעת הזאת לגבי יכולות בשפה העברית). ואני מחדד – סוגי נתונים כאלה לא הופיעו בסט האימון המקורי, אך VASA עדיין מצליח להתמודד איתם כאשר משתמשים מזינים לו אותם כאינפוט.

שיקולי אתיקה ואחריות של VASA-1

מיקרוסופט מדגישים שהמודל שפיתחו במסגרת המחקר שלהם ממוקד ביצירת מיומנויות ויזואליות־רגשיות לאווטרים ולסוכני AI וירטואליים כדי לעודד יישומים חיוביים. אין להם כוונה לאפשר יצירת תוכן מטעה, והם יפעלו למזעור נזקים (הפחתת הסיכוי של יצירת פייק ניוז, שימוש למטרות הונאה ומרמה וכן הלאה). הם מודעים לעובדה שכמו בכל טכנולוגיית ייצור תוכן (ובמיוחד בכל הנוגע לבינה מלאכותית יוצרת), גם פה עלול הכלי לשמש למטרות זדוניות ולחיקוי בני אדם אמיתיים (מה שמנוגד למדיניות החברה). הם מצהירים שהם מתנגדים לכל יצירה של תכנים מטעים או פוגעניים של אנשים אמיתיים, ולכן יפעלו ליישם טכניקות לגילוי זיופים. למרות הסיכונים הרבים חשוב להכיר בפוטנציאל החיובי הניכר של מודל זה – יתרונות בעולמות החינוך וההוראה, שיפור הנגישות למתמודדים עם קשיי תקשורת, הצעת חברה ותמיכה טיפולית לנזקקים ועוד. כל אלו ממחישים, לטענת מיקרוסופט, את חשיבות המחקר ואת יצירת המודל החדש.

הזמינות של VASA-1 לציבור ב־API

במיקרוסופט מספרים שבשלב זה אין להם תוכניות לשחרר כלי או ממשק שזמין לציבור וגם לא גישה ל־API. לדבריהם הם לא הולכים לשחרר שום מוצר או יישום בצורה כזאת או אחרת עד שיהיו בטוחים שהטכנולוגיה תשמש באופן אחראי ובהתאם לתקנות מתאימות.

מבט לעתיד

VASA-1 טומן בחובו פוטנציאל עצום ליישומים חיוביים רבים אך גם סכנות ניכרות לשימוש לרעה, לזיופים ולהונאות. המודל ממחיש את המשך ההתקדמות המדהימה בתחום הבינה המלאכותית הגנרטיבית ואת חשיבות הטיפול המושכל והאחראי בכוחן הרב של טכנולוגיות אלה. האם באמת יצליחו במיקרוסופט לגדר את הכלי ולצמצם את הפוטנציאל לנזק? ימים יגידו. מה שבטוח, ככל שאנחנו צועדים אל עבר עתיד שבו בינה מלאכותית נעשית חלק בלתי נפרד מהיום־יום שלנו, חלה על כולנו – הן המשתמשים והן החברות שמאחורי פיתוח הכלים הללו – החובה לגלות אחריות. זה הרבה מעבר לשימוש מושכל! זאת גישה כללית שמנסה לשים את הקדמה והביטחון בראש סדר העדיפויות בשל ההבנה שפעמים רבות מדובר בערכים סותרים. האיזון בין ערכים אלה יהיה מה שיקבע אם ה־AI ישמש ככלי לתועלת הציבור או כטכנולוגיה הרסנית עם השלכות הרות גורל הן ליחידים והן לקולקטיב.

הפוסט VASA-1 – מיקרוסופט נכנסת לשוק הדיפ־פייק ומכריזה על מודל ליפ סינק חדש ומרשים הופיע ראשון בLet's AI בינה מלאכותית

פיצ’ר הליפסינק החדש של ראנוויי זמין לציבור הרחב

אביתר אדרי — Mon, 25 Mar 2024 05:13:13 +0000

פיצ’ר הליפסינק (Lip Sync) החדש של ראנוויי Runway ai, מחולל הווידאו המוביל, פתוח לציבור הרחב.

אבל לפני הכול – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכון, חידוש או מידע על כלי חדש שיוצא…

Email

בלחיצה על "הרשמה" אני מאשר/ת את תקנון האתר, מדיניות הפרטיות וקבלת מסרים פרסומיים במייל

ממליצים לכם להצטרף גם לקהילות ה-AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה־AI שלנו? לחצו פה.

קצת על ראנוויי

ראנוויי, שתמיד עמדה בחזית הטכנולוגית של כלי הווידאו הג’נרטיביים, אהובה במיוחד על יוצרי וידאו ברחבי העולם, ויש לכך סיבות טובות! במשך השנה האחרונה היא הקפידה לשחרר פיצ’רים מתקדמים בקצב מסחרר. זה התחיל ב־Gen1 (מחולל Video2Video), המשיך ב־Gen2 (מחולל Text2Video) וממשיך בשורה של שדרוגים: מברשת התנועה (Motion Brush) המאפשרת להנפיש אזורים מוגדרים בתוך הסרטון, ובקרת המצלמה (Camera Motion) שנתנה ליוצרים חופש אדיר ושליטה על כיוון תנועת המצלמה ועל ההתרחשות בסרטון.

תחרות עזה בנישת הדיבוב והנפשת התמונות

לראנוויי, סטארט־אפ צעיר עם שווי שוק מוערך של חצי מיליארד דולר, יש לא מעט מתחרים! בעבר היא עמדה כמעט לבדה בנישת מחוללי הווידאו, אך מהר מאוד צמחו לה מתחרים כמו פיקה (Pika) שנוגסת בנתח השוק שלה. מהר מאוד חברות נוספות הציגו כלי הנפשת תמונות דומים המאפשרים לקחת תמונה סטטית ולהפיח בה חיים כסרטון. חברות כמו דומו (Domo), לאונרדו ואפילו פרום (Prome) גם השיקו כלים כאלה.

אך התחרות לא באה רק מצד מחוללי וידאו קלסיים או מחוללי תמונות שהוסיפו פי’צרים של עיבודי וידאו; היא הגיעה גם מצד כלים ליצירת אווטארים והנפשתם כמו D-ID הישראלית או הייג’ן (Heygen), שאף השיקה לאחרונה את גרסה 5.0 שלה. כלים אלה מתמחים ביצירת ‘ראשים מדברים’ (Talking Heads). הם מאפשרים לעבוד עם תמונה סטטית (לרבות תמונות שנוצרו בכלים אחרים) ולהנפיש אותה (להוסיף לה דיבוב, לג’נרט את תנועות השפתיים ולהתאים את הבעות הפנים). החברה היחידה שלה מודל Text2Speech שתומך גם בעברית היא D-ID, ואילו שאר הכלים תומכים רק בהעלאה של הקלטה קולית בעברית ובהנפשת הפנים לפיה. גם בגזרת מחוללי האווטארים התחרות לא עצרה; הייג’ן ו־D-ID הציגו מוצרים חדשניים ומהפכניים כמו סוכני AI ג’נרטיביים ויצירת אווטארים הייפר ריאליסטיים כולל כאלה שנוצרו על בסיס סרטונים שהעלו המשתמשים עצמם.

בשלב זה פיקה מיהרה ליישר קו ושחררה גם היא פי’צר הנפשת ודיבוב תמונות סטטיות: ליפ סינק (Lip Sync). ונראה שזה היה הקש ששבר את גב הגמל. כשפיקה, המתחרה הישירה של ראנוויי, משחררת כלי שמציב אותה כאלטרנטיבה ל־D-ID או הייג’ן ויכול לשמש כיתרון יחסי למשתמשים המתלבטים אם לעבוד עם הממשק הוובי של ראנוויי או שלה, לראנוויי לא נותרת ברירה. היא חייבת ליישר קו גם היא. כן, זה היה צפוי ומתבקש, והינה זה קורה.

דיבוב והנפשת תמונות בתוך ראנוויי

הפיצ’ר החדש של Runway מאפשר לכם להנפיש תמונת פנים בעזרת מודל Text to Speech או הקלטה קולית. ראו דוגמה בסרטון (הקרינג’י) מטה:

גייסנו את רוס גלר (דייויד שווימר מ”חברים”) להציג לכם את הפיצ’ר החדש. מתנצלים מראש על הסרטון הקרינג’י…

איך זה עובד?

כנסו לאתר של ראנוויי.

בחרו בכלי: Generative Audio.

העלו תמונה: אפשר לבחור מהמאגר של ראנוויי או מהתמונות שכבר נמצאות בתיקיית הנכסים שלכם בראנוווי, ואפשר גם להעלות תמונה מהמחשב או מהטלפון.

הקלידו טקסט או העלו הקלטה קולית.

אם הקלדתם טקסט, בחרו בקול מתוך המבחר העשיר של ראנוויי (נכון לרגע זה הכלי לא תומך ב־Text to Speech בעברית, ולכן תיאלצו להסתפק בהקלטה קולית).

לחצו על Generate, וזהו בתוך זמן קצר הסרטון שלכם יהיה מוכן.

דגשים והמלצות

כדי שהאודיו יהיה תואם לליפ סינק, הוא חייב לכלול מילים שמדוברות בבירור. הקפידו על הגייה תקינה ותאפשרו למודל של ראנוויי להנפיש את הפנים ואת תנועת השפתיים של הדמות.

לא רק תמונות; גם סרטונים! בניגוד לכלים אחרים המודל של ראנוויי מאפשר להנפיש ולדובב גם קבצי וידאו ולא רק תמונות סטטיות.

הקפידו שהפנים בתמונה או בסרטון יפנו ישירות אל המצלמה וממורכזות מהכתפיים ומעלה (לא קרובות מדי למצלמה).

חשוב שהתמונות או הסרטונים שלכם יהיו יחסית פוטו־ריאליסטיות ומספיק דומות לפנים אנושיות (עיניים, אף ופה), אחרת המודל יתקשה להנפיש אותן.

אם אתם מנפישים סרטון, הקפידו שהוא לא יכלול תנועות יוצאות דופן של הפה, של המצלמה, של הגוף או של הראש. כמו כן, רצוי שלא יהיו בו שינויי תאורה מובהקים.

הפוסט פיצ’ר הליפסינק החדש של ראנוויי זמין לציבור הרחב הופיע ראשון בLet's AI בינה מלאכותית

הייג’ן (Heygen) משיקה את גרסה 5.0

אביתר אדרי — Thu, 21 Mar 2024 10:49:10 +0000

הייג’ן (Heygen) משיקה את גרסה 5.0 ויוצאת בסדרה של שיפורים ושדרוגים לפלטפורמה שלה.

אבל לפני הכול – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכונים, חידושים או מידעים על כלים חדש שיוצאים.

Email

בלחיצה על "הרשמה" אני מאשר/ת את תקנון האתר, מדיניות הפרטיות וקבלת מסרים פרסומיים במייל

ממליצים לכם להצטרף גם לקהילות ה-AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה־AI שלנו? לחצו פה.

קצת על הייג’ן

למי שלא מכיר, הייג’ן (Heygen) היא אחת מפלטפורמות ה־AI המובילות בשוק ליצירת אווטארים דיגיטליים. לצידה תמצאו מתחרות כמו D-ID, סינתזיה ואפילו פיקה שמנסה לחדור לשוק הדיבוב וההנפשה.

לא רק הנפשה ודיבוב

תרגום לשפות אחרות ודיבוב אוטומטי

הייג’ן היא הרבה יותר מכלי ליצירת אווטארים או לדיבוב ‘ראשים מדברים’ (Talking Heads). היא מחזיקה בארסנל של כלים עוצמתיים במיוחד כמו למשל כלי הדיבוב שלה שיודע לקחת סרטון בשפה אחת, לתרגם אותו אוטומטית למגוון שפות אחרות, לבנות מודל קול של הדובר ולג’נרט סרטון חדש שבו הדובר מדבר בשפה אחרת בקולו שלו ובהנפשת הפנים ותנועות השפתיים בצורה מושלמת. מדהים!

כלי ליצירת וידאו פרסונלי בתפוצה רחבה

אחד הכלים המיוחדים והשימושיים של הייג’ן הוא כלי ה־Personalized Video. כלי זה מאפשר ליצור סדרת סרטונים של וידאו פרסונלי בסקייל (הכול בקליק אחד). כל מה שצריך לעשות, הוא להעלות קובץ אקסל עם משתנים כמו שם, מידע אישי או כל דבר שתרצו, להכניס את המייל של הנמען ולשלוח לו וידאו פרסונלי ישירות למייל שלו. תחשבו איזה פוטנציאל שיווקי אדיר יש כאן לפרסונליזציה עם הלקוחות שלכם, בין שאתם עסק קטן, ובין שאתם עסק גדול. לקוח אחד מארצות הברית מקבל סרטון אישי באנגלית שבו אתם מברכים אותו בשמו, ולקוח אחר מצרפת מקבל את אותו סרטון, אבל הפעם בשפתו שלו – צרפתית, ובסרטון הזה אתם אלה שמדברים בקול שלכם ופונים אליו בשמו. פרסונליזציה מושלמת!

כמה פשוט, ככה מדהים!

בסרטון הבא תמצאו מדריך לשימוש בכלי הווידאו הפרסונלי של Heygen

אווטארים מתקדמים ופוטוריאליסטיים

כמובן הדובדבן שבקצפת של הייג’ן הוא המגוון האדיר של האווטארים הדיגיטליים שלהם שנראים פשוט מדהים! קשה להבחין שאין מדובר באדם אמיתי. מדובר באווטארים ברזולוציה של HD שיכולים לדבר בכל שפה ואפילו מגיעים עם סטים שונים של לבוש. סט האווטארים של Heygen כולל גברים, נשים (ומגוון רחב של מאפיינים אתניים וגוני עור). אפשר לערוך את הרקע שמאחוריהם בעזרת עורך מתקדם ואף להיעזר ב־AI כדי לג’נרט להם טקסט בכל שפה. תעיפו מבט על הסרטון הבא שמציג מספר אווטארים שכאלה.

אינסטנט אווטאר שנראה ונשמע כמוכם

ללא ספק הפיצ’ר הכי מטורף שאיתו הייג’ן יצאו, הוא האינסטנט אווטאר (Instant Avatar). הכלי הזה מאפשר לכם ליצור אווטאר שנראה ונשמע בדיוק כמוכם ויודע לדבר במגוון רחב מאוד של שפות (אפילו עברית). אגב, אם תרצו שהוא ידבר עברית, יהיה עליו לוותר על אופציית ה־Text to Speech ולהשתמש בהקלטה קולית שלכם בעברית. בשאר השפות הקלדת הטקסט עובדת מצוין. מה שמדהים בכלי הזה, הוא הקלות הבלתי נסבלת שבה יוצרים את האווטאר. הוא מתבסס על צילום רגיל (אפילו מהטלפון הנייד) של שתיים־שלוש דקות וזהו. כתבנו מדריך מקיף על הכלי הזה – מוזמנים להעיף מבט.

ופה תוכלו לראות הדגמה של האווטאר שבניתי לעצמי:

שיפורים ושדרוגים בגרסה 5.0

כאמור, ממש היום השיקה הייג’ן את הגרסה החדשה, המשופרת והמשודרגת שלה – גרסה 5.0. אלה עיקרי השיפורים והשדרוגים:

עורך הסטודיו החדש AI Studio 3.0

ממשק עריכת הוידאו של הייג’ן (AI Studio 3.0) השתפר ומגיע עם יכולות משופרות ועוצמתיות יותר. מושלם ליצירת סרטוני הסבר על מוצרים, סרטונים חינוכיים, קורסים וסדנאות אונליין, פרסומות ומודעות וכמובן סדרות רשת או סרטים.

בתוך ממשק העורך ממשק התסריט עבר לצד שמאל והטיים־ליין שודרג ויכול להכיל מספר שכבות וערוצים ומגוון קבצים שונים (סאונד, וידאו, טקסט, אלמנטים עיצוביים ועוד).

העורך החדש של הייג’ן | credit: Heygen

אווטאר בלייב סטרים

כלי הלייב סטרים של הייג’ן אינו דבר חדש, אך גם הוא קיבל מקצה שיפורים. למי שלא מכיר, מדובר בפיצ’ר שמאפשר לכם לדבר בזמן אמת עם אווטאר שמחובר ל־API של ChatGPT ולכן יכול להגיב מייד לשאלות של המשתמש, ולענות לו בפורמט ידידותי ואנושי בהרבה; שיחה קולחת וטבעית עם מערכת AI בעלת חזות ומניירות אנושיות. ראוי לציין ש־D-ID הישראלית הקדימה את הייג’ן והשיקה כלי זהה. כתבנו בהרחבה על סוכני ה־AI של D-ID במאמר הבא.

שיפורים נוספים

הייג’ן שינו ושיפרו גם את הניווט בדף הבית של האתר שלהם. כעת תוכלו למצוא בקלות את כל המוצרים.

הייג’ן גרסה 5.0 – שיפורים בממשק האתר | credit: Heygen

גם שאר הכלים של הייג’ן עברו מקצה שיפורים:

Instant Avatars – אווטאר דיגיטלי הדומה לכם בקולו ובמראהו, כך שאינכם צריכים לעמוד מול מצלמה.
Video Translation – המרת סרטונים לשפות שונות בשמירה על קול המרצה המקורי ועל תנועות השפתיים.
Personalized Videos – יצירת סרטוני פנייה אישיים המותאמים לכל צופה בשפת האם שלו. כל זה בקנה מידה רחב ובתוך זמן קצר.
Streaming Avatar – מעורבות טובה יותר עם הקהל שלכם באמצעות שילוב אווטאר בשידורי לייב מול משתמשים בזמן אמת.
ועוד!

הפוסט הייג’ן (Heygen) משיקה את גרסה 5.0 הופיע ראשון בLet's AI בינה מלאכותית

פיצ’ר הליפסינק החדש של פיקה טורף את הקלפים!

אביתר אדרי — Wed, 28 Feb 2024 06:35:16 +0000

פיקה (Pika), מחולל הוידאו שכבר מזמן לא “האח הקטן” של Runway מדיסקורד, אלא סטארטאפ שצמח למימדי מפלצת בשווי 300 מיליון דולר ואתר ייעודי לג’ינרוט סרטוני AI, משחררת פיצ’ר חדש ומסקרן במיוחד: יכולת דיבוב סרטונים (ליפ סינק Lip sync).

אבל לפני הכל – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכון, חידוש או מידע על כלי חדש שיוצא…

Email

בלחיצה על "הרשמה" אני מאשר/ת את תקנון האתר, מדיניות הפרטיות וקבלת מסרים פרסומיים במייל

ממליצים לכם להצטרף גם לקהילות ה-AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה-AI שלנו? לחצו פה.

סרטון ההשקה של פיצ’ר הליפסינק החדש של פיקה

בסרטון ההשקה שהחברה השיקה נראה הפיצ’ר החדש, והוא בהחלט נראה מדהים. יש לו פוטנציאל אדיר להביא לתוצאות מעולות של התאמת שפתיים לקטעי סאונד, בין אם על סרטים שג’ונרטו בתוך הפלטפורמה או סרטונים שהועלו אליה ונוצרו בלפטפורמות אחרות. מדובר בכלי עוצמתי במיוחד שכאשר הוא חובר לכלים אחרים (אינטגרציה בין כלים) נוצר שלם שעולה על סך חלקיו.

למה זה טוב?

הכלי מציג תוצאות מרשימות – הוא יכול לשמש להפקת סרטוני דיפ פייק (Deep Fake), ליצירת אווטארים, ליצירת סרטוני AI ופרסומות AI, להפקת קליפים, סרטוני אנימציה ועוד ועוד.

איך משתמשים בפיצ’ר החדש?

בימים הראשונים להשקת הפיצ’ר, הוא היה זמין רק למנויי מנוי Pro של החברה ורק באתר הייעודי. נכון להיום, פיצ’ר הליפ סינק של פיקה זמין גם בחבילה החינמית. כל ג’ינרוט יעלה לכם 2 קרדיטים. כדאי לדעת שבחבילה החינמית תקבלו 250 קרדיטים חינם כדי שתוכלו להתחיל ליצור.

החבילות והמנויים של פיקה.

קצת דוגמאות

בסרטון ההשקה אפשר לראות את הפוטנציאל של הכלי, אבל משתמשים ברחבי העולם כבר החלו להשתמש בכלי ולקחו אותו צעד אחד קדימה. למשל, משתמש ה-X העונה לכינוי AshutoshShrivastava (@ai_for_success) לקח את הסרטונים של סורה (Sora) והוסיף להם דיבוב בעזרת הפיצ’ר החדש של פיקה. הדמות בסרטון שדיבב (שכאמור נוצר ב”סורה”) לועגת לצופים בעוקצנות:

אתם חושבים שתצליחו להניח את הידיים שלכם על סורה? שכחו מזה – הוא לא זמין!

ומה לגבי האיכות – פה התוצאות מדברות בשם עצמן.

When SORA Videos Met Pika LipSync

I took some SORA videos and used the Pika Lip Sync released yesterday, and the results are
if you like them, please repost and share with others. It helps a lot.
More examples in
1/4 pic.twitter.com/6GSuBUGFAc

— AshutoshShrivastava (@ai_for_success) February 28, 2024

עוד קצת דוגמאות לשילוב בין סורה לפיצ’ר הליפסינק של פיקה:

4/4
Lip sync works really awesome, and all these clips are first try.@pika_labs pic.twitter.com/OuYG7yqoxO

— AshutoshShrivastava (@ai_for_success) February 28, 2024

הפוסט פיצ’ר הליפסינק החדש של פיקה טורף את הקלפים! הופיע ראשון בLet's AI בינה מלאכותית

רוצים לראות איך הייתם נראים בתור דמות מצוירת? זה אפשרי!

ציפי גרינברג — Tue, 23 Jan 2024 22:08:53 +0000

כלי ה-InsightFaceSwap, הוא אחד הכלים השימושיים והמיוחדים שנמצאים בדיסקורד – אפשר לעבוד איתו על בסיס תמונות שיצרתם במידג’רני או בכל כלי אחר (אפילו בתמונות שאתם מעלים מהמחשב או שצילמתם בסמאטרפון שלכם). באמצעות הכלי הזה ניתן לקחת תמונה של כל אדם שהוא ולהחליף לו את הפנים בלחיצת כפתור. אבל מה קורה שרוצים להחליף את הפנים של חד קרן מהאגדות? הרי “פייס סאוופ” לא מאפשר להחליף פנים לדמויות שאינם בני אדם, כמו חיות למשל. אז מסתבר שזה כן אפשרי ושגם לזה מצאתי פתרון!

אבל לפני הכל – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכון, חידוש או מידע על כלי חדש שיוצא…

לפני שמתחילים

רגע לפני שמתחילים ולפני שאלמד אתכם איך להחליף פנים לדמות מצוירת, אתם צריכים מנוי למידג’רני או לכל מחולל תמונות אחר. אם אתם מחפשים מחוללים חינמיים, אפשר לעבוד עם לאונרדו או עם דאלי3.

אם אתם לא יודעים איך עובדים עם “פייס סוואפ” ואיך פותחים סרבר פרטי שאליו תוכלו להזמין את הבוט של פייס סוואפ (ורצוי גם את הבוט של מידג’רני), ממליצים לקרוא את המדריך המלא שלנו על כלי זה.

למה אי אפשר להחליף פנים לדמות לא אנושית?

אם התנסיתם בעבר בכלי המגניב של החלפת הפנים, אתם בטח יודעים, כשמנסים לבצע החלפת פנים על גבי דמויות שאינן אנושיות, מקבלים הודעת Failed
(ראו תמונה מטה), משום שהבוט לא מזהה פנים אנושיות שעליהן הוא צריך להתבסס ולכן הוא לא מצליח לבצע את החלפת הפנים.

הודעת שגיאה – לא מצליח לזהות פנים אנושיות

קבלו את הטריק הסודי שלי להחלפת פנים לחיות ולדמויות לא אנושיות

מצאתי לכם דרך לעקוף את הסירוב הזה ולהצליח להחליף פנים גם לדמויות מצוירות! הנה לכם מדריך קצר, שלב אחרי שלב, איך אפשר להחליף פנים לדמות לא אנושית/מצוירת, בעזרת הבוט InsightFaceSwap:

שלב 1) יצירת תמונה

צרו תמונה של הדמות שאתם רוצים להפוך לאנושית במידג’רני (או בכל מחולל תמונות אחר).
אני בחרתי ליצור תמונה של חד קרן קסום מהאגדות (ראו תמונה מטה).

שלב 2) משנים לדמות את הפנים לפנים אנושיות

לחצו על כפתור Vary region במידג’רני (נכון ליום פרסום המדריך הוא זמין רק בגרסה 5.2, אך צפוי להיכנס גם לגרסה 6 בהמשך).
אם אין לכם מידג’רני, השתמשו בכל כלי שמאפשר לבצע אינפיינטינג, למשל: פוטושופ ג’נרייטיב פיל, לאונרדו קנבס או פרום.
שנו את אזור הפנים והחליפו אותו בפנים אנושיות (פשוט סמנו את האזור המדובר ושנו את הפרומפט, בדומה לדוגמה מטה).

החלפת פני האוביקט בפנים אנושיות בעזרת אינפיינטינג

שלב 3) בוחרים את התוצאה שאהבתם

בשלב זה תקבלו 4 וריאציות שונות עבור הפרומפט שכתבתם. בחרו את הוריאציה שהכי אהבתם והגדילו אותה (UPSCALE).

שימו לב שלחד הקרן כעת יש פנים אנושיות

שלב 4) מעלים את התמונה שלכם

העלו תמונה שלכם (או של מי שתרצו לשתול את הפנים שלו בדמות המצוירת).
איך עושים את זה? בשורת הפרומפט כתבו /saveid ותופיע לכם האפשרות להעלות תמונה מהמחשב.
העלו את התמונה ותנו לה שם בקוביית הטקסט שבה רשום idname

פקודת /save id בפייס סוואפ

ככה בעצם אפשר להעלות תמונות שונות ולכל אחת לתת שם משלה. (זכרו טוב את ה-ID שנתתם לתמונה כי תצטרכו להגדיר אותו בהמשך).

שלב 5) מפעילים את InsightFaceSwap

לחצו מקש ימני על גבי התמונה והפעילו את הבוט – InsightFaceSwap, הבוט יחליף את הפנים של הדמות המצוירת שלכם עם התמונה האחרונה ששהגדרתם אצלו (באמצעות ה-setid).
אם העלתם רק תמונה אחת בלבד, הוא ישתמש בה.
למידע נוסף על תפעול הבוט של פייס סוואפ, ממליצה לכם בחום לקרוא את המדריך המלא (לינק מעלה).

הטמעת הפנים האחרונות ששמרנו

שלב 6) בתמונה הסופית

וכך אתם יכולים להטמיע את פניכם בתמונה של דמות מצוירת ולא אנושית… או במקרה שלי… מזהים מי הפכה לחד קרן?
התשובה בגוף השאלה

אני בתור חד קרן

הפוסט רוצים לראות איך הייתם נראים בתור דמות מצוירת? זה אפשרי! הופיע ראשון בLet's AI בינה מלאכותית

הכירו את סוכני ה-AI של D-ID

אביתר אדרי — Fri, 29 Dec 2023 10:58:00 +0000

למי שלא מכיר, D-ID היא חברה ישראלית, ואחת מחלוצות האווטארים הג’נרטיביים. היא אחת החברות הראשונות בעולם שיצרו “ראשים מדברים” (Talking Heads). כלומר, דמויות AI שניתן להנפיש ולדובב. ניתן לבחור דמויות אלו מתוך מבחר רחב שהחברה מעמידה לרשות המשתמשים, אך יש גם אפשרות לג’נרט דמות בתוך הממשק של D-ID או אפילו ליצור דמות במחולל תמונות אחר ולהעלות אותה ל-D-ID). עם הזמן צמחו לחברה מתחרות רציניות בתחום – אחת מהן היא Heygen, והיה נדמה לרגע ש-D-ID עלולה להישאר מאחור. אבל בישראל כמו בישראל לא נחים על זרי דפנה ולא נרדמים בשמירה. החבר’ה מ-D-ID המשיכו לפתח ולשחרר מוצרים מהפכניים חדשים, מהם נציג שניים היום:

אבל לפני הכול – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכונים, חידושים או מידעים על כלים חדש שיוצאים.

Email

בלחיצה על "הרשמה" אני מאשר/ת את תקנון האתר, מדיניות הפרטיות וקבלת מסרים פרסומיים במייל

ממליצים לכם להצטרף גם לקהילות ה-AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה-AI שלנו? לחצו פה.

הראשון הוא כלי ליצירת סוכני AI שמתקשרים בזמן אמת עם המשתמשים, הן במישור טקסטואלי (כתוב), ויזואלי (הנפשת פני הדמות) וקולית (הדמות מדברת בפועל).

הכלי השני הוא צ’אט מיוחד שמאפשר לייצר אווטאר שכזה, איתו ניתן לדבר בזמן אמת.

בסרטון הבא תוכלו לראות הדגמה בלייב שלי, מדבר עם סוכן שכזה, שבניתי לשיווק הקורסים שלנו. הקטע לקוח מתוך הרצאת ה-AI למנהלים שלי.

סוכני AI מבית D-ID

לפני הכל, צפו בסרטון ההשקה של פיצ’ר סוכני ה-AI של D-ID:

איך מקבלים גישה ל-D-ID ai?

כדי לקבל גישה לכלי, יש להכנס לאתר הבא.

מה זה בכלל סוכן AI ואיך זה עובד?

סוכני ה-AI של D-ID הם סייעני בינה מלאכותית אוטונומיים שיכולים לענות על שאלות על בסיס הידע שהעלה הבעלים שלהם, ולבצע תפקיד או משימה ספציפית שיעילים עבור מקרי שימוש עסקיים או אישיים. הם יכולים לעזור למשתמשים בכל דבר החל מלימוד אסטרונומיה, ניתוח מסמכים, ואפילו לשמש כפלטפורמה למשפיענים או חברות המעוניינים בממשק צ’אט שינהל שיח אנושי עם העוקבים שלהם. כל סוכן הוא מומחה בתחום אחר ויש לו גישה לידע ייעודי שהיוצר שלו סיפק. סוכנים אלו משתמשים בעיבוד שפה טבעית (NLP) ובינה מלאכותית ג’נרטיבית כדי להבין את הקלט הטקסטואלי או הקולי שלך, ואז לספק תגובות רלוונטיות או לבצע משימות. סוכנים יכולים לענות על שאלות, לספר סיפורים, לתת המלצות ועוד.

על ידי מיזוג הטכנולוגיה המתקדמת של מודלי שפה עם החום האנושי שמתקבל בעת תקשורת מול דמות אנושית פנים אל פנים, סוכני ה-AI של D-ID מצליחים לייצר חוויית תקשורת דיגיטלית חדשה בין אדם למכונה. חוויה אישית ואנושית יותר, אינטימית יותר וטבעית יותר. כל שעליכם לעשות הוא לבחור את מראה הסוכן שתרצו ליצור, לבחור את הקול שלו, לתאר כיצד אתם רוצים שהוא יתקשר, ולספק לו מסמכים כדי להרחיב ולהתאים אישית את בסיס הידע שלו. בתוך דקות ספורות תקבלו “אדם דיגיטלי” מוכן לפעולה, איתו אפשר לשוחח בדיוק כמו עם בן אדם אמיתי.

* איך עובדים סוכני ה-AI של D-ID. מקור: האתר של D-ID

אז איך זה באמת עובד? בשלב הראשון המשתמש שואל שאלה (מזין פרומפט טקסטואלי). המידע מתקבל במערכת ובעזרת מודלי החישוב מתבצע ניתוח של השאלה ושליפת הידע. המידע מעובד במודל שפה גדול שמנסח תשובה לשאלה שנשאלה. האווטאר הדיגיטלי (סוכן ה-AI) מונפש בהתאם לטקסט. כל התהליך הזה קורה בזמן אמת ובצורה פלואידית. מדהים!

מה ההבדל בין סוכני ה-AI של D-ID לבין כלים/סוכנים אחרים?

קאסטומיזציה מוחלטת: התאמה אישית של סוכן הD-ID מאפשרת לכם להתאים אותם לצרכים הספציפיים שלכם, ולהביא נוכחות ידידותית ואקטיבית בכל אינטראקציה.
צעד אחד מעבר לטקסט: הסוכנים מקשיבים, מגיבים, ומציעים מימד אנושי לשיחות דיגיטליות. חוויה שונה לחלוטין משיחה עם מודל שפה גדול כמו ChatGPT או Claud.
תגובות מהירות ומדויקות: עם דיוק של מעל 90% המסופק בפחות משתי שניות, השאילתות שלכם מקבלות מענה מהיר ומדויק במיוחד.
אמינות וחדשנות: הודות לטכנולוגיית retrieval augmented generation (RAG), סוכני ה-AI של D-ID משתחררים מהגבלות מודלי שפה טיפוסיים, ומספקים מידע מעודכן ומשופר.

בסרטון הבא תוכלו לראות את היתרונות של סוכני AI לעומת ממשקי צ’אט מסורתיים:

איך יוצרים סוכן AI עם D-ID?

כל אחד יכול ליצור סוכן AI, ללא כל ידע בקידוד. יצירת סוכן קלה כמו בחירת תפקיד, מתן הוראות לסוכן והעלאת ידע נוסף. כל מה שאתם צריכים הוא חשבון ב-D-ID ובקשת גישה דרך הרשימה המוקדמת (פירוט מעלה). לאחר קבלת הגישה תוכלו להשתמש בפלטפורמת הסוכנים, לה יש ממשק נוח ואינטואיטיבי במיוחד! תוכלו לאמן את הסוכן שלכם על דאטה ייעודית, מה שיהפוך אותו למומחה בתחומו, יועץ או סייען יעיל במיוחד. בסופו של דבר, מה שהסוכן שלכם יעשה תלוי לחלוטין בכם ובמידע שתספקו לו (וכמובן גם לאינפוטים שהוא יקבל ממשתמש הקצה). המסמכים והנתונים שתעלו יספקו לסוכן שלכם דאטה שאינו זמין ל-LLM (מודל השפה) עליו מבוססים הסוכנים. לדוגמה, המסמכים והנתונים שלכם יכולים להכיל חדשות עדכניות או מידע שאינו פומבי. אפשר להעלות קבצי PDF, קבצי טקסט או אפילו מצגת PowerPoint (קובץ PPT), מה שיעצים משמעותית את המומחיות והיכולות של הסוכן שלכם. בהמשך יהיה ניתן להעלות גם לינקים לאתרי אינטרנט (פונקציה זו עדיין לא נתמכת, אך לדברי החברה תהיה בעתיד הקרוב). עבור תוצאות אופטימליות, מומלץ להעלות מסמכים המכילים מידע רלוונטי ומדויק עבור התפקיד של הסוכן שברצונכם לבנות.

חשוב לדעת: המסמכים שלכם נגישים רק לכם ולסוכנים שתבנו ויקבלו גישה לדאטה שלכם. עם זאת, חשוב לזכור שאם אתם מאפשרים למשתמשים אחרים לשוחח עם הסוכן שלכם, אז הם יכולים גם ללמוד על תוכן מסמכים ונתונים אלו.

לפניכם סרטון הדרכה קצרצר המסביר איך אפשר לבנות סוכן AI שכזה:

איך ניתן לשוחח בפועל עם סוכן ה-AI?

לאחר יצירת סוכן ה-AI שלכם, תוכלו להנגיש אותו לקהלים שלכם ע”י הטמעתו באתר או ע”י משלוח לינק שמפנה לסוכן שלכם. הקהלים שלכם יכולים להתחיל לייצר שיח מול הסוכן שלכם. הם יכולים להקליד שאלות בתיבת הקלט הטקסטואלית, או אף לדבר איתו במישור קולי ע”י לחיצה על סמל המיקרופון ודיבור בקולם. ל-D-ID יש טכנולוגיית המרת דיבור לטקסט שתאפשר שיח זורם וטבעי.

אלו קולות זמינים לסוכני ה-AI של D-ID?

בעת יצירת סוכן תקבלו גישה למגוון קולות עשיר, מתוך המבחר של D-ID. קולות באיכות גבוהה מ-ElevenLabs יהיו זמינים רק עבור חלק מהתוכניות (Pro, Advanced, and Enterprise).

האם המידע שלי מוגן וחסוי?

חשוב מאוד להגן על הפרטיות שלכם, ולכן בכל מצב לא מומלץ לשתף, לחשוף או להעלות פרטים אישיים או מידע אישי רגיש, הן בשלב אימון הסוכן והן בשלב השיח עימו.

קצת דוגמאות… איך זה נראה בפועל?

שימו לב איך זה נראה בפועל. יובל אבידני בנה סוכן AI בעזרת הפלטפורמה של D-ID. בדוגמה הראשונה הוא בנה סוכן בו בן דמותו משיב למשתמשים. בדוגמה השניים הוא בנה סוכן העונה לשם “האוס” (תכף תבינו למה) שמתפקד כסוכן נדל”ן עם מאגר ידע על דירות, אשר משיב על פי המאגר שברשותו.

@yuval.ai

This is so cool: custom AI avatars with custom knowledge base! I built myself and also built a real estate salesman! Check it oit! So cool D- ID!! #ai #did #artificialintelligence #avidani #hackit #yuvai #deepfake #avatar #aiavatar #interfacesevolve #בינהמלאכותית #דיפפייק #אוואטר #אווטאר

♬ צליל מקורי – Yuval Avidani (AI)

* קרדיט: יובל אבידני.

לשוחח עם ChatD-ID

לא רק סוכני בינה מלאכותית! D-ID היא האפליקציה הראשונה שמאפשרת שיחות פנים אל פנים עם ChatGPT. זו ההזדמנות שלכם לתת למודל השפה שלכם דמות, איתה אפשר לשוחח, ממש כמו שיחה עם אדם אמיתי. והכי חשוב – כל הפאן הזה חינמי לגמרי (בחבילת התנסות מוגבלת). אבל לפני הכל, צפו בסרטון הבא:

הוסיפו “מגע אנושי” לשיחות שלכם עם AI ונהלו שיחה בזמן אמת עם “אדם דיגיטלי” המונע על ידי שילוב של טכנולוגיית D-ID, LLM ו-NLP. היכולות המתקדמות של D-ID בהנפשת פנים מאפשרות למשתמשים לקבל חוויית שיחה עם בינה מלאכותית באופן אנושי וטבעי יותר, באמצעות דיבור ווידאו במקום שיחה במישור טקסטואלי בלבד.

הפיצ’ר זמין לניסיון חינם בחבילה מוגבלת. כדי לקבל גישה לכלי, לחצו פה. משתמשים יכולים לקיים עד חמישה צ’טים עם אדם דיגיטלי, כל צ’ט מורכב מ-6 אינטראקציות הלוך ושוב. בסרטון הבא תוכלו לראות שיחה לדוגמה שלי, עם דמות בשם אוליביה:

* השיחה שלי עם אוליביה – אווטאטרית דיגיטלית מבית D-ID שהופכת את השיחה עם ChatGPT לקולחת וזורמת הרבה יותר.

אולי גם זה יעניין אתכם…

קבלו מדריך מפורט שילמד אתכם צעד אחר צעד איך ליצור אווטאטר מתקדם בדמותכם, שיראה, ישמע ויתנהג בדיוק כמוכם! לקריאה לחצו כאן.

קורס בינה מלאכותית

הפוסט הכירו את סוכני ה-AI של D-ID הופיע ראשון בLet's AI בינה מלאכותית

Let it go – Bibi style

אביתר אדרי — Tue, 26 Dec 2023 14:27:53 +0000

מבלי להיכנס לפוליטיקה ומבלי לנקוט עמדה או צד – בואו פשוט נחייך ונעריך את היכולות והכלים בהם השתמש אורי בז’רנו כדי לייצר את קליפ ה-AI הסאטירי הבא, שעושה פרפרזה לשיר המפורסם מ”לשבור את הקרח”. הקליפ הפך ויראלי ברשתות החברתיות ונכון לרגע זה עומק על למעלה מ 100,000 צפיות ומאות שיתופים.

את התמונות אורי ג’ינרט עם הגרסה החדשה של מידג’רני (Midjourney V6). מידול קול הוא עשה עם KITS, דיבוב לקטעי השירה עם D-ID, תנועות אנימציה עם PIKA, עריכה עם CAPCUT וכתוביות עם KAPWING.

הפוסט המקורי של אורי בפייסבוק.

הפוסט Let it go – Bibi style הופיע ראשון בLet's AI בינה מלאכותית

איך בונים אוואטאר דיגיטלי בדמותכם בשניות?!

אביתר אדרי — Wed, 13 Dec 2023 12:53:52 +0000

כבר חודשים אני נהנה לראות איך Heygen הופכת מחברה קטנה לחברה מהפכנית שמטלטלת את עולם ה-AI. זה התחיל מהאוואטארים הריאליסטיים המדהימים שלהם, שהכניסו לכיס הקטן את D-id (וזה חבל ממש כי יש לי חיבה גדולה ל-D-id כחברה ישראלית מובילה בתחומה בעולם). זה המשיך עם כלי תרגום הוידאו שלהם (שמתרגם, מנפיש ומדובב את הסרטון שלכם למגוון שפות). לצד כל אלו לחברה יש מחולל תמונות מובנה, כלי פייס סוואפ לוידאו, התממשקות עם ChatGPT, ועוד שלל כלים ניסיוניים שהחברה מפתחת.

אבל לפני הכל, שימו לב לסרטון הבא!

* בסרטון: אווטאר דיגיטלי שיצרתי בדמותי בעזרת Heygen, על בסיס סרטון שצולם בטלפון הנייד שלי.

שלבים ליצירת אווטאר בינה מלאכותית בדמותכם עם Heygen

בשלב הראשון כנסו לאתר של Heygen והירשמו לכלי שמאפשר יצירת אווטאר בינה מלאכותית. בחבילה החינמית תקבלו קרדיט אחד בודד חינם המאפשר ליצור סרטון של עד דקה. כמו כן, תקבלו אוואטאר דיגיטלי אחד (Instant Avatar). אם תעשו מנוי (החבילות מתחילות מ-29 דולר בחודש) תיהנו מ-3 אוואטארים כאלה וג’ינרוט סרטונים של עד 3 דקות כל אחד.

* צילום מסך של עמוד פתיחת חשבון ב-Heygen

לאחר ההרשמה הראשונית תגיעו לעמוד הבית של Heygen, שם יופיעו לכם 1 עד 3 אוואטארים דיגיטליים (Instant Avatars) בהתאם לחבילה שלכם. לחצו על אחד מהספוטים הפנויים (מודגשים בתמונה מטה באדום).

* באדום: כפתורי יצירת האוואטרים המיידיים בדמותכם (Instant Avatar).

במסך הבא תפגשו בסרטון של מייסד Heygen – אפשר לדלג את הצפייה בסרטון זה וללחוץ על הכפתור הסגול Get Started (אלא אם אתם ממש סקרנים…)

* צילום מסך מתוך Heygen. אפשר לדלג על הסרטון…

במסך הבא תקבלו את ההנחיות ליצירת סרטון הבסיס שלכם, שעל בסיסו יבנה האווטאר. להלן עיקרי הדגשים: צלמו סרטון באורך של 2 דקות ומעלה, רצוי ברזולוציה כמה שיותר גבוהה (מומלץ להעיף מבט על הגדרות הוידאו בטלפון הנייד שלכם – לרוב תגלו שאתם לא על הרזולוציה המקסימלית של מצלמת הוידאו שלכם). יש להקליט את הסרטון במקום מואר ושקט. בזמן הסרטון עליכם להביט היישר למצלמה ולהקפיד לעשות פאוזה של כשנייה בין משפט למשפט (כשהפה שלכם סגור). אפשר להשתמש בתנועות ידיים גנריות (אך להקפיד שלא יעברו את גובה החזה). יש להקפיד שתנועות הידיים לא יסתירו את הפנים ולא יהיו מוגזמות. חשוב שהסרטון יהיה רציף, ללא עריכות וללא פאוזות ארוכות מדי בדיבור. חשוב לשבת בתנוחה קבועה ולא לזוז יותר מדי. וודאו שאין צללים על הפנים שלכם ושאתם לא מסיטים את המבט למקום אחר (זכרו – מקדו את המבט במצלמה). אם אתם ממש רוצים, במסמך הבא יש את ההנחיות המלאות (באנגלית), אבל באמת שזה העיקר. אתם יכולים לדבר באיזו שפה שאתם רוצים וזה ממש לא משנה על מה תדברו – העיקר שיהיה ל-Heygen מספיק חומר גלם מצולם ומספיק הקלטות של הקול שלכם כדי לבנות מודל קול ואוואטאר דיגיטלי על בסיס דמותכם.

* תקציר ההנחיות של Heygen ליצירת אוואטאר דיגיטלי.

בשלב הבא תתבקשו להעלות את הסרטון שהקלטתם מבעוד מועד. ישנן שתי אפשרויות – להשתמש בסרטון שהוקלט מראש או להקליט סרטון עם מצלמת המחשב והמיקרופון שלו. כמובן שזו אופציה פחות טובה ומומלץ להשקיע בהקלטה איכותית מראש (אם יש לכם גישה למצלמה מקצועית ולא טלפון אז עדיף, אבל מנסיונות שלי גם מצלמות סמארטפונים עושות עבודה מצוינת). בתחתית המסך תוכלו לראות דוגמאות רצויות שהחברה מספקת. לאחר שתעלו את הסרטון תתבקשו לאשר שוב שהפנים שלכם גלויות, שאתם מסתכלים כל הזמן לאותו מקום (למצלמה), שיש פאוזות קצרות בין משפט למשפט ושהסביבה שלכם מוארת ושקטה. לאחר סימון וי על כל האפשרויות הנ”ל תוכלו ללחוץ על כפתור My Footage Looks Good שיעלה בפועל את הסרטון לפלטפורמה. שימו לב שיש אפשרות לסמן וי גם בתחתית המסך על בקשת אישור לעשות שימוש בוידאו שלכם לאימון המודלים של Heygen (על כל מה שמשתמע מכך). אתם לא חייבים לסמן אופציה זו אם אתם לא רוצים.

* מסך העלאת הסרטון.

כמעט סיימנו – בשלב האחרון תצטרכו לצלם סרטון הסכמה שמוכיח שאתם אכן אתם ושהאווטאר שאתם מנסים ליצור הוא שלכם ולא של אדם אחר. במהלך הסרטון תתבקשו להקריא למצלמת המחשב טקסט קבוע מראש. ברגע שאתם מוכנים לחצו על הכפתור הסגול: Start Recording.

* הטקסט שתצטרכו להקריא מול המצלמה כדי לתת את הסכמתכם.

וזהו זה – בסיום התהליך Heygen יתחילו להפיק את האוואטאר הדיגיטלי שלכם. התהליך לוקח כ10-20 דק’ ובסופו תקבלו מייל אישור.

הגיע הזמן להתמקצע!

אני מלמד על Heygen, על מגוון הפיצ’רים המיוחדים שלו בסדנת ה-AI בוידאו שלי. בסדנה תלמדו לעבוד עם מחוללי הוידאו המובילים בשוק, כמו ראנוויי (Runway) Gen1 ו-Gen2, קאיבר (Kaiber), וונדר סטודיו (Wonder Studio), ועוד. וכמובן שלקוראי המגזין שלנו יש הנחה! למימוש ההטבה הזינו את קוד הקופון LETSAI בלינק הבא.

תרגום ודיבוב סרטונים לשפות אחרות עם Heygen

להייג’ן יש פיצ’ר מדהים נוסף (שאגב, הפך רלוונטי מתמיד בימי המלחמה בכלל במלחמת ההסברה בפרט). מוזמנים לצפות בסרטון הקצר הבא שמסביר על הפי’צר ועל התהליך:

* למדו לדבר שפה זרה בשניות… סתם סתם – הפיצ’ר המדהים הזה מאפשר לכם לקחת סרטון שלכם באנגלית (או באחת מהשפות התומכות) ואז לתרגם ולדובב אותו בשניות למגוון שפות אחרות. התוצאה – סרטון שלכם מדברים בקולכם האמיתי בשפה זרה בצורה קוהרנטית ומובנת.

התוסף של Heygen ל-ChatGPT

להייג’ן יש גם פלאגאין ל-ChatGPT, מה שמאפשר לכם ליצור אוואטארים ישירות מתוך מודל השפה האהוב. עם זאת, לא מדובר באוואטאר שלכם, אלא של דמויות גנריות מתוך המאגר של Heygen.

איך עושים את זה?

1. מתקינים את הפלאגאין של HeyGen בתוך שרשור חדש ב-ChatGPT (צריך כמובן מנוי ל-GPT PLUS).
2. מתארים לו את הסרטון הרצוי (אפשר לתת לו טקסט מוכן מראש ואפשר לבקש ממנו לג’נרט טקסט).
3. וזהו – יוצאים לדרך. תוך שניות תקבלו לינק לסרטון האווטאר שלכם, שנוצר בעזרת HeyGen.

מוזמנים לצפות בסרטון הבא שמדגים את כל התהליך:

* שימו לב שבסוף הסרטון יש הסבר על פיצ’ר נוסף של Heygen – פייס סוואפ בוידאו.

הפוסט איך בונים אוואטאר דיגיטלי בדמותכם בשניות?! הופיע ראשון בLet's AI בינה מלאכותית