הנפשת ודיבוב אווטרים | Let's AI בינה מלאכותית https://letsai.co.il/articles/animation-and-dubbing/ בינה מלאכותית Wed, 25 Sep 2024 07:52:28 +0000 he-IL hourly 1 https://wordpress.org/?v=6.5.5 https://letsai.co.il/wp-content/uploads/2024/03/cropped-logo-lets-ai-32x32.webp הנפשת ודיבוב אווטרים | Let's AI בינה מלאכותית https://letsai.co.il/articles/animation-and-dubbing/ 32 32 שיבוט קול בעברית עם Play HT! לא תאמינו כמה זה פשוט וקל (ומפחיד) https://letsai.co.il/playht-voice-cloning/ https://letsai.co.il/playht-voice-cloning/#respond Mon, 23 Sep 2024 07:34:37 +0000 https://letsai.co.il/?p=31381 שנה עברה מאז שסיקרתי לראשונה את Play.ht, כלי שבזמנו הציע פתרון מדהים: הזנת טקסט ויצירת קול ריאליסטי במיוחד, בהתאם לדגימת קול קצרה של 30 שניות. השבוע, הכלי קיבל עדכון חשוב ומעניין במיוחד עבורנו – דוברי העברית. מסתבר שהכלי תומך בעברית! כמובן שלא יכולתי להתאפק וניגשתי מיד לבדוק איך זה עובד, והתוצאות לא פחות ממדהימות.   […]

הפוסט שיבוט קול בעברית עם Play HT! לא תאמינו כמה זה פשוט וקל (ומפחיד) הופיע ראשון בLet's AI בינה מלאכותית

]]>

שנה עברה מאז שסיקרתי לראשונה את Play.ht, כלי שבזמנו הציע פתרון מדהים: הזנת טקסט ויצירת קול ריאליסטי במיוחד, בהתאם לדגימת קול קצרה של 30 שניות. השבוע, הכלי קיבל עדכון חשוב ומעניין במיוחד עבורנו – דוברי העברית. מסתבר שהכלי תומך בעברית! כמובן שלא יכולתי להתאפק וניגשתי מיד לבדוק איך זה עובד, והתוצאות לא פחות ממדהימות.

 

איך עושים Text to Speach בעברית?

לפני שנצלול למסקנות שלי, אני מזמין אתכם לצפות בסרטון החדש שהכנתי על העדכון של Play.ht, ולהתרשם מהיכולות המרשימות בעצמכם:

 

 

מה זה Play.ht?

קודם כל בואו נבין מה זה Play.ht. מדובר בכלי שמאפשר לקחת טקסט וליצור ממנו קול מלאכותי שנשמע כל כך ריאליסטי שקשה להבחין שהוא לא אנושי. מה שמדהים בכלי הזה הוא לא רק הריאליזם של הקול, אלא גם המגוון העצום של השפות, המבטים והסגנונות שהמערכת מציעה. עם יותר מ-900 קולות ו-142 שפות שונות, Play.ht יכול להפוך כל טקסט, פשוט או מורכב, ליצירת דיבור מקצועית ומדויקת.

 

איך Play.ht עובד?

כשהתנסיתי בגרסה הראשונה של הכלי, השתמשתי בדגימת קול של בני פרבר, חבר יקר ומגיש הפודקאסט “פשוט AI”. שיכפלתי את קולו של בני וכתבתי טקסט שהמערכת הפכה לקול שלו, כאילו הוא עצמו מדבר. זה היה פשוט מטורף – כך קיבלתי את קולו של בני מקריא טקסטים חדשים לחלוטין שכתבתי בעצמי. אתם יכולים לצפות בסרטון הישן ולראות איך זה עבד לפני שנה:

 

 

כמובן, כל התהליך נעשה באישור מלא של בני, ואני רוצה להדגיש: השימוש בכלי כזה מצריך אחריות. אם אתם משכפלים קול, תמיד יש לוודא שאתם עושים זאת בהסכמת בעל הקול. אין להשתמש בטכנולוגיה הזו כדי לפגוע באחרים.

 

העדכון החדש – תמיכה בעברית

העדכון המשמעותי שקיבל Play.ht הוא תמיכה בעברית. עד כה, אחד החסמים המשמעותיים היה היכולת לעבוד בעברית, אבל עכשיו המערכת תומכת בשפה בצורה חלקה. ניגשתי לבדוק איך זה עובד – והופתעתי לטובה. הקול שנוצר נשמע טבעי ומותאם בצורה יוצאת דופן לשפה.

 

קורס יצירת מוזיקה עם בינה מלאכותית

רוצים ללמוד איך ליצור זמרי AI מותאמים אישית, איך ליצור מוזיקה עם AI כמו המקצוענים ואך לקחת את המוזיקה שלכם צעד אחד קדימה? הצטרפו לקורס יצירת מוזיקה עם AI של LetsAI וגלו עולם חדש של יצירתיות מתפרצת!

 

הכלים והפיצ’רים של Play.ht

Play.ht מציעה מגוון כלים ופיצ’רים שמספקים פתרונות מתקדמים ליצירת קול מלאכותי ברמה הגבוהה ביותר. מהיכולת לשכפל קולות ועד התאמה אישית מדויקת של תכונות הקול, הפלטפורמה מספקת מענה לכל סוגי הפרויקטים – מסרטוני שיווק ועד דיבוב למשחקי וידאו. הנה כמה מהכלים והפיצ’רים המרכזיים ש-Play.ht מציעה.

 

טקסט לדיבור (TTS)

המנוע המרכזי של Play.ht הוא טכנולוגיית טקסט לדיבור (Text-to-Speech – TTS) המבוססת על בינה מלאכותית. עם מעל 900 קולות שונים ב-142 שפות ומבטאים, Play.ht מאפשרת ליצור קולות מציאותיים שנשמעים כאילו הם מוקלטים על ידי אנשים אמיתיים. המערכת תומכת גם בקולות עם אינטונציות שונות ויכולות רגשיות, מה שמאפשר להעניק לקול אופי שמתאים באופן מדויק לפרויקט שלך.

 

שכפול קול (Voice Cloning)

אחד מהפיצ’רים הייחודיים של Play.ht הוא היכולת לשכפל קולות. באמצעות טכנולוגיה מתקדמת, ניתן ליצור עותק דיגיטלי מדויק של קול של אדם אמיתי, ולהשתמש בו להפקת דיבור חדש. הכלי הזה מושלם עבור יוצרי תוכן שמעוניינים להשתמש בקול קיים בלי להזדקק לאישורים והקלטות חוזרות. חשוב לזכור להשתמש בכלי הזה בצורה אתית, כפי שכבר ציינתי, ולקבל אישור לשכפול קול מבעליו.

 

עורך טקסט לדיבור עם תצוגה מקדימה

Play.ht מציעה עורך טקסט לדיבור פשוט ונוח לשימוש, שבו ניתן להקליד, להדביק או לייבא טקסט ולהפוך אותו לקובץ קול תוך מספר שניות. אחד מהפיצ’רים הבולטים בעורך הוא האפשרות לתצוגה מקדימה של התוצר, כך שתוכלו להאזין לתוצאה הסופית לפני שתשמרו או תורידו את הקובץ. זהו כלי חשוב למי שרוצה לחדד את הדיבור ולוודא שהקול מתאים בדיוק לציפיות.

 

תכונות התאמה אישית מתקדמות

Play.ht מספקת כלים להתאמה מדויקת של הקול. ניתן לשנות את מהירות ההקראה, לקבוע טון דיבור, להוסיף הדגשות למילים ספציפיות, ואפילו לשלב הפסקות טבעיות בטקסט כדי להעניק לקול גוון אנושי יותר. הכלי הזה מאפשר ליצור קריינות שמשדרת מקצועיות ואיכות, תוך כדי שמירה על אותנטיות.

 

Multi-Voice Feature

אחת התכונות המיוחדות של Play.ht היא האפשרות לשלב מספר קולות שונים באותו קובץ שמע. זה מאפשר ליצור דיאלוגים או שיחות בין דמויות שונות בתוך פרויקט אחד, ולשמור על גיוון ושילוב קולני עשיר בתכנים כמו פודקאסטים, סיפורי שמע, או סרטוני הדרכה.

 

ספריית הגדרות הגייה אישית

באמצעות Play.ht ניתן לקבוע הגייה מדויקת למילים מסוימות, ולשמור את ההגדרות לשימוש חוזר. כלי זה שימושי במיוחד עבור מקרים שבהם יש צורך לשמור על אחידות במושגים טכניים, שמות מותגים, או ביטויים ייחודיים. כך, תוכלו להבטיח שכל הקלטות הקול ישמרו על אותן הגדרות ההגייה בכל פעם.

 

תמיכה ב-SSML

העורך של Play.ht תומך בתגיות SSML (Speech Synthesis Markup Language), שמאפשרות שליטה מתקדמת עוד יותר על טקסטים. באמצעות SSML ניתן להגדיר אינטונציות, דגשים, הפסקות ומאפיינים נוספים כדי להגיע לתוצאה מדויקת ואיכותית. זהו כלי חשוב למי שזקוק לשליטה מלאה על כל פרט ופרט בהפקת הקול.

 

שילוב API

Play.ht מציעה גם API מתקדם, המאפשר למפתחים לשלב את טכנולוגיית הקול של Play.ht באפליקציות ופלטפורמות שונות. ה-API מתאים במיוחד לחברות גדולות וסטארט-אפים שרוצים לשלב תכונות דיבור או שכפול קולות בתוך מוצרים דיגיטליים כמו עוזרים קוליים, מערכות IVR, ועוד.

 

אפשרויות ייצוא

לאחר יצירת הקול, ניתן לייצא את הקובץ בפורמטים שונים, כגון MP3 או WAV. הפורמטים האלה מאפשרים לשמור על איכות גבוהה ולהתאים את הקובץ לשימושים שונים, בין אם מדובר בפודקאסטים, סרטונים או מערכות טלפוניות

 

שימושים אפשריים ל-Play.ht

Play.ht מציעה פתרון מושלם ליצירת קריינות לסרטונים, פודקאסטים, ספרי שמע, ועוד המון שימושים נוספים. הכלי מתאים במיוחד עבור:

  • יצירת פודקאסטים וספרי שמע: הפלטפורמה מאפשרת יצירת קולות קריינים מקצועיים לספרים ולפודקאסטים.
  • קריינות לסרטוני שיווק והדרכה: הכלי מספק קולות ריאליסטיים שמתאימים בדיוק לסרטוני פרסומת או סרטוני הדרכה.
  • שכפול קולות לדמויות במשחקים: אם אתם יוצרים משחקי וידאו, Play.ht מאפשר לכם ליצור דמויות עם קול ייחודי.
  • מערכות IVR ועוזרים קוליים: הכלי מתאים גם לשימוש במערכות טלפון אינטראקטיביות או עוזרים קוליים.

 

כמה זה עולה?

Play.ht מציעה מגוון חבילות מנויים שמותאמות לצרכים שונים, החל ממשתמשים חינמיים ועד לחברות גדולות. כל חבילה מספקת גישה לטכנולוגיית הקול המתקדמת של Play.ht, אך עם תכונות שונות שמתאימות לסוגי שימוש מגוונים. להלן פירוט של כל אחת מהחבילות.

 

החבילה החינמית

החבילה החינמית של Play.ht מאפשרת למשתמשים להתנסות במערכת בצורה פשוטה ונגישה. בחבילה זו מקבלים 12,500 תווים לחודש ושכפול קול אחד. למרות שמדובר בחבילה בסיסית, היא כוללת גישה מלאה לכל הקולות והשפות שהמערכת מציעה. זהו פתרון מעולה עבור משתמשים שמעוניינים לנסות את הכלי לפני התחייבות לתכנית בתשלום.

 

חבילת Creator

חבילת ה-Creator מיועדת למשתמשים שמחפשים יותר אפשרויות וגמישות ביצירת תכנים. במחיר של 31.20 דולר לחודש (עם תשלום שנתי של 374.40 דולר), החבילה מספקת 3 מיליון תווים לשנה ו-10 שכפולי קולות. בנוסף, כל משתמש בחבילה זו מקבל גישה מלאה לכל הקולות והשפות, והאפשרות להשתמש בתכנים ללא צורך במתן קרדיט. חבילה זו מתאימה במיוחד ליוצרים שמעוניינים ביכולות מתקדמות יותר ויכולים להפיק תועלת משכפול קולות ותכנים בהיקף רחב יותר.

 

חבילת Unlimited

החבילה הפופולרית ביותר ב-Play.ht היא חבילת ה-Unlimited, שמספקת אפשרויות בלתי מוגבלות כמעט לכל צורך. בעלות של 29 דולר לחודש (עם תשלום שנתי של 348 דולר), החבילה כוללת שימוש בלתי מוגבל בתווים ובשכפולי קולות, ומספקת גישה לכל הקולות והשפות. בנוסף, משתמשים בחבילה זו מקבלים זכויות שימוש מסחרי בתכנים שהם יוצרים, מה שהופך אותה לאידיאלית עבור עסקים ויוצרים מקצועיים שזקוקים לכמויות גדולות של תוכן קולי ברמה גבוהה.

 

חבילת Enterprise

לארגונים גדולים ולמשתמשים עם צרכים מורכבים יותר, Play.ht מציעה חבילת Enterprise. חבילה זו מותאמת אישית לצרכי המשתמש, עם אפשרות לשכפול קולות באיכות גבוהה וללא הגבלה. בנוסף, היא כוללת גישה לצוותים, פתרונות אבטחה מתקדמים ותמיכה טכנית מורחבת. חבילת ה-Enterprise מציעה את כל היתרונות של החבילות האחרות, אך עם גמישות רבה יותר בהתאמה לצרכים המסחריים של חברות גדולות ופרויקטים מורכבים.

 

סיכום

Play.ht ממשיך להוכיח את עצמו ככלי עוצמתי וחיוני ליצירת תוכן קולי. בין אם אתם מחפשים ליצור קריינות מקצועית לסרטונים או לשכפל קול קיים לצרכים יצירתיים – הכלי הזה נותן לכם את הכלים לעשות זאת בקלות ובמהירות. העדכון החדש שמוסיף שיבוט קול בעברית הופך אותו לשימושי במיוחד לקהל הישראלי.

שווה לכם לנסות את הכלי ולראות בעצמכם את היכולות המרשימות שהוא מציע.

הפוסט שיבוט קול בעברית עם Play HT! לא תאמינו כמה זה פשוט וקל (ומפחיד) הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/playht-voice-cloning/feed/ 0
חברת D-ID משחררת כלי לתרגום סרטונים – קבלו מדריך מקיף https://letsai.co.il/d-id-video-translate/ https://letsai.co.il/d-id-video-translate/#comments Wed, 21 Aug 2024 15:36:11 +0000 https://letsai.co.il/?p=28148 בעידן שבו תקשורת וידאו היא כלי מרכזי להגעה לקהלים גלובליים, האתגרים הנובעים מפערי שפה ותרבות הופכים פחות דרמטיים, הודות לכניסתם של כלי AI חדשים. החדירה לשווקים בינלאומיים מחייבת התאמות ושינויים בשפה ובמסר, מה שעלול להפוך את התהליך למורכב ויקר. עם זאת, התקדמות הבינה המלאכותית הביאה לפיתוח כלים שמאפשרים להנגיש תכני וידאו במספר שפות בקלות וביעילות […]

הפוסט חברת D-ID משחררת כלי לתרגום סרטונים – קבלו מדריך מקיף הופיע ראשון בLet's AI בינה מלאכותית

]]>

בעידן שבו תקשורת וידאו היא כלי מרכזי להגעה לקהלים גלובליים, האתגרים הנובעים מפערי שפה ותרבות הופכים פחות דרמטיים, הודות לכניסתם של כלי AI חדשים. החדירה לשווקים בינלאומיים מחייבת התאמות ושינויים בשפה ובמסר, מה שעלול להפוך את התהליך למורכב ויקר. עם זאת, התקדמות הבינה המלאכותית הביאה לפיתוח כלים שמאפשרים להנגיש תכני וידאו במספר שפות בקלות וביעילות – קליק אחד ואתם מדברים בשלל שפות שונות, בקול שלכם, ועם סינכרון שפתיים מושלם! אחד מהכלים החדשים שפרצו לשוק Video Translate של חברת D-ID, שהושק בשבוע האחרון. כלי זה מאפשר ליצור סרטונים מתורגמים באיכות גבוהה, ומציע יתרונות משמעותיים: ממשק נוח ואינטואיטיבי, תפעול קל ומהיר ותוצאות אפקטיביות.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

צפו בסרטון השקת המוצר, בו גיל פרי – מנכ”ל D-ID ומייסד-שותף – מציג את יכולותיו המרשימות של הפיצ’ר החדש:

Credit: D-ID

 

תרגום סרטונים בשפות שונות לא רק שמרחיב את היכולת להגיע לקהלים חדשים, אלא גם מהווה כלי חשוב להסברה בינלאומית. מאז ה”שבעה באוקטובר”, כלים דומים שימשו יוצרים, משפיענים, דמויות ציבוריות ואושיות AI, במלחמת ההסברה של ישראל, כאשר סרטוני הסברה תורגמו לשפות רבות במטרה להעביר את המסרים של ישראל בצורה מדויקת ואפקטיבית.

 

חשוב לציין כי בשוק קיימים כלים דומים נוספים, כמו Heygen, שהשיקו יכולות תרגום וידאו לפני יותר משנה. עם זאת, Video Translate של D-ID מביא עמו חידושים טכנולוגיים ייחודיים, כמו התאמה מדויקת של הבעות הפנים והקול בשפה המתורגמת, מה שהופך אותו לבחירה מצוינת עבור חברות, יוצרי תוכן ומוסדות המעוניינים להגיע לקהלים ברחבי העולם בצורה אפקטיבית ומקצועית. כמו כן, מדובר בחברה “כחול-לבן” שממשיכה למקם את ישראל כמעצמת בינה מלאכותית, שמחזיקה בארסנל של כלים איכותיים, נוחים ומתקדמים. ואם אפשר לפרגן לחברה ישראלית שעושה עבודה מדהימה בשדה הבינלאומי, אז למה לא?!

 

במדריך הבא נציג הסבר מקיף על אופן השימוש ב-Video Translate של D-ID, ונדריך אתכם בשלבים ובטכניקות לשימוש מיטבי בכלי.

 

איך משתמשים בכלי תרגום הסרטונים של D-ID?

לפניכם סרטון הסבר קצר (באנגלית) שידגים לכם צעד אחר צעד, איך להשתמש בכלי החדש:

Credit: D-ID

 

שלב 1: העלאת הסרטון

הצעד הראשון בעבודה עם Video Translate הוא העלאת הסרטון שברצונכם לתרגם. לשם כך:

  • היכנסו לפלטפורמת D-ID ובחרו בכלי תרגום הסרטונים.
  • לחצו על האפשרות להעלאת סרטון.
  • בחרו את הסרטון מהמחשב שלכם והעלו אותו לפלטפורמה, או גררו ושחררו בחלון הייעודי.

 

שלב 2: בחירת שפות היעד

לאחר העלאת הסרטון, תופיע רשימת השפות הזמינות לתרגום.

  • כלי Video Translate מאפשר לתרגם את הסרטון ל-30 שפות שונות, מה שמקל על הפקת גרסאות בשפות שונות בבת אחת.
  • סמנו את השפות שאליהן תרצו לתרגם את הסרטון.
  • ניתן לבחור במספר שפות במקביל לצורך תרגום מרובה שפות. 

 

שלב 3: עיבוד הסרטון

ברגע שהשפות נבחרו, המערכת של D-ID תתחיל לעבד את הסרטון:

  • המערכת תשבט את קול הדובר המקורי לשפות היעד שנבחרו, תוך שמירה על קצב ואינטונציה דומים.
  • התהליך כולל גם סנכרון תנועות השפתיים (ליפסינק) והתאמת הבעות הפנים, כך שהסרטון ייראה טבעי ואמין בכל שפה.

 

שלב 4: קבלת התוצאות

לאחר תהליך העיבוד, תקבלו את כל הגרסאות המתורגמות תוך זמן קצר:

  • כל גרסה תכלול את השפה המתורגמת עם ליפסינק מלא, דבר שמבטיח חוויית צפייה חלקה ואותנטית.
  • ניתן להוריד את הגרסאות ולשתף אותן בערוצים השונים בהתאם לצורך.

 

טיפים לצילום וידאו מיטבי לתרגום

כדי להפיק את המיטב מכלי התרגום של D-ID, חשוב להקפיד על מספר הנחיות בעת צילום הווידאו:

  • אדם אחד בלבד בפריים: ודאו שהדובר הוא האדם היחיד המופיע בפריים, כדי למנוע בלבול בתרגום ובהתאמת סנכרון השפתיים.
  • כיוון הפנים כלפי המצלמה: הקפידו שהדובר יפנה את פניו ישירות אל המצלמה לאורך כל הסרטון, כך שהפנים יהיו גלויים וברורים בכל רגע נתון.
  • איכות שמע מיטבית: על מנת להבטיח תרגום מדויק ושיבוט קול איכותי, העלו סרטון שבו השמע ברור ונטול רעשי רקע או מוזיקה מיותרת. מומלץ להקליט לפחות 30 שניות של תוכן למיטוב התוצאה.
  • אורך הווידאו: דאגו שהסרטון שאותו אתם מעלים יהיה באורך של עד 5 דקות, כך שהתהליך יהיה מהיר ויעיל.
  • גודל הקובץ: ודאו שהקובץ שהנכם מעלים אינו חורג מ-2GB, כדי להבטיח עיבוד תקין ומהיר של הסרטון.
  • הכנה מוקדמת: ודאו כי החומר המקורי הוא ברור, עם משפטים קצרים והגייה מדויקת.
  • ביקורת מקצועית: מומלץ להתייעץ עם מומחים לשפה כדי לבדוק את החומר המקורי ואת התרגום, ולוודא שהתוצאות הסופיות מדויקות ומשקפות את המסר בצורה נכונה.
  • בדיקת תוצאות: בדקו כל גרסה מתורגמת כדי לוודא שהתרגום מדויק, שהבעות הפנים מתאימות ושאיכות השמע משקפת את המסר הנכון.

 

הקפדה על הנחיות אלו תבטיח תרגום איכותי, סנכרון מדויק של תנועות השפתיים, ויצירת תוכן מותאם ואפקטיבי לכל שפה.

 

יתרונות השימוש ב-Video Translate

  • חיסכון בזמן: הכלי מאפשר תרגום מהיר ויעיל ל-30 שפות שונות בלחיצת כפתור אחת, ובכך חוסך שעות רבות של עבודה ידנית.
  • איכות גבוהה: שיבוט קול מדויק והתאמת תנועות השפתיים והבעות הפנים מבטיחים תוצאות מקצועיות ואותנטיות, המעניקות לצופה חוויית צפייה טבעית ומשכנעת.
  • הרחבת קהל היעד: תרגום למספר רב של שפות מאפשר גישה לשווקים חדשים וגדולים יותר, תוך יצירת קשר ישיר עם קהלים מגוונים ברחבי העולם.
  • שימושיות: הכלי אידיאלי לאנשי שיווק בחברות בינלאומיות, ליוצרי תוכן, ולמוסדות חינוך המעוניינים להנגיש את המסרים שלהם בשפות שונות.

 

למי הכלי זמין?

כפי שציין תומר צוקר, סמנכ”ל השיווק של D-ID: “לרגל ההשקה, אנחנו מציעים שימוש חינמי במוצר במהלך תקופת ה-Trial וללקוחות שלנו אנחנו פותחים את המוצר לשימוש חופשי עד הודעה חדשה.”

 

כלומר, הכלי זמין למנויים משלמים ללא עלות נוספות, והשימוש בו בעת הזו פתוח וללא הגבלה. אין צורך בהטענת קרדיטים. 

 

אתגרים ושיקולים בשימוש בתרגום וידאו מבוסס AI

למרות היתרונות המרובים של תרגום וידאו מבוסס AI, קיימים גם אתגרים שיש לקחת בחשבון:

  • דיוק: מערכת ה-AI עלולה לשגות במקרים של תרגום לא מדויק של מילים דומות בצליל, כמו “I’ll” ו-“eye”, או בהעברת סלנג וניואנסים תרבותיים בצורה נכונה.
  • השמטות: במקרים מסוימים, ייתכן שהמערכת תיאלץ להשמיט מילים כדי להתאים את אורך הטקסט המתורגם לאורך הסרטון המקורי.
  • טון דיבור: התאמת הטון לדובר המקורי ולשפה המתורגמת יכולה להיות מאתגרת, במיוחד בשפות שבהן הטון משפיע על המשמעות של המילים, כמו במנדרינית למשל.
  • מבטא: ייתכן שהמערכת תייצר תוצאה שבה המבטא אינו עקבי או שהשמע מעט מונוטוני.

 

האם הפיצ’ר עובד גם בעברית?

בקצרה – כן! דיברנו עם ה-CTO של D-ID והוא הסביר לנו שאפשר לקחת סרטון בעברית ואז לתרגם אותו (מוזמנים לראות את הדוגמה מטה בסרטון ששחר גולן יצר). עם זאת, זה עדיין לא מושלם – אם אתם רוצים תוצאות מיטביות, כדאי שסרטון המקור שלכם יהיה באנגלית – מה שיקל על פעולת התרגום לשפות אחרות. לדברי נציגי החברה, אם מכניסים אינפוט באנגלית התוצאה שתתקבל תהיה ברמה הכי גבוהה שיש.

 

סרטון הדרכה של שחר גולן

צפו בסרטון ההדרכה ששחר גולן יצר על הכלי החדש.

 

 

מחסום השפה נפרץ – אבל האם יש חדש תחת השמש?

כלי ה-Video Translate של D-ID מציע שימושי במיוחד להנגשת תוכן וידאו לקהל גלובלי, תוך חיסכון משמעותי בזמן ומשאבים. אמנם זה לא הכלי הראשון שעושה את זה, והטכנולוגיה קיימת כבר זמן מה, אבל הממשק הנוח של D-ID וחוויית השימוש, הופכים אותו לאלטרנטיבה טובה בתחום זה. הכלי יכול לסייע ליוצרים ומשווקים להגיע לקהל רחב יותר ולייצר תכנים מותאמים בשפות שונות בקלות ובמהירות. עם ממשק משתמש ידידותי ותמיכה ב-30 שפות, מדובר בכלי חובה לכל מי שמחפש להרחיב את השפעתו בזירה הבינלאומית.

 

הכלי מתאים לשימוש במגוון תחומים, כגון חינוך, שיווק, ותקשורת ארגונית, ומאפשר למשתמשים להתאים את התוכן שלהם לשווקים שונים ולתרבות המקומית. Video Translate מאפשר לארגונים להעביר את המסר שלהם בצורה עקבית ואפקטיבית בכל השפות, ובכך להרחיב את טווח ההשפעה ולהגיע לשווקים חדשים במהירות ובעלות נמוכה.

 

הטכנולוגיה של תרגום וידאו מבוסס AI מתפתחת במהירות, ובמהלך השנים הקרובות נצפה לשיפורים נוספים שיגבירו את הדיוק והאוטומציה של התהליך. ארגונים ויוצרים שיאמצו את הכלי הזה יהיו בעמדה מצוינת לנצל את היתרונות של תקשורת גלובלית ולהתמודד עם האתגרים שבכניסה לשווקים חדשים. Video Translate של D-ID הוא לא רק כלי טכני, אלא גשר לעולם חדש של אפשרויות תקשורת, שמאפשר ליצור חיבור אמיתי עם קהלים ברחבי העולם.

 

הפוסט חברת D-ID משחררת כלי לתרגום סרטונים – קבלו מדריך מקיף הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/d-id-video-translate/feed/ 1
מדריך מקיף לשימוש במחולל הווידאו של פיקה (Pika) באתר הייעודי https://letsai.co.il/pika-how-to-use/ https://letsai.co.il/pika-how-to-use/#respond Sat, 04 May 2024 16:58:43 +0000 https://letsai.co.il/?p=17893 תחום יצירת הווידאו עם בינה מלאכותית הוא תחום לוהט וחדשני. אחת החברות המובילות בתעשייה היא Pika, מתחרה גדולה של סטארט־אפ ה־GenAI ראנוויי (Runway). שורשיה של פיקה בתחרות סרטוני AI שיצרה ראנוויי, אך מאז היא עשתה כברת דרך, וכיום מדובר באחד ממחוללי הווידאו הטובים בעולם שעשה את המעבר מדיסקורד ומציע ממשק אינטרנטי מתקדם העשיר בתכונות ומאפשר […]

הפוסט מדריך מקיף לשימוש במחולל הווידאו של פיקה (Pika) באתר הייעודי הופיע ראשון בLet's AI בינה מלאכותית

]]>
תחום יצירת הווידאו עם בינה מלאכותית הוא תחום לוהט וחדשני. אחת החברות המובילות בתעשייה היא Pika, מתחרה גדולה של סטארט־אפ ה־GenAI ראנוויי (Runway). שורשיה של פיקה בתחרות סרטוני AI שיצרה ראנוויי, אך מאז היא עשתה כברת דרך, וכיום מדובר באחד ממחוללי הווידאו הטובים בעולם שעשה את המעבר מדיסקורד ומציע ממשק אינטרנטי מתקדם העשיר בתכונות ומאפשר למשתמשים ליצור סרטונים מרהיבים באמצעות בינה מלאכותית. עם כלים כמו סנכרון שפתיים ודיבוב (ליפ סינק), הנפשת תמונות סטטיות, בקרה על תנועת המצלמה, הוספת סאונד לסרטונים, אינפיינטינג ואאוטפיינטינג בווידאו, פיקה מעניקה חוויה יצירתית ייחודית לאנשים שרוצים למנף את כוחה של הבינה המלאכותית בפרויקטים מרתקים.

 

אבל לפני הכול – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכון, חידוש או מידע על כלי חדש שיוצא.

ממליצים לכם להצטרף גם לקהילות ה־AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה־AI שלנו? לחצו פה.

 

קצת על פיקה

תעשיית מחוללי הווידאו היא שוק רותח. אחת המתחרות הכי גדולות של ראנוויי היא פיקה (Pika ai) – חברה שהחלה את דרכה כששתי יוצרות שרצו להשתתף בתחרות ג’ינרוט סרטונים של ראנוויי, החליטו לבסוף להשתמש בכישורים שלהן ולהקים חברה מתחרה. היום שווי השוק של פיקה הוא 300 מיליון דולר (קצת מאחורי ראנוויי, שלה יש שווי שוק של 500 מיליון דולר). פיקה החלה את דרכה כמחולל וידאו חינמי בדיסקורד (ועדיין יש לה גרסה כזו), אך ב־2023 היא השיקה ממשק וובי (אתר אינטנרט ייעודי) מתקדם ועשיר בפיצ’רים. לגרסה זו קוראים Pika 1.0. מהלך זה מיצב אותה כשחקנית מובילה בשוק, שעכשיו יכולה לתת למשתמשים שלה הרבה יותר!

אני אישית ממליץ להשתמש בגרסה שבאתר הייעודי (שכאמור גם בה יש חבילת התנסות חינמית), אבל אם בכל זאת נפשכם חפצה בדיסקורד, בלינק הבא תמצאו מדריך לפיקה בדיסקורד (חינמי וזמין לשימוש לכולם). כדאי לדעת שבדיסקורד יש אפשרות לג’נרט גם טקסט ואפקטים של וידאו בטקסט.

 

איך נרשמים לאתר של פיקה?

  • נכנסים לאתר של פיקה בלינק הבא.
  • לוחצים על כפתור “נסו את פיקה”, Try Pika.
  • הירשמו בעזרת חשבון הגוגל שלכם או עם הדוא”ל שלכם.

 

 

 

החבילות של פיקה

פיקה מציעה מספר חבילות שונות כדי להתאים למגוון צרכים ורמות שימוש.

  • החבילה הבסיסית (מנוי BASIC) מציע גישה חינמית לפיקה. החבילה כוללת 250 קרדיטים חינם לתחילת שימוש. 30 קרדיטים נוספים ניתנים מדי יום לאחר שהקרדיטים הראשוניים אזלו.
  • בעבור 8 דולר לחודש חבילת STANDARD מציעה 700 קרדיטים חודשיים ללא הגבלה על פיצ’ר הליפ סינק (Lip Sync) ואפשרות להורדת הסרטונים שיצרתם ללא חותמת מים נוסף להנחה על רכישת קרדיטים נוספים.
  • חבילת UNLIMITED תומכת בעבודה ללא הפסקה ועולה 28 דולר לחודש. היא נותנת 2,000 קרדיטים חודשיים.
  • חבילת Pro תעלה לכם 58 דולר לחודש. החבילה מיועדת לשימוש מסחרי ומציעה גישה מוקדמת לתכונות חדשות וקרדיטים בלתי מוגבלים בקצב יצירה מהיר במיוחד.

 

שימוש מסחרי: שימו לב שהמסלול היחיד שנותן רישיון לשימוש מסחרי, הוא חבילת Pro שעולה 58 דולר במסלול שנתי או 70 דולר במסלול חודשי (696 דולר או 840 דולר בשנה בהתאמה).

 

החבילות והמנויים של פיקה

החבילות והמנויים של פיקה – שימו לב להבדל בין חיוב שנתי (למעלה) ובין חיוב חודשי (למטה).

 

דגש: המחירים המצוינים פה מתייחסים למנוי שנתי. המחיר למנוי חודשי מעט גבוה יותר (בכ־20%). עם זאת אנחנו תמיד ממליצים לעשות מנוי חודשי ולא מנוי שנתי ממספר סיבות:

  • בעולמות ה־AI לא כדאי להתחייב לכלי כזה או אחר. כל חודש יוצא כלי חדש שיכול לייתר את העבודה בכלי שאתם מנויים לו.
  • בחבילה שנתית החיוב מתבצע במכה אחת. חבל לשלם עשרות או מאות דולרים בתשלום אחד (אם יכול מאוד להיות שלא תזדקקו לו למשך כל השנה).
  • חשוב לציין שהמחירים והתנאים יכולים להשתנות. מוזמנים לעיין בעמוד המנויים של פיקה ולקבל מידע על מחירים מדויקים ופירוט החבילות.

 

פיצ’רים מתקדמים בגרסת הווב של פיקה:

 

מדריך מקיף לשימוש ב־Pika

איך מתחילים ליצור?

הממשק של פיקה סופר אינטואיטיבי וקל מאוד לעבוד איתו.

  • מייד לאחר הכניסה הראשונית תוכלו לראות במסך הבית מגוון סרטונים שנוצרו בפיקה.
  • אם תרחפו עם העכבר מעל סרטון, פיקה יתחיל לנגן אותו. נוסף על כך, תוכלו לראות את הפרומפט שממנו נוצר הסרטון, ואף להעתיק אותו בקלות בלחיצה על כפתור Copy שיופיע כשהעכבר ירחף מעל הפרומפט.
  • מתחת לכל סרטון יש כפתורי עריכה מתקדמים; נדבר עליהם בהמשך. אבל קודם כל בואו נבין איך יוצרים סרטון מאפס. רדו לתחתית המסך, שם תמצאו תיבת פרומפטים (ראו תמונה מטה).

 

תיבת הפרומפטים של פיקה

תיבת הפרומפטים של פיקה

 

  • בתיבת הפרומפטים תוכלו לרשום את תיאור הסרטון הרצוי. פשוט תארו במשפטים קצרים וברורים את הסצנה, למשל: “מטוס טס בשמיים כחולים עם עננים לבנים” (A plane flies in a blue sky with white clouds).
  • בתוך תיבת הפרומפטים תמצאו מספר כפתורים שימושיים שמאפשרים להעלות תמונת או סרטון רפרנס, לייצר סרטון עם סאונד ואפילו כפתור שייצור בשבילכם פרומפט אקראי (מעולה למי שלא יודע איך וממה להתחיל).
  • ישנו גם כפתור של אפשרויות מתקדמות כמו בקרת מצלמה, שינוי ממדי הסרטון ועוד. נרחיב עליו בהמשך המדריך.

 

עבודה באתר הייעודי של פיקה – פיצ’רים מתקדמים

מאז שפיקה השיקו את האתר הייעודי שלהם, הפלטפורמה שלהם נעשתה רלוונטית מתמיד. היא מרובה בפיצ’רים מתקדמים כמו:

  • ליפ סינק (סינכרון שפתיים).
  • ג’ינרוט סרטונים עם סאונד (פיצ’ר ייחודי ושימושי במיוחד) בעזרת הפעלת כפתור: Sound Effects שבתחתית תיבת הפרומפטים. ראו דוגמה מטה.

 

 

  • בקרת מצלמה מתקדמת (זום אין ואאוט, תנועות מצלמה כמו פאן, טילט וכן הלאה).
  • הנפשת תמונה סטטית לסרטון.
  • בחירת ממדי התמונה (Aspect Ratio).
  • ג’ינרוט סרטונים בקצב פריימים גבוה: 24 פריימים בשנייה.
  • ג’ינרוט וידאו על בסיס טקסט (Text to Video). ראו דוגמה בסרטון מטה:

 

 

  • ג’ינרוט וידאו על בסיס תמונה (Image to Video).

    דוגמה לג’ינרוט סרטון על בסיס תמונת רפרנס ובקרת מצלמה: בסרטון אפשר לראות איך להעלות תמונת רפרנס (אנשים במסיבת חצר), להוסיף פרומפט חיובי שמתאר את תנועת המצלמה ואת ההתרחשות (אנשים מחייכים), וכן פרומפט שלילי (‘מדברים’ Talking כיוון שהיוצר לא רוצה שהם ידברו בסצנה הספציפית הזו). ולבסוף, בקרת מצלמה – זום אאוט.

 

 

  • אפשר אפילו להעלות סרטון כשכבת רפרנס, ממש כמו Gen1 בראנוויי (Video to Video). ראו דוגמה מטה:

 

 

  • שליטה בעוצמת התנועה.
  • מחולל פרומפטים אקראי (לחצו על אייקון הקוביות ופיקה תמציא לכם פרומפט אקראי).
  • שימוש במספרי סיד ליצירת המשכיות ועקביות בתוך סדרת תמונות בפרויקט.
  • כל הפיצ’רים הללו זמינים בממשק סופר נוח, אינטואיטיבי שנותן חווית משתמש נהדרת (ראו תמונה מטה). אפשר להפעיל אותו בלחיצה על כפתור ה־Advanced Options שבתיבת הפרומפטים.

 

הגדרות נוספות בפיקה

הגדרות נוספות בפיקה

 

אפשרויות עריכה מתקדמות לעיבוד סרטון לאחר יצירתו

אפשרויות לעריכת סרטון בפיקה, לאחר יצירתו

אפשרויות לעריכת סרטון בפיקה לאחר יצירתו

 

לאחר יצירת סרטון נפתחות אופציות שימושיות נוספות (ראו תמונה מעלה) כמו למשל:

  • הארכת הסרטון בעוד כמה שניות (Add 4S).
  • ג’ינרוט מחדש של הסרטון (Retry). זה יוביל ליצירת וריאציה חדשה.
  • שיתוף הסרטון (הכפתור עם האייקון של החץ).
  • לחיצה על כפתור ה־Info תאפשר לראות את קצב הפריימים ואת מספר הסיד של הסרטון.
  • עריכת הפרומפט מחדש בשליחת הסרטון שיצא לכם לג’ינרוט נוסף (עם כפתור Reprompt). זה יאפשר לכם להשתמש בו כסרטון רפרנס ונוסף על כך לרשום פרומפט חדש. התוצאה תהיה סרטון חדש שמושתת גם על הפרומפט החדש וגם על הרפרנס.

 

צפו בסרטון הבא שממחיש את השימוש בשני הפיצ’רים האלו: Retry ו־Reprompt:

 

 

  • לחיצה על 3 הנקודות בצד תפתח אפשרות לשלוח את הסרטון שלכם לאפסקיילר של פיקה (כלומר פיקה תג’נרט גרסה חדשה ומוגדלת של הסרטון).

 

פיצ’רים מתקדמים בגרסת הווב של פיקה

 

לחיצה על כפתור Edit תפתח עוד אפשרויות מתקדמות של עריכה (אינפיינטינג, אאוטפיינטינג ועוד).

 

כפתור Edit בפיקה

אפשרויות נוספות לאחר לחיצה על כפתור Edit בפיקה

 

  • לאחר שתלחצו על ‘עריכה’ ייפתח חלון בתחתית המסך ובו מספר אפשרויות כמו הוספת ליפ סינק (דיבוב על בסיס טקסט או קובץ אודיו).

 

 

  • אופצייה נוספת היא הוספה אוטומטית של אפקטים קוליים (Sound Effects) אם לא הוספתם סאונד בשלב הראשוני של ג’ינרוט הסרטון. לחיצה על כפתור זה תאפשר לכם לתאר במילים את הסאונד שאתם רוצים שיתווסף לסרטון, ופיקה תג’נרט גם אותו (בהלימה לסרטון).

 

  • לחיצה על כפתור Modify Region תאפשר לכם לבצע אינפיינטינג בתוך הסרטון (כלומר לערוך אזורים ספציפיים ולג’נרט מחדש רק אותם). בחלון שייפתח תוכלו לסמן את האזור הרצוי ואז לתאר במילים מה השינוי הרצוי (למשל להוסיף משקפי שמש ל’בייבי רוס גלר’ 😜).

 

אינפיינטינג בסרטון

 

צפו בסררטון מטה כדי להבין איך פיצ’ר האינפיינטינג עובד:

 

 

  • לחיצה על כפתור Expand Canvas תאפשר לכם לבצע אאוטפיינטינג מעבר לגבולות הפריים (כלומר לג’נרט אזורים מחוץ לממדי הסרטון המקורי). ראו סרטון מטה:

 

 

בחלון שיפתח תוכלו לשנות את גודל הסרטון בתוך הפריים ולקבוע אילו אזורים חדשים יג’ונרטו. כמו כן, תוכלו לתאר במילים כיצד ‘להשלים’ את האזורים החסרים. ונוסף על כך, תוכלו לשנות את ממדי הסרטון עצמו (למשל לשנות סרטון 16:9 לסרטון מרובע 1:1 ולהפך).

 

אאוטפיינטינג בווידאו

 

המחשה לפיצ’ר האאוטפיינטינג של פיקה:

 

פיקה או ראנוויי?

גם פיקה וגם ראנוויי (Runway) מנגישים למשתמש ממשקים סופר נוחים, משוכללים ומתקדמים ליצירת לעיבוד סרטונים עם AI. בשני הכלים האלה יש אפשרות לעשות ליפ סינק ושניהם נותנים מוצר דומה מאוד. עם זאת, לפיקה יש דברים שאין בראנוויי. ראשית, יש חבילה חינמית נדיבה; יש אפשרויות אינפיינטינג ואאוטפיינטינג נוחות ביותר; יש אפשרות לג’ינרוט סאונד. שנית, נראה שבפיקה לא מתכוונים להאט או לעצור את קצב שחרור השדרוגים והחידושים בפלטפורמה. מדובר בשני כלים עוצמתיים, ורסטיליים ומתקדמים שכדאי מאוד שיימצאו בתוך ארגז הכלים שלכם, בטח שבטח אם אתם בתחום יצירת סרטים עם AI, יצירת קליפים או ייצור תוכן באופן כללי. אבל בכל מה שקשור לפיקה, אני לא רואה שום סיבה לא להירשם גם למחולל הווידאו המדהים הזה ולהתנסות בו, במיוחד לנוכח הממשק הנוח והקרדיטים שניתנים להתנסות בחינם.

 

נקודה אחת לרעת פיקה שחשוב לשים לב אליה, היא היעדר הרישיון לשימוש מסחרי בחבילות הבסיסיות. למעשה, אם תרצו לעשות בו שימוש מסחרי תיאלצו להיפרד מ־70 דולר בחודש (בחבילה חודשית), וזה לא מעט בכלל!

 

ולסיום, שימו לב מה קורה כשכישרון גדול פוגש בטכנולוגיה מתקדמת ומתובל בלא מעט דמיון ויצירתיות. את הסרטון הבא יצר הישראלי מתן כהן גרומי (ה־Founding Creative Director של החברה), והוא ממחיש את העוצמות של מחולל הווידאו הספציפי הזה בפרט אבל גם את הכוח של מחוללי וידאו בכלל. הם מאפשרים לנו לתת דרור לדמיון ולייצר סיפורים שבעבר הפקתם הייתה בגדר חלום רחוק (ויקר). אז שאפו למתן ושאפו לעבודה המדהימה שהוא עושה בפיקה (את רוב הסרטונים של פיקה שיצא לכם לראות, הוא יצר). ועכשיו כל שנותר לכם לעשות, הוא להירשם לפיקה ולהתחיל ליצור. זה כל כך קל וכיף!

 

 

יצירת סרטים עם AI

המדריכים שלנו תמיד חינמיים ותמיד ימשיכו להיות חינמיים, אבל אם אתם רוצים להעמיק את הידע שלכם ולהתמקצע, אתם מוזמנים להצטרף לקורס המקיף שלנו ליצירת סרטים עם בינה מלאכותית, עבודה עם מחוללי וידאו ובניית אווטרים דיגיטליים. הוא כולל עשרות שיעורים מוקלטים, מדריכים כתובים, מפגשי לייב זום אחת לשבוע ועוד הרבה דברים טובים. פרטים והרשמה באתר הקורס.

 

OpenAI מחזרת אחרי הוליווד

קורס יצירת סרטים עם AI

הפוסט מדריך מקיף לשימוש במחולל הווידאו של פיקה (Pika) באתר הייעודי הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/pika-how-to-use/feed/ 0
משרד החוץ האוקראיני מציג: דוברת AI https://letsai.co.il/victoria-shi-ai-spokesperson/ https://letsai.co.il/victoria-shi-ai-spokesperson/#respond Thu, 02 May 2024 16:33:32 +0000 https://letsai.co.il/?p=18402 ב־1 במאי 2024 הציגה ממשלת אוקראינה את ‘ויקטוריה שי’ (Victoria Shi), דוברת רשמית שאינה בשר ודם. למעשה מדובר באווטר דיגיטלי המבוסס על טכנולגיית בינה מלאכותית. לוויקטוריה מראה אנושי ריאליסטי במיוחד, והיא נשמעת ומתנהגת ממש כמו דוברת אנושית. לפי הפרסום, מטרתה לשמש כדוברת רשמית של משרד החוץ האוקראיני. צעד זה הוא אבן דרך טכנולוגית חדשנית בזירה […]

הפוסט משרד החוץ האוקראיני מציג: דוברת AI הופיע ראשון בLet's AI בינה מלאכותית

]]>
ב־1 במאי 2024 הציגה ממשלת אוקראינה את ‘ויקטוריה שי’ (Victoria Shi), דוברת רשמית שאינה בשר ודם. למעשה מדובר באווטר דיגיטלי המבוסס על טכנולגיית בינה מלאכותית. לוויקטוריה מראה אנושי ריאליסטי במיוחד, והיא נשמעת ומתנהגת ממש כמו דוברת אנושית. לפי הפרסום, מטרתה לשמש כדוברת רשמית של משרד החוץ האוקראיני. צעד זה הוא אבן דרך טכנולוגית חדשנית בזירה הדיפלומטית העולמית ובגזרת הנגשת שירותים ומידע בעזרת טכנולוגיות ג’נרטיביות.

 

אבל לפני הכול – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכון, חידוש או מידע על כלי חדש שיוצא.

ממליצים לכם להצטרף גם לקהילות ה־AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה־AI שלנו? לחצו פה.

 

הציוץ הראשון של ויקטוריה בחשבון ה־X של משרד החוץ האוקראיני

 

 

למה צריך דוברת AI?

בעולם שבו אנו עדים למשפיעני AI שמגלגלים מאות אלפי יורו בחודש, לשחקני AI שמככבים בסרטים שמעולם לא צולמו, ולסוכנים ג’נרטיביים שנותנים שירותים או מבצעים פעולות שמייתרות בני אנוש, אין פלא שמדינה שנמצאת במלחמה תבחר בפתרון טכנולוגי נוח, זמין, זול ואיכותי. בשנה האחרונה תעשיית האווטרים הדיגיטליים עשתה קפיצת מדרגה דרמטית. הם נראים ריאליסטיים לגמרי ונשמעים ממש כמו בני אדם רגילים. חברות כמו מיקרוסופט מראות את העתיד – למודלים כמו VASA-1 יש יכולת לשוחח בזמן אמת ללא השהייה או זמן תגובה. שבבי LPU של חברת Groq הם עוד צעד לכיוון הנכון שבו נוכל לדבר עם מכונות, והן גם יענו לנו בזמן אמת. לכל זה תחברו יכולות של אמפתיה ואינטליגנציה רגשית בדומה ליכולות של EVI, הבוט האמפתי הראשון בעולם, ותעטפו הכול בעטיפה יפה בדמות האווטרים הדיגיטליים של Heygen, של D-ID או של Synthesia, והינה – יש לנו פלטפורמת AI שמחקה פעילות אנושית ומתנהלת בעולם בצורה טבעית, ‘אנושית’ ולתועלת האנושות.

 

החזון שתיארתי מעלה עדיין לא כאן. אבל הוא קרוב; קרוב מאוד. הטכנולוגיה כבר קיימת, צריך רק לחבר אותה. ויקטוריה שי אינה סוכן ג’נרטיבי שאומן על מאגרי ידע ויודע להגיב אינטואיטיבית בזמן אמת לפניות של כתבים או של גורמי חוץ. זו לא מטרתה. אבל היא עושה משהו אחר – היא סמל; היא ייצוג של קדמה, של מערביות ושל נאורות; היא דוגמה לשימוש בטכנולוגיה מיטיבה; היא ייצוגית ומדויקת – אין לה פליטות פה, ואי אפשר להתקיל אותה. וזה מוביל אותי לשאלה הבאה: אז למה צריך את כל זה?

למה צריך סוכני וסייעני AI?

למה צריך משפיעני AI?

למה צריך דוברי AI?

 

לטענת משרד החוץ האוקראיני, יש בדוברת ג’נרטיבית הרבה תועלת!

השימוש בדוברת AI שמושתתת על אווטר דיגיטלי מבוסס בינה מלאכותית כמו ויקטוריה שי מאפשר לצוותי משרד החוץ לחסוך זמן ומשאבים יקרים. הדוברת הווירטואלית תגיש בצורה מדויקת ואוטומטית את ההודעות והדיווחים שכותבים אנשי צוות משרד החוץ ותשמור על רמה גבוהה ביותר של מקצועיות ואיכות, כך אומרים האוקראינים. דובר אנושי יודע לדבר במספר שפות (במקרה הטוב), אבל ויקטוריה יכולה לדבר במגוון רחב של שפות. והיא תמיד תיראה ותישמע אותו דבר ללא קשר לשפה שבה היא מדברת. היא יכולה גם לדבר מכל לוקיישן. ליוצרים שלה יש שליטה מוחלטת על הפריים, והם יכולים לשנות את הרקע, את הלבוש וכמובן את הטקסט. אפשר ליצור מכל מקום ובכל זמן סרטון הסברה שנראה מצוין, מדברר את המסרים ההסברתיים והדיפלומטיים הרלוונטיים, ונוצר במעט מאוד מאמץ, עלות והשקעה. והאיכות בהחלט מרשימה – ויקטוריה מאופיינת במראה מרשים, מפורט וטבעי במיוחד, המדמה בהצלחה רבה דמות אנושית אמיתית. הממשק הגרפי המתקדם שלה מאפשר תזוזות חלקות ונאמנות למציאות של ידיים וראש, וזה מגביר את החוויה האנושית והמשכנעת שהיא נותנת לצופים.

 

שפטו בעצמכם – ויקטוריה שי; מתוך ערוץ היוטיוב של משרד החוץ האוקראיני

 

 

למה דווקא Victoria Shi?

השם שניתן לדוברת הוא ויקטוריה שי;  שמה נגזר משילוב המילים ניצחון ובינה מלאכותית בשפה האוקראינית. היא נוצרה בדמותה ובקולה של הזמרת, כוכבת הריאליטי והשחקנית האוקראינית רוזאלי נומברה (Rosalie Nombre), ילידת העיר דונצק (Donetsk) שבמזרח אוקראינה, עיר שנכון להיום נמצאת בשליטה רוסית. בסרטון שפורסם מספרת ויקטוריה שהיא נוצרה בידי צוות משרד החוץ האוקראיני בעזרת בינה מלאכותית ושהיא אינה אדם אמיתי; שהמראה והקול שאתם רואים ושומעים אינם אמיתיים אלא נוצרו באמצעות AI. היא מספרת שתפקידה, בין השאר, הוא לתת מידע עדכני ומהימן בנושאי הסברה ושירותים קונסולריים לאזרחי אוקראינה השוהים ברחבי העולם. היא תיתן מידע לעיתונאים על אודות פעילות הקונסולים האוקראינים בהגנה על הזכויות ועל ענייניהם של אזרחי אוקראינה ברחבי העולם ובאופן כללי תנסה להיות הפנים והקול של ההסברה האוקראינית כלפי העולם בכלל והמערב בפרט. היתרונות שעולים מהסרטון ברורים!

  • נגישות וזמינות: הנגשת מידע קונסולרי לציבור הרחב ללא מגבלות זמן ומקום.
  • מהירות ודיוק: העברת מידע מדויק ועדכני בזמן אמת.
  • שקיפות: הגברת השקיפות של משרד החוץ בפעולותיו למען אזרחי אוקראינה השוהים ברחבי העולם.
  • חדשנות: הצגת הפנים החדשות של משרד החוץ תוך כדי שימוש בטכנולוגיות מתקדמות.

 

הקול הרשמי של משרד החוץ האוקראיני

הרבה נכתב על מלחמת אוקראינה־רוסיה ועוד ייכתב. העימות הצבאי המדמם הזה הוא פצע פתוח ביבשת אירופה שחשבה שעידן המלחמות מאחוריה. גם בגזרת ה־AI והחדשנות הביאה מלחמה זו שלל פיתוחים, שיטות לחימה וכלים: כטב”מים מתאבדים, שימוש נרחב ברחפנים, מערכות AI לפיקוד ולשליטה וכמובן שימוש נרחב בתקשורת ובמדיה החברתית. יש המכנים את המלחמה הזאת ‘מלחמת ה־AI הראשונה’. השקתה של ויקטוריה שי הוא ההמשך של המגמה הזאת – פתרונות טכנולוגיים חכמים ויעילים שעושים מהר, בזול ובקלות את מה שבעבר היה מצריך צוותי הפקה שלמים (במאי, צלם, שחקנית, דוברת, מלבישה, מאפרת, תאורן וכן הלאה). זו דוגמה מצוינת לייעול תהליכים באמצעות טכנולוגיית AI – בינה מלאכותית בשירות הדיפלומטיה וההסברה.

 

אבטחה, מהימנות ואמינות

בדיוק כפי שקל לייצר אווטר דיגיטלי מדבר, קל גם להעתיק אותו ולזייף אותו. באמצעים יחסית פשוטים (שימוש בקובצי וידאו והקלטות קוליות) אפשר לבנות מודל קול של ויקטוריה ולייצר דמות דיגיטלית זהה שתיראה ותישמע כמוה. כמו במלחמה גם פה יש מרוץ חימוש – לו ירצה הצד השני, הוא יוכל בקלות לייצר תכני פייק ניוז ותעמולה שקרית כדי למצב את דעת הקהל ולשנות תודעה. אני יכול בקלות לדמיין איך סרטון מזויף של ויקטוריה יכול להיעשות ויראלי בתוך שניות; פשוט שותלים לה בפה את הטקסט הלא נכון, והופ – יש לנו משבר דיפלומטי־הסברתי.

 

כל מה שתיארתי מעלה לא זר או רחוק לצד השני; כן כן רוסיה, אני מסתכל עליך. רוסיה יצאה בעבר עם שלל קמפיינים לשינוי תודעה בקנה מידה נרחב (הבחירות בארצות הברית הן רק קצה הקרחון). כדי להבטיח את אמינות דבריה של ויקטוריה ולמנוע זיופים דיגיטליים מצורף קוד QR לכל סרטון רשמי שלה. הקוד מוביל להצהרות הרשמיות באתר האינטרנט של משרד החוץ האוקראיני. באוקראינה מקווים שכך הציבור יוכל לאמת את המידע שנתנה הדוברת הווירטואלית.

AI בשירות הדיפלומטיה

ויקטוריה שי היא חלק ממהלך כולל של משרד החוץ האוקראיני ליישום טכנולוגיות מתקדמות המבוססות על בינה מלאכותית, שנועדו לחזק את יכולותיו ולקפוץ קפיצת מדרגה טכנולוגית שטרם נראתה בשירות דיפלומטי אחר בעולם. מעבר לכך, היא הצצה לעתיד שבו עוד ועוד ממשלות, ארגונים וחברות ייעזרו בכלי AI כדי לשפר ולייעל את התנהלותם. זוהי מגמה שצפויה להתחזק מאוד, ומי שידע לגרום לבינה המלאכותית לעבוד בשבילו או במקומו, יצליח לנצל את ההזדמנויות שהעולם החדש מציע.

 

קורס בניית אווטרים ויצירת סרטים עם AI

קורס מקיף שכולל עשרות שיעורים מוקלטים, מדריכים כתובים, מפגשי לייב זום אחת לשבוע – לפרטים ולהרשמה.

 

נשים בתחום ה ai

קורס בניית אווטרים דיגיטליים ויצירת סרטים עם מחוללי וידאו וכלי GenAI

 

הפוסט משרד החוץ האוקראיני מציג: דוברת AI הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/victoria-shi-ai-spokesperson/feed/ 0
חברת D-ID הישראלית זכתה בפרס Silver בתחרות פרסי Edison https://letsai.co.il/d-id-edison/ https://letsai.co.il/d-id-edison/#respond Mon, 22 Apr 2024 11:28:54 +0000 https://letsai.co.il/?p=17421 חברת D-ID ממשיכה להביא כבוד וגאווה לסצנת ה־AI הישראלית. החברה מישראל זכתה בפרס ה־Silver המכובד בקטגורית ה־Entertainment & Design Technologies בתחרות פרסי Edison היוקרתית למוצרים החדשים והטובים ביותר, וב־5 פרסים נוספים בתחרות Muse. בשיחה עם תומר צוקר, סמנכ״ל השיווק של החברה, דיברנו על הזכיות והפרסים המרשימים ועל הדרך המיוחדת ש־D-ID עושה כבר שנים בתוך שוק […]

הפוסט חברת D-ID הישראלית זכתה בפרס Silver בתחרות פרסי Edison הופיע ראשון בLet's AI בינה מלאכותית

]]>
חברת D-ID ממשיכה להביא כבוד וגאווה לסצנת ה־AI הישראלית. החברה מישראל זכתה בפרס ה־Silver המכובד בקטגורית ה־Entertainment & Design Technologies בתחרות פרסי Edison היוקרתית למוצרים החדשים והטובים ביותר, וב־5 פרסים נוספים בתחרות Muse. בשיחה עם תומר צוקר, סמנכ״ל השיווק של החברה, דיברנו על הזכיות והפרסים המרשימים ועל הדרך המיוחדת ש־D-ID עושה כבר שנים בתוך שוק הרווי במתחרים. תומר סיפר על תהליכי המיתוג מחדש וגם נתן הצצה לעתיד החברה. 

 

אבל לפני הכול – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכון, חידוש או מידע על כלי חדש שיוצא…

ממליצים לכם להצטרף גם לקהילות ה־AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה־AI שלנו? לחצו פה.

 

 

D-ID צומחת ומביאה רוח של חדשנות

תומר צוקר, סמנכ״ל שיווק D-ID, מספר על הזכייה בתחרות:

אני נרגש וגאה לשתף ש־D-ID זכתה בפרס ה־Silver המכובד… הסטודיו שלנו, Creative Reality™, ניצב בחזית החדשנות העולמית של תעשיית ה־AI; הוא משלב באופן מלא טכנולוגיית Deep_Learning, עם יכולות Text generation ו־Text-to-image generation מבוססות LLM (מודל למידה גדול).

 

צוקר מוסיף ומספר על הצמיחה הגדולה של החברה ומוצריה: יותר ממיליון הורדות של האפליקציה של D-ID לנייד בתוך 4 חודשים. כל זאת לצד נתוני שימוש מרשימים – מעל 170 מיליון ‘אנשים דיגיטלים’ נוצרו בפלטפורמות של D-ID.

 

צוקר מוסיף:

הסטודיו שלנו ואפליקציית המובייל שלנו, שזכתה ליותר ממיליון הורדות תוך 4 חודשים (!), מאפשרים לארגונים, עסקים ויוצרי תוכן להמיר בקלות תמונות סטטיות לאווטרים מדברים ב־120 שפות ול־Agents חכמים! 

 

תומר צוקר - סמנכ״ל השיווק של D-ID

תומר צוקר, סמנכ״ל השיווק של D-ID

 

סוכני AI – סייענים שעובדים בשבילכם

דבריו של צוקר מכוונים לאחד הפיצ’רים החדשניים והמסקרנים שהשיקה החברה בתחילת השנה – פלטפורמת סוכני ה־AI של D-ID, שמאפשרים ליצור סייענים בלייב סטרים, מדברים בזמן אמת עם המשתמשים ומגיבים בהתאם לדאטה שהוזן להם ושעליו הם אומנו (בד בבד לאפשרות להתממשק עם אתרי אינטרנט חיצוניים).

 

פה תוכלו לראות דוגמה לסוכן כזה שבניתי לטובת הרצאת ה־AI למנהלים שהעברנו בתחילת השנה.

 

 

 

על הזכייה בפרס Silver בקטגוריית Entertainment & Design Technologies

כך נכתב בעמוד הזוכים של התחרות על הזכייה של D-ID במקום השני בקטגוריית Entertainment & Design Technologies:

הפלטפורמה של D-ID משנה את דרך יצירת התוכן הדיגיטלי. באמצעות עריכה דרך המחשב או בטלפון הנייד, משתמשים יכולים להפיח חיים בתמונות סטטיות ולהנפיש בקלות את תמונת הפנים לאנימציית AI מדברת. בין אם מדובר בדמויות היסטוריות, דמויות בדיוניות או תמונה אישית של המשתמש, הפלטפורמה מציעה כלי יצירתי ומשכנע עבור יוצרי תוכן, שבאמצעותו הם יכולים לספר סיפורים.

 

D-ID זוכה בפרס סילבר בתחרות אדיסון

D-ID זוכה בפרס סילבר בתחרות אדיסון

 

על תחרות Edison

תחרות אדיסון היא תחרות גלובלית מכובדת ומוערכת שמוקירה חדשנות ופיתוח של מוצרים ושירותים חדשים. התחרות נערכת מדי שנה וההשראה לה (כמו גם שמה) נובעים מהממציא והיזם האמריקאי המפורסם תומס אדיסון. התחרות האחרונה התקיימה בין ה־17 ל־19 באפריל 2024 בפורט מיירס פלורידה. באירוע הוצגו מוצרים חדשים וחדשניים מרחבי העולם. תחרות אדיסון מעודדת את רוח החדשנות, היצירתיות והיזמות ומעודדת את המשכיותה. רוח זאת אפיינה את אדיסון וצוותו במנלו פארק (כך לדברי מארגני התחרות).

 

5 פרסים בתחרות הקריאטיב של MUSE

נוסף לפרס בתחרות אדיסון קטפה D-ID עוד 5 פרסים בקטגוריות שונות בתחרות הקריאטיב היוקרתית של MUSE ל־2024.

 

D-ID קוטפת פרסים בתחרות MUSE

D-ID קוטפת פרסים בתחרות MUSE

 

  • בתחום אפליקציות המובייל האפליקציה Creative Reality Studio Mobile App של D-ID זכתה בפרס הפלטינה בקטגוריית הצילום והווידאו וכן בפרס הפלטינה בקטגוריית ה־Workflow והפרודוקטיביות.

 

  • בתחום סרטוני הווידאו סרטון ההשקה של D-ID שחשף את NUI (Natural User Interface) – הגישה המהפכנית של D-ID לממשק אדם־מכונה – זכה בפרס הזהב בקטגוריית המיתוג!

 

 

  • קמפיין המיתוג מחדש של D-ID זכה להכרה בזכיית המותג NUI בפרס הזהב בקטגוריית ה־Integrated Marketing לתחום המיתוג מחדש.

 

  • המחויבות של D-ID לאחריות חברתית ולתחום ה־Impact זכתה להכרה בזכיית פרויקט Sophia Bot למניעת אלימות במשפחה ופרויקט הנצחת מרד גטו ורשה בשיתוף עם March of the Living (מצעד החיים הבין־לאומי) בפרס הזהב בקטגוריית אחריות חברתית (פרו בונו).

 

 

תומר צוקר מספר על הזכיות המרגשות:

הפרסים הללו הם ביטוי מרגש לחזון שלנו לשנות את האופן שבו בני אדם מקיימים אינטרקצייה עם טכנולוגיה ולפרוץ את גבולות החדשנות בתחום ה־AI!

 

 

ומה בעתיד?

כששאלתי את תומר אם יש צפי לחידושים נוספים או לכלים ופיצ’רים ש־D-ID מתכוונת להשיק בזמן הקרוב, הוא סיפר שהם מכינים הרבה הפתעות מעניינות שיושקו בחודשים הקרובים. הוא אומר שהעולם של ה־Agents צובר תאוצה מדהימה!

 

כשנשאל על הזכיות המרשימות ועל  הזהות המיתוגית של D-ID, הוא השיב:

 

מאד גאה במהלכים האלה. המיתוג מחדש היה תהליך עמוק ואסטרטגי שזיקק את הזהות שלנו כחברה ואת הצעת הערך שלנו. הזהות הוויזואלית שלנו מאוד מובחנת ושונה מהמתחרים, ויש מאחוריה סיפור שלם. יצרנו קטגוריה חדשה בשם NUI (Natural User Interface) עם חזון גדול לשנות את הדרך שבה בני אדם יוצרים אינטראקצייה עם כל דבר דיגיטלי. Agents (סוכני AI) הם המימוש הראשון של הגישה הזאת.

 

איך משתמשים ב־D-ID

אם עדיין לא התנסיתם ב־D-ID, אז רוצו לעשות את זה. פה תמצאו מדריך מקיף לשימוש בכלי. כדאי גם לדעת שיש לכם חבילה חינמית נדיבה (14 יום ניסיון) וגישה לטכנולוגיות המתקדמות של החברה (סוכני AI ויצירת אווטרים מדברים).

 

השימוש בכלי סופר פשוט:

  • כנסו לאתר של D-ID, הירשמו ופתחו חשבון (יש חבילה חינמית של 14 יום).
  • בחרו את הדמות של האווטר שלכם מהמגוון הרחב של D-ID. אם לא מצאתם משהו מתאים, יש לכם אפשרות לג’נרט אווטר ישירות בממשק של D-ID או פשוט להעלות תמונה שיצרתם במחולל תמונות אחר.
  • הזינו את הטקסט לדיבוב הדמות (אפילו בעברית). אגב, אם יש בעיות של הגייה בעברית, מומלץ להוסיף ניקוד או לכתוב ב’עברית־אנגלית’ (כלומר Shalom במקום ‘שלום’).
  • בחרו קול ממבחר הקולות העשיר (יותר מ־100 שפות).
  • אפשר להעלות גם הקלטה קולית או להקליט ישירות בממשק D-ID.
  • אם אתם לא יודעים מה לומר, אפשר לתת למחולל הטקסטים של D-ID ליצור את הטקסט בשבילכם. פשוט רשמו כמה מילים או משפט ובקשו מ-D-ID ליצור ממנו תסריט.
  • לבסוף, לחצו על Generate ובתוך כדקה יהיה לכם סרטון מוכן שבו D-ID ינפיש את התמונה שלכם ויזיז את תנועות השפתיים, הגבות ומחוות הפנים בהתאם לטקסט או להקלטה הקולית שהעליתם.

 

הסרטון הבא מציג את השימוש באפליקציה של D-ID לנייד, שזמינה גם למשתמשי אנדרואיד וגם למשתמשי IOS:

 

 

בסופו של יום יש לי הרבה מה לומר על D-ID. קודם כל מדובר בחברה ישראלית; זה לא מובן מאליו ומבחינתי זו גאווה לאומית שמדינה קטנה כמו שלנו מצליחה לייצא לעולם טכנולוגיות מהפכניות. זה משהו שראוי לדבר עליו ולגמרי מגיע להם הפירגון! אבל אני לא אוהב אותם בגלל שהם ‘כחול־לבן’; אני אוהב אותם בגלל שהם טובים! הם היו אחת מחברות ה־GenAI המסחריות הראשונות שהשיקה פתרון לדיבוב ולהנפשת דמויות סטטיות (מה שמכונה ‘ראשים מדברים’), ועד היום הם עושים את זה ממש טוב. יש להם תחרות רצינית בשוק (חברות כמו הייג’ן (Heygen) מאיימות לנגוס להם בנתח השוק, ולאחרונה חברות כמו פיקה (Pika) וראנוויי (Runway) שיחררו פיצ’רים של ליפ סינק שחולשים על זירה דומה).

 

למרות כל הכתוב לעיל, בתור יוצר פעמים רבות מצאתי שלאחר השוואה בין כל הכלים האלה (והאמינו לי שעשיתי את ההשוואות הללו לפרויקטים מסחריים אין־ספור פעמים, שכן יש לי מנוי לכל כלי בעולם בערך 😜), בסוף אני תמיד חוזר ל־D-ID. בסופו של יום, האופן שהפלטפורמה שלהם מצליחה להנפיש שפתיים ותנועות ראש, נראה (לדעתי) הכי מוצלח וטבעי (בטח בכל מה שקשור לדיבוב טקסט או להקלטה קולית בעברית).

הפוסט חברת D-ID הישראלית זכתה בפרס Silver בתחרות פרסי Edison הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/d-id-edison/feed/ 0
VASA-1 – מיקרוסופט נכנסת לשוק הדיפ־פייק ומכריזה על מודל ליפ סינק חדש ומרשים https://letsai.co.il/vasa-1/ https://letsai.co.il/vasa-1/#comments Fri, 19 Apr 2024 11:38:35 +0000 https://letsai.co.il/?p=17035 אין ספק שמפרוץ מהפכת ה־Gen AI, סף הריגוש שלנו עלה, והיום קשה יותר להפתיע אותנו. אנחנו כבר מורגלים בהשקות ובהכרזות על כלים ומודלים המדהימים ביכולותיהם ובפוטנציאל שלהם, ולרוב גם על כאלה שמעלים חששות רבים בנוגע להשלכות השימוש בטכנולוגיות ג’נרטיביות. דיפ־פייק ו־AI בווידאו הם שניים מהתחומים הכי נפיצים בעולם הבינה המלאכותית כיום (וגם הכי מסוכנים). אומנם […]

הפוסט VASA-1 – מיקרוסופט נכנסת לשוק הדיפ־פייק ומכריזה על מודל ליפ סינק חדש ומרשים הופיע ראשון בLet's AI בינה מלאכותית

]]>
אין ספק שמפרוץ מהפכת ה־Gen AI, סף הריגוש שלנו עלה, והיום קשה יותר להפתיע אותנו. אנחנו כבר מורגלים בהשקות ובהכרזות על כלים ומודלים המדהימים ביכולותיהם ובפוטנציאל שלהם, ולרוב גם על כאלה שמעלים חששות רבים בנוגע להשלכות השימוש בטכנולוגיות ג’נרטיביות. דיפ־פייק ו־AI בווידאו הם שניים מהתחומים הכי נפיצים בעולם הבינה המלאכותית כיום (וגם הכי מסוכנים). אומנם מדובר בפלא של ממש – טכנולוגיות AI מרשימות שקל להתלהב מהן, אבל מצד שני הן טומנות בחובן סיכונים רבים בקנה מידה נרחב ביותר. על אף העובדה שאנחנו מוצפים בחידושים, מדי פעם מגיע כלי חדש שמרים את הרף וגורם לנו שוב להתרגש ולהתפעל. VASA-1 של מיקרוסופט הוא אחד כזה – מודל ליפ סינק (Lip Sync) ליצירת סרטונים מדובבים בזמן אמת שמפיק תוצאות מטריפות אפילו על בסיס תמונת פנים סטטית אחת. הינה כל מה שחשוב לדעת על המודל החדש.

 

אבל לפני הכול – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכונים, חידושים או מידעים על כלים חדש שיוצאים.

ממליצים לכם להצטרף גם לקהילות ה־AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה־AI שלנו? לחצו פה.

 

 

לפני הכול פשוט צפו בסרטון הבא – זה באמת משהו שאסור לפספס!

 

 

המסע של מיקרוסופט לטופ של תעשיית ה־AI

מיקרוסופט לא מפסיקה להפתיע! כחברה שהצליחה להמציא את עצמה מחדש בתהליך שעברה מתאגיד עולמי אדיר אך מנומנם לחברה חדשנית ומהפכנית (הרבה הודות להשקעה הנכבדת ב־OpenAI), היא הצליחה למצב את עצמה בטופ של תעשיית ה־AI העולמית. עם מוצרים כמו Copilot וכמובן המוצרים של ‘האחות הקטנה־גדולה’ OpenAI (ChatGPT ,Dall-E3 ו־Sora) היא יצרה לעצמה ארסנל מרשים מאוד. אסופת כלים ג’נרטיביים שממציאים מחדש את התעשייה ואת העולם שבו אנחנו חיים. יחד שתי החברות הללו מכתיבות את הקצב ומציבות את הרף לתעשייה.

 

מה כל כך מיוחד ב־VASA-1

הנפשת ודיבוב דמות בהתבסס על תמונה בודדת

אתמול (18.4.24) הטילה מיקרוסופט פצצה נוספת שמציגה ביצועים גבוהים במיוחד (מה שמפליא הוא שתוצאות אלה מושגות גם לנוכח הזנת אינפוטים מועטים ודלים). הפצצה הזאת היא  מודל בינה מלאכותית חדש ועוצמתי המכונה VASA-1 ומפיק סרטוני דיפ־פייק (DeepFake) מציאותיים להפליא של פנים מדברות (מה שמכונה בתעשייה: ‘ראשים מדברים’, ‘Talking Heads’). הסרטונים הללו מופקים מתמונת פנים יחידה בשילוב קטע קול או טקסט. וכל זה קורה בזמן אמת!

 

אבל זה לא נגמר פה – למודל יכולות מרשימות לייצר הבעות פנים אנושיות וטבעיות בעזרת ממשק שמאפשר לשנות את זווית הפנים ואפילו את מנעד הרגשות שהן יביעו.

 

VASA-01

VASA-01 | credit: Microsoft

 

שליטה מדויקת ומגוונת באאוטפוט 

המודל שמיקרוסופט מציגים בעמוד ההכרזה של הכלי מפגין יכולות מדויקות להפליא לסנכרון שפתיים לשמע, וזה מבטיח יצירת סרטון עקבי, רציף ובעל מראה טבעי (ראו דוגמאות בסרטון מעלה). הוא מצליח לקלוט ולשחזר הבעות פנים מגוונות, רגשות שונים, מחוות טבעיות ותנועות ראש אמיתיות. המשתמש יכול לשלוט בפרמטרים כמו כיוון המבט העיקרי, מרחק הראש בפריים ואפקטים רגשיים ספציפיים.

 

רזולוציה וקצב פריימים גבוה לצד השהייה נמוכה – פוטנציאל גבוה!

VASA-1 תומך ביצירה בזמן אמת של סרטונים באיכות גבוהה (512×512 פיקסלים) בקצב של עד 45 פריימים לשנייה (במצב האופליין) ו־40 פריימים לשנייה במצב של און ליין סטרימינג עם השהיה התחלתית מזערית בלבד – רק 170 מילי־שניות (בניסוי שנעשה במחשב שולחני עם כרטיס גרפי NVIDIA RTX 4090 יחיד). פרט זה חשוב במיוחד כיוון שהוא מאפשר ליצור סוכני AI ג’נרטיביים שמגיבים בזמן אמת, ומראה אנושי טבעי לאינפוטים של משתמשים אנושיים. דמיינו סוכני מכירות ג’נרטיביים, מוקדני AI בשירות לקוחות מקוון, פסיכולוגים ג’נרטיביים חכמים ועוד אינספור שימושים פונקציונליים שכלי כזה יכול להציע. יש לציין כי המודל נועד למחקר בלבד והחברה אינה מתכוונת לשחרר מוצר או API בשלב זה בשל גישת האחריות החברתית שלה.

 

שליטה בהיבטי הייצור

מודל הדיפוזיה של VASA-1 מקבל אותות אופציונליים כתנאי כמו כיוון המבט העיקרי של העין, מרחק הראש ומחוות רגשיות. ועכשיו בעברית – משמעות הדבר שהמשתמש יכול לשלוט בפרמטרים אלה ולקבל תוצאות שונות – לדוגמה לשנות את כיוון המבט של הדמות לצדדים או כלפי מעלה, להגדיל או להקטין את המרחק של הראש בפריים או ליצור הבעות רגש ספציפיות כמו אדישות, שמחה, זעם או הפתעה. המודל מצליח לייצר תנועה טבעית שמשמרת מראה עקבי, גם אל מול שינוי בזווית הראש או שינוי בדינמיקת הפנים. המשתמש יכול לשלוט ידנית בנתונים אלה בעזרת סליידרים שמאפשרים שליטה וכוונון נפרדים של התכונות השונות בתוכן המיוצר.

 

אאוטפוטים מגוונים ויצירתיים

המודל מציג ביצועים מרשימים גם אם הוא מקבל תמונות או קבצי אודיו שחורגים מטווח הנתונים שעליו אומן, כמו למשל תמונות אומנותיות (ראו את הדוגמה עם המונה ליזה בסרטון מעלה), קלטי שירה ואפילו דיבור בשפות שונות שאינן אנגלית (אין לנו מידע בעת הזאת לגבי יכולות בשפה העברית). ואני מחדד – סוגי נתונים כאלה לא הופיעו בסט האימון המקורי, אך VASA עדיין מצליח להתמודד איתם כאשר משתמשים מזינים לו אותם כאינפוט.

 

שיקולי אתיקה ואחריות של VASA-1

מיקרוסופט מדגישים שהמודל שפיתחו במסגרת המחקר שלהם ממוקד ביצירת מיומנויות ויזואליות־רגשיות לאווטרים ולסוכני AI וירטואליים כדי לעודד יישומים חיוביים. אין להם כוונה לאפשר יצירת תוכן מטעה, והם יפעלו למזעור נזקים (הפחתת הסיכוי של יצירת פייק ניוז, שימוש למטרות הונאה ומרמה וכן הלאה). הם מודעים לעובדה שכמו בכל טכנולוגיית ייצור תוכן (ובמיוחד בכל הנוגע לבינה מלאכותית יוצרת), גם פה עלול הכלי לשמש למטרות זדוניות ולחיקוי בני אדם אמיתיים (מה שמנוגד למדיניות החברה). הם מצהירים שהם מתנגדים לכל יצירה של תכנים מטעים או פוגעניים של אנשים אמיתיים, ולכן יפעלו ליישם טכניקות לגילוי זיופים. למרות הסיכונים הרבים חשוב להכיר בפוטנציאל החיובי הניכר של מודל זה – יתרונות בעולמות החינוך וההוראה, שיפור הנגישות למתמודדים עם קשיי תקשורת, הצעת חברה ותמיכה טיפולית לנזקקים ועוד. כל אלו ממחישים, לטענת מיקרוסופט, את חשיבות המחקר ואת יצירת המודל החדש.

 

הזמינות של VASA-1 לציבור ב־API

במיקרוסופט מספרים שבשלב זה אין להם תוכניות לשחרר כלי או ממשק שזמין לציבור וגם לא גישה ל־API. לדבריהם הם לא הולכים לשחרר שום מוצר או יישום בצורה כזאת או אחרת עד שיהיו בטוחים שהטכנולוגיה תשמש באופן אחראי ובהתאם לתקנות מתאימות.

 

מבט לעתיד

VASA-1 טומן בחובו פוטנציאל עצום ליישומים חיוביים רבים אך גם סכנות ניכרות לשימוש לרעה, לזיופים ולהונאות. המודל ממחיש את המשך ההתקדמות המדהימה בתחום הבינה המלאכותית הגנרטיבית ואת חשיבות הטיפול המושכל והאחראי בכוחן הרב של טכנולוגיות אלה. האם באמת יצליחו במיקרוסופט לגדר את הכלי ולצמצם את הפוטנציאל לנזק? ימים יגידו. מה שבטוח, ככל שאנחנו צועדים אל עבר עתיד שבו בינה מלאכותית נעשית חלק בלתי נפרד מהיום־יום שלנו, חלה על כולנו – הן המשתמשים והן החברות שמאחורי פיתוח הכלים הללו – החובה לגלות אחריות. זה הרבה מעבר לשימוש מושכל! זאת גישה כללית שמנסה לשים את הקדמה והביטחון בראש סדר העדיפויות בשל ההבנה שפעמים רבות מדובר בערכים סותרים. האיזון בין ערכים אלה יהיה מה שיקבע אם ה־AI ישמש ככלי לתועלת הציבור או כטכנולוגיה הרסנית עם השלכות הרות גורל הן ליחידים והן לקולקטיב.

הפוסט VASA-1 – מיקרוסופט נכנסת לשוק הדיפ־פייק ומכריזה על מודל ליפ סינק חדש ומרשים הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/vasa-1/feed/ 1
פיצ’ר הליפסינק החדש של ראנוויי זמין לציבור הרחב https://letsai.co.il/runway-lipsync/ https://letsai.co.il/runway-lipsync/#respond Mon, 25 Mar 2024 05:13:13 +0000 https://letsai.co.il/?p=13589 פיצ’ר הליפסינק (Lip Sync) החדש של ראנוויי Runway ai, מחולל הווידאו המוביל, פתוח לציבור הרחב.    אבל לפני הכול – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכון, חידוש או מידע על כלי חדש שיוצא… ממליצים לכם להצטרף גם לקהילות ה-AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה־AI שלנו? לחצו פה. […]

הפוסט פיצ’ר הליפסינק החדש של ראנוויי זמין לציבור הרחב הופיע ראשון בLet's AI בינה מלאכותית

]]>
פיצ’ר הליפסינק (Lip Sync) החדש של ראנוויי Runway ai, מחולל הווידאו המוביל, פתוח לציבור הרחב. 

 

אבל לפני הכול – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכון, חידוש או מידע על כלי חדש שיוצא…

ממליצים לכם להצטרף גם לקהילות ה-AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה־AI שלנו? לחצו פה.

 

קצת על ראנוויי

ראנוויי, שתמיד עמדה בחזית הטכנולוגית של כלי הווידאו הג’נרטיביים, אהובה במיוחד על יוצרי וידאו ברחבי העולם, ויש לכך סיבות טובות! במשך השנה האחרונה היא הקפידה לשחרר פיצ’רים מתקדמים בקצב מסחרר. זה התחיל ב־Gen1 (מחולל Video2Video), המשיך ב־Gen2 (מחולל Text2Video) וממשיך בשורה של שדרוגים: מברשת התנועה (Motion Brush) המאפשרת להנפיש אזורים מוגדרים בתוך הסרטון, ובקרת המצלמה (Camera Motion) שנתנה ליוצרים חופש אדיר ושליטה על כיוון תנועת המצלמה ועל ההתרחשות בסרטון.

 

תחרות עזה בנישת הדיבוב והנפשת התמונות

לראנוויי, סטארט־אפ צעיר עם שווי שוק מוערך של חצי מיליארד דולר, יש לא מעט מתחרים! בעבר היא עמדה כמעט לבדה בנישת מחוללי הווידאו, אך מהר מאוד צמחו לה מתחרים כמו פיקה (Pika) שנוגסת בנתח השוק שלה. מהר מאוד חברות נוספות הציגו כלי הנפשת תמונות דומים המאפשרים לקחת תמונה סטטית ולהפיח בה חיים כסרטון. חברות כמו דומו (Domo), לאונרדו ואפילו פרום (Prome) גם השיקו כלים כאלה.

 

אך התחרות לא באה רק מצד מחוללי וידאו קלסיים או מחוללי תמונות שהוסיפו פי’צרים של עיבודי וידאו; היא הגיעה גם מצד כלים ליצירת אווטארים והנפשתם כמו D-ID הישראלית או הייג’ן (Heygen), שאף השיקה לאחרונה את גרסה 5.0 שלה. כלים אלה מתמחים ביצירת ‘ראשים מדברים’ (Talking Heads). הם מאפשרים לעבוד עם תמונה סטטית (לרבות תמונות שנוצרו בכלים אחרים) ולהנפיש אותה (להוסיף לה דיבוב, לג’נרט את תנועות השפתיים ולהתאים את הבעות הפנים). החברה היחידה שלה מודל Text2Speech שתומך גם בעברית היא D-ID, ואילו שאר הכלים תומכים רק בהעלאה של הקלטה קולית בעברית ובהנפשת הפנים לפיה. גם בגזרת מחוללי האווטארים התחרות לא עצרה; הייג’ן ו־D-ID הציגו מוצרים חדשניים ומהפכניים כמו סוכני AI ג’נרטיביים ויצירת אווטארים הייפר ריאליסטיים כולל כאלה שנוצרו על בסיס סרטונים שהעלו המשתמשים עצמם.

 

בשלב זה פיקה מיהרה ליישר קו ושחררה גם היא פי’צר הנפשת ודיבוב תמונות סטטיות: ליפ סינק (Lip Sync). ונראה שזה היה הקש ששבר את גב הגמל. כשפיקה, המתחרה הישירה של ראנוויי, משחררת כלי שמציב אותה כאלטרנטיבה ל־D-ID או הייג’ן ויכול לשמש כיתרון יחסי למשתמשים המתלבטים אם לעבוד עם הממשק הוובי של ראנוויי או שלה, לראנוויי לא נותרת ברירה. היא חייבת ליישר קו גם היא. כן, זה היה צפוי ומתבקש, והינה זה קורה. 

 

דיבוב והנפשת תמונות בתוך ראנוויי

הפיצ’ר החדש של Runway מאפשר לכם להנפיש תמונת פנים בעזרת מודל Text to Speech או הקלטה קולית. ראו דוגמה בסרטון (הקרינג’י) מטה:

 

גייסנו את רוס גלר (דייויד שווימר מ”חברים”) להציג לכם את הפיצ’ר החדש. מתנצלים מראש על הסרטון הקרינג’י…

 

איך זה עובד?

 

  • בחרו בכלי: Generative Audio.

 

  • העלו תמונה: אפשר לבחור מהמאגר של ראנוויי או מהתמונות שכבר נמצאות בתיקיית הנכסים שלכם בראנוווי, ואפשר גם להעלות תמונה מהמחשב או מהטלפון.

 

  • הקלידו טקסט או העלו הקלטה קולית.

 

  • אם הקלדתם טקסט, בחרו בקול מתוך המבחר העשיר של ראנוויי (נכון לרגע זה הכלי לא תומך ב־Text to Speech בעברית, ולכן תיאלצו להסתפק בהקלטה קולית).

 

  • לחצו על Generate, וזהו בתוך זמן קצר הסרטון שלכם יהיה מוכן.

 

 

דגשים והמלצות

  • כדי שהאודיו יהיה תואם לליפ סינק, הוא חייב לכלול מילים שמדוברות בבירור. הקפידו על הגייה תקינה ותאפשרו למודל של ראנוויי להנפיש את הפנים ואת תנועת השפתיים של הדמות.

 

  • לא רק תמונות; גם סרטונים! בניגוד לכלים אחרים המודל של ראנוויי מאפשר להנפיש ולדובב גם קבצי וידאו ולא רק תמונות סטטיות.

 

  • הקפידו שהפנים בתמונה או בסרטון יפנו ישירות אל המצלמה וממורכזות מהכתפיים ומעלה (לא קרובות מדי למצלמה).

 

  • חשוב שהתמונות או הסרטונים שלכם יהיו יחסית פוטו־ריאליסטיות ומספיק דומות לפנים אנושיות (עיניים, אף ופה), אחרת המודל יתקשה להנפיש אותן.

 

  • אם אתם מנפישים סרטון, הקפידו שהוא לא יכלול תנועות יוצאות דופן של הפה, של המצלמה, של הגוף או של הראש. כמו כן, רצוי שלא יהיו בו שינויי תאורה מובהקים.

 

 

 

הפוסט פיצ’ר הליפסינק החדש של ראנוויי זמין לציבור הרחב הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/runway-lipsync/feed/ 0
הייג’ן (Heygen) משיקה את גרסה 5.0 https://letsai.co.il/heygen-v5/ https://letsai.co.il/heygen-v5/#respond Thu, 21 Mar 2024 10:49:10 +0000 https://letsai.co.il/?p=13364 הייג’ן (Heygen) משיקה את גרסה 5.0 ויוצאת בסדרה של שיפורים ושדרוגים לפלטפורמה שלה.     אבל לפני הכול – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכונים, חידושים או מידעים על כלים חדש שיוצאים. ממליצים לכם להצטרף גם לקהילות ה-AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה־AI שלנו? לחצו פה.   […]

הפוסט הייג’ן (Heygen) משיקה את גרסה 5.0 הופיע ראשון בLet's AI בינה מלאכותית

]]>
הייג’ן (Heygen) משיקה את גרסה 5.0 ויוצאת בסדרה של שיפורים ושדרוגים לפלטפורמה שלה.

 

 

אבל לפני הכול – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכונים, חידושים או מידעים על כלים חדש שיוצאים.

ממליצים לכם להצטרף גם לקהילות ה-AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה־AI שלנו? לחצו פה.

 

קצת על הייג’ן

למי שלא מכיר, הייג’ן (Heygen) היא אחת מפלטפורמות ה־AI המובילות בשוק ליצירת אווטארים דיגיטליים. לצידה תמצאו מתחרות כמו D-ID, סינתזיה ואפילו פיקה שמנסה לחדור לשוק הדיבוב וההנפשה.

 

 

לא רק הנפשה ודיבוב

 

תרגום לשפות אחרות ודיבוב אוטומטי

הייג’ן היא הרבה יותר מכלי ליצירת אווטארים או לדיבוב ‘ראשים מדברים’ (Talking Heads). היא מחזיקה בארסנל של כלים עוצמתיים במיוחד כמו למשל כלי הדיבוב שלה שיודע לקחת סרטון בשפה אחת, לתרגם אותו אוטומטית למגוון שפות אחרות, לבנות מודל קול של הדובר ולג’נרט סרטון חדש שבו הדובר מדבר בשפה אחרת בקולו שלו ובהנפשת הפנים ותנועות השפתיים בצורה מושלמת. מדהים!

 

 

כלי ליצירת וידאו פרסונלי בתפוצה רחבה

אחד הכלים המיוחדים והשימושיים של הייג’ן הוא כלי ה־Personalized Video. כלי זה מאפשר ליצור סדרת סרטונים של וידאו פרסונלי בסקייל (הכול בקליק אחד). כל מה שצריך לעשות, הוא להעלות קובץ אקסל עם משתנים כמו שם, מידע אישי או כל דבר שתרצו, להכניס את המייל של הנמען ולשלוח לו וידאו פרסונלי ישירות למייל שלו. תחשבו איזה פוטנציאל שיווקי אדיר יש כאן לפרסונליזציה עם הלקוחות שלכם, בין שאתם עסק קטן, ובין שאתם עסק גדול. לקוח אחד מארצות הברית מקבל סרטון אישי באנגלית שבו אתם מברכים אותו בשמו, ולקוח אחר מצרפת מקבל את אותו סרטון, אבל הפעם בשפתו שלו – צרפתית, ובסרטון הזה אתם אלה שמדברים בקול שלכם ופונים אליו בשמו. פרסונליזציה מושלמת!

 

כמה פשוט, ככה מדהים!

 

 

 

בסרטון הבא תמצאו מדריך לשימוש בכלי הווידאו הפרסונלי של Heygen

 

 

אווטארים מתקדמים ופוטוריאליסטיים

כמובן הדובדבן שבקצפת של הייג’ן הוא המגוון האדיר של האווטארים הדיגיטליים שלהם שנראים פשוט מדהים! קשה להבחין שאין מדובר באדם אמיתי. מדובר באווטארים ברזולוציה של HD שיכולים לדבר בכל שפה ואפילו מגיעים עם סטים שונים של לבוש. סט האווטארים של Heygen כולל גברים, נשים (ומגוון רחב של מאפיינים אתניים וגוני עור). אפשר לערוך את הרקע שמאחוריהם בעזרת עורך מתקדם ואף להיעזר ב־AI כדי לג’נרט להם טקסט בכל שפה. תעיפו מבט על הסרטון הבא שמציג מספר אווטארים שכאלה.

 

 

 

אינסטנט אווטאר שנראה ונשמע כמוכם

ללא ספק הפיצ’ר הכי מטורף שאיתו הייג’ן יצאו, הוא האינסטנט אווטאר (Instant Avatar). הכלי הזה מאפשר לכם ליצור אווטאר שנראה ונשמע בדיוק כמוכם ויודע לדבר במגוון רחב מאוד של שפות (אפילו עברית). אגב, אם תרצו שהוא ידבר עברית, יהיה עליו לוותר על אופציית ה־Text to Speech ולהשתמש בהקלטה קולית שלכם בעברית. בשאר השפות הקלדת הטקסט עובדת מצוין. מה שמדהים בכלי הזה, הוא הקלות הבלתי נסבלת שבה יוצרים את האווטאר. הוא מתבסס על צילום רגיל (אפילו מהטלפון הנייד) של שתיים־שלוש דקות וזהו. כתבנו מדריך מקיף על הכלי הזה – מוזמנים להעיף מבט.

 

ופה תוכלו לראות הדגמה של האווטאר שבניתי לעצמי:

 

 

שיפורים ושדרוגים בגרסה 5.0

כאמור, ממש היום השיקה הייג’ן את הגרסה החדשה, המשופרת והמשודרגת שלה – גרסה 5.0. אלה עיקרי השיפורים והשדרוגים:

 

עורך הסטודיו החדש AI Studio 3.0 

ממשק עריכת הוידאו של הייג’ן (AI Studio 3.0) השתפר ומגיע עם יכולות משופרות ועוצמתיות יותר. מושלם ליצירת סרטוני הסבר על מוצרים, סרטונים חינוכיים, קורסים וסדנאות אונליין, פרסומות ומודעות וכמובן סדרות רשת או סרטים.

 

בתוך ממשק העורך ממשק התסריט עבר לצד שמאל והטיים־ליין שודרג ויכול להכיל מספר שכבות וערוצים ומגוון קבצים שונים (סאונד, וידאו, טקסט, אלמנטים עיצוביים ועוד).

 

 

העורך החדש של הייג'ן

העורך החדש של הייג’ן | credit: Heygen

 

אווטאר בלייב סטרים

כלי הלייב סטרים של הייג’ן אינו דבר חדש, אך גם הוא קיבל מקצה שיפורים. למי שלא מכיר, מדובר בפיצ’ר שמאפשר לכם לדבר בזמן אמת עם אווטאר שמחובר ל־API של ChatGPT ולכן יכול להגיב מייד לשאלות של המשתמש, ולענות לו בפורמט ידידותי ואנושי בהרבה; שיחה קולחת וטבעית עם מערכת AI בעלת חזות ומניירות אנושיות. ראוי לציין ש־D-ID הישראלית הקדימה את הייג’ן והשיקה כלי זהה. כתבנו בהרחבה על סוכני ה־AI של D-ID במאמר הבא.

 

 

שיפורים נוספים

הייג’ן שינו ושיפרו גם את הניווט בדף הבית של האתר שלהם. כעת תוכלו למצוא בקלות את כל המוצרים.

 

הייג'ן גרסה 5.0

הייג’ן גרסה 5.0 – שיפורים בממשק האתר | credit: Heygen

 

גם שאר הכלים של הייג’ן עברו מקצה שיפורים:

  • Instant Avatars – אווטאר דיגיטלי הדומה לכם בקולו ובמראהו, כך שאינכם צריכים לעמוד מול מצלמה.
  • Video Translation – המרת סרטונים לשפות שונות בשמירה על קול המרצה המקורי ועל תנועות השפתיים.
  • Personalized Videos – יצירת סרטוני פנייה אישיים המותאמים לכל צופה בשפת האם שלו. כל זה בקנה מידה רחב ובתוך זמן קצר.
  • Streaming Avatar – מעורבות טובה יותר עם הקהל שלכם באמצעות שילוב אווטאר בשידורי לייב מול משתמשים בזמן אמת.
    ועוד!

 

 

 

 

הפוסט הייג’ן (Heygen) משיקה את גרסה 5.0 הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/heygen-v5/feed/ 0
פיצ’ר הליפסינק החדש של פיקה טורף את הקלפים! https://letsai.co.il/pika-lipsync/ https://letsai.co.il/pika-lipsync/#respond Wed, 28 Feb 2024 06:35:16 +0000 https://letsai.co.il/?p=11377 פיקה (Pika), מחולל הוידאו שכבר מזמן לא “האח הקטן” של Runway מדיסקורד, אלא סטארטאפ שצמח למימדי מפלצת בשווי 300 מיליון דולר ואתר ייעודי לג’ינרוט סרטוני AI, משחררת פיצ’ר חדש ומסקרן במיוחד: יכולת דיבוב סרטונים (ליפ סינק Lip sync).     אבל לפני הכל – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכון, חידוש […]

הפוסט פיצ’ר הליפסינק החדש של פיקה טורף את הקלפים! הופיע ראשון בLet's AI בינה מלאכותית

]]>
פיקה (Pika), מחולל הוידאו שכבר מזמן לא “האח הקטן” של Runway מדיסקורד, אלא סטארטאפ שצמח למימדי מפלצת בשווי 300 מיליון דולר ואתר ייעודי לג’ינרוט סרטוני AI, משחררת פיצ’ר חדש ומסקרן במיוחד: יכולת דיבוב סרטונים (ליפ סינק Lip sync).

 

 

אבל לפני הכל – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכון, חידוש או מידע על כלי חדש שיוצא…

ממליצים לכם להצטרף גם לקהילות ה-AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה-AI שלנו? לחצו פה.

 

סרטון ההשקה של פיצ’ר הליפסינק החדש של פיקה

 

 

בסרטון ההשקה שהחברה השיקה נראה הפיצ’ר החדש, והוא בהחלט נראה מדהים. יש לו פוטנציאל אדיר להביא לתוצאות מעולות של התאמת שפתיים לקטעי סאונד, בין אם על סרטים שג’ונרטו בתוך הפלטפורמה או סרטונים שהועלו אליה ונוצרו בלפטפורמות אחרות. מדובר בכלי עוצמתי במיוחד שכאשר הוא חובר לכלים אחרים (אינטגרציה בין כלים) נוצר שלם שעולה על סך חלקיו. 

 

למה זה טוב?

הכלי מציג תוצאות מרשימות – הוא יכול לשמש להפקת סרטוני דיפ פייק (Deep Fake), ליצירת אווטארים, ליצירת סרטוני AI ופרסומות AI, להפקת קליפים, סרטוני אנימציה ועוד ועוד.

 

איך משתמשים בפיצ’ר החדש?

בימים הראשונים להשקת הפיצ’ר, הוא היה זמין רק למנויי מנוי Pro של החברה ורק באתר הייעודי.  נכון להיום, פיצ’ר הליפ סינק של פיקה זמין גם בחבילה החינמית. כל ג’ינרוט יעלה לכם 2 קרדיטים. כדאי לדעת שבחבילה החינמית תקבלו 250 קרדיטים חינם כדי שתוכלו להתחיל ליצור.

 

החבילות והמנויים של פיקה

החבילות והמנויים של פיקה.

 

קצת דוגמאות

בסרטון ההשקה אפשר לראות את הפוטנציאל של הכלי, אבל משתמשים ברחבי העולם כבר החלו להשתמש בכלי ולקחו אותו צעד אחד קדימה. למשל, משתמש ה-X העונה לכינוי AshutoshShrivastava (@ai_for_success) לקח את הסרטונים של סורה (Sora) והוסיף להם דיבוב בעזרת הפיצ’ר החדש של פיקה. הדמות בסרטון שדיבב (שכאמור נוצר ב”סורה”) לועגת לצופים בעוקצנות:

 

אתם חושבים שתצליחו להניח את הידיים שלכם על סורה? שכחו מזה – הוא לא זמין!

 

ומה לגבי האיכות – פה התוצאות מדברות בשם עצמן.

 

עוד קצת דוגמאות לשילוב בין סורה לפיצ’ר הליפסינק של פיקה:

 

 

 

 

הפוסט פיצ’ר הליפסינק החדש של פיקה טורף את הקלפים! הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/pika-lipsync/feed/ 0
רוצים לראות איך הייתם נראים בתור דמות מצוירת? זה אפשרי! https://letsai.co.il/insightfaceswap-2/ https://letsai.co.il/insightfaceswap-2/#respond Tue, 23 Jan 2024 22:08:53 +0000 https://letsai.co.il/?p=8318 כלי ה-InsightFaceSwap, הוא אחד הכלים השימושיים והמיוחדים שנמצאים בדיסקורד – אפשר לעבוד איתו על בסיס תמונות שיצרתם במידג’רני או בכל כלי אחר (אפילו בתמונות שאתם מעלים מהמחשב או שצילמתם בסמאטרפון שלכם). באמצעות הכלי הזה ניתן לקחת תמונה של כל אדם שהוא ולהחליף לו את הפנים בלחיצת כפתור. אבל מה קורה שרוצים להחליף את הפנים של […]

הפוסט רוצים לראות איך הייתם נראים בתור דמות מצוירת? זה אפשרי! הופיע ראשון בLet's AI בינה מלאכותית

]]>
כלי ה-InsightFaceSwap, הוא אחד הכלים השימושיים והמיוחדים שנמצאים בדיסקורד – אפשר לעבוד איתו על בסיס תמונות שיצרתם במידג’רני או בכל כלי אחר (אפילו בתמונות שאתם מעלים מהמחשב או שצילמתם בסמאטרפון שלכם). באמצעות הכלי הזה ניתן לקחת תמונה של כל אדם שהוא ולהחליף לו את הפנים בלחיצת כפתור. אבל מה קורה שרוצים להחליף את הפנים של חד קרן מהאגדות? הרי “פייס סאוופ” לא מאפשר להחליף פנים לדמויות שאינם בני אדם, כמו חיות למשל. אז מסתבר שזה כן אפשרי ושגם לזה מצאתי פתרון!

 

אבל לפני הכל – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכון, חידוש או מידע על כלי חדש שיוצא…

 

לפני שמתחילים

רגע לפני שמתחילים ולפני שאלמד אתכם איך להחליף פנים לדמות מצוירת, אתם צריכים מנוי למידג’רני או לכל מחולל תמונות אחר. אם אתם מחפשים מחוללים חינמיים, אפשר לעבוד עם לאונרדו או עם דאלי3.

אם אתם לא יודעים איך עובדים עם “פייס סוואפ” ואיך פותחים סרבר פרטי שאליו תוכלו להזמין את הבוט של פייס סוואפ (ורצוי גם את הבוט של מידג’רני), ממליצים לקרוא את המדריך המלא שלנו על כלי זה.

 

הטמעת פנים במידג'רני עם InsightFaceSwap

 

למה אי אפשר להחליף פנים לדמות לא אנושית?

אם התנסיתם בעבר בכלי המגניב של החלפת הפנים, אתם בטח יודעים, כשמנסים לבצע החלפת פנים על גבי דמויות שאינן אנושיות, מקבלים הודעת Failed
(ראו תמונה מטה), משום שהבוט לא מזהה פנים אנושיות שעליהן הוא צריך להתבסס ולכן הוא לא מצליח לבצע את החלפת הפנים.

 

הודעת שגיאה - לא מצליח לזהות פנים אנושיות

הודעת שגיאה – לא מצליח לזהות פנים אנושיות

 

קבלו את הטריק הסודי שלי להחלפת פנים לחיות ולדמויות לא אנושיות

מצאתי לכם דרך לעקוף את הסירוב הזה ולהצליח להחליף פנים גם לדמויות מצוירות! הנה לכם מדריך קצר, שלב אחרי שלב, איך אפשר להחליף פנים לדמות לא אנושית/מצוירת, בעזרת הבוט InsightFaceSwap:

 

שלב 1) יצירת תמונה

צרו תמונה של הדמות שאתם רוצים להפוך לאנושית במידג’רני (או בכל מחולל תמונות אחר).
אני בחרתי ליצור תמונה של חד קרן קסום מהאגדות (ראו תמונה מטה).

 

שלב 2) משנים לדמות את הפנים לפנים אנושיות

  • לחצו על כפתור Vary region במידג’רני (נכון ליום פרסום המדריך הוא זמין רק בגרסה 5.2, אך צפוי להיכנס גם לגרסה 6 בהמשך).
  • אם אין לכם מידג’רני, השתמשו בכל כלי שמאפשר לבצע אינפיינטינג, למשל: פוטושופ ג’נרייטיב פיל, לאונרדו קנבס או פרום.
  • שנו את אזור הפנים והחליפו אותו בפנים אנושיות (פשוט סמנו את האזור המדובר ושנו את הפרומפט, בדומה לדוגמה מטה).

 

החלפת פני האוביקט בפנים אנושיות בעזרת אינפיינטינג

החלפת פני האוביקט בפנים אנושיות בעזרת אינפיינטינג

 

שלב 3) בוחרים את התוצאה שאהבתם

בשלב זה תקבלו 4 וריאציות שונות עבור הפרומפט שכתבתם. בחרו את הוריאציה שהכי אהבתם והגדילו אותה (UPSCALE).

 

שימו לב שלחד הקרן כעת יש פנים אנושיות

שימו לב שלחד הקרן כעת יש פנים אנושיות

 

שלב 4) מעלים את התמונה שלכם

  • העלו תמונה שלכם (או של מי שתרצו לשתול את הפנים שלו בדמות המצוירת).
  • איך עושים את זה? בשורת הפרומפט כתבו /saveid ותופיע לכם האפשרות להעלות תמונה מהמחשב.
  • העלו את התמונה ותנו לה שם בקוביית הטקסט שבה רשום idname

 

פקודת /save id בפייס סוואפ

פקודת /save id בפייס סוואפ

 

ככה בעצם אפשר להעלות תמונות שונות ולכל אחת לתת שם משלה. (זכרו טוב את ה-ID שנתתם לתמונה כי תצטרכו להגדיר אותו בהמשך).

 

שלב 5) מפעילים את InsightFaceSwap

  • לחצו מקש ימני על גבי התמונה והפעילו את הבוט – InsightFaceSwap, הבוט יחליף את הפנים של הדמות המצוירת שלכם עם התמונה האחרונה ששהגדרתם אצלו (באמצעות ה-setid).
  • אם העלתם רק תמונה אחת בלבד, הוא ישתמש בה.
  • למידע נוסף על תפעול הבוט של פייס סוואפ, ממליצה לכם בחום לקרוא את המדריך המלא (לינק מעלה).

 

הטמעת הפנים האחרונות ששמרנו

הטמעת הפנים האחרונות ששמרנו

 

שלב 6) בתמונה הסופית

וכך אתם יכולים להטמיע את פניכם בתמונה של דמות מצוירת ולא אנושית… או במקרה שלי… מזהים מי הפכה לחד קרן?
התשובה בגוף השאלה 😜

 

אני בתור חד קרן

אני בתור חד קרן

הפוסט רוצים לראות איך הייתם נראים בתור דמות מצוירת? זה אפשרי! הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/insightfaceswap-2/feed/ 0
הכירו את סוכני ה-AI של D-ID https://letsai.co.il/d-id-agents/ https://letsai.co.il/d-id-agents/#respond Fri, 29 Dec 2023 10:58:00 +0000 https://letsai.co.il/?p=6542 למי שלא מכיר, D-ID היא חברה ישראלית, ואחת מחלוצות האווטארים הג’נרטיביים. היא אחת החברות הראשונות בעולם שיצרו “ראשים מדברים” (Talking Heads). כלומר, דמויות AI שניתן להנפיש ולדובב. ניתן לבחור דמויות אלו מתוך מבחר רחב שהחברה מעמידה לרשות המשתמשים, אך יש גם אפשרות לג’נרט דמות בתוך הממשק של D-ID או אפילו ליצור דמות במחולל תמונות אחר […]

הפוסט הכירו את סוכני ה-AI של D-ID הופיע ראשון בLet's AI בינה מלאכותית

]]>
למי שלא מכיר, D-ID היא חברה ישראלית, ואחת מחלוצות האווטארים הג’נרטיביים. היא אחת החברות הראשונות בעולם שיצרו “ראשים מדברים” (Talking Heads). כלומר, דמויות AI שניתן להנפיש ולדובב. ניתן לבחור דמויות אלו מתוך מבחר רחב שהחברה מעמידה לרשות המשתמשים, אך יש גם אפשרות לג’נרט דמות בתוך הממשק של D-ID או אפילו ליצור דמות במחולל תמונות אחר ולהעלות אותה ל-D-ID). עם הזמן צמחו לחברה מתחרות רציניות בתחום – אחת מהן היא Heygen, והיה נדמה לרגע ש-D-ID עלולה להישאר מאחור. אבל בישראל כמו בישראל לא נחים על זרי דפנה ולא נרדמים בשמירה. החבר’ה מ-D-ID המשיכו לפתח ולשחרר מוצרים מהפכניים חדשים, מהם נציג שניים היום:

 

אבל לפני הכול – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכונים, חידושים או מידעים על כלים חדש שיוצאים.

ממליצים לכם להצטרף גם לקהילות ה-AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה-AI שלנו? לחצו פה.

 

 

הראשון הוא כלי ליצירת סוכני AI שמתקשרים בזמן אמת עם המשתמשים, הן במישור טקסטואלי (כתוב), ויזואלי (הנפשת פני הדמות) וקולית (הדמות מדברת בפועל).

 

הכלי השני הוא צ’אט מיוחד שמאפשר לייצר אווטאר שכזה, איתו ניתן לדבר בזמן אמת.

 

בסרטון הבא תוכלו לראות הדגמה בלייב שלי, מדבר עם סוכן שכזה, שבניתי לשיווק הקורסים שלנו. הקטע לקוח מתוך הרצאת ה-AI למנהלים של עומר הררי ושלי.

 

 

סוכני AI מבית D-ID

לפני הכל, צפו בסרטון ההשקה של פיצ’ר סוכני ה-AI של D-ID:

 

 

איך מקבלים גישה ל-D-ID ai?

כדי לקבל גישה לכלי, יש להכנס לאתר הבא.

 

מה זה בכלל סוכן AI ואיך זה עובד?

סוכני ה-AI של D-ID הם סייעני בינה מלאכותית אוטונומיים שיכולים לענות על שאלות על בסיס הידע שהעלה הבעלים שלהם, ולבצע תפקיד או משימה ספציפית שיעילים עבור מקרי שימוש עסקיים או אישיים. הם יכולים לעזור למשתמשים בכל דבר החל מלימוד אסטרונומיה, ניתוח מסמכים, ואפילו לשמש כפלטפורמה למשפיענים או חברות המעוניינים בממשק צ’אט שינהל שיח אנושי עם העוקבים שלהם. כל סוכן הוא מומחה בתחום אחר ויש לו גישה לידע ייעודי שהיוצר שלו סיפק. סוכנים אלו משתמשים בעיבוד שפה טבעית (NLP) ובינה מלאכותית ג’נרטיבית כדי להבין את הקלט הטקסטואלי או הקולי שלך, ואז לספק תגובות רלוונטיות או לבצע משימות. סוכנים יכולים לענות על שאלות, לספר סיפורים, לתת המלצות ועוד. 

 

על ידי מיזוג הטכנולוגיה המתקדמת של מודלי שפה עם החום האנושי שמתקבל בעת תקשורת מול דמות אנושית פנים אל פנים, סוכני ה-AI של D-ID מצליחים לייצר חוויית תקשורת דיגיטלית חדשה בין אדם למכונה. חוויה אישית ואנושית יותר, אינטימית יותר וטבעית יותר. כל שעליכם לעשות הוא לבחור את מראה הסוכן שתרצו ליצור, לבחור את הקול שלו, לתאר כיצד אתם רוצים שהוא יתקשר, ולספק לו מסמכים כדי להרחיב ולהתאים אישית את בסיס הידע שלו. בתוך דקות ספורות תקבלו “אדם דיגיטלי” מוכן לפעולה, איתו אפשר לשוחח בדיוק כמו עם בן אדם אמיתי.

 

סוכני AI של D-ID

* איך עובדים סוכני ה-AI של D-ID. מקור: האתר של D-ID

 

אז איך זה באמת עובד? בשלב הראשון המשתמש שואל שאלה (מזין פרומפט טקסטואלי). המידע מתקבל במערכת ובעזרת מודלי החישוב מתבצע ניתוח של השאלה ושליפת הידע. המידע מעובד במודל שפה גדול שמנסח תשובה לשאלה שנשאלה. האווטאר הדיגיטלי (סוכן ה-AI) מונפש בהתאם לטקסט. כל התהליך הזה קורה בזמן אמת ובצורה פלואידית. מדהים!

 

מה ההבדל בין סוכני ה-AI של D-ID לבין כלים/סוכנים אחרים?

  • קאסטומיזציה מוחלטת: התאמה אישית של סוכן הD-ID מאפשרת לכם להתאים אותם לצרכים הספציפיים שלכם, ולהביא נוכחות ידידותית ואקטיבית בכל אינטראקציה.
  • צעד אחד מעבר לטקסט: הסוכנים מקשיבים, מגיבים, ומציעים מימד אנושי לשיחות דיגיטליות. חוויה שונה לחלוטין משיחה עם מודל שפה גדול כמו ChatGPT או Claud.
  • תגובות מהירות ומדויקות: עם דיוק של מעל 90% המסופק בפחות משתי שניות, השאילתות שלכם מקבלות מענה מהיר ומדויק במיוחד.
  • אמינות וחדשנות: הודות לטכנולוגיית retrieval augmented generation (RAG), סוכני ה-AI של D-ID משתחררים מהגבלות מודלי שפה טיפוסיים, ומספקים מידע מעודכן ומשופר.

 

בסרטון הבא תוכלו לראות את היתרונות של סוכני AI לעומת ממשקי צ’אט מסורתיים:

 

 

איך יוצרים סוכן AI עם D-ID?

כל אחד יכול ליצור סוכן AI, ללא כל ידע בקידוד. יצירת סוכן קלה כמו בחירת תפקיד, מתן הוראות לסוכן והעלאת ידע נוסף. כל מה שאתם צריכים הוא חשבון ב-D-ID ובקשת גישה דרך הרשימה המוקדמת (פירוט מעלה). לאחר קבלת הגישה תוכלו להשתמש בפלטפורמת הסוכנים, לה יש ממשק נוח ואינטואיטיבי במיוחד! תוכלו לאמן את הסוכן שלכם על דאטה ייעודית, מה שיהפוך אותו למומחה בתחומו, יועץ או סייען יעיל במיוחד. בסופו של דבר, מה שהסוכן שלכם יעשה תלוי לחלוטין בכם ובמידע שתספקו לו (וכמובן גם לאינפוטים שהוא יקבל ממשתמש הקצה). המסמכים והנתונים שתעלו יספקו לסוכן שלכם דאטה שאינו זמין ל-LLM (מודל השפה) עליו מבוססים הסוכנים. לדוגמה, המסמכים והנתונים שלכם יכולים להכיל חדשות עדכניות או מידע שאינו פומבי. אפשר להעלות קבצי PDF, קבצי טקסט או אפילו מצגת PowerPoint (קובץ PPT), מה שיעצים משמעותית את המומחיות והיכולות של הסוכן שלכם. בהמשך יהיה ניתן להעלות גם לינקים לאתרי אינטרנט (פונקציה זו עדיין לא נתמכת, אך לדברי החברה תהיה בעתיד הקרוב). עבור תוצאות אופטימליות, מומלץ להעלות מסמכים המכילים מידע רלוונטי ומדויק עבור התפקיד של הסוכן שברצונכם לבנות.

 

חשוב לדעת: המסמכים שלכם נגישים רק לכם ולסוכנים שתבנו ויקבלו גישה לדאטה שלכם. עם זאת, חשוב לזכור שאם אתם מאפשרים למשתמשים אחרים לשוחח עם הסוכן שלכם, אז הם יכולים גם ללמוד על תוכן מסמכים ונתונים אלו.

 

לפניכם סרטון הדרכה קצרצר המסביר איך אפשר לבנות סוכן AI שכזה:

 

 

איך ניתן לשוחח בפועל עם סוכן ה-AI?

לאחר יצירת סוכן ה-AI שלכם, תוכלו להנגיש אותו לקהלים שלכם ע”י הטמעתו באתר או ע”י משלוח לינק שמפנה לסוכן שלכם. הקהלים שלכם יכולים להתחיל לייצר שיח מול הסוכן שלכם. הם יכולים להקליד שאלות בתיבת הקלט הטקסטואלית, או אף לדבר איתו במישור קולי ע”י לחיצה על סמל המיקרופון ודיבור בקולם. ל-D-ID יש טכנולוגיית המרת דיבור לטקסט שתאפשר שיח זורם וטבעי.

 

אלו קולות זמינים לסוכני ה-AI של D-ID?

בעת יצירת סוכן תקבלו גישה למגוון קולות עשיר, מתוך המבחר של D-ID. קולות באיכות גבוהה מ-ElevenLabs יהיו זמינים רק עבור חלק מהתוכניות (Pro, Advanced, and Enterprise).

 

האם המידע שלי מוגן וחסוי?

חשוב מאוד להגן על הפרטיות שלכם, ולכן בכל מצב לא מומלץ לשתף, לחשוף או להעלות פרטים אישיים או מידע אישי רגיש, הן בשלב אימון הסוכן והן בשלב השיח עימו.

 

קצת דוגמאות… איך זה נראה בפועל?

שימו לב איך זה נראה בפועל. יובל אבידני בנה סוכן AI בעזרת הפלטפורמה של D-ID. בדוגמה הראשונה הוא בנה סוכן בו בן דמותו משיב למשתמשים. בדוגמה השניים הוא בנה סוכן העונה לשם “האוס” (תכף תבינו למה) שמתפקד כסוכן נדל”ן עם מאגר ידע על דירות, אשר משיב על פי המאגר שברשותו.

 

@yuval.ai

This is so cool: custom AI avatars with custom knowledge base! I built myself and also built a real estate salesman! Check it oit! So cool D- ID!! 🚀🚀🚀 #ai #did #artificialintelligence #avidani #hackit #yuvai #deepfake #avatar #aiavatar #interfacesevolve #בינהמלאכותית #דיפפייק #אוואטר #אווטאר

♬ צליל מקורי – Yuval Avidani (AI)

* קרדיט: יובל אבידני.

 

לשוחח עם ChatD-ID

לא רק סוכני בינה מלאכותית! D-ID היא האפליקציה הראשונה שמאפשרת שיחות פנים אל פנים עם ChatGPT. זו ההזדמנות שלכם לתת למודל השפה שלכם דמות, איתה אפשר לשוחח, ממש כמו שיחה עם אדם אמיתי. והכי חשוב – כל הפאן הזה חינמי לגמרי (בחבילת התנסות מוגבלת). אבל לפני הכל, צפו בסרטון הבא:

 

 

הוסיפו “מגע אנושי” לשיחות שלכם עם AI ונהלו שיחה בזמן אמת עם “אדם דיגיטלי” המונע על ידי שילוב של טכנולוגיית D-ID, LLM ו-NLP. היכולות המתקדמות של D-ID בהנפשת פנים מאפשרות למשתמשים לקבל חוויית שיחה עם בינה מלאכותית באופן אנושי וטבעי יותר, באמצעות דיבור ווידאו במקום שיחה במישור טקסטואלי בלבד.

 

הפיצ’ר זמין לניסיון חינם בחבילה מוגבלת. כדי לקבל גישה לכלי, לחצו פה. משתמשים יכולים לקיים עד חמישה צ’טים עם אדם דיגיטלי, כל צ’ט מורכב מ-6 אינטראקציות הלוך ושוב. בסרטון הבא תוכלו לראות שיחה לדוגמה שלי, עם דמות בשם אוליביה:

 

 

* השיחה שלי עם אוליביה – אווטאטרית דיגיטלית מבית D-ID שהופכת את השיחה עם ChatGPT לקולחת וזורמת הרבה יותר.

 

 

אולי גם זה יעניין אתכם…

קבלו מדריך מפורט שילמד אתכם צעד אחר צעד איך ליצור אווטאטר מתקדם בדמותכם, שיראה, ישמע ויתנהג בדיוק כמוכם! לקריאה לחצו כאן.

 

אווטאר דיגיטלי עם Heygen

 

סדנת יצירת אווטארים ומחוללי וידאו

קחו את היכולות שלכם צעד אחד קדימה, והצטרפו לסדנה מקיפה על כלי ה-AI בוידאו החזקים בשוק, לצד כלים ליצירת אווטאטרים דיגיטליים. פרטים והרשמה כאן.

 

סדנת AI בוידאו

 

קורס בינה מלאכותית

 קורס בינה מלאכותית

הפוסט הכירו את סוכני ה-AI של D-ID הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/d-id-agents/feed/ 0
Let it go – Bibi style https://letsai.co.il/let-it-go-bibi-style/ https://letsai.co.il/let-it-go-bibi-style/#respond Tue, 26 Dec 2023 14:27:53 +0000 https://letsai.co.il/?p=5896 מבלי להיכנס לפוליטיקה ומבלי לנקוט עמדה או צד – בואו פשוט נחייך ונעריך את היכולות והכלים בהם השתמש אורי בז’רנו כדי לייצר את קליפ ה-AI הסאטירי הבא, שעושה פרפרזה לשיר המפורסם מ”לשבור את הקרח”. הקליפ הפך ויראלי ברשתות החברתיות ונכון לרגע זה עומק על למעלה מ 100,000 צפיות ומאות שיתופים. את התמונות אורי ג’ינרט עם […]

הפוסט Let it go – Bibi style הופיע ראשון בLet's AI בינה מלאכותית

]]>
מבלי להיכנס לפוליטיקה ומבלי לנקוט עמדה או צד – בואו פשוט נחייך ונעריך את היכולות והכלים בהם השתמש אורי בז’רנו כדי לייצר את קליפ ה-AI הסאטירי הבא, שעושה פרפרזה לשיר המפורסם מ”לשבור את הקרח”. הקליפ הפך ויראלי ברשתות החברתיות ונכון לרגע זה עומק על למעלה מ 100,000 צפיות ומאות שיתופים.

את התמונות אורי ג’ינרט עם הגרסה החדשה של מידג’רני (Midjourney V6). מידול קול הוא עשה עם KITS, דיבוב לקטעי השירה עם D-ID, תנועות אנימציה עם PIKA, עריכה עם CAPCUT וכתוביות עם KAPWING.

 

 

 

הפוסט המקורי של אורי בפייסבוק.

 

הפוסט של אורי

הפוסט Let it go – Bibi style הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/let-it-go-bibi-style/feed/ 0
איך בונים אוואטאר דיגיטלי בדמותכם בשניות?! https://letsai.co.il/heygenavatar/ https://letsai.co.il/heygenavatar/#respond Wed, 13 Dec 2023 12:53:52 +0000 https://letsai.co.il/?p=4684 כבר חודשים אני נהנה לראות איך Heygen הופכת מחברה קטנה לחברה מהפכנית שמטלטלת את עולם ה-AI. זה התחיל מהאוואטארים הריאליסטיים המדהימים שלהם, שהכניסו לכיס הקטן את D-id (וזה חבל ממש כי יש לי חיבה גדולה ל-D-id כחברה ישראלית מובילה בתחומה בעולם). זה המשיך עם כלי תרגום הוידאו שלהם (שמתרגם, מנפיש ומדובב את הסרטון שלכם למגוון […]

הפוסט איך בונים אוואטאר דיגיטלי בדמותכם בשניות?! הופיע ראשון בLet's AI בינה מלאכותית

]]>
כבר חודשים אני נהנה לראות איך Heygen הופכת מחברה קטנה לחברה מהפכנית שמטלטלת את עולם ה-AI. זה התחיל מהאוואטארים הריאליסטיים המדהימים שלהם, שהכניסו לכיס הקטן את D-id (וזה חבל ממש כי יש לי חיבה גדולה ל-D-id כחברה ישראלית מובילה בתחומה בעולם). זה המשיך עם כלי תרגום הוידאו שלהם (שמתרגם, מנפיש ומדובב את הסרטון שלכם למגוון שפות). לצד כל אלו לחברה יש מחולל תמונות מובנה, כלי פייס סוואפ לוידאו, התממשקות עם ChatGPT, ועוד שלל כלים ניסיוניים שהחברה מפתחת.

 

אבל לפני הכל, שימו לב לסרטון הבא!

* בסרטון: אווטאר דיגיטלי שיצרתי בדמותי בעזרת Heygen, על בסיס סרטון שצולם בטלפון הנייד שלי.

 

שלבים ליצירת אווטאר בינה מלאכותית בדמותכם עם Heygen

  • בשלב הראשון כנסו לאתר של Heygen והירשמו לכלי שמאפשר יצירת אווטאר בינה מלאכותית. בחבילה החינמית תקבלו קרדיט אחד בודד חינם המאפשר ליצור סרטון של עד דקה. כמו כן, תקבלו אוואטאר דיגיטלי אחד (Instant Avatar). אם תעשו מנוי (החבילות מתחילות מ-29 דולר בחודש) תיהנו מ-3 אוואטארים כאלה וג’ינרוט סרטונים של עד 3 דקות כל אחד.

 

הרשמה ראשונית ל-Heygen

* צילום מסך של עמוד פתיחת חשבון ב-Heygen

 

 

  • לאחר ההרשמה הראשונית תגיעו לעמוד הבית של Heygen, שם יופיעו לכם 1 עד 3 אוואטארים דיגיטליים (Instant Avatars) בהתאם לחבילה שלכם. לחצו על אחד מהספוטים הפנויים (מודגשים בתמונה מטה באדום).

 

יצירת אווטאר עם Heygen

* באדום: כפתורי יצירת האוואטרים המיידיים בדמותכם (Instant Avatar).

 

 

  • במסך הבא תפגשו בסרטון של מייסד Heygen – אפשר לדלג את הצפייה בסרטון זה וללחוץ על הכפתור הסגול Get Started (אלא אם אתם ממש סקרנים…)

 

הסבר על יצירת אווטאר עם Heygen

* צילום מסך מתוך Heygen. אפשר לדלג על הסרטון…

 

 

  • במסך הבא תקבלו את ההנחיות ליצירת סרטון הבסיס שלכם, שעל בסיסו יבנה האווטאר. להלן עיקרי הדגשים: צלמו סרטון באורך של 2 דקות ומעלה, רצוי ברזולוציה כמה שיותר גבוהה (מומלץ להעיף מבט על הגדרות הוידאו בטלפון הנייד שלכם – לרוב תגלו שאתם לא על הרזולוציה המקסימלית של מצלמת הוידאו שלכם). יש להקליט את הסרטון במקום מואר ושקט. בזמן הסרטון עליכם להביט היישר למצלמה ולהקפיד לעשות פאוזה של כשנייה בין משפט למשפט (כשהפה שלכם סגור). אפשר להשתמש בתנועות ידיים גנריות (אך להקפיד שלא יעברו את גובה החזה). יש להקפיד שתנועות הידיים לא יסתירו את הפנים ולא יהיו מוגזמות. חשוב שהסרטון יהיה רציף, ללא עריכות וללא פאוזות ארוכות מדי בדיבור. חשוב לשבת בתנוחה קבועה ולא לזוז יותר מדי. וודאו שאין צללים על הפנים שלכם ושאתם לא מסיטים את המבט למקום אחר (זכרו – מקדו את המבט במצלמה). אם אתם ממש רוצים, במסמך הבא יש את ההנחיות המלאות (באנגלית), אבל באמת שזה העיקר. אתם יכולים לדבר באיזו שפה שאתם רוצים וזה ממש לא משנה על מה תדברו – העיקר שיהיה ל-Heygen מספיק חומר גלם מצולם ומספיק הקלטות של הקול שלכם כדי לבנות מודל קול ואוואטאר דיגיטלי על בסיס דמותכם.

 

הנחיות ליצירת אוואטאר דרך HeyGen

* תקציר ההנחיות של Heygen ליצירת אוואטאר דיגיטלי.

 

 

  •  בשלב הבא תתבקשו להעלות את הסרטון שהקלטתם מבעוד מועד. ישנן שתי אפשרויות – להשתמש בסרטון שהוקלט מראש או להקליט סרטון עם מצלמת המחשב והמיקרופון שלו. כמובן שזו אופציה פחות טובה ומומלץ להשקיע בהקלטה איכותית מראש (אם יש לכם גישה למצלמה מקצועית ולא טלפון אז עדיף, אבל מנסיונות שלי גם מצלמות סמארטפונים עושות עבודה מצוינת). בתחתית המסך תוכלו לראות דוגמאות רצויות שהחברה מספקת. לאחר שתעלו את הסרטון תתבקשו לאשר שוב שהפנים שלכם גלויות, שאתם מסתכלים כל הזמן לאותו מקום (למצלמה), שיש פאוזות קצרות בין משפט למשפט ושהסביבה שלכם מוארת ושקטה. לאחר סימון וי על כל האפשרויות הנ”ל תוכלו ללחוץ על כפתור My Footage Looks Good שיעלה בפועל את הסרטון לפלטפורמה. שימו לב שיש אפשרות לסמן וי גם בתחתית המסך על בקשת אישור לעשות שימוש בוידאו שלכם לאימון המודלים של Heygen (על כל מה שמשתמע מכך). אתם לא חייבים לסמן אופציה זו אם אתם לא רוצים.

 

העלאת הסרטון לאתר HeyGen

* מסך העלאת הסרטון.

 

  • כמעט סיימנו – בשלב האחרון תצטרכו לצלם סרטון הסכמה שמוכיח שאתם אכן אתם ושהאווטאר שאתם מנסים ליצור הוא שלכם ולא של אדם אחר. במהלך הסרטון תתבקשו להקריא למצלמת המחשב טקסט קבוע מראש. ברגע שאתם מוכנים לחצו על הכפתור הסגול: Start Recording.

 

סרטון הסכמה באתר HeyGen

* הטקסט שתצטרכו להקריא מול המצלמה כדי לתת את הסכמתכם.

 

  • וזהו זה – בסיום התהליך Heygen יתחילו להפיק את האוואטאר הדיגיטלי שלכם. התהליך לוקח כ10-20 דק’ ובסופו תקבלו מייל אישור.

 

 

הגיע הזמן להתמקצע!

אני מלמד על Heygen, על מגוון הפיצ’רים המיוחדים שלו בסדנת ה-AI בוידאו שלי. בסדנה תלמדו לעבוד עם מחוללי הוידאו המובילים בשוק, כמו ראנוויי (Runway) Gen1 ו-Gen2, קאיבר (Kaiber), וונדר סטודיו (Wonder Studio), ועוד. וכמובן שלקוראי המגזין שלנו יש הנחה! למימוש ההטבה הזינו את קוד הקופון LETSAI בלינק הבא.

 

סדנת AI בוידאו

 

תרגום ודיבוב סרטונים לשפות אחרות עם Heygen

להייג’ן יש פיצ’ר מדהים נוסף (שאגב, הפך רלוונטי מתמיד בימי המלחמה בכלל במלחמת ההסברה בפרט). מוזמנים לצפות בסרטון הקצר הבא שמסביר על הפי’צר ועל התהליך:

 

* למדו לדבר שפה זרה בשניות… סתם סתם – הפיצ’ר המדהים הזה מאפשר לכם לקחת סרטון שלכם באנגלית (או באחת מהשפות התומכות) ואז לתרגם ולדובב אותו בשניות למגוון שפות אחרות. התוצאה – סרטון שלכם מדברים בקולכם האמיתי בשפה זרה בצורה קוהרנטית ומובנת.

 

התוסף של Heygen ל-ChatGPT

להייג’ן יש גם פלאגאין ל-ChatGPT, מה שמאפשר לכם ליצור אוואטארים ישירות מתוך מודל השפה האהוב. עם זאת, לא מדובר באוואטאר שלכם, אלא של דמויות גנריות מתוך המאגר של Heygen.

 

איך עושים את זה?

1. מתקינים את הפלאגאין של HeyGen בתוך שרשור חדש ב-ChatGPT (צריך כמובן מנוי ל-GPT PLUS).
2. מתארים לו את הסרטון הרצוי (אפשר לתת לו טקסט מוכן מראש ואפשר לבקש ממנו לג’נרט טקסט).
3. וזהו – יוצאים לדרך. תוך שניות תקבלו לינק לסרטון האווטאר שלכם, שנוצר בעזרת HeyGen.

 

מוזמנים לצפות בסרטון הבא שמדגים את כל התהליך:

 

* שימו לב שבסוף הסרטון יש הסבר על פיצ’ר נוסף של Heygen – פייס סוואפ בוידאו.

הפוסט איך בונים אוואטאר דיגיטלי בדמותכם בשניות?! הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/heygenavatar/feed/ 0
סוכנים גנרטיביים: עידן חדש בנהלי הפעלה סטנדרטיים https://letsai.co.il/sop-agents/ https://letsai.co.il/sop-agents/#respond Sun, 13 Aug 2023 08:47:53 +0000 https://letsai.co.il/?p=3447 האם המטריקס כבר כאן?! הנוף הדיגיטלי עבר שלבים אבולוציוניים שונים, שכל אחד מהם מביא גל חדש של אפשרויות. כיום, אנו עומדים על סף מהפכה משמעותית נוספת, הודות למחקר פורץ דרך שהציגו סטנפורד וגוגל דיפמיינד אשר יצא עכשיו בקוד פתוח (כלומר כולם יכולים להשתמש בזה). הכל התחיל ממאמר שכותרתו: “Generative Agents: Interactive Simulacra of Human Behavior” […]

הפוסט סוכנים גנרטיביים: עידן חדש בנהלי הפעלה סטנדרטיים הופיע ראשון בLet's AI בינה מלאכותית

]]>
האם המטריקס כבר כאן?! הנוף הדיגיטלי עבר שלבים אבולוציוניים שונים, שכל אחד מהם מביא גל חדש של אפשרויות. כיום, אנו עומדים על סף מהפכה משמעותית נוספת, הודות למחקר פורץ דרך שהציגו סטנפורד וגוגל דיפמיינד אשר יצא עכשיו בקוד פתוח (כלומר כולם יכולים להשתמש בזה). הכל התחיל ממאמר שכותרתו:

“Generative Agents: Interactive Simulacra of Human Behavior”

ומציג את הרעיון של סוכנים גנרטיביים. כלומר אוסף של “דמויות” מבוססות בינה מלאכותית (אבל לא רק), אשר לכל אחת מהן יש “אישיות” ייחודית ושבפועל הן נועדו לדמות התנהגות אנושית. סוכנים אלו מסוגלים לבצע פעולות יומיומיות, לגבש דעות, ליזום שיחות ולהרהר בחוויות העבר. 

 

אבל לפני הכל – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכון, חידוש או מידע על כלי חדש שיוצא…

 

 

בסרטון הבא אפשר לראות טעימה מהניסוי – הסוכנים הג’נרטיביים מתנהלים ב”עולם” שלהם, קמים בבוקר, מנהלים חיי חברה, מתכננים לעתיד תוך התבססות על חוויות העבר שלהם… או בקיצור – חיים!

 

 

הרעיון המרכזי בניסוי

המאמר מציג ארכיטקטורה מדהימה של LLM (מודל שפה גדול) שמסוגל לייצר תיעוד שלם של חוויות הסוכן תוך שימוש בשפה טבעית, סינתוז הזיכרונות הללו לכדי השתקפויות ברמה גבוהה יותר, ואיחזור המידע כדי לתכנן התנהגות. במהלך הניסוי (הלינק לדמו נמצא בסוף) הסוכנים (יש 25 כאלה) הראו יכולות מדהימות לקדם פעילויות שונות, וזאת באמצעות שיתוף פעולה אחד עם השני.

 

25 הסוכנים הג'רנטיביים

25 הסוכנים הג’רנטיביים ש”השתתפו” בניסוי

 

הרעיון המרכזי: לתת לכל דמות ״חזון / משימת על״ ולשחרר אותו/ה לחופשי, תחת הרעיון שהסוכן ייצר לעצמו משימות ויבצע אותן עד להשגת אותו חזון, תוך ביצוע/חיקוי התנהגות אנושית עד כמה שניתן. אבל רגע לפני שנבין את המשמעות של זה, בואו נבין איך זה עובד.

 

הנה מה שחשוב שתדעו

  • זיכרון: לכל אחד מהסוכנים, באופן נפרד, יש  זיכרון לטווח ארוך שמתעד את החוויות שלו. מודל של אחזור זיכרון משלב רלוונטיות, עדכניות וחשיבות כדי להציג את הרשומות הדרושות ובכך להתאים את התנהגות הסוכן. כלומר, הם לא חולקים את אותו “מוח”, אלא מתנהלים כיישויות עצמאיות בתוך המרחב הוירטואלי שיצרו החוקרים.

 

  • השתקפות: רכיב זה מסנתז זיכרונות למסקנות ברמה גבוהה יותר לאורך זמן. זה בעצם מה שמאפשר לסוכן להסיק מסקנות על עצמו ועל אחרים כדי להנחות את התנהגותו.

 

  • תכנון: מתרגם את המסקנות ואת הסביבה הנוכחית לתוכניות פעולה ברמה גבוהה יותר. תוכניות אלה מחולקות לאחר מכן להתנהגויות מפורטות לפעולה ולתגובה, ואז ההשתקפויות והתוכניות הללו מוחזרות לזרם הזיכרון כדי להשפיע על התנהגותו העתידית של הסוכן.

 

  • ביצוע: עשרים וחמישה הסוכנים הללו נמצאים בסביבה מוגדרת (במאמר – Smallville). בסביבה זו, הם מקיימים אינטראקציה עם סוכנים אחרים באמצעות שפה טבעית בהתאם לתוכניות שלהם, זוכרים את התוצאות ומגיבים בהתאם על סמך חוויות העבר, הלמידה והסביבה הנוכחית.

 

סמולוויל - העיירה של הסוכנים הג'נרטיביים

סמולוויל – העיירה של הסוכנים הג’נרטיביים. בתמונה ניתן לקבל טעימה מחלק מהשיחות שהסוכנים מנהלים בינם לבין עצמם: אביגייל שואלת אל קלואס אם הוא רוצה להצטרף אליה לקפה. הוא נענה בחיוב ושואל לשלומה. ג’ון שואל את טום אם הוא שמע על הבחירות לראשות העיר וטום עונה שלא והאם הוא יודע מי המועמדים…

 

 

המפה של סמולוויל – ה”עולם” של הסוכנים:

 

המפה של סמולוויל

 

תהליכי קבלת ההחלטות של הסוכנים הג’נרטיביים

במבט על, זה נראה ככה:

סביבה מוגדרת של סוכנים גנרטיביים

 

 

אז מה רואים פה בעצם? אותם סוכנים יוצרים תוכניות יומיות המשקפות את המאפיינים והחוויות שלהם. הם יכולים לממש את התוכניות הללו, להגיב לשינויים ולתכנן מחדש בעת הצורך. הם מקבלים החלטות על סמך “זיכרונות” וחוויות עבר. הם יכולים להרהר במה שקרה להם ועל סמך תובנות אלו לשנות את הפעולה שלהם או לקבל החלטה אחרת. מתחת למכסה המנוע, הסוכן עושה הלוך וחזור בין הזיכרון שלו לבין ChatGPT בשביל לבדוק כל הזמן איך הכי נכון להתמודד עם הסיטואציה.

 

עוד דבר מעניין הוא שבמהלך הניסוי, המחברים ערכו הערכות שונות כדי לבדוק את האמינות של התנהגות הסוכנים. הם ממש עשו “ראיון” לסוכנים בשפה טבעית כדי לבחון את יכולתם לזכור, לתכנן, להגיב ולשקף בצורה מדויקת את מה הם יודעים / למדו / רוצים לעשות בעתיד.

 

מה המשמעות של כל הניסוי הזה ולמי זה יכול להועיל?

כמו שאמרנו, מדובר בסוכנים יצרניים – סוכני תוכנה חישוביים המסוגלים לדמות התנהגות דמוית אדם. ועכשיו, הם בקוד פתוח, והיישומים הפוטנציאליים עצומים! 

בעבר חשבו שהמקום עליו הנושא ישפיע בצורה החזקה ביותר הוא מן הסתם בגיימינג, באזורים בהם ניתן לתת ל-NPC (דמויות בתוך המשחק שלא ניתנות לשיחוק) להתנהל במרחב ולתת לשחקנים הרגשה פרסונלית יותר. אבל הניסוי הזה מראה שאנחנו הולכים למקום אחר, הרבה מעבר לגיימינג, אל לב ליבן של תעשיות הנשענות על נהלי הפעלה סטנדרטיים (SOPs).

 

בבסיסם, סוכנים אלו הם בעלי אישיות מובהקת שהוגדרה מראש ויכולים לבצע פעילויות שגרתיות (בתוך הסביבה המדומה) כמו למשל התעוררות, בישול ארוחת בוקר ויציאה לעבודה.

 

שגרת הבוקר של ג'ון

שגרת הבוקר של ג’ון: הוא קם בבוקר סביבות 6:00, משלים את משימות הבוקר שלו (קימה מהמיטה, צחצוח שיניים, מקלחת בוקר והכנת ארוחת בוקר). לאחר מכן ב-7:30 הוא מקשקש קצת עם אשתו מאי ועם בנו אדי, ואז אורז את הציוד שלו ויוצא לעבודה, שם מתחיל “יום עבודה”. ושוב – כל הכתוב לעיל נוצר מתוך יוזמות עצמאיות של הסוכנים ולא מתוך הגדרות קבועות מראש. מדהים!

אבל כמו שאמרנו, מה שמייחד אותם הוא היכולת שלהם לזכור, לשקף את פעולותיהם בעבר ולתכנן התנהגויות עתידיות על סמך השתקפויות אלו. הזיכרונות הבנויים שלהם, בשילוב עם פרופיל אישיותי ייחודי, מאפשרים להם ליצור אינטראקציה, לגבש דעות ואפילו ליזום שיחות אחד עם השני.

 

יאללה… מי בא למסיבה?

לדוגמה, במאמר ניתן לראות איך איזבלה, אחת מהסוכנים שבערכי הליבה שלה הוגדר לה שעליה “לדאוג לקהילה״, החליטה לבדה לארגן מסיבת ולנטיין (חג האהבה), הזמינה את החברים שלה, הם העבירו את המסר הלאה לחברים שלהם וגם הגיבו לה חזרה. ואז, כאשר הגיע התאריך למסיבה, הם באמת הגיעו. אגב, מי שלא הצליח להגיע הפיק תירוץ מהימן לסיבה שבגינה לא הגיע. 

 

 

.

המסיבה של איזבלה

המסיבה של איזבלה: הסוכנים מנהלים אינטראקציה, מזמינים סוכנים אחרים למסיבה ואף חוזרים לאיזבלה ומספרים לה שהם מתכוונים להגיע.

 

הדוגמה הזו מראה את היכולת המדהימה של הסוכנים לקבל אינפורמציה מבחוץ, לעבד אותה ולהתאים את עצמם למצב המשתנה מבלי לפגוע במשימת העל שלהם. הם מגיבים לסביבה ופועלים על פי התנאים המשתנים. הם זוכרים החלטות שקיבלו בעבר ומתנהלים על פיהן.

 

איפה זה פוגש את העסק או החברה שלי?

כמו שאתם וודאי יודעים, כל מגזר – משירותי בריאות ועד לוגיסטיקה – עובד בצורה של  SOPs (תהליכים קבועים שחוזרים על עצמם בארגון), ממש בצורה של מדריך מפורט, צעד אחר צעד, כדי להבטיח עקביות ולשפר את יעילות העובדים.

 

לצורך הדוגמה בואו נשתמש בתהליך שיש בכל עסק. פרסום. כלומר, יצירת תוכן.

 

מטרה: להשתמש בסוכן ג’נרטיבי כדי לסייע ביצירת תוכן, חידוד ויצירה עבור חברה X.

בשלב הראשון יכנס קלט מהעורך שמניע את התהליך, כמו למשל תקציר או קבוצה של נושאים.

 

ואז מתחיל התהליך:
1. הסוכן הראשון (בעל גישה למקורות מהאינטרנט) מייצר טיוטות תוכן מרובות בהתבסס על הבריף הנתון.

 

2. הסוכן השני (עם גישה למסד נתונים, פרסומים קודמים וכלים לניתוח מגמות) יודע מה הקוראים אוהבים ומה לא, עובר על הטיוטות ומאשר את מה שרלוונטי.

 

3. הסוכן הראשון  מציע עריכות, מחדד את השפה, משפר את הזרימה הנרטיבית ומבטיח התאמה לקהל היעד ולהנחיות החברה.

 

4. הסוכן השני מצליב את התוכן עם מקורות אמינים, מאמת הצהרות עובדתיות ובודק הפרות אפשריות של זכויות יוצרים.

 

5. הסוכן הראשון יוצר תמונות מוסיף תמונות למאמר, כותב תקצירים עבור התמונות או הגרפיקה ושולח לאישור לפני פרסום.

 

6. מפרסמים.

 

7. הסוכן השני מנתח את הערות הקוראים, ביקורות ומדדי מעורבות כדי לזהות מגמות, העדפות ואזורי שיפור ומציע הצעות לנושאים חדשים או התאמות עתידיות על סמך משוב זה.

 

8. התהליך חוזר חלילה.

 

כמובן שבדוגמה לעיל תהליך מצומצם מאוד, אבל יכולות החיפוש, הלמידה, הביצוע והדיוק להמשך רלוונטיות לכל תהליך באשר הוא, בכמעט כל עסק (בין אם מדובר בדיוק הלקוחות לשיחות מכירה, ביצוע ראיונות לעובדים חדשים או תקשורת עם ספקים להזמנת סחורה).

 

או במילים אחרות…

כמעט כל תהליך רפטטיבי בארגון יכול להיות מבוצע על ידי סוכן AI, או לכל הפחות, יכול להיעזר בסוכן שכזה, מה שיובל להתייעלות ומקסום פוטנציאל ורווחים. מעבר לכך – כל סוכן AI יכול לעזור לסוכן AI אחר! שלם שעולה על סך חלקיו. למה? כי ככה עובדים הסוכנים שלנו – יש להם משימת על, דברים שצריך לקחת בחשבון ולצידם יש משימות המושפעות מהסביבה המשתנה. והסוכנים שלנו עונים על כל הדרישות!

 

אוטומציה של משימות שגרתיות: 

עם תכונות הלמידה וההסתגלות הטבועות בהם, הסוכנים יכולים להתמודד עם משימות שגרתיות בדיוק ובמהירות ללא תחרות.

  • SOPs:  מרכיב ההשתקפות בסוכנים מאפשר להם להתפתח על סמך משוב. כתוצאה מכך, SOPs יכולים להישאר דינמיים, תוך אופטימיזציה ככל שצצים נתונים חדשים.
  • מזעור שגיאות: הדיוק המובנה של הסוכנים מבטיח הפחתה דרסטית בטעויות אנוש, מה שמוביל לתפוקות עקביות ואיכותיות.
  • ניתוח נתונים ומשוב בזמן אמת: סוכנים אלה יכולים לספק תובנות מיידיות לגבי תהליכים, ובכך לאפשר פתרון בעיות וקבלת החלטות מהירים.

 

גם אתם יכולים ליצור סוכנים כאלה – הם זמינים בקוד פתוח

כן – הסוכנים הללו זמינים בקוד פתוח!

לקריאת המאמר המקורי המלא לחצו כאן.

עם זמינות הקוד הפתוח שלהם, סוכנים ג’נרטיביים הולכים להגדיר מחדש את יחסי הגומלין בין בני אדם לטכנולוגיה. הפוטנציאל שלהם טמון לא רק ביכולתם לחקות התנהגות אנושית, אלא ביכולתם לייעל, להתאים ולשפר את הפעולות בין התעשיות. ככל שאנו משלבים יותר ויותר את סוכני הבינה המלאכותית הללו בתשתיות שלנו, נהיה עדים לשינוי קיצוני, המאופיין בהגברת יעילות, עקביות וכושר הסתגלות שאין שני להם. 

 

האופק נראה מבטיח ולגמרי מבשר על עידן חדש בשיתוף פעולה הדוק בין אנשים ל – AI. העסקים והארגונים שישכילו להתאים את עצמם ברמת האוריינות והמיינדסט לסוכנים החדשים, ישתמשו בהם ויתאימו אותם לעצמם, לדעתי, ינצחו במירוץ.

 

איפה אפשר לצפות בניסוי?

לצפייה בהקלטה של הניסוי, בה ניתן לראות את פעולות הסוכנות השונים בזמן אמת (כלומר, הקלטה של הפעולות שקיבלו בזמן אמת), לחצו פה
פשוט לחצו Play, הקליקו על הסוכן שבו אתם רוצים לצפות ותוכלו לראות את המיקום שלו, הפעולות שלו באותה העת והאם הוא מקיים שיחה עם סוכן אחר.

 

סוכנים ג'נרטיביים

 

 

 

הפוסט סוכנים גנרטיביים: עידן חדש בנהלי הפעלה סטנדרטיים הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/sop-agents/feed/ 0