הפיצ’ר החדש של ElevenLabs, העונה לשם Voice Design, מציע אפשרות שימושית במיוחד ליצירת קולות סינתטיים מאפס, תוך שליטה בפרמטרים כמו מגדר, גיל ומבטא. בעידן שבו אינטראקציות קוליות תופסות מקום הולך וגדל בעולמות התוכן, המשחקים והתקשורת, כלי זה מעניק למשתמשים ויוצרים גמישות רבה ליצור קולות מותאמים לצרכים שונים, ללא תלות באנשים אמיתיים.
רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.
אפשר גם להרשם לניוזלטר שלנו
מהו Voice Design?
ג’ינרוט מודל קול בעזרת הנחיה טקסטואלית
Voice Design הוא פיצ’ר חדש שמאפשר למשתמשים ליצור קולות סינתטיים מותאמים אישית, הנוצרים ישירות מהפרומפטים של המשתמשים. בא לך קריין מרשים עם מבטא בריטי לטריילר ה-AI שאתה יוצר?! אין שום בעיה – פשוט מקלידים בתיבת הפרומפט תיאור של הקריין AI הרצוי, ותוך שניות יש לכם מודל קול מותאם אישית.
בשונה מכלים אחרים בשוק המבוססים על מאגר של קולות מוכנים מראש, Voice Design מציע גישה ג’נרטיבית, כלומר: כל קול שנוצר הוא ייחודי לחלוטין. המערכת מאפשרת למשתמשים לבחור מאפיינים בסיסיים של הקול, כמו מגדר, גיל, מבטא וטון, ומייצרת קול חדש ומותאם אישית בכל פעם. הייחודיות של Voice Design טמונה בכך שהוא מוסיף שכבה של אקראיות, כך שכל קול שנוצר יהיה שונה, אפילו אם בוחרים את אותם פרמטרים בסיסיים.
שליטה מלאה על הקול
Voice Design מעניק גמישות רבה למשתמשים על ידי שליטה בפרמטרים שונים של הקול:
- מגדר: אפשרות לבחור בין קולות גבריים ונשיים, ולהתאים אותם לפי הצורך.
- גיל: ניתן לבחור טווחי גיל שונים, מגיל צעיר ועד מבוגר, כך שניתן להתאים את הקול לדמות הרצויה.
- מבטא: המערכת תומכת במבטאים שונים כמו אמריקאי, בריטי, אוסטרלי והודי. נכון להיום, השפות הנתמכות הן בעיקר באנגלית, אך ייתכן שבעתיד יתווספו שפות נוספות.
- טון ואופי הדיבור: ניתן לשנות גם את הטון וההגשה של הדיבור כך שתתאים לצורך הספציפי.
טוטוריאל קצר (באנגלית) שמדגים את השימוש בפיצ’ר החדש:
קצת על אילבן לאבס
אילבן לאבס (ElevenLabs) היא חברה טכנולוגית המתמחה בפיתוח פתרונות מתקדמים ליצירת קול סינתטי. החברה מציעה כלים פורצי דרך המאפשרים המרה של טקסט לדיבור בצורה טבעית, תוך שמירה על אינטונציה והטעמה מותאמת להקשר. בין הכלים המרכזיים של החברה ניתן למצוא את מערכת המרת הטקסט לדיבור, המסוגלת להפיק קולות באיכות גבוהה ובמגוון שפות, ולהתאים את סגנון הדיבור לצרכים שונים כמו קריינות חדשותית או קריאה דרמטית של סיפורים. אילבן לאבס ממשיכה לשפר את היכולות שלה בתחום הבינה המלאכותית הקולית, כשהיא שמה דגש על חדשנות, איכות ויכולת התאמה לצרכים מגוונים של המשתמשים.
איך יוצרים קולות AI ב-Voice Design?
זמינות ועלויות
השימוש ב-Voice Design פשוט מאוד ונעשה באמצעות בחירה של פרמטרים שונים היוצרים קול סינתטי מותאם אישית. הכלי זמין גם בחבילה החינמית של אילבן לאבס (בה ניתן ליצור 3 קולות AI מותאמים אישית). עם זאת, שימו לב שהחבילה החינמית לא כוללת רישיון לשימוש מסחרי – לשם כך תיאלצו לרכוש מנוי, החל מ-5 דולר בחודש.
שלבי השימוש:
- כניסה לאתר של אילבן לאבס: כנסו לאתר של ElevenLabs. אם אתם לא רשומים, השלימו את הליך ההרשמה.
- בחירה בכלי יצירת הקולות: לחצו על Add a new voice ואז בחרו באפשרות של Voice Design.
- בחירת הפרמטרים: רשמו תיאור טקסטואלי של הקול הרצוי, לרבות מאפיינים כמו מגדר, גיל ומבטא. בהמשך ניתן גם לשנות את הטון ואת גובה הקול.
- יצירת הקול: לאחר בחירת הפרמטרים הרצויים, המערכת תייצר קול מותאם אישית על בסיס ההגדרות שהוזנו. מאחר שהמערכת משתמשת באקראיות, כל קול שנוצר הוא ייחודי לחלוטין.
- שמירה ושימוש בקול: ניתן לשמור את הקול שנוצר לשימוש חוזר, או להשתמש בו באופן מיידי לצרכים מסחריים, כמו למשל לפרסומות, משחקים, סרטונים ועוד.
טיפים להנדסת פרומפטים ב-Voice Design
Voice Design מאפשר ליצור קול ייחודי באמצעות פרומפט טקסטואלי פשוט, כשהמשתמש מתאר את מאפייני הקול שהוא מעוניין בו, והמערכת מייצרת שלוש אפשרויות שונות. להלן טיפים לבניית מודל קול מוצלח והמלצות להנדסת פרומפטים בכלי:
טיפים ליצירת קול מוצלח
- הגדרת אופי הדמות: כאשר יוצרים קול לדמות בדיונית או לדמות בסיפור, כדאי לחשוב על האופי של הדמות ולשקף אותו בבחירת הטון והגיל.
- ניסויים בפרמטרים: אפשר לנסות לשחק עם פרמטרים כמו גובה הקול או הטון כדי לראות איך זה משפיע על האופי הכללי של הקול.
דוגמאות לפרומפטים ליצירת קולות ריאליסטיים:
- “אישה הודית צעירה עם קול רך וגבוה. דיבור שקט ואיטי, בטון נינוח.”
A young Indian female with a soft, high voice. Conversational, slow and calm
- “גבר בריטי מבוגר עם קול מחוספס ועמוק. טון מקצועי ורגוע.”
An old British male with a raspy, deep voice. Professional, relaxed and assertive
- “אישה אוסטרלית בגיל הביניים עם קול חם ונמוך. דיבור מהיר ושמח.”
A middle-aged Australian female with a warm, low voice. Corporate, fast and happy
דוגמאות לפרומפטים ליצירת קולות דמויות בדיוניות:
- “ענק מרושע עם קול עבה ועמוק, נשמע כמו טרול.”
A massive evil ogre, troll
- “עכבר קטנטן וחריף עם קול צפצפני.”
A sassy little squeaky mouse
- “פיראט זקן וזועם, צועק במלוא עוצמתו.”
An angry old pirate, shouting
דוגמאות לפרמטרים מרכזיים ליצירת קול:
- גיל: צעיר, מבוגר, בגיל העשרה.
- מבטא: בריטי, הודי, אמריקאי, פולני.
- מגדר: זכר, נקבה, נייטרלי.
- טון: רך, מחוספס, חם.
- גובה הקול: גבוה, נמוך, צפצפני.
- סגנון דיבור: מקצועי, שקט, דיבור מהיר.
- רגש/הגשה: שמח, כועס, נינוח, דרמטי.
באמצעות פרומפטים מדויקים ושימוש במאפיינים השונים, תוכלו ליצור קולות שמתאימים בדיוק לצרכים הייחודיים שלכם.
שימושים עיקריים של Voice Design
השימוש ב-Voice Design פותח מגוון אפשרויות רחב למספר תחומים, ביניהם תעשיית התוכן, משחקי וידאו, חדשות ואפילו שיווק ותקשורת פנים-ארגונית.
תעשיית התוכן והמדיה
לסופרים ויוצרי תוכן יש כעת אפשרות ליצור קולות ייחודיים שיכולים להוסיף מימד נוסף ליצירות שלהם. למשל, ספרי אודיו יכולים לקבל קולות מותאמים אישית לכל דמות, מה שמוסיף רבדים רבים לסיפור. מפיקי חדשות ואנשי מדיה יכולים לבחור קריין עם קול מותאם אישית שייצג את המותג שלהם, דבר שהופך לחשוב במיוחד בתקשורת שבה הקריין מזוהה עם המותג.
מפתחי משחקים
מפתחי משחקי וידאו יכולים להשתמש ב-Voice Design כדי להעניק אישיות קולית לדמויות במשחקים שלהם, ובכך להחיות אותן. קולות מותאמים אישית יכולים להחליף דמויות אילמות במשחקים, ולהוסיף להם ממד אינטראקטיבי ועשיר יותר. במיוחד במשחקים הכוללים דמויות רבות כמו NPCs (דמויות שאינן ניתנות לשליטה על ידי השחקן), הפיצ’ר חוסך את הצורך בהקלטות יקרות ומורכבות, ומאפשר יצירת קולות במהירות ובגמישות רבה.
שיווק ופרסום
בנוסף לכך, כלי Voice Design יכול לסייע לחברות ביצירת תכנים קוליים למטרות שיווק פנימיות או חיצוניות, למשל בפרסומות או בהודעות קוליות לצוותי העובדים. המערכת מספקת שליטה מלאה על הקול כך שהוא ישקף את המותג והמסר הרצוי. מושלם ליוצרי AI, אנשי שיווק, פרסומאים, עורכי וידאו וכן הלאה.
יתרונות ומגבלות
יתרונות
- מגוון קולות אינסופי: כל קול שנוצר הוא ייחודי, מה שמאפשר יצירת אינסוף אפשרויות קוליות.
- שליטה מלאה על מאפייני הקול: יכולת להתאים את הקול לדמות ספציפית, לגיל, מגדר, מבטא ועוד.
- רישיון שימוש מסחרי: הקולות המיוצרים זמינים לשימוש מסחרי (למי שיש מנוי בתשלום), מה שמבטיח שמירה על זכויות יוצרים ושקט נפשי למשתמשים בתעשיות שונות.
- קלות שימוש: המערכת קלה לשימוש, ואין צורך בידע טכני מעמיק ליצירת קולות ייחודיים.
מגבלות
- תמיכה מוגבלת בשפות: נכון להיום, Voice Design תומך בשפה האנגלית בלבד, מה שמגביל את היכולת לשימוש עבור דוברי שפות אחרות. לצערנו, הכלי לא תומך עדיין בעברית.
- מבטאים מוגבלים: נכון להיום, הכלי תומך במבטאים מסוימים (אמריקאי, בריטי, אוסטרלי, הודי), והדיוק הגבוה ביותר הוא עבור מבטאים אמריקאיים ובריטיים.
למרות המגבלות, Voice Design מהווה כלי ורסטילי ושימושי במיוחד ליוצרים ואנשי מקצוע בתעשיות שונות כמו מדיה, משחקים ושיווק. הרעיון שהמערכת מאפשרת יצירת מגוון עצום של קולות מותאמים אישית, הוא לא פחות ממהפכני! אין ספק שעם הזמן יתווספו כלים נוספים שישלימו את Voice Design, כך שלמשתמשים תהיה שליטה רבה יותר על יצירת התוכן הקולי שלהם – מה שבטוח, כבר עכשיו מדובר בכלי מעולה שרבים יפיקו ממנו תועלת!