מחולל הווידאו המדהים שהשיקה חברת OpenAI לפני מספר שבועות יהיה זמין לציבור הרחב עוד השנה ואולי אף בחודשים הקרובים! כך לפי מירה מוראטי, ה-CTO של OpenAI.
אבל לפני הכול – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכון, חידוש או מידע על כלי חדש שיוצא…
ממליצים לכם להצטרף גם לקהילות ה-AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה־AI שלנו? לחצו פה.
אם לא הייתם על כדור הארץ בחודש האחרון ולא שמעתם עדיין על Sora, הינה תקציר:
מאירועי הפרקים הקודמים
חברת OpenAI חשפה לאחרונה את Sora – כלי AI מדהים שיכול ליצור סרטונים היפר־ריאליסטיים מפרומפט טקסטואלי בלבד (לצד יכולות מרשימות אחרות כמו וידאו לווידאו ועוד). עד כה הכלי היה זמין רק ליחידי סגולה (יוצרים בולטים, משפיענים, במאים מובילים, מעצבים וצלמים), אך הציבור הרחב נותר ללא גישה לכלי המהפכני הזה.
הצד האפל של סורה ai – סיכונים ואיומים
הסיבות מגוונות – מלבד הצורך בתשתית יקרה ומורכבת, הרצון לבדוק את הכלי בתנאים מבוקרים לפני השקתו הרשמית וסוגיות של עלות לצרכן, לסורה ai ול־OpenAI יש בעיות גדולות יותר! לכלי יש פוטנציאל הרסני במיוחד בכל מה שקשור להשפעה על תודעה, להטיות במערכות בחירות (בדגש על הבחירות לנשיאות בארצות הברית), להונאות, לשליטה בדעת קהל, ליצירת פייק ניוז, וזה רק על קצה המזלג. זהו כלי שיכול (כך לפי הטיזרים שראינו) לייצר סרטונים שמדמים את המציאות באופן מוחלט ומרשים עד שכמעט לא אפשרי לזהות זאת בעין לא מיומנת. קל לדמיין את שובל ההרס שכלי כזה יכול להשאיר אם הוא מתופעל בידי אנשים או גורמים בעלי כוונות זדוניות.
מתי סורה ai יהיה זמין לכל המשתמשים?
לפי מירה מוראטי, ה־CTO של OpenAI, הגישה של Sora לציבור הרחב צפויה להינתן לפני תום השנה. לדבריה אולי אפילו בתוך מספר חודשים.
לא רק וידאו – גם אודיו
אך זו לא הכול! מוראטי גם חשפה שהם מתכננים להוסיף יכולות אודיו בעתיד, כך שהסצנות יהיו אפילו יותר מרשימות וריאליסטיות. מדובר בהעצמה דרמטית של כלי שכבר היום נחשב פריצה טכנולוגית אדירה. זה דבר אחד שיש סרטון AI שכמעט אי אפשר להבדילו מהמציאות, אבל זה דבר אחר לגמרי אם לסרטון הזה יש גם סאונד. זו רמה אחרת לגמרי של ריאליזם ושכבה נוספת של סכנות ופוטנציאל לנזק.
אם אתם רוצים לקבל טעימה ולהבין איך זה נשמע, העיפו מבט על הניסוי של ‘אילבן לאבס’ (ElevenLabs) שהוסיפו לסרטונים של סורה ai סאונד (שכמובן גם הוא נוצר באמצעות מודלי הקול של החברה המבוססים על בינה מלאכותית). התוצאה מרשימה ביותר.
יכולות עריכה בתוך סורה ai
OpenAI רוצים לשפר את חוויית השימוש בסורה. ככל הנראה לכלי יהיו יכולות עריכה כאלה ואחרות שיאפשרו לדייק את הסרטונים שייווצרו בתוך הפלטפורמה של Sora. לא ברור עדיין איך ובאיזה פורמט, אך סביר להניח שנראה פיצ’רים דמויי אינפיינטינג או איחוד סצנות שונות לסרטון אחד (עם השלמת הקטעים החסרים); משהו שכבר ראינו במאמרים הקודמים שפרסמה OpenAI. אגב, לכלי יהיו גם יכולות ג’ינרוט של טקסט בווידאו. הרחבה על היכולות והפיצ’רים של סורה במאמר הבא.
יש גם כמה סימני שאלה
מוראטי לא הייתה כל כך ספציפית לגבי מקורות הנתונים שהשתמשו בהם כדי לאמן את Sora. היא סיפרה שמדובר ב”נתונים שזמינים לציבור או נתונים שקיבלו רישיון”, אך אישרה שבאימון המודל נעשה שימוש גם בתכנים של Shutterstock. מוראטי סיפרה גם שהעלות להפעלת Sora “הרבה יותר יקרה” מעלות הפעלת DALL-E, אך OpenAI מנסה לעשות מ־Sora כלי נגיש וזמין ב”עלויות שדומות” לעלויות של הכלים הג’נרטיביים הקודמים שלה.
מנגנוני הגנה
כמו בכל טכנולוגיית AI גנרטיבית יש גם חששות של דיסאינפורמציה ותעמולה שקרית. מוראטי אמרה שככל הנראה Sora לא יוכל ליצור תמונות של דמויות ציבוריות, בדומה למדיניות של DALL-E, וגם הווידאו יכיל חותמת מים כדי להבדילו מחומר אמיתי.
הריאיון המלא
מוזמנים לצפות בראיון המלא של מירה מוראטי עם ג’ונה סטרן מהוול סטריט ג’ורנל