היי חברים, שישי שמח לכולם!
1. בצעד מפתיע (או שלא), גוגל מסירה את אפליקציית ה-AI Test Kitchen שלה מחנויות Play ו-App Store, ומתמקדת אך ורק בגרסת האינטרנט. הכלי, שהושק בשנה שעברה, אפשר למשתמשים ליצור אינטראקציה עם פרויקטים המופעלים על ידי מודלי AI שונים, כולל LaMDA2. סביר להניח שמדובר במהלך אסטרטגי בעקבות המהומה של השבוע האחרון בכל הקשור למוזיקה. כרגע, AI Test Kitchen ממוקד רק במודל טקסט-למוזיקה בשם MusicLM, שהוכרז מוקדם יותר השנה ב-Google IO. אישית, טרם ראיתי אותו מגיע לידי ביטוי באופן המצדיק את קיומו.
2. נראה שלא רק אני רואה אותו כך, שכן כל מה שנדרש כדי לגרום לשינוי זה היה שחברה כמו Meta תציג מודל חדש בשם AudioCraft, שהוא גם בקוד פתוח, כדי לעורר את גוגל לפעולה. כולנו יודעים שגוגל נוטה להיכנס ללחץ במצבים כאלה. בכל מקרה, חזרה למטא – מדובר במודל המייצר אודיו ומוזיקה איכותיים ומציאותיים מאוד מטקסט. ה-AudioCraft מורכב משלושה מודלים: MusicGen, AudioGen ו-EnCodec. ה-MusicGen יוצר מוזיקה מטקסט, בעוד ש-AudioGen יוצר שמע מטקסט וה-EnCodec מאפשר גם הוא יצירת מוזיקה באיכות גבוהה יותר, לטענתם. המודלים זמינים למטרות מחקר. במאמר מוסגר אוסיף, שמי שטרם התנסה בבוט החדש של Suno בדיסקורד, כדאי שיפנה לעצמו כשעה וילך להתנסות בו.
3. חשוב להבין, נושא המרת טקסט לקול הוא קריטי. זוהי הדרך העיקרית בה אנו מתקשרים ומעבירים לא רק מידע, אלא גם רגשות. השיפור הקיצוני ביכולת זו פותח שער לעולמות חדשים. אחד התחומים המעבירים רגשות בצורה החזקה ביותר דרך קול הוא עולם שידורי הספורט, שברגעים אלו ממש עובר שינוי קיצוני לעבר בינה מלאכותית. פרשני AI משמשים כעת בתחרויות עולמיות גדולות כמו טורניר הגולף מאסטרס או אליפות הטניס ווימבלדון. הפרשנים החדשים מבוססי AI נוצרו בעזרת IBM, ולמרות החששות לגבי ביטחון תעסוקתי וביצועי AI, נציגי Eurosport ו-IBM טוענים כי AI נועד לסייע ולא להחליף פרשנים אנושיים. כרגע, כנראה שישתמשו ביכולת זו כדי לכסות אירועים שלא זכו לפרשנות קודם לכן, אך כך זה תמיד מתחיל…
4. ועכשיו לחזית אחרת. Google DeepMind הציגה מודל חדש ופורץ דרך, Robotics Transformer 2 או בקיצור, RT-2. מודל זה מאומן על טקסט ותמונות מהאינטרנט ויכול להפיק ישירות פעולות רובוטיות. כלומר, RT-2 יכול להעביר ידע מהאינטרנט ישירות לרובוט פעיל כדי שיתאים את עצמו לצורך. רעיון זה מאפשר לו להתמודד עם משימות מורכבות ומופשטות בסביבות דינמיות מאוד. למשל, הוא יכול לזהות תפוח, להבחין בינו לבין כדור אדום ולהבין כיצד להרים אותו, וזאת מבלי שהיה צורך לאמן אותו מראש. נכון, התרגלנו כבר לשימושים מרשימים יותר, אבל תנו לו שנה והוא יקום בלילה להחזיר את הילד לישון…
5. ההתקדמות של הבינה המלאכותית כבר לא יכולה להשאיר אף אחד שאנן, כמו לדוגמה מנכ”ל אינטל, פט גלסינגר, שהכריז על תוכניות שאפתניות לשילוב AI בכל מוצר שאינטל מייצרת. בהמשך השנה, אינטל מתכוונת לשלוח ללקוחות את Meteor Lake, (שבב המיועד לשוק הצרכני) עם מעבד רשתות נוירונים מובנה למשימות למידת מכונה. גלסינגר, בשונה מחברות אחרות, צופה עתיד שבו בינה מלאכותית וענן לא בהכרח הולכים יד ביד ומדגיש שהפעלת AI חייבת להיעשות בצד הלקוח כדי שהכל יעבוד כנדרש. כרגע החזון הזה מכוון לתרגום שפה בזמן אמת בשיחות זום, תמלול בזמן אמת, סוכנים ואוטומציה, הצגת תוכן רלוונטי שנוצר בסביבות משחקים – והכל מתרחש בקצה אצל הלקוח, לא בענן.
6. העניין הוא, שכאשר זה בענן, זה מאפשר לעולם להתמודד עם דילמות אתיות שלא בטוח היו מגיעות לשולחן אם כל אחד היה פועל לבד. דוגמה לכך היא כאשר אמנים כמו גרג רוטקובסקי, הידוע בסגנונו החי והסוריאליסטי, “מחוקים” על ידי ה-AI, כלומר הסגנונות שלהם מועתקים, לרוב בניגוד לרצונם. למרות ההתנגדות הקולנית של רוטקובסקי לאמנות AI, הקהילה יצרה כלי לחקות את הסגנון שלו. זה הוביל למצב שבו רוטקובסקי עצמו מתקשה להבדיל בין יצירות שנוצרו ב-AI לבין יצירותיו האמיתיות. ועם כל הכאב שלי על האמן, זה איכשהו יורד בגרון. אבל מה יקרה כשיהיה יותר מחיקוי אחד?
7. ניוז קורפ אוסטרליה, לדוגמה, ממנפת את כוח ה-AI כדי לייצר לא פחות מ-3,000 מאמרים בשבוע, תוך התמקדות בסיפורים מקומיים על מזג אוויר, מחירי דלק ותנאי תנועה. יחידת ה-Data Local, בראשות עורך העיתונות של ניוז קורפ, פיטר ג’אד, משתמשת ב-AI כדי להשלים את עבודתם של כתבים. לדבריהם, בעוד שהכתבות נוצרות באמצעות AI, הן מפוקחות על ידי עיתונאים, מה שמבטיח דיוק ורלוונטיות. אין ספק שגישה זו מדגישה את המגמה ההולכת וגוברת של שימוש ב-AI בקרב חברות ענק, לא רק בעיתונות אלא בתחומי היצירה וההתבטאות בכלל (אמנות, מוזיקה, רדיו, סטוריטלינג וכו’).
8. מי שמגיב בצורה היפה ביותר לכל ה”בלגן” של ה-AI הוא שוק הערכות ה-AI העולמי, שכרגע חוזה צמיחה משמעותית, עם CAGR של 40.1% מ-2021 עד 2028. על פי דו”ח של Grand View Research, השוק צפוי להגיע ללא פחות מ-100.6 מיליארד דולר עד 2028. זה כמובן מונע מהאימוץ הגובר של AI בתעשיות שונות, כולל שירותי בריאות, רכב וקמעונאות. הדו”ח גם מדגיש את תפקידה של AI בעולם שלאחר הקורונה, שבו נעשה שימוש כדי לחזות מגיפות עתידיות, לשפר עבודה מרחוק ולשפר את חוויות הלמידה המקוונות.
9. כדי שהתחזיות יתממשו, נדרש כמובן חומרה שתריץ את הכל, ו-AMD לא מתכוונת לתת לנבידיה את כל ההנאה. חברת השבבים הזו מתכוננת לסיום חזק של השנה הקרובה עם ההשקה המתוכננת של שבבי הדגל MI300 מוכווני ה-AI שלה. השבבים הללו, המצויים במחסור, מיועדים להתחרות מול שבבי H100 המתקדמים של Nvidia. מנכ”לית AMD, ליסה סו, הצהירה כי העניין של הלקוחות בשבבים מסדרת MI300 הוא “גבוה מאוד” וכי AMD הרחיבה את עבודתה עם ספקי ענן מהשורה הראשונה, ארגונים גדולים ומספר רב של חברות AI מובילות. שבבי MI300, שאמורים לצאת מאוחר יותר השנה, צפויים לאתגר את Nvidia בשוק הגואה של שבבי AI מתקדמים. אף על פי שאני מעריץ את אנבידיה מאז ומעולם, אני לא אוהב מונופולים… אז זה יופי.
10. ולסיום, OpenAI הגישה בקשה לסימן מסחרי עבור “GPT-5”! זה עדיין לא אומר הרבה חוץ מהצהרת כוונות, אבל בינתיים הם הודיעו שבמהלך השבוע הבא אנחנו הולכים לראות כמה שיפורים בצ’אט. למשל, דוגמאות מיידיות, הצעות לתשובות להמשך שיחה והעלאת קבצים מרובים.
זהו להפעם חברים, נשתמע שוב בשבוע הבא!