חוקרים מאוניברסיטת קליפורניה בלוס אנג’לס מציגים פריצת דרך שעשויה לשנות לגמרי את הדרך שבה מערכות בינה מלאכותית יוצרות תמונות. במקום מחשבים שצורכים כמויות חשמל אדירות, הם הצליחו להראות שאפשר להשתמש באור עצמו כדי לבצע את עיקר העבודה. התוצאה – יצירת תמונות באיכות גבוהה כמעט בלי כוח חישובי, בצריכת אנרגיה נמוכה פי מאות בהשוואה לשיטות המקובלות.
רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.
אפשר גם להרשם לניוזלטר שלנו
הבעיה האנרגטית של ה-AI הגנרטיבי
מאחורי כל תמונה שנוצרת בלחיצת כפתור מסתתר מחיר כבד – חשמל. מחקר מאוניברסיטה בעיר פירנצה (University of Florence) באיטליה, הראה שהפער בצריכת האנרגיה בין מודלים שונים של יצירת תמונות יכול להגיע ל- פי 46. הסיבה היא שמודלי הדיפוזיה הנפוצים היום דורשים מאות עד אלפי חישובים נפרדים לכל תמונה אחת. כל חישוב כזה הוא עוד “ביס” מהחשמל.
מבט רחב יותר מגלה תמונה לא פחות מדאיגה. מרכזי הנתונים ברחבי העולם צרכו ב-2022 כ-460 טרה-וואט שעה, כמות חשמל השווה לתצרוכת של מדינה בינונית. אפילו פעולה פשוטה כמו שאילתה ב-ChatGPT דורשת בערך פי עשרה יותר אנרגיה מחיפוש רגיל בגוגל. אם המגמה תימשך, עד סוף העשור מרכזי הנתונים עלולים לצרוך כמעט פי שלושה יותר חשמל לעומת תחזיות שנעשו לפני “הבום” של הבינה המלאכותית.
הפתרון האופטי המהפכני
כדי להתמודד עם הבעיה האנרגטית, חוקרי UCLA בראשות פרופ’ איידוגאן אוזג’אן (Aydogan Ozcan) ובהובלת ד”ר שיקי צ’ן (Shiqi Chen) בחרו לחשוב אחרת לגמרי. במקום להעמיס על מחשבים במיליוני חישובים, הם ניצלו משהו שקיים בטבע עצמו – את האור. הפיזיקה של קרני האור מאפשרת לבצע את “העבודה הקשה” כמעט בלי לחשב דבר, ובכך להפוך תהליך שדורש כיום כמויות עצומות של חשמל לפעולה מהירה וחסכונית.
איך זה עובד בפועל? המערכת האופטית בנויה משלושה שלבים פשוטים להבנה:
-
שלב ראשון: מחשב קטן מייצר מעין “רעש” – דפוס ראשוני של נקודות אור אקראיות. זהו הבסיס שממנו תיווצר התמונה, והוא כמעט לא צורך אנרגיה.
-
שלב שני: הדפוס הזה מוטבע על קרן לייזר בעזרת מכשיר מיוחד שנקרא מודולטור אור מרחבי (Spatial Light Modulator – SLM).
-
שלב שלישי: קרן הלייזר עוברת דרך מודולטור נוסף, שמפענח את הדפוס והופך אותו לתמונה של ממש. הכל קורה במהירות האור בלי צורך במיליוני חישובים דיגיטליים.
כדי להבין איך זה עובד בפועל, הנה מבט מבפנים: בצד שמאל רואים את התרשים העקרוני של המערכת – קרן לייזר שעוברת דרך רכיבים שונים עד שהיא מומרת לתמונה. בצד ימין מופיעה הגרסה האמיתית שהורכבה במעבדה. בתחתית אפשר לראות דוגמאות ראשונות לתמונות פשוטות שנוצרו, כמו ספרות ובגדים – הוכחה שהמערכת לא נשארת על הנייר, אלא באמת עובדת:
ביצועים מרשימים ברמה המעשית
כדי לבדוק את השיטה, החוקרים נתנו לה משימה אמיתית – יצירת תמונות. המערכת הצליחה להפיק דיוקנאות של דמויות מוכרות, תמונות של פרפרים ופרחים, פריטי אופנה ואפילו יצירות אמנות בהשראת ואן גוך. ההשוואה מול מערכות AI מסורתיות הראתה שהאיכות טובה, אבל צריכת האנרגיה קטנה פי מאות.
במאמר מרתק שפורסם ב-Nature הוצגו שתי דרכי פעולה שונות: הראשונה, מודלים אופטיים מהירים במיוחד (snapshot), שמייצרים תמונה במעבר יחיד של קרן אור. השנייה, מודלים “איטרטיביים”, שמדמים את התהליך הדיגיטלי המקובל אבל עושים זאת באמצעות אור במקום חישוב כבד.
כדי להבין את ההבדל בצורה מוחשית, הנה דוגמה מתוך המחקר. בצד שמאל רואים תמונות שנוצרו במודל דיגיטלי רגיל (עם אלפי שלבי חישוב), ובצד ימין את אותן תמונות שנוצרו במערכת האופטית החדשה. ההבדלים באיכות עדיין קיימים, אך התוצאה מפתיעה – הדמיה באמצעות אור מצליחה להגיע לאיכות דומה ובחיסכון עצום באנרגיה:
תחומי יישום עתידיים
החוקרים מדגישים שהטכנולוגיה הזו לא נועדה להישאר על שולחן הניסויים ויש לה פוטנציאל יישומי רחב מאוד.
-
מכשירים ניידים ולבישים: המערכת יכולה להשתלב במשקפי מציאות רבודה או מציאות מדומה (AR/VR), בסמארטפונים ואפילו בשעונים חכמים. המשמעות היא חוויות ויזואליות עשירות בלי שהסוללה תתרוקן במהירות.
-
יישומים רפואיים: הדמיה ואבחון רפואי דורשים עיבוד תמונה מהיר ואמין. כאן, השימוש באור יכול להאיץ בדיקות ולחסוך זמן קריטי במצבים רפואיים.
-
מדיה אימרסיבית: עולם הבידור והמשחקים יכול ליהנות מתמונות וסרטונים באיכות גבוהה שמיוצרים בצורה חסכונית, כך שחוויות אימרסיביות יהפכו זמינות יותר ופחות תלויות בתשתיות יקרות.
השלכות על תעשיית ה-AI
המשמעות הרחבה של המחקר היא לא פחות ממהפכה – הגישה החדשה מראה שאפשר לשנות את כל כללי המשחק ולעבוד עם חוקי הפיזיקה עצמם. כפי שהסביר פרופ’ איידוגאן אוזג’אן (Aydogan Ozcan): “מודלים גנרטיביים אופטיים פותחים את הדלת למערכות AI יעילות אנרגטית שיכולות לשנות טכנולוגיות יומיומיות.”
אתגרים ומגבלות
כמו בכל פריצת דרך, גם כאן יש לא מעט אתגרים. איכות התמונות שהמערכת מפיקה עדיין לא משתווה לזו של הכלים המובילים בשוק כמו Ideogram או Midjourney, והיא דורשת עוד פיתוח לפני שתוכל להתחרות בהם ישירות. בנוסף, כרגע היא מתאימה בעיקר לסוגי תמונה פשוטים יחסית, בעוד שמודלים דיגיטליים יכולים להתמודד עם בקשות מורכבות בהרבה.
גם המעבר מהדגמות מעבדה למוצר תעשייתי ידרוש זמן והשקעה. השילוב של רכיבים אופטיים במערכות מחשוב קיימות אינו פשוט, וייצורם עדיין יקר יותר בהשוואה לחומרה דיגיטלית רגילה. עם זאת, החוקרים מעריכים שעם הזמן ועל רקע ההתקדמות בננו-ייצור, המחירים ירדו והטכנולוגיה תהפוך נגישה הרבה יותר.

מסקנות והצצה לעתיד
פריצת הדרך של חוקרי UCLA היא הרבה יותר מעוד שדרוג טכנולוגי, היא רמז לעידן חדש שבו פוטוניקה ובינה מלאכותית משתלבים ליצירת מערכות חכמות, מהירות וחסכוניות. היא מראה איך חוקי הפיזיקה עצמם יכולים להפוך לכלי לפתרון בעיות טכנולוגיות שהיו נראות בלתי פתירות. הטכנולוגיה עדיין בראשית דרכה, אבל הפוטנציאל ברור – היא יכולה לשנות את כללי המשחק של תעשיית ה-AI.
כדי להגיע לשם, נדרשת עבודה נוספת כמו שיפור ברזולוציית ואיכות התמונות, הרחבת סוגי התכנים שניתן ליצור, הפחתת עלויות הייצור של רכיבים אופטיים ופיתוח מסגרות תעשייתיות שיאפשרו שילוב המערכת במכשירים יומיומיים. רק שילוב של התקדמות טכנולוגית, כלכלית ותעשייתית יוכל להפוך את ההבטחה הזו למציאות נגישה.
בעולם שבו הבינה המלאכותית הופכת לחלק בלתי נפרד מהחיים הדיגיטליים שלנו, המחקר הזה מזכיר שאפשר לחדש, ועדיין להיות אחראים לסביבה. זה לא רק עתיד של טכנולוגיה חכמה יותר, אלא גם עתיד של טכנולוגיה נקייה יותר.