דף הבית » סוכנים גנרטיביים: עידן חדש בנהלי הפעלה סטנדרטיים

סוכנים גנרטיביים: עידן חדש בנהלי הפעלה סטנדרטיים

עומר הררי

13/08/2023

זמן קריאה: 10 דקות

האם המטריקס כבר כאן?! הנוף הדיגיטלי עבר שלבים אבולוציוניים שונים, שכל אחד מהם מביא גל חדש של אפשרויות. כיום, אנו עומדים על סף מהפכה משמעותית נוספת, הודות למחקר פורץ דרך שהציגו סטנפורד וגוגל דיפמיינד אשר יצא עכשיו בקוד פתוח (כלומר כולם יכולים להשתמש בזה). הכל התחיל ממאמר שכותרתו:

“Generative Agents: Interactive Simulacra of Human Behavior”

ומציג את הרעיון של סוכנים גנרטיביים. כלומר אוסף של “דמויות” מבוססות בינה מלאכותית (אבל לא רק), אשר לכל אחת מהן יש “אישיות” ייחודית ושבפועל הן נועדו לדמות התנהגות אנושית. סוכנים אלו מסוגלים לבצע פעולות יומיומיות, לגבש דעות, ליזום שיחות ולהרהר בחוויות העבר.

אבל לפני הכל – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכון, חידוש או מידע על כלי חדש שיוצא…

בסרטון הבא אפשר לראות טעימה מהניסוי – הסוכנים הג’נרטיביים מתנהלים ב”עולם” שלהם, קמים בבוקר, מנהלים חיי חברה, מתכננים לעתיד תוך התבססות על חוויות העבר שלהם… או בקיצור – חיים!

הרעיון המרכזי בניסוי

המאמר מציג ארכיטקטורה מדהימה של LLM (מודל שפה גדול) שמסוגל לייצר תיעוד שלם של חוויות הסוכן תוך שימוש בשפה טבעית, סינתוז הזיכרונות הללו לכדי השתקפויות ברמה גבוהה יותר, ואיחזור המידע כדי לתכנן התנהגות. במהלך הניסוי (הלינק לדמו נמצא בסוף) הסוכנים (יש 25 כאלה) הראו יכולות מדהימות לקדם פעילויות שונות, וזאת באמצעות שיתוף פעולה אחד עם השני.

25 הסוכנים הג’רנטיביים ש”השתתפו” בניסוי

הרעיון המרכזי: לתת לכל דמות ״חזון / משימת על״ ולשחרר אותו/ה לחופשי, תחת הרעיון שהסוכן ייצר לעצמו משימות ויבצע אותן עד להשגת אותו חזון, תוך ביצוע/חיקוי התנהגות אנושית עד כמה שניתן. אבל רגע לפני שנבין את המשמעות של זה, בואו נבין איך זה עובד.

הנה מה שחשוב שתדעו

זיכרון: לכל אחד מהסוכנים, באופן נפרד, יש זיכרון לטווח ארוך שמתעד את החוויות שלו. מודל של אחזור זיכרון משלב רלוונטיות, עדכניות וחשיבות כדי להציג את הרשומות הדרושות ובכך להתאים את התנהגות הסוכן. כלומר, הם לא חולקים את אותו “מוח”, אלא מתנהלים כיישויות עצמאיות בתוך המרחב הוירטואלי שיצרו החוקרים.

השתקפות: רכיב זה מסנתז זיכרונות למסקנות ברמה גבוהה יותר לאורך זמן. זה בעצם מה שמאפשר לסוכן להסיק מסקנות על עצמו ועל אחרים כדי להנחות את התנהגותו.

תכנון: מתרגם את המסקנות ואת הסביבה הנוכחית לתוכניות פעולה ברמה גבוהה יותר. תוכניות אלה מחולקות לאחר מכן להתנהגויות מפורטות לפעולה ולתגובה, ואז ההשתקפויות והתוכניות הללו מוחזרות לזרם הזיכרון כדי להשפיע על התנהגותו העתידית של הסוכן.

ביצוע: עשרים וחמישה הסוכנים הללו נמצאים בסביבה מוגדרת (במאמר – Smallville). בסביבה זו, הם מקיימים אינטראקציה עם סוכנים אחרים באמצעות שפה טבעית בהתאם לתוכניות שלהם, זוכרים את התוצאות ומגיבים בהתאם על סמך חוויות העבר, הלמידה והסביבה הנוכחית.

סמולוויל – העיירה של הסוכנים הג’נרטיביים. בתמונה ניתן לקבל טעימה מחלק מהשיחות שהסוכנים מנהלים בינם לבין עצמם: אביגייל שואלת אל קלואס אם הוא רוצה להצטרף אליה לקפה. הוא נענה בחיוב ושואל לשלומה. ג’ון שואל את טום אם הוא שמע על הבחירות לראשות העיר וטום עונה שלא והאם הוא יודע מי המועמדים…

המפה של סמולוויל – ה”עולם” של הסוכנים:

תהליכי קבלת ההחלטות של הסוכנים הג’נרטיביים

במבט על, זה נראה ככה:

אז מה רואים פה בעצם? אותם סוכנים יוצרים תוכניות יומיות המשקפות את המאפיינים והחוויות שלהם. הם יכולים לממש את התוכניות הללו, להגיב לשינויים ולתכנן מחדש בעת הצורך. הם מקבלים החלטות על סמך “זיכרונות” וחוויות עבר. הם יכולים להרהר במה שקרה להם ועל סמך תובנות אלו לשנות את הפעולה שלהם או לקבל החלטה אחרת. מתחת למכסה המנוע, הסוכן עושה הלוך וחזור בין הזיכרון שלו לבין ChatGPT בשביל לבדוק כל הזמן איך הכי נכון להתמודד עם הסיטואציה.

עוד דבר מעניין הוא שבמהלך הניסוי, המחברים ערכו הערכות שונות כדי לבדוק את האמינות של התנהגות הסוכנים. הם ממש עשו “ראיון” לסוכנים בשפה טבעית כדי לבחון את יכולתם לזכור, לתכנן, להגיב ולשקף בצורה מדויקת את מה הם יודעים / למדו / רוצים לעשות בעתיד.

מה המשמעות של כל הניסוי הזה ולמי זה יכול להועיל?

כמו שאמרנו, מדובר בסוכנים יצרניים – סוכני תוכנה חישוביים המסוגלים לדמות התנהגות דמוית אדם. ועכשיו, הם בקוד פתוח, והיישומים הפוטנציאליים עצומים!

בעבר חשבו שהמקום עליו הנושא ישפיע בצורה החזקה ביותר הוא מן הסתם בגיימינג, באזורים בהם ניתן לתת ל-NPC (דמויות בתוך המשחק שלא ניתנות לשיחוק) להתנהל במרחב ולתת לשחקנים הרגשה פרסונלית יותר. אבל הניסוי הזה מראה שאנחנו הולכים למקום אחר, הרבה מעבר לגיימינג, אל לב ליבן של תעשיות הנשענות על נהלי הפעלה סטנדרטיים (SOPs).

בבסיסם, סוכנים אלו הם בעלי אישיות מובהקת שהוגדרה מראש ויכולים לבצע פעילויות שגרתיות (בתוך הסביבה המדומה) כמו למשל התעוררות, בישול ארוחת בוקר ויציאה לעבודה.

שגרת הבוקר של ג’ון: הוא קם בבוקר סביבות 6:00, משלים את משימות הבוקר שלו (קימה מהמיטה, צחצוח שיניים, מקלחת בוקר והכנת ארוחת בוקר). לאחר מכן ב-7:30 הוא מקשקש קצת עם אשתו מאי ועם בנו אדי, ואז אורז את הציוד שלו ויוצא לעבודה, שם מתחיל “יום עבודה”. ושוב – כל הכתוב לעיל נוצר מתוך יוזמות עצמאיות של הסוכנים ולא מתוך הגדרות קבועות מראש. מדהים!

אבל כמו שאמרנו, מה שמייחד אותם הוא היכולת שלהם לזכור, לשקף את פעולותיהם בעבר ולתכנן התנהגויות עתידיות על סמך השתקפויות אלו. הזיכרונות הבנויים שלהם, בשילוב עם פרופיל אישיותי ייחודי, מאפשרים להם ליצור אינטראקציה, לגבש דעות ואפילו ליזום שיחות אחד עם השני.

יאללה… מי בא למסיבה?

לדוגמה, במאמר ניתן לראות איך איזבלה, אחת מהסוכנים שבערכי הליבה שלה הוגדר לה שעליה “לדאוג לקהילה״, החליטה לבדה לארגן מסיבת ולנטיין (חג האהבה), הזמינה את החברים שלה, הם העבירו את המסר הלאה לחברים שלהם וגם הגיבו לה חזרה. ואז, כאשר הגיע התאריך למסיבה, הם באמת הגיעו. אגב, מי שלא הצליח להגיע הפיק תירוץ מהימן לסיבה שבגינה לא הגיע.

המסיבה של איזבלה: הסוכנים מנהלים אינטראקציה, מזמינים סוכנים אחרים למסיבה ואף חוזרים לאיזבלה ומספרים לה שהם מתכוונים להגיע.

הדוגמה הזו מראה את היכולת המדהימה של הסוכנים לקבל אינפורמציה מבחוץ, לעבד אותה ולהתאים את עצמם למצב המשתנה מבלי לפגוע במשימת העל שלהם. הם מגיבים לסביבה ופועלים על פי התנאים המשתנים. הם זוכרים החלטות שקיבלו בעבר ומתנהלים על פיהן.

איפה זה פוגש את העסק או החברה שלי?

כמו שאתם וודאי יודעים, כל מגזר – משירותי בריאות ועד לוגיסטיקה – עובד בצורה של SOPs (תהליכים קבועים שחוזרים על עצמם בארגון), ממש בצורה של מדריך מפורט, צעד אחר צעד, כדי להבטיח עקביות ולשפר את יעילות העובדים.

לצורך הדוגמה בואו נשתמש בתהליך שיש בכל עסק. פרסום. כלומר, יצירת תוכן.

מטרה: להשתמש בסוכן ג’נרטיבי כדי לסייע ביצירת תוכן, חידוד ויצירה עבור חברה X.

בשלב הראשון יכנס קלט מהעורך שמניע את התהליך, כמו למשל תקציר או קבוצה של נושאים.

ואז מתחיל התהליך:
1. הסוכן הראשון (בעל גישה למקורות מהאינטרנט) מייצר טיוטות תוכן מרובות בהתבסס על הבריף הנתון.

2. הסוכן השני (עם גישה למסד נתונים, פרסומים קודמים וכלים לניתוח מגמות) יודע מה הקוראים אוהבים ומה לא, עובר על הטיוטות ומאשר את מה שרלוונטי.

3. הסוכן הראשון מציע עריכות, מחדד את השפה, משפר את הזרימה הנרטיבית ומבטיח התאמה לקהל היעד ולהנחיות החברה.

4. הסוכן השני מצליב את התוכן עם מקורות אמינים, מאמת הצהרות עובדתיות ובודק הפרות אפשריות של זכויות יוצרים.

5. הסוכן הראשון יוצר תמונות מוסיף תמונות למאמר, כותב תקצירים עבור התמונות או הגרפיקה ושולח לאישור לפני פרסום.

6. מפרסמים.

7. הסוכן השני מנתח את הערות הקוראים, ביקורות ומדדי מעורבות כדי לזהות מגמות, העדפות ואזורי שיפור ומציע הצעות לנושאים חדשים או התאמות עתידיות על סמך משוב זה.

8. התהליך חוזר חלילה.

כמובן שבדוגמה לעיל תהליך מצומצם מאוד, אבל יכולות החיפוש, הלמידה, הביצוע והדיוק להמשך רלוונטיות לכל תהליך באשר הוא, בכמעט כל עסק (בין אם מדובר בדיוק הלקוחות לשיחות מכירה, ביצוע ראיונות לעובדים חדשים או תקשורת עם ספקים להזמנת סחורה).

או במילים אחרות…

כמעט כל תהליך רפטטיבי בארגון יכול להיות מבוצע על ידי סוכן AI, או לכל הפחות, יכול להיעזר בסוכן שכזה, מה שיובל להתייעלות ומקסום פוטנציאל ורווחים. מעבר לכך – כל סוכן AI יכול לעזור לסוכן AI אחר! שלם שעולה על סך חלקיו. למה? כי ככה עובדים הסוכנים שלנו – יש להם משימת על, דברים שצריך לקחת בחשבון ולצידם יש משימות המושפעות מהסביבה המשתנה. והסוכנים שלנו עונים על כל הדרישות!

אוטומציה של משימות שגרתיות:

עם תכונות הלמידה וההסתגלות הטבועות בהם, הסוכנים יכולים להתמודד עם משימות שגרתיות בדיוק ובמהירות ללא תחרות.

SOPs: מרכיב ההשתקפות בסוכנים מאפשר להם להתפתח על סמך משוב. כתוצאה מכך, SOPs יכולים להישאר דינמיים, תוך אופטימיזציה ככל שצצים נתונים חדשים.
מזעור שגיאות: הדיוק המובנה של הסוכנים מבטיח הפחתה דרסטית בטעויות אנוש, מה שמוביל לתפוקות עקביות ואיכותיות.
ניתוח נתונים ומשוב בזמן אמת: סוכנים אלה יכולים לספק תובנות מיידיות לגבי תהליכים, ובכך לאפשר פתרון בעיות וקבלת החלטות מהירים.

גם אתם יכולים ליצור סוכנים כאלה – הם זמינים בקוד פתוח

כן – הסוכנים הללו זמינים בקוד פתוח!

לקריאת המאמר המקורי המלא לחצו כאן.

עם זמינות הקוד הפתוח שלהם, סוכנים ג’נרטיביים הולכים להגדיר מחדש את יחסי הגומלין בין בני אדם לטכנולוגיה. הפוטנציאל שלהם טמון לא רק ביכולתם לחקות התנהגות אנושית, אלא ביכולתם לייעל, להתאים ולשפר את הפעולות בין התעשיות. ככל שאנו משלבים יותר ויותר את סוכני הבינה המלאכותית הללו בתשתיות שלנו, נהיה עדים לשינוי קיצוני, המאופיין בהגברת יעילות, עקביות וכושר הסתגלות שאין שני להם.

האופק נראה מבטיח ולגמרי מבשר על עידן חדש בשיתוף פעולה הדוק בין אנשים ל – AI. העסקים והארגונים שישכילו להתאים את עצמם ברמת האוריינות והמיינדסט לסוכנים החדשים, ישתמשו בהם ויתאימו אותם לעצמם, לדעתי, ינצחו במירוץ.

איפה אפשר לצפות בניסוי?

לצפייה בהקלטה של הניסוי, בה ניתן לראות את פעולות הסוכנות השונים בזמן אמת (כלומר, הקלטה של הפעולות שקיבלו בזמן אמת), לחצו פה.
פשוט לחצו Play, הקליקו על הסוכן שבו אתם רוצים לצפות ותוכלו לראות את המיקום שלו, הפעולות שלו באותה העת והאם הוא מקיים שיחה עם סוכן אחר.

רוצים להתמקצע?

בואו ללמוד איתנו בינה מלאכותית בקורס המקיף, העשיר והמבוקש בשוק. הצטרפו לאלפים הרבים שכבר עברו את הקורסים והסדנאות שלנו. פרטים והרשמה באתר.

לקבלת הנחה במחיר הקורסים – הזינו את קוד הקופון LETSAI

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

אפשר גם להרשם לניוזלטר שלנו

עומר הררי

עומר הררי - יועץ GenAI לחברות ציבוריות וארגונים ממשלתיים. מרצה בתחומי הבינה המלאכותית היוצרת ושיטות עבודה של העולם החדש במוסדות אקדמיים, תוכניות הכשרת מנהלים בכירים בתעשייה, קורסי דירקטורים ופיקוד בכיר בצה״ל ומשרדי הביטחון.