תוצאות נוספות...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
× Send

מה קורה לסוכן AI כשהוא הולך לישון? אנתרופיק חושפת את התשובה

סוכן דרימינג
תוכן עניינים

בכנס המפתחים השנתי השני שלה, אנת'רופיק (Anthropic) הציגה שלוש יכולות חדשות שהיא מציבה בלב הסיפור על סוכני AI שיפעלו בארגונים גדולים. אחת מהן עוסקת ב-AI שמנתח את הטעויות של עצמו בזמן שאתם ישנים. עוד לפני שהוצגה במלואה, היא כבר נתנה ללקוחות הראשונים תוצאות שקשה להתעלם מהן.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

שלוש יכולות, בעיה אחת

הכנס Code with Claude, שנערך ב-6 במאי בסן פרנסיסקו, הציג שלוש תכונות חדשות בפלטפורמת Claude Managed Agents. הראשונה, דרימינג (Dreaming). דרימינג היא יכולת חדשה לחלוטין שיוצאת בגרסת תצוגה מוקדמת למחקר. השתיים האחרות, אאוטקאמס (Outcomes) ואורקסטרציית רב-סוכנים (Multi-Agent Orchestration), עוברות מתצוגה ניסיונית לבטא ציבורית ופתוחות לכל המפתחים בפלטפורמה.

 

"דרימינג מציף דפוסים שסוכן בודד לא יכול לראות בכוחות עצמו, כולל טעויות חוזרות, תהליכי עבודה שסוכנים מתכנסים אליהם, והעדפות שמשותפות לצוות. זיכרון ודרימינג יחד יוצרים מערכת זיכרון יציבה לסוכנים שמשתפרים מעצמם."

— מתוך New in Claude Managed Agents: dreaming, outcomes, and multiagent orchestration, הבלוג הרשמי של אנתרופיק

 

שלושתן יחד מתמודדות עם מה שאנתרופיק מזהה כצוואר הבקבוק האמיתי באימוץ סוכני AI בארגונים: לא איכות המודל, אלא היכולת להפעיל אותו במשימות אמיתיות בלי שייתקע, ייסחף או יצריך פיקוח אנושי על כל צעד. הצמיחה של החברה ברבעון הראשון של 2026 הפתיעה אפילו אותה. ההכנסות והשימוש גדלו בקצב שנתי של פי 80, לעומת תוכנית שדיברה על פי 10. נפח השימוש ב-API גדל בקצב של פי 70 בהשוואה לשנה שעברה, והמפתח הממוצע ב-Claude Code מבלה עם הכלי 20 שעות בשבוע.

 

ה-Opening Keynote של הכנס שבו דריו אמודיי הצהיר את הציטוט על "פי 80 במקום פי 10" — הצהרה שמעוגנת במאמר אבל בלי המקור הראשוני שלה.

 

דרימינג: סוכן שלומד מעצמו בלילה

דרימינג היא היכולת המעניינת ביותר מבחינה רעיונית, ואנתרופיק עומלת להבדיל אותה ממערכות זיכרון רגילות. בעוד שתכונת הזיכרון שהושקה מוקדם יותר השנה מאפשרת לקלוד לשמור העדפות והקשר בין שיחות, דרימינג פועלת ברמת הפשטה גבוהה יותר. מדובר בתהליך מתוזמן שסוקר את כל השיחות והזיכרונות של הסוכן, מחלץ דפוסים, ומזקק אותם לתובנות שיעזרו לסוכן לעבוד טוב יותר בעתיד.

 

אלכס אלברט (Alex Albert), שמוביל את ניהול המוצר במחקר של אנתרופיק, השווה את היכולת ליצירת מיומנויות באופן ידני. אנשים בארגונים נוהגים, לאחר שעבדו על משימה והתלבטו בה, לתעד את הדרך שעברו. דרימינג עושה זאת באופן אוטומטי. הסוכן עצמו כותב את ההערות לעצמו לעתיד.

 




סשן ייעודי מהכנס Code with Claude שמעביר Mahesh Murag (Member of Technical Staff באנת'רופיק). הסרטון מסביר איך זיכרון ודרימינג עובדים יחד ב-Claude Managed Agents והופכים אותם למערכות לומדות.

 

נקודה חשובה היא שהתהליך אינו משנה את משקלי המודל. במקום זאת, הסוכן כותב הערות בטקסט פשוט ויוצר מסמכי "פלייבוק" שניתנים לבדיקה אנושית. הכל גלוי, ניתן לעריכה, וניתן לאימות. אלברט הודה שיש כאן עניין של אמון, ועם זאת הדגיש שהמשתמש יכול לבדוק כל הערה שהמערכת כותבת לעצמה ולערוך אותה.

 

הלקוחות הראשונים כבר מדווחים על תוצאות. חברת הארווי (Harvey), שמפתחת AI לעולם המשפטי, ראתה את אחוזי השלמת המשימות עולים פי 6 בערך אחרי הטמעת דרימינג. ויזדוקס (Wisedocs), שמתמחה בסקירת מסמכים רפואיים, קיצרה את זמן הסקירה ב-50% באמצעות אאוטקאמס. נטפליקס (Netflix) משתמשת באורקסטרציה הרב-סוכנית כדי לעבד לוגים של מאות תהליכי בנייה במקביל.

 

אאוטקאמס - סוכן שני שבודק את הראשון

אאוטקאמס מאפשרת למפתחים להגדיר מהי "תוצאה טובה" בעזרת רובריקה, מסמך הנחיות, סטנדרט עיצובי או קול מותגי. הסוכן עובד מולה באופן עצמאי עד שהוא עומד בה. הייחודיות כאן היא ההפרדה: אחרי שהסוכן הראשי מסיים את העבודה, סוכן נפרד שתפקידו לדרג מקבל את התוצר ובוחן אותו מול הרובריקה. הסוכן הבודק עובד בחלון הקשר עצמאי משלו, כך שהוא אינו מושפע מההיגיון ומההטיות שצברה השיחה הארוכה.

 

אלברט הסביר שהגישה הזו עובדת טוב יותר מהדרך הישנה של לבקש מהמודל לבדוק את עצמו באותה שיחה. בשיחות ארוכות הקשב מתפזר, ובדיקה בחלון רענן נותנת תוצאות עקביות יותר. השיטה הזו אינה ייחודית לאנתרופיק. בגיטהאב (GitHub) מפעילים גישה דומה, ב-Copilot מודל קטן וזול מבצע את העבודה, ומודל גדול ויקר משמש לו כיועץ. סוכן בודק נכנס לפעולה בשלוש נקודות: אחרי תכנון, אחרי כתיבה מורכבת, ואחרי כתיבת בדיקות.

 

אורקסטרצייה רב-סוכנית - צוות במקום עובד יחיד

היכולת השלישית מאפשרת לסוכן ראשי לפצל משימה גדולה לתת-משימות, לחלק אותן בין סוכנים מומחים, ולאחד את התוצאות. כל סוכן משני מקבל מודל משלו, פרומפט מערכת משלו, כלים משלו וחלון הקשר משלו. כל פעולה ניתנת למעקב בקונסולה של אנתרופיק.

 

אלברט מציע אבחנה שימושית למתי לפצל ומתי לא. כשמדובר בחקירה, חיפוש או איסוף מידע שרובו ייזרק בסוף, פיצול לסוכנים עובד טוב. כשנדרשת תשובה לשאלה ספציפית, אין צורך לגרור את כל תוצאות החיפוש חזרה לסוכן הראשי. בעתיד, לדבריו, המודל עצמו יחליט מתי להפעיל אורקסטרציה רב-סוכנית, והמשתמש לא ירגיש את ההבדל.

 

בהמחשה על הבמה, אנתרופיק הציגה איך שלוש היכולות עובדות יחד על תרחיש דמיוני של חברת לומרה (Lumara) שמנחיתה רחפנים על הירח. שלושה סוכנים, אחד אחראי על המשימה הכללית, אחד מזהה אזורי נחיתה ואחד מטפל בטיסה. רובריקה מגדירה הצלחה: נחיתה רכה, קרקע נקייה, ודלק מספיק לחזרה. אחרי הסימולציה הראשונית, תהליך דרימינג רץ בלילה ויצר פלייבוק נחיתה. בבוקר, התוצאות באותם אזורים שכשלו קודם השתפרו משמעותית. כל מה שנדרש היה לחיצה אחת על כפתור.

 

שינוי בקטגוריה

הגישה של אנתרופיק מסמנת שינוי תפיסתי - עד עכשיו, התחרות בין פלטפורמות ה-AI של אנתרופיק, OpenAI וגוגל (Google) התמקדה באינטליגנציה הגולמית של המודלים. שלוש היכולות החדשות מתחילות לדבר בשפה אחרת לגמרי, של אמינות בייצור ובמשימות שצריך לסמוך עליהן בלי לפקח עליהן באובססיביות. הבדיקה הזו לא תוכרע במבחני ביצועים, אלא בהחלטות של מנהלי IT בחברות גדולות. כשמרקדו ליברה (Mercado Libre) מפעילה 23,000 מהנדסים על Claude Code ומכוונת ל-90% כתיבת קוד אוטונומית עד הרבעון השלישי של השנה, ההכרעה הזו כבר מתרחשת.

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

רוצים הרצאה או ייעוץ של הילה ששון?
השאירו פרטים ונשמח לחזור אליכם עם המידע הרלוונטי
אולי יעניין אותך גם...
guest
0 תגובות
Inline Feedbacks
צפה בכל התגובות
Let's update

רוצים לקבל עדכונים על כל מה שחדש ומעניין בעולם ה-AI? הרשמו לניוזלטר שלנו!

אירועי AI קרובים

תפריט נגישות

תוצאות נוספות...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
וובינר וייב קודינג
ובניית אפליקציות
רביעי 06.05.26 | 20:00 | בלייב זום