דף הבית » מה אנחנו יודעים על אוטונומיה, פיקוח וסיכון של סוכני AI בעולם האמיתי

מה אנחנו יודעים על אוטונומיה, פיקוח וסיכון של סוכני AI בעולם האמיתי

רון גולד

03/03/2026

זמן קריאה: 8 דקות

מחקר חדש של אנטרופיק (Anthropic), המבוסס על מיליוני אינטראקציות עם סוכני AI, מגלה דפוס עקבי: ככל שהמשתמשים צוברים ניסיון, הם מעניקים לסוכנים יותר חופש פעולה אבל ממשיכים לפקח עליהם באמצעות התערבות נקודתית. בעולם שבו סוכני AI הופכים לכלי עבודה שגרתי, השאלה המרכזית היא לא רק מה הם מסוגלים לבצע אלא כיצד אנשים משתמשים בהם בפועל. הנתונים מראים שמשתמשים מנוסים מפחיתים את הצורך לאשר כל פעולה, עוברים לניטור רציף ומתערבים רק כשמשהו דורש תיקון או שינוי כיוון. כך נוצרת מערכת יחסים שבה האוטונומיה של הסוכן אינה רק תכונה טכנולוגית אלא תוצאה של שילוב בין התנהגות המשתמש, עיצוב המוצר ויכולת המודל לזהות מצבי אי ודאות.

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

אפשר גם להרשם לניוזלטר שלנו

איך מודדים סוכנים בעולם אמיתי

למרות ההתקדמות המהירה בתחום, מדידת ההתנהגות של סוכני AI בשטח היא משימה מורכבת. אין הגדרה מוסכמת למהו סוכן, והארכיטקטורות משתנות במהירות, ממערכות קצרות שמפעילות סוכן יחיד ועד מערכות מרובות סוכנים שפועלות במשך שעות. בנוסף, ספקי מודלים רואים רק חלק מהתמונה כיוון שב‑API הציבורי ניתן לנתח פעולות בודדות אך לא את רצף הפעולות המלא, ואילו ב‑Claude Code אפשר לעקוב אחר סשנים שלמים אבל רק בתחום אחד, הנדסת תוכנה.

כדי להתגבר על הפער הזה, אנטרופיק שילבה בין שני מקורות נתונים משלימים: עומק מתוך Claude Code ורוחב מתוך ה‑API הציבורי. השילוב מאפשר לזהות מגמות שלא ניתן לראות מכל מקור בנפרד ולבנות תמונה אמפירית של האופן שבו סוכנים באמת פועלים בעולם האמיתי.

כשסוכן עובד לבד במשך עשרות דקות

אחד הממצאים הבולטים במחקר הוא העלייה המשמעותית במשך הזמן שבו Claude Code עובד ללא התערבות אנושית. המדד של ה‑99.9‑percentile, שמייצג את המקרים הקיצוניים שבהם המשתמשים מאפשרים לסוכן לעבוד ברצף לאורך זמן, כמעט הוכפל בתוך כמה חודשים. בספטמבר 2025 תורים ארוכים נמשכו פחות מ‑25 דקות, ובינואר 2026 הם כבר עברו את רף 45 הדקות.

מקרים קיצוניים שבהם הסוכן עובד הכי הרבה זמן ברצף | anthropic

העלייה הזו אינה מוסברת רק בשיפור יכולות המודל. היא מתרחשת בצורה חלקה, ללא קפיצות סביב שחרורי גרסאות, ומרמזת על שינוי בהרגלי המשתמשים ובסוגי המשימות שהם נותנים לסוכן. אנטרופיק מציינת כי הירידה הקלה בינואר ופברואר עשויה להיות תוצאה של הכפלת בסיס המשתמשים ושל מעבר מפרויקטי חגים למשימות עבודה קצרות יותר. למרות התנודות, המגמה הכוללת ברורה - סוכנים עובדים לבד למשכי זמן ארוכים יותר.

משתמשים מנוסים משנים אסטרטגיה

ככל שהמשתמשים צוברים ניסיון, הם משנים את אופן הפיקוח שלהם על הסוכן. משתמשים חדשים נוטים לאשר כמעט כל פעולה, ולכן שיעור ה‑auto‑approve אצלם עומד על כ‑20 אחוז מהסשנים. לעומתם, משתמשים מנוסים שעברו מאות סשנים מגיעים ליותר מ‑40 אחוז שימוש ב‑auto‑approve.

שיעור אישור אוטומטי לפי ניסיון | anthropic

במקביל, דווקא אצל המשתמשים המנוסים שיעור ההפרעות גבוה יותר: מ‑5 אחוז אצל חדשים ל‑9 אחוז אצל ותיקים. זו אינה סתירה אלא שינוי גישה. במקום לאשר כל צעד, המשתמשים המנוסים מאפשרים לסוכן לעבוד באופן חופשי, עוקבים אחר התקדמותו ומתערבים רק כשמשהו דורש תיקון או שינוי כיוון. אנטרופיק מציינת כי דפוס דומה מופיע גם ב‑API הציבורי, שם ככל שהמשימה מורכבת יותר, יש פחות מעורבות אנושית בכל פעולה, כנראה משום שאישור רציף אינו מעשי במשימות ארוכות ורב שלביות.

שיעור ההפרעות (interrupts) על בסיס ניסיון המשתמש | anthropic

שאלות הבהרה כמנגנון בטיחות

לא רק המשתמשים משפיעים על רמת האוטונומיה בפועל, אלא גם הסוכן עצמו. המחקר מראה שככל שהמשימה מורכבת יותר, Claude Code עוצר לשאול שאלות הבהרה בתדירות גבוהה יותר, ובמשימות המורכבות ביותר הוא עושה זאת פי שניים יותר מאשר המשתמשים עוצרים אותו.

ככל שהמשימה מורכבת יותר, Claude שואל יותר והאנשים גם מפריעים יותר | anthropic

הסיבות לעצירות מצד Claude מגוונות, לדוגמה, איסוף מידע, בקשת הבהרה, בקשת הרשאות ובקשת אישור לפני פעולה. מנגד, המשתמשים עוצרים בעיקר כדי לספק הקשר טכני חסר, להתמודד עם איטיות או תקיעות וגם כדי לקחת את השלב הבא לידיים.

אנטרופיק מדגישה שעצירות יזומות מצד הסוכן הן מנגנון בטיחות משמעותי. מודל שמזהה אי ודאות ושואל שאלות מפחית סיכון ומשלים את מנגנוני הפיקוח החיצוניים כמו הרשאות ואישורים.

מדוע Claude עוצר ומדוע בני אדם עוצרים אותו | anthropic

סוכנים בתחומי סיכון

בניתוח של כמעט מיליון קריאות כלי ב‑API הציבורי, אנטרופיק מדרגת כל פעולה לפי רמת סיכון ואוטונומיה בסולם של אחת עד עשר. רוב הפעולות נמצאות באזור נמוך סיכון ונמוך אוטונומיה, אך יש גם אשכולות קיצוניים בתחומים כמו גישה לרשומות רפואיות, טיפול בחומרים מסוכנים, תגובה לאירועי אש ופריסת קוד לפרודקשן. חלק מהפעולות הללו הן ככל הנראה סימולציות או הערכות אבטחה, אך הן עדיין מצביעות על פוטנציאל לסיכון גבוה יותר.

היכן משתמשים בסוכנים | anthropic

מנגד, פעולות בעלות אוטונומיה גבוהה כוללות מסחר אוטונומי בקריפטו, ניטור מערכות, סינון תיבות מייל ומשימות אדמיניסטרציה אוטומטיות. אנטרופיק מציינת כי שמונים אחוז מהסוכנים משתמשים במנגנוני הגנה כלשהם, ורק 0.8 אחוז מהפעולות הן בלתי הפיכות, נתון שמרמז על רמת זהירות גבוהה יחסית בשימוש בפועל.

סיכון מול אוטונומיה | anthropic

מבחינת תחומי פעילות, כמעט חמישים אחוז מהשימושים מגיעים מהנדסת תוכנה, אך תחומים נוספים כמו BI, שירות לקוחות, מכירות, פיננסים, סייבר ורפואה מתחילים לאמץ סוכנים בהיקפים קטנים. מגמה זו מרמזת על התרחבות עתידית של השימוש בסוכנים גם בתחומים שבהם רמת הסיכון עשויה להיות גבוהה יותר.

מפת סיכון‑אוטונומיה בפועל | anthropic

מה מיוחד במחקר הזה

ייחודו של המחקר הזה הוא בכך שאין כאן בחינה של יכולות המודל בתנאי מעבדה, אלא מיקוד באופן שבו אנשים משתמשים בו בפועל. הוא מראה שהאוטונומיה שמתקבלת בשטח היא תוצאה של שילוב בין יכולות המודל, עיצוב המוצר והתנהגות המשתמש. המשמעות היא שלא ניתן להעריך סוכנים רק באמצעות מבחני יכולת, אלא יש צורך במדידה רציפה של האופן שבו הם פועלים בסביבות אמיתיות, תחום שבו הכלים הקיימים עדיין מוגבלים.

אנטרופיק מציינת כמה מגבלות משמעותיות שצריך לקחת בחשבון - הנתונים מגיעים מספק אחד בלבד, ב‑API הציבורי אין דרך לעקוב אחר סשנים מלאים, חלק מהפעולות המסוכנות הן ככל הנראה סימולציות או הערכות אבטחה, והניתוח משקף חלון זמן מוגבל. למרות המגבלות, המחקר מספק הצצה נדירה לדינמיקה האמיתית של סוכנים בעולם העבודה ולשינויים שמתרחשים כאשר משתמשים מתחילים לסמוך עליהם יותר.

פיקוח לא נעלם, הוא פשוט משתנה

המחקר של אנטרופיק מציג תמונה ברורה. ככל שהמשתמשים מתקדמים, הם מעניקים לסוכנים יותר חופש פעולה אך אינם מוותרים על פיקוח. במקום לאשר כל פעולה מראש, הם עוברים למודל עבודה שבו הסוכן פועל באופן עצמאי רוב הזמן, וההתערבות מתרחשת רק כשמשהו דורש תיקון או שינוי כיוון. במקביל, הסוכנים עצמם יודעים לעצור, לשאול שאלות ולהגביל את עצמם כשהם מזהים אי ודאות, מה שמוסיף שכבת בטיחות נוספת.

המשמעות לתעשייה ברורה. בטיחות לא תושג באמצעות דרישה לאישור לכל פעולה, אלא באמצעות תשתיות ניטור לאחר פריסה, ממשקי פיקוח יעילים ומודלים שמזהים מתי עליהם לעצור ולבקש הבהרה. ככל שסוכנים ייכנסו לתחומים חדשים ומורכבים יותר, היכולת להבין את הדינמיקה הזו ולנהל אותה בצורה מושכלת תהפוך חיונית.

למחקר המלא של אנטרופיק, כנסו כאן.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

רון גולד

מלמד ויועץ לחדשנות אסטרטגית, משלב בינה יוצרת וכלי אוטומציה להעצמת תהליכים עסקיים ופרודוקטיביות אישית. במסע מתמשך של חקירה ולימוד בתחום הבינה המלאכותית.