אם אתם עובדים עם בינה מלאכותית, אתם בטח מכירים את זה: אתם כותבים שאלה או הנחיה ומקבלים תשובה שנשמעת נכונה ואפילו “חכמה”, אבל בפועל חסרת ערך. נניח שבניתם לעצמכם סוכן (Agent) וביקשתם ממנו להזמין מלון בפריז לקראת כנס חשוב. דקה אחר כך נוחת אצלכם המייל עם האישור – מלון בפריז, קנטקי. לא בפריז, צרפת. זה אולי נשמע מצחיק, אבל זו לא טעות קטנה – זו המחשה לבעיה עמוקה. המודל לא טעה כי הוא “טיפש”, אלא כי לא היה לו הקשר. וכשאנחנו מתחילים להשתמש ב־AI לא רק לשיחות, אלא כסוכנים שמבצעים פעולות אמיתיות כמו הזמנות, חיפושים ותיאומים, הקשר הוא ההבדל בין הצלחה לכישלון. בלי הקשר ברור ורחב, הסוכן שלכם לא יכול לקבל החלטה נכונה. וכאן נכנסת ההבחנה: הנדסת פרומפטים מתמקדת באיך לנסח את הבקשה, הנדסת הקשר בונה את כל התמונה סביב המודל – המידע, הכלים והזיכרון שהוא חייב כדי לפעול בצורה חכמה ומדויקת.
רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.
אפשר גם להרשם לניוזלטר שלנו
ההבחנה המרכזית
הנדסת פרומפטים היא האמנות של ניסוח ההוראה המדויקת ל-AI. זה כמו לנסח שאלה בצורה הכי ברורה שיש – לבחור את המילים, לתת דוגמאות, להחליט על פורמט – כדי למקסם את הסיכוי לקבל את התשובה שאתם רוצים.
הנדסת הקשר, לעומת זאת, היא הרבה יותר רחבה. היא בונה סביב המודל את כל הסביבה שהוא צריך כדי לעבוד חכם באמת: מסמכים רלוונטיים, זיכרון משיחות קודמות, גישה לנתוני זמן אמת וכלים שמאפשרים לו לבצע פעולות.
תחשבו על זה ככה: הנדסת פרומפטים היא כתיבה של שאלה או הנחיה מושלמת. הנדסת הקשר היא לוודא שלסוכן שלכם יש גם את ספר הלימוד הנכון, גם מחשבון, גם הערות מהעבר – וגם את המפתחות כדי להיכנס לכיתה ולבצע את המשימה בפועל.
איך פועלת הנדסת פרומפטים
כדי להפוך תשובה של AI למדויקת ושימושית יותר, יש כמה טכניקות פשוטות אבל חזקות:
הגדרת תפקיד
כשאתם אומרים למודל “אתה מפתח פייתון בכיר שבודק קוד לפגיעויות אבטחה” – תקבלו ניתוח שונה לגמרי מאשר אם תכתבו רק “בדוק את הקוד הזה”. למה? כי המודל נכנס לדמות, מאמץ את השפה ואת סדר העדיפויות של אותו תפקיד.
דוגמאות Few-Shot
נהוג לומר Show don’t Tell – תמיד עדיף להראות מאשר להסביר. אם תסבירו שאתם רוצים פלט JSON, זה עלול לצאת בכל מיני וריאציות. אבל אם תיתנו 2-3 דוגמאות מדויקות, המודל ילמד את הפורמט, את השפה ואפילו את הסגנון שלכם.
שרשרת מחשבה (CoT)
הוספת הנחיה כמו “בואו נחשוב צעד אחר צעד” מאלצת את המודל לפרוס את ההיגיון שלו ולא לקפוץ ישר למסקנה. זה כלי מצוין כשמדובר בבעיות מורכבות או בחישובים לוגיים.
הערה חשובה: במודלים ישנים יותר, הנחיה כזו הייתה קריטית לדיוק התשובה. לעומת זאת, במודלי חשיבה (Reasoning) מתקדמים, היכולת הזו כבר מוטמעת בפנים, והמודל מבצע את שרשרת המחשבה בעצמו. במקרים כאלה, ההנחיה לא תשפר את הדיוק, אך עדיין שימושית כאשר רוצים לראות את ההיגיון או הדרך – לצורך שקיפות, למידה או בדיקה.
הגדרת מגבלות
לפעמים דווקא הצבת גבולות מחדדת את התוצאה. למשל: “הגבילו את התשובה ל-100 מילים” או “השתמשו רק במידע מההקשר שסופק”. זה שומר על מיקוד ומונע מהמודל לגלוש לנושאים לא רלוונטיים.
הנה תרשים קצר שמרכז את ארבעת המרכיבים החשובים ביותר:
העולם הרחב של הנדסת הקשר
כאן כבר לא מדובר רק בניסוח פרומפטים חכמים, אלא בבנייה של מערכת שמספקת ל-AI את כל מה שהוא צריך כדי להתנהג כמו סוכן אמיתי:
ניהול זיכרון
למודל יש “זיכרון קצר טווח”, מה נאמר קודם באותה שיחה, וגם “זיכרון ארוך טווח” שמבוסס על מאגרי מידע. כך הוא יכול לזכור העדפות, אינטראקציות עבר ודפוסים שחוזרים על עצמם. בלי זה, כל שיחה מתחילה מאפס.
ניהול מצבים
כאשר ה-AI מבצע תהליך מרובה שלבים, למשל תכנון נסיעה, עליו לדעת איפה הוא נמצא בשרשרת: האם הטיסה כבר הוזמנה? באיזו שעה תנחתו? האם צריך להזמין הסעה? בלי ניהול מצבים בתוך התהליך, הוא יאבד את החוט באמצע.
RAG – Retrieval Augmented Generation
במקום להעמיס על המודל עשרות עמודים, RAG מאפשר לו “לדוג” רק את החלקים הרלוונטיים. למשל, כשאתם צריכים את מדיניות הנסיעות של החברה, הוא ימשוך רק את החוקים הקשורים ליעד שלכם, לא את כל החוברת.
אינטגרציית כלים
מודלי שפה יודעים לדבר, אבל לא לפעול. חיבור לכלים – API, מסדי נתונים, מערכות הזמנות – מאפשר להם לבצע פעולות אמיתיות. כאן מתבצע המעבר מצ’אטבוט חכם לסוכן שמבצע משימות.
הנה תרשים שמרכז את האלמנטים הקריטיים: זיכרון, ניהול מצבים, RAG, אינטגרציית כלים וכמובן גם פרומפטים כחלק מהתמונה הגדולה:
השילוב עם מערכות מרובות סוכנים
כאן מגיע הרובד שמראה את מלוא העוצמה של הנדסת הקשר: מערכות מרובות סוכנים (Multi-Agent Systems).
במקום מודל אחד שמנסה לעשות הכול, אנחנו מפעילים כמה סוכנים מתמחים:
-
סוכן אחד שאוסף מידע ממקורות שונים,
-
סוכן אחר שבודק מדיניות וחוקים רלוונטיים,
-
וסוכן שלישי שמתכנן את הצעד הבא ומחבר את התמונה הכוללת.
הנדסת ההקשר היא זו שמארגנת את כל החלקים האלו – מתזמרת את ה־RAG, את הזיכרון ואת ההנחיות – כדי שהשיחה לא תהיה אוסף תשובות אלא תהליך דינמי ומדויק.
התוצאה? מערכת שפועלת כמעט כמו צוות אנושי: כל אחד מתמחה בתחום שלו, וכולם יחד מייצרים פעולה חכמה, יציבה ואמינה הרבה יותר ממה שסוכן יחיד יכול לספק.
למה שניהם חשובים
הכוח האמיתי לא נמצא בפרומפטים לבד, וגם לא רק בהקשר – אלא בשילוב ביניהם.
דמיינו שאתם כותבים ל-AI: “תכין לי מסלול טיול ליומיים בפריז.” זה פרומפט טוב, אבל עדיין כללי. כאן נכנסת הנדסת ההקשר: המערכת מוסיפה אוטומטית את הטיסות שכבר הזמנתם, את המלון שבו תשהו, את ההעדפות האישיות שלכם (למשל מוזיאונים ולא קניות), ואת מזג האוויר הצפוי. בפועל, ההוראה שה-AI מקבל מורכבת ברובה (כ־80%) מתוכן דינמי שמגיע מהמערכות והעדפות שלכם, ורק כ־20% מהבקשה המקורית. השילוב הזה מייצר המלצה הרבה יותר רלוונטית – כזו שתוכלו פשוט לקחת ולצאת לדרך.
הנדסת פרומפטים עוזרת לכם לשאול שאלות טובות יותר. הנדסת הקשר בונה את המערכת שסביבן – כדי שה-AI יוכל לתת תשובות נכונות ולבצע פעולות בפועל. בלי פרומפטים טובים, ה-AI לא יבין אתכם. בלי הקשר, גם בקשה ברורה עלולה להסתיים בהזמנה של מלון ביבשת הלא נכונה או בהחלטה עסקית שמנוגדת למדיניות שלכם. מערכות AI מודרניות זקוקות לשתיהן: ניסוח מדויק מצד אחד, והקשר מלא מצד שני – זיכרון, ניהול מצבים, מסמכים, כלים ותיאום בין סוכנים. רק השילוב הזה יוצר AI שלא רק “מבין מילים”, אלא באמת מבין את העולם שלכם ועוזר לכם לפעול בו.