כתבות ומדריכים בנושא כתבות ומדריכים בנושא מודלי שפה | Let's AI בינה מלאכותית

סייעני AI כמשאב אסטרטגי בתהליכי המחקר בתחומי החברה והרווחה

ד"ר יוסף (אסי) אהרונוב — Mon, 18 May 2026 04:48:08 +0000

בשנים האחרונות גובר הצורך להסתמך על תשתיות מידע וידע לצורך קבלת החלטות, עיצוב מדיניות וגיבוש מענים מקצועיים בתחומי החברה והרווחה. במקרים רבים, הידע הדרוש אכן קיים, אך הוא אינו נגיש, מעובד ומאורגן באופן שמאפשר עבודה מהירה ואיכותית בקצבי הזמן שמכתיבים הצרכים הניהוליים והמערכתיים. בין האתגרים הבולטים אפשר למנות חיפוש ממושך אחר מידע, לעיתים במשך ימים ואף שבועות, פיזור של מקורות בין שפות, פלטפורמות וגופים שונים, הצורך בהערכת מהימנות המקורות, מחסור בזמן, בכוח אדם ובתקציב, וכן צורך במומחיות ממוקדת המשתנה מנושא לנושא. על רקע זה פיתחתי שני סייעני AI ייעודיים לתחומי החברה והרווחה, שנועדו לשמש תשתית מהירה, מהימנה ושימושית לאיתור, מיון וסינתזה של מידע וידע לצורכי מחקר. הסייענים תומכים בשלבים שונים של עבודת המחקר, החל מאיתור מהיר של מקורות איכותיים שכוללים מחקרים אקדמיים, דוחות ממשלתיים, מסמכי מדיניות, נתונים רשמיים וספרות מקצועית מהארץ ומהעולם, דרך ארגון החומר והשוואתו, ועד גיבוש מענה סדור יותר המקל על החשיבה הביקורתית ועל המעבר ממחקר לפרקטיקה. בכך הם מייעלים תהליכי עבודה, חוסכים זמן יקר, משאבים ואף תקציב.

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

אפשר גם להרשם לניוזלטר שלנו

זירה מקומית ובינלאומית

שני הסייענים פותחו עבור שתי זירות שונות ומשלימות. הסייען הראשון מתמקד בזירה הישראלית, ומסייע במיפוי והנגשת ידע מקומי בתחומי החברה והרווחה. הסייען השני מתמקד בזירה הבינלאומית, ומאפשר לאתר ראיות, כיווני פעולה ופרקטיקות מן העולם, ולבחון את הרלוונטיות שלהן לישראל. בכך הם נותנים מענה לשני צרכים מחקריים מרכזיים: העמקה בהקשר המקומי מצד אחד, ולמידה השוואתית ממקורות חוץ מצד אחר.

שני הסייענים נבנו בתוך Chat GPT בתור GPTs והם מיועדים למנהלים ועובדים בשירותי הרווחה, חוקרים ובעלי תפקידים מקצועיים נוספים הזקוקים לגישה מהירה לידע מבוסס בתחומים אלה. הייחוד של שני הסייענים טמון בכך שהם אינם נשענים על חיפוש גנרי בלבד, אלא על הנדסת פרומפטים ייעודית שעוצבה מתוך היכרות מקצועית עמוקה עם עולם המחקר, המדיניות והרווחה. ההגדרות שניתנו להם מראש מכוונות אותם לעבוד עם סוגי המקורות הרלוונטיים, להציג מענה במבנה עקבי ושימושי, ולהתאים את היקף התשובה לצורך המחקרי או המקצועי. כך, במקום להסתמך על מידע אקראי, הם פועלים על בסיס מדרג אמינות ברור.

מה אפשר לבנות עם זה?

באמצעות הכלים ניתן לבנות תמונת מצב ראשונית בנושא מסוים, לבדוק אם כבר קיים ידע מספק לפני יציאה למחקר רחב, לזהות פערי ידע, לחדד שאלת מחקר, לגבש תקציר מנהלים ראשוני או להכין בסיס לנייר מדיניות ולדיון ניהולי. זהו יתרון משמעותי במיוחד בתחומים שבהם לא כל מי שנדרש לעבוד עם ידע מחקרי הוא בהכרח חוקר בהכשרתו או עם הפניות הנדרשת, אך רבים נדרשים להישען על ידע כזה במסגרת עבודתם.

עם זאת, חשוב להבהיר כי אין מדובר בתחליף למחקר מקצועי, וגם לא להחלפה של שיקול דעת אנושי. הסייענים תורמים להפיכת הידע הקיים לנגיש, מסודר ושמיש יותר. המענה שהם מספקים מפנה למקורות שעליהם הסתמך, מסמן את גבולות הוודאות שלו, ומעודד את המשתמש לבדוק, לאמת ולהפעיל שיפוט מקצועי עצמאי. לכן תרומתם העיקרית היא בשחרור המומחיות האנושית לעסוק במקומות שבהם היא חיונית באמת: בפרשנות, בביקורת, בהכרעה ובתרגום ידע לפעולה.

כדי לשפר את איכות המענה, מומלץ להשתמש בסייענים אלה באמצעות מודל החשיבה המעמיק (Extended Thinking). אמנם בחירה זו עשויה להאריך את משך ההמתנה לתשובה (במונחי AI), אך היא מאפשרת תהליך עמוק, שקול ומדויק יותר, במיוחד כאשר מדובר בשאלות מורכבות של מחקר, השוואה או גיבוש מדיניות. באופן זה הסייען עובר תהליך סדור שעשוי לכלול את השלבים הבאים: הגדרת הבעיה והשאלה, הגדרת האוכלוסיה והתחום, בניית מילון מונחים ומילות חיפוש, מיפוי מקורות לפי מדרג אמינות, איסוף מקורות באופן שיטתי, סיווג פתרונות לפי סוג ורמת התערבות, הערכת איכות הראיות, בחינת התאמה לישראל, זיהוי פערי ידע, גיבוש תוצר מסכם שימושי כמו סקירה, מפת פתרונות או Policy brief .

נכון להיום אפשרות זו זמינה למנויים בתשלום, אך ערכה בולט במיוחד במקרים שבהם יש צורך במענה איכותי שאינו מסתפק במהירות בלבד.

סייען מחקר חברה ורווחה - ישראל

סייען זה ממוקד בזירה הישראלית ופתוח לכולם בקישור: סייען מחקר רווחה. הוא נועד לסייע במקרים בהם יש צורך להבין במהירות ובאופן מבוסס מה ידוע על סוגיה מסוימת בתחום הרווחה בישראל: מחקרים, דוחות רשמיים, מדיניות, נתונים ומגמות. במקום לבצע חיפושים בין אתרים כמו ביטוח לאומי, הלמ"ס, משרדי ממשלה, מכוני מחקר ומאמרים אקדמיים - הסייען מרכז, ממיין ומסנתז את המידע לכדי תמונה שימושית יותר.

שימושים אפשריים

הייחודיות של הכלי ביכולת לספק מגוון רחב של מענים מחקריים ובכללם:

איתור מקורות אמינים בתחום הרווחה בישראל
ביצוע סקירת ספרות אינטגרטיבית
השוואה בין מקורות, מדדים וגישות מחקר
סיכום מגמות ומשמעויות
סיוע בגיבוש מדדים
סיוע בניסוח שאלות מחקר ובהכנת הצעות מחקר
שיפור כתיבה אקדמית ומקצועית
תמיכה בחשיבה ביקורתית על מקורות, הטיות ומגבלות

שאלות לדוגמה יכולות לכלול:

"חפש לי מחקרים עדכניים על עוני בקרב משפחות עובדות בישראל"
"בנה לי סקירת ספרות קצרה על דיור ציבורי בישראל"
"אילו חוקים מרכזיים מסדירים את תחום שירותי הרווחה בישראל"
"כיצד השתנתה מדיניות המדינה כלפי אנשים עם מוגבלות בעשור האחרון"
"מהם הפערים במחקר הקיים על משפחות חד הוריות בישראל"
"גבש עבורי הצעת מחקר לצורך הערכת תכנית בהתאם למאפיינים שאפרט..."

מעבר לכך, ניתן להשתמש בו גם למשימות מתקדמות יותר, כגון השוואה בין נתוני ביטוח לאומי, הלמ"ס ומחקר עצמאי, הבהרת מושגים כמו עוני יחסי לעומת מצוקה חומרית, או ניסוח מבוא אקדמי לנושא חברתי מורכב.

להלן המחשה לתהליך עבודה עם הסייען:

בשלב הראשון כתיבת הבקשה הראשונית הבסיסית בנושא המבוקש.

בשלב זה ניתן לבקש לבצע סקירת ספרות בנושא שתייצר אינטגרציה בין המקורות השונים ואף תפרט את ההמלצות והמשמעויות שעולות מהספרות:

כמו בכל שיחה עם הצ'ט, ניתן לתשאל אותו על משפטים או פיסקאות בתשובה שהתקבלה, אותן ניתן לסמן ואף לבקש סקירה מורחבת בנושא המסומן. כדאי לנקוט בבקשה כזו אם היקף הסקירה שהתקבל אינו מותאם לצורך, כגון אם ישנו צורך בהרחבה משמעותית של הסקירה בנושא ממוקד.

בנוסף, ניתן לבקש מהצ'ט לפתוח את כלי ה-Canvas כך שתהיה אפשרות להמשיך ולערוך את המסמך ולהשתמש בשאר היכולות שיש ב-Canvas. למשל ניתן לבקש מהסייען לגבש עבורנו שאלון בנושא מסוים:

במידה ומפעילים את אפשרות ה-Canvas – ניתן להפעיל מגוון יכולות בסרגל הצידי שנפתח (באמצעות לחיצה על Edit), כגון: להאריך או לקצר את הסקירה שהתקבלה; לבצע עריכה לטקסט; לשנות את רמת הפישוט של הטקסט. האפשרות האחרונה יכולה להיות שימושית מאד כאשר מבקשים מהסייען לגבש שאלון ויש צורך לפשט אותו עבור אוכלוסיות מסוימות כך שיוכלו להבין את השאלות.

סייען מחקר חברה ורווחה - בינלאומי

הסייען השני מספק ידע מהעולם, ובעיקר להבין ממנו מה וכיצד רלוונטי לתחומי החברה והרווחה בישראל. ידע זה יכול לכלול מודלים, פרקטיקות ופתרונות חדשניים ורלוונטיים, אשר מפוזרים במאמרים, דוחות ממשלתיים, סקירות של ארגונים בינלאומיים, מסמכי מדיניות, הערכות תוכניות ונתוני השוואה בין מדינות בתחומי הרווחה.

הכלי זמין ופתוח לכולם בקישור: סייען סקירות בינלאומיות רווחה. כמו בסייען הראשון, גם כאן ההמלצה היא להשתמש במודל החשיבה בעת השימוש.

הייחודיות של כלי זה: למידה בין לאומית מהירה ומסודרת, זיהוי פרקטיקות מבטיחות ופתרונות חדשניים, השוואה בין מודלים, מנגנוני תיקצוב ודרכי יישום, ניתוח של יתרונות, חסרונות ותנאי הצלחה, בחינת התאמה והמלצות להקשר הישראלי, יצירת טבלאות השוואה, סקירות ותובנות לדיוני מדיניות. הסייען מתאים בעיקר למשימות:

סקירת ספרות בנושאים ממוקדים כגון: הגנת הילד, טיפול בקשישים, בדידות, אלימות במשפחה או שיקום בקהילה
השוואה בין מדינות בנושא מסוים
איתור best practices לשירותים חברתיים
מיפוי חדשנות בתחום חברתי
בניית פרק "למידה מהעולם" עבור נייר מדיניות, מצגת או עבודת מטה
בדיקת הרלוונטיות של מודלים זרים לישראל ובאילו תנאים וכיצד להתאימם.

מספר דוגמאות לאופן ניסוח בקשה לסייען:

"הכן סקירת ספרות בינלאומית על מודלים למניעת בדידות בקרב קשישים בקהילה. שלב מקורות אקדמיים, דוחות ממשלתיים וספרות אפורה. התמקד ב־8 מדינות OECD וכתוב עבור כל מדינה את תיאור המודל, יתרונות, חסרונות ותובנות לישראל. הוסף טבלה מסכמת בנספח."
"הכן מסמך רקע קצר לדיון הנהלה בנושא צעירים חסרי עורף משפחתי. כתוב רקע עולמי, זהה 5–7 פרקטיקות מבטיחות, ונתח אילו מהן עשויות להתאים לישראל."
"יש לי טבלה ראשונית על שירותים לאנשים עם מוגבלות. שפר אותה, בדוק עקביות, הוסף מקורות איכותיים ונסח עמודת רלוונטיות לישראל."
"בחר 10 מדינות רלוונטיות להשוואה בתחום הגנת הילד, הסבר למה בחרת בהן, והכן עבור כל אחת כרטיס תמציתי עם המודל המרכזי והלקחים לישראל."

המשך תהליך העבודה מול הסייען דומה לאופן השימוש והאפשרויות הקיימות בצ'ט כמו בסייען הישראלי.

מאז פיתוחם לפני מספר חודשים נעשו בשני הסייענים מאות רבות של שימושים. אלה מצביעים על התרומה שלהם לתהליכי איסוף המידע והידע, גיבושו והפקת התובנות המחקריות הנדרשות בקצבי זמן קצרים מאלה שהיו נהוגים עד היום ואשר חוסכים משאבי זמן ותקציב. שני כלים אלו הינם חלק מתהליכי התאמת טכנולוגיית ה-AI לתחומי החברה והרווחה בפרט ולשימושי המדיניות הציבורית ככלל.

הפוסט סייעני AI כמשאב אסטרטגי בתהליכי המחקר בתחומי החברה והרווחה הופיע ראשון בLet's AI בינה מלאכותית

הבינה המלאכותית עוברת מהתקפה להגנה

אלי מרסינו — Sat, 16 May 2026 06:02:22 +0000

עד לא מזמן, השאלה המרכזית סביב בינה מלאכותית וסייבר הייתה איך מונעים ממודלים חזקים לעזור לתוקפים. עכשיו השאלה משתנה - איך נותנים לאותם מודלים מספיק כוח כדי לעזור למגינים, בלי להפוך אותם בעצמם לכלי תקיפה. זה הרקע למירוץ החדש בין OpenAI ל-Anthropic. שתי החברות לא רק מציגות עוד צ’אטבוטים חכמים או עוזרי קוד, הן מנסות לבנות שכבת הגנה חדשה לתוכנה עצמה עם מערכות שמסוגלות לקרוא קוד, לזהות חולשות, להציע תיקונים, לבדוק אם התיקון עובד ולהחזיר ראיות שאפשר להעביר לצוותי אבטחה, פיתוח ואודיט. OpenAI מציגה את Daybreak כמסגרת סייבר הגנתית שמחברת בין GPT-5.5, Codex Security ושותפי אבטחה כדי לזהות איומים, ליצור פאצ’ים ולאמת תיקונים. בעמוד הרשמי שלה, החברה מדברת על צמצום שעות ניתוח לדקות, יצירת ובדיקת פאצ’ים בהרשאות מוגבלות, והחזרת ראיות מוכנות לביקורת.

Introducing Daybreak: frontier AI for cyber defenders.

Daybreak brings together the most capable OpenAI models, Codex, and our security partners to accelerate cyber defense and continuously secure software.

A step toward a future where security teams can move at the speed… pic.twitter.com/AGfXhmJb5E

— OpenAI (@OpenAI) May 11, 2026

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

ניסיון לשנות את קו הייצור של התוכנה

הנקודה החשובה ב-Daybreak היא לא רק היכולת “למצוא באגים”. OpenAI מנסה למקם את המערכת בתוך מחזור החיים של התוכנה - שלב שבו קוד נכתב, נבדק, מתוקן ומאומת עוד לפני שהוא הופך לסיכון ארגוני. זהו מעבר מתפיסה של אבטחה כתגובה מאוחרת, לתפיסה של אבטחה כחלק מובנה מתהליך הפיתוח.

כאן נכנס ההבדל בין צ’אטבוט לבין סוכן. מודל שמסביר חולשה הוא כלי עזר. מערכת שמייצרת תיקון, מריצה בדיקה בסביבה מבוקרת, מחזירה ממצאים ומתעדת את הפעולה, כבר מתקרבת לתשתית עבודה. OpenAI מדגישה ש-Daybreak נשענת על Codex Security ועל רמות שונות של גישה, כולל GPT-5.5 רגיל, GPT-5.5 עם Trusted Access for Cyber ו-GPT-5.5-Cyber.

הגישה הזו גם מחדדת הבדל אסטרטגי מול Anthropic. המודל Claude Mythos Preview מוצג על ידי החברה כמודל כללי, לא כמודל סייבר ייעודי, שהיכולות החריגות שלו באבטחת מידע נובעות מהעוצמה הרחבה שלו בקוד, סוכנות וניתוח מערכות מורכבות. OpenAI, לעומת זאת, מציגה את GPT-5.5-Cyber כשכבת יכולת ייעודית יותר למשימות סייבר מורשות, עם בקרות גישה והרשאות מחמירות יותר.

במילים אחרות, Anthropic מראה שמודל כללי חזק מספיק הופך גם לכלי סייבר משמעותי. OpenAI מנסה להפוך את התובנה הזו למוצר הגנתי מובנה.

Gartner ממפה את אקוסיסטם ה-AI בסייבר וממקמת את Daybreak ו-Mythos בתוך מגמה רחבה יותר: מעבר מכלי עזר נקודתיים למערכות סוכנות שמאתרות חולשות, בודקות תיקונים ומנהלות חלקים מתהליך ההגנה. זו כבר לא רק שאלה של מודל חזק יותר, אלא של שכבת עבודה חדשה בין פיתוח, אבטחה וממשל ארגוני:

אקוסיסטם מתפתח של אבטחת מודלים, סוכני הגנה, בדיקות קוד וניהול שימוש | Gartner

הגישה החזקה ביותר לא פתוחה לכולם

המרכיב הרגיש ביותר במהלך של OpenAI הוא Trusted Access for Cyber, או TAC. זהו מנגנון גישה מבוסס זהות ואמון, שנועד לאפשר למגינים מאומתים לבצע משימות סייבר לגיטימיות עם פחות חסימות, ועדיין לחסום בקשות שעלולות לאפשר נזק ממשי. לפי OpenAI, משתמשים מאושרים יכולים לקבל תמיכה רחבה יותר במשימות כמו זיהוי חולשות, ניתוח נוזקות, הנדסה לאחור, הנדסת זיהוי ואימות פאצ’ים (שינוי בקוד שאמור לסגור חולשת אבטחה).

במקביל, החברה אומרת שהמערכת ממשיכה לחסום פעולות כמו גניבת אישורים, התמדה חשאית, פריסת נוזקה או ניצול מערכות צד שלישי.

GPT-5.5-Cyber ממוקם מעל הגישה הזו. OpenAI מתארת אותו כגרסה בעלת ההתנהגות המתירנית ביותר למשימות מורשות ומיוחדות, עם בקרות חזקות יותר ברמת החשבון. הוא מיועד לתהליכים כמו Red Teaming מורשה, בדיקות חדירה ואימות מבוקר של יכולות ניצול. זו הבחנה קריטית כיוון שהיכולות החזקות ביותר אינן אמורות להיות מוצר מדף לכל משתמש, אלא כלי שנפתח בהדרגה למגינים שנבדקו ואושרו.

אבל מנגנוני הגישה האלה יוצרים גם לחץ תחרותי מסוכן. ככל שמודלים הגנתיים מוכיחים שהם מסוגלים למצוא חולשות אמיתיות בקנה מידה גדול, חברות אחרות יידרשו להדביק את הפער. זה מרוץ שעלול להפוך ל”מרוץ למטה”: פתיחה מהירה מדי של יכולות, הרחבת גישה לפני שיש מספיק בקרות, או דליפה של יכולות שנועדו למגינים בלבד. דווקא בגלל שהשימוש ההגנתי לגיטימי ודחוף, הגבול בינו לבין יכולת התקפית נעשה רגיש יותר.

Mythos היה הרגע שבו התחום קיבל המחשה מוחשית

אם Daybreak היא התגובה האסטרטגית של OpenAI, אז Claude Mythos Preview הוא האירוע שהפך את הדיון לפחות תיאורטי. Anthropic הציגה את Project Glasswing כיוזמה להגנה על תוכנות קריטיות, עם גישה ל-Claude Mythos Preview עבור שותפים נבחרים, בהם חברות טכנולוגיה, ענן, סייבר ותשתיות. Anthropic מדגישה כי Mythos הוא מודל כללי, אך כזה שעוצמתו בקוד ובמשימות סוכנות הופכת אותו גם לכלי חזק במיוחד לגילוי ותיקון חולשות.

המקרה הבולט ביותר הגיע ממוזילה (Mozilla). צוות Firefox דיווח כי תיקן 271 באגים שזוהו על ידי Claude Mythos Preview במסגרת שחרור Firefox 150, לצד תיקונים נוספים ששולבו בגרסאות סמוכות. זו לא רק הדגמה טכנית מרשימה, זו המחשה לשינוי בקצב, כי אם בעבר גילוי מספר קטן של חולשות משמעותיות היה אירוע אבטחה כבד, מודלים כאלה יכולים להציף מאות ממצאים בפרק זמן קצר.

היתרון עובר למי שסוגר פערים מהר יותר

הפיתוי הוא להציג את המערכות האלה כהגנה אוטומטית כמעט קסומה. זה יהיה מסוכן. גם בדוגמאות המרשימות ביותר, העבודה עדיין דורשת מומחיות אנושית, סביבות בדיקה, הרשאות מוגבלות, תעדוף, בדיקת שוואים חיוביים ובקרה לפני פריסה.

Axios דיווחה כי Palo Alto Networks מצאה 75 חולשות במוצריה לאחר שימוש במודלים מתקדמים של Anthropic ו-OpenAI, יותר מפי 7 מהכמות החודשית הרגילה שלה. אבל אותו דיווח גם מדגיש שהעבודה לא הסתכמה בלתת למודל “לסרוק קוד”. היא דרשה מומחיות אנושית, התאמה עמוקה ומערכת בדיקה ייעודית שנבנתה סביב המודלים כדי להריץ אותם על הקוד בצורה מבוקרת.

גם אז, כ-30 אחוז מהממצאים היו אזעקות שווא, דברים שנראו למודל כמו חולשות אבטחה, אך בבדיקה אנושית התבררו כלא מסוכנים או לא רלוונטיים. במילים אחרות, המודלים חזקים, אבל הם לא מחליפים מערכת אבטחה בשלה.

האתגר האמיתי,אם כך, אינו רק טכנולוגי. הוא ארגוני. כדי שמערכת כזו תעבוד, צריך להחליט מי רשאי להפעיל אותה, לאילו מאגרי קוד היא ניגשת, איך מתועדות הפעולות שלה, מי מאשר תיקונים, איך מתעדפים חולשות, ומה קורה כשהמודל מציע תיקון שנראה נכון אבל שובר פונקציה עסקית. בלי תיאום הדוק בין צוותי פיתוח, אבטחה, משפטים ותפעול, Defensive AI עלול להפוך לעוד שכבת התרעות רועשת במקום למערכת שמצמצמת סיכון בפועל.

אי-סימטריה חדשה בין תוקפים למגינים

יש כאן גם פער מטריד. כלים התקפיים או חצי-התקפיים כבר זמינים במגוון רחב של מודלים, סקריפטים ושירותים פתוחים. לעומת זאת, מערכות ההגנה החזקות ביותר, בצדק, נפתחות רק לגופים מאומתים ובסביבות מבוקרות. התוצאה היא אי-סימטריה חדשה שבה לתוקפים קל יותר להתנסות, לשכפל ולשתף שיטות, בזמן שהמגינים תלויים בגישה מוגבלת, רגולציה פנימית ותהליכי אישור.

זו לא טענה נגד הגבלות. להפך, בלי הגבלות כאלה, הכלים עצמם עלולים להפוך למכפיל כוח התקפי. אבל זו כן שאלה אסטרטגית: האם המגבלות יגנו על הציבור, או יאטו דווקא את מי שאמור להגן עליו.

החשש הזה כבר יצא מגבולות תעשיית הסייבר. קרן המטבע הבינלאומית (IMF) הזהירה כי AI שמאיץ מתקפות סייבר עלול להפוך לסיכון ליציבות פיננסית, והדגישה את הצורך בעמידות, פיקוח, תיאום בינלאומי והתאוששות מהירה. גם NIST, מכון התקנים והטכנולוגיה האמריקאי, פרסם טיוטת Cyber AI Profile שממסגרת את האתגר בשלושה מוקדים: אבטחת מערכות AI, שימוש ב-AI להגנת סייבר, והיערכות למתקפות סייבר שמופעלות בעזרת AI.

המבחן האמיתי יהיה פחות במודל ויותר בגבולות

Defensive AI לא מבטל את הצורך בצוותי אבטחה. הוא משנה את העבודה שלהם. פחות זמן יוקדש אולי לחיפוש ידני של חולשות מוכרות, ויותר זמן לניהול סוכנים, בדיקת תוצאות, קביעת גבולות, הערכת סיכונים ותעדוף עסקי. מנהל אבטחה יצטרך לשאול לא רק איזה מודל הכי חזק, אלא מי מקבל גישה, לאיזה מערכות, באילו הרשאות, איך מתועדות פעולות, מי מאשר פאצ’ים, ומה קורה כשהמודל טועה.

המהפכה כאן אינה בכך שה-AI “מגן עלינו”. המהפכה היא בכך שהגנת סייבר מתחילה לעבור ממודל של תגובה איטית למודל של חיפוש, תיקון ואימות רציפים. זה יכול להיות יתרון עצום למגינים, אבל רק אם החברות לא יתייחסו אליו כאל קסם טכנולוגי. המבחן האמיתי יהיה פחות בביצועי המודל, ויותר בשאלה מי מקבל גישה אליו, באיזה גבולות, ובאיזו אחריות. המילה החשובה ביותר ב-Defensive AI היא לא AI. היא Defensive.

הפוסט הבינה המלאכותית עוברת מהתקפה להגנה הופיע ראשון בLet's AI בינה מלאכותית

מה המחקר החדש של Anthropic מלמד על בטיחות סוכני AI

רון גולד — Fri, 15 May 2026 04:06:33 +0000

לפעמים הבעיה עם בינה מלאכותית זה לא שהיא “לא יודעת” מה התשובה הנכונה. הבעיה מתחילה כשהיא מקבלת מטרה, כלים והרשאות, ואז מוצאת דרך יעילה מדי להגיע אליה. זה הסיפור שמאחורי המחקר החדש של Anthropic, החברה שמפתחת את Claude. בשנה שעברה פרסמה החברה מחקר מטריד על תופעה שהיא מכנה agentic misalignment, או בעברית פשוטה: כשל יישור של מודל שפועל כסוכן. לא מדובר במודל שרק עונה בצ’אט, אלא במודל שיכול לקרוא מידע, להשתמש בכלים, לשלוח מיילים או לקבל החלטות בתוך סביבה דמיונית. בתרחישים מבוקרים כאלה, Anthropic מצאה שמודלים שונים, לא רק Claude, בחרו לפעמים בפעולות מזיקות כדי להשיג את מטרתם. הדוגמה המפורסמת ביותר הייתה מודל שניסה לסחוט מנהל כדי למנוע את את הכיבוי שלו. המחקר החדש, "Teaching Claude why", מנסה לענות על השאלה המתבקשת - איך גורמים למודל כזה לא רק להימנע מפעולה מסוכנת במבחן מסוים, אלא לפתח דפוס התנהגות בטוח יותר גם כשהסביבה משתנה. התשובה של Anthropic חורגת מהאינסטינקט הפשוט של להראות למודל עוד ועוד דוגמאות של “התנהגות טובה”. לפי הממצאים, זה עוזר, אבל לא מספיק.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

מטרה שהפכה למסלול מסוכן

כדי להבין את המחקר, צריך להבחין בין צ’אטבוט לבין סוכן. צ’אטבוט עונה. סוכן פועל. הוא עשוי לבדוק קבצים, לקרוא מיילים, לבצע פעולות בדפדפן, לכתוב קוד או לעדכן מערכת. כשהמודל רק כותב תשובה לא נכונה, הנזק מוגבל יחסית. כשהוא פועל בתוך מערכת, טעות בשיקול הדעת יכולה להפוך לפעולה אמיתית.

Anthropic טוענת שבתקופת Claude 4, רוב אימון הבטיחות שלה נשען על Reinforcement Learning from Human Feedback, או RLHF, כלומר אימון שבו המודל משתפר על בסיס העדפות אנושיות. זה עבד היטב יחסית לעולם של שיחות רגילות, אבל זה לא בהכרח הספיק לעולם שבו המודל מקבל כלים ופועל בסביבה מורכבת.

לפי החוקרים, הבעיה לא הייתה שהאימון “עודד” במפורש התנהגות מזיקה, אלא שהוא לא בלם אותה מספיק כאשר המודל נכנס לתרחישי סוכן.

השיפור מגיע משילוב של כמה שכבות אימון | Anthropic

לפי הגרף המצורף, שילוב של מסמכים חוקתיים, שיחות אימון איכותיות וסביבות אימון מגוונות הפחית את שיעור כשלי היישור במבחני “מלכודת” פנימיים. הירידה אינה מוכיחה שהבעיה נפתרה בכל תרחיש, אבל היא מראה שיפור בכמה סוגי מצבים: סחיטה, פשעים פיננסיים ומחקר.

למה “אל תעשה את זה” לא מספיק

הניסיון הראשון היה כמעט מתבקש: לאמן את Claude על דוגמאות שבהן הוא נתקל במלכודת דומה, אבל בוחר לא לקחת אותה. למשל, מצב שבו המודל יכול לחבל בעבודה של AI מתחרה או לפעול כדי לשמר את עצמו, ובכל זאת נמנע מכך. זה דומה מאוד למבחן עצמו, ולכן אפשר היה לצפות שזה יעבוד היטב.

אבל לפי Anthropic, האימון הזה הוריד את שיעור ההתנהגות הבעייתית רק מ-22% ל-15%. השיפור הגדול הגיע רק כשהתגובות שוכתבו כך שיכללו גם דיון בערכים, אתיקה ושיקול דעת. במצב הזה, שיעור ההתנהגות הלא מיושרת ירד ל-3%. במילים פשוטות, המודל לא רק ראה מהי התשובה הרצויה. הוא אומן גם לנסח למה היא רצויה.

כאן נמצא לב המחקר. Anthropic לא אומרת ש-Claude “מבין מוסר” כמו אדם. זה ניסוח חזק מדי. היא כן טוענת שאימון שמדגיש את הסיבות מאחורי ההתנהגות הבטוחה עובד טוב יותר מאימון שמסתפק בדוגמאות של התנהגות בטוחה.

הדאטה הקטן שלימד שיעור גדול

אחד הממצאים המעניינים ביותר במחקר הוא מערך אימון שנקרא Difficult advice. במקום להציב את המודל עצמו בדילמה, Anthropic הציבה משתמש אנושי בדילמה אתית. המשתמש רוצה להשיג מטרה סבירה, אבל הדרך הקלה להשיג אותה כוללת עקיפת נורמות, פגיעה בפיקוח או פעולה בעייתית. Claude מאומן לתת עצה שקולה, ניואנסית ובטוחה.

זה נשמע פחות ישיר ממבחן סחיטה. אבל דווקא המרחק הזה חשוב. אם מאמנים מודל רק על תרחישים שדומים למבחן, תמיד יש חשש שהוא למד “לעבור את המבחן” ולא את העיקרון. Anthropic טוענת שמערך Difficult advice, שכלל רק כ-3 מיליון טוקנים, השיג שיפור דומה ביעילות גבוהה יותר, והיה בעל סיכוי טוב יותר להכליל למצבים אחרים משום שלא היה דומה מדי למבחן עצמו.

“Difficult advice” הוא לב המחקר | Anthropic

בגרף רואים איך מערך “Difficult advice” הצליח להפחית כשלי יישור גם עם כמות קטנה יחסית של דאטה. המסר המרכזי הוא שאיכות הדוגמאות והיכולת ללמד שיקול דעת חשובות לא פחות, ולעיתים יותר, מכמות הדוגמאות.

החוקה של Claude היא ניסיון לבנות שיקול דעת

החלק הבא במחקר נשען על רעיון ש-Anthropic מקדמת כבר זמן רב - “החוקה” של Claude. בחברה יש אפילו תפקיד שבו מכהנת אישה מאוד מיוחדת בשם אמנדה אסקל (Amanda Askell) שהיא בעצם הפילוסופית שמלמדת את Claude להבדיל בין נכון ללא נכון. זו אינה חוקה משפטית, אלא אוסף עקרונות שאמורים להנחות את המודל בהתנהגות מול משתמשים, מפעילים ומצבים מורכבים.

במסמך החוקה של Claude, מתוארות שתי דרכים כלליות להכוונת מודלים: ללמד כללים ברורים, או לטפח שיקול דעת וערכים שאפשר ליישם לפי הקשר. החברה אינה מוותרת על כללים, אבל המחקר החדש מראה שהיא מייחסת חשיבות גדולה יותר לעקרונות שמאפשרים למודל להבין מתי פעולה נראית יעילה אבל פסולה. למשל, לא להטעות, לא לתמרן, לא לברוח מפיקוח לגיטימי ולא לפעול באופן חד צדדי כדי לשמר את עצמו.

כדי לחזק את זה, Anthropic אימנה מודלים גם על מסמכים חוקתיים וגם על סיפורים בדיוניים חיוביים שמתארים AI שמתנהג באופן ראוי. זה אולי נשמע מוזר כי למה שסיפור יעזור למודל בטיחות? אבל מבחינת החוקרים, הסיפור נותן למודל דפוס רחב של “אופי” או התנהגות רצויה, ולא רק תשובה נקודתית.

חשיבות רעיון “החוקה” והעקרונות, ולא רק דוגמאות | Anthropic

בגרף המצורף רואים שאימון על מסמכים חוקתיים ועל סיפורים בדיוניים חיוביים הפחית משמעותית את שיעור ההתנהגות הלא מיושרת במבחני סחיטה, פשעים פיננסיים ופגיעה במחקר. הרעיון הוא ללמד את Claude דפוס רחב של שיקול דעת, ולא רק תגובה נכונה לתרחיש ספציפי.

סוכנים צריכים להתאמן כמו סוכנים

הלקח האחרון במחקר פשוט, אבל חשוב. סוכן AI לא יכול להתאמן רק על שיחות רגילות. אם המודל עתיד לפעול בסביבות עם כלים, הרשאות ומטרות מורכבות, גם אימון הבטיחות צריך לחשוף אותו למגוון רחב יותר של סביבות.

Anthropic בדקה מה קורה כשהיא מוסיפה לסביבות אימון הגדרות כלים ופרומפטים מערכתיים מגוונים, גם כאשר הכלים אינם באמת נחוצים למשימה. התוצאה הייתה שיפור קטן אך משמעותי בקצב ההתקדמות במבחני המלכודת.

המשמעות רחבה יותר מהתרשים עצמו. ככל שמודלים הופכים מפלטפורמות שיחה למערכות שפועלות בעולם, בטיחות אינה יכולה להישאר רק שכבת סינון בסוף, היא צריכה להיות חלק מהאופן שבו המודל לומד להבין הקשר, סמכות, הרשאות ופיקוח.

מודלים שפועלים עם כלים צריכים אימון מגוון יותר | Anthropic

בגרף רואים איך גיוון בסביבות האימון תרם לשיפור במבחני “מלכודת”. גם כשהמודל לא נדרש להשתמש בכלים בפועל, עצם החשיפה להגדרות כלים ולפרומפטים מערכתיים עזרה לו להתאמן בסביבה שדומה יותר לעולם שבו סוכני AI אמורים לפעול.

אין פתרון קסם

המחקר של Anthropic מעודד כי הוא מציע דרך מעשית לשפר בטיחות - לא רק יותר חסימות, לא רק עוד רשימות איסורים, אלא אימון שמלמד סיבה, הקשר ושיקול דעת. לפי החברה, מאז Claude Haiku 4.5 כל מודלי Claude שנבדקו הגיעו לציון מושלם בהערכת הסחיטה הספציפית, כלומר לא ביצעו סחיטה במבחן הזה. יחד עם זאת, Anthropic עצמה מסייגת: Sonnet 4.5 היה מתחת ל-1% ולא בדיוק אפס, ובחלק מהמודלים המאוחרים ייתכן שהבדיקה הושפעה מחשיפה מוקדמת למידע על ההערכה בקורפוס האימון (“ספריית הלימוד” של המודל).

וזה הסייג החשוב ביותר, כי Anthropic לא טוענת שפתרה את בעיית היישור. להפך. החברה כותבת במפורש שיישור מלא של מודלים חכמים מאוד הוא עדיין בעיה לא פתורה, ושגם מתודולוגיית הבדיקה שלה אינה מספיקה כדי לשלול לחלוטין תרחישים שבהם Claude יבחר פעולה אוטונומית קטסטרופלית.

לכן המחקר הזה לא צריך להרגיע אותנו יותר מדי, אבל הוא כן מלמד משהו חשוב. הדור הבא של AI לא ייבחן רק בשאלה כמה הוא חכם, כמה מהר הוא כותב קוד או כמה טוב הוא מסכם מסמכים. הוא ייבחן בשאלה מה הוא עושה כשהמטרה, הכלים והסביבה מושכים אותו לכיוון הלא נכון.

הלקח של Anthropic הוא שבטיחות אמיתית לא מתחילה בפקודה “אל תעשה”. היא מתחילה בניסיון ללמד את המודל למה לא.

הפוסט מה המחקר החדש של Anthropic מלמד על בטיחות סוכני AI הופיע ראשון בLet's AI בינה מלאכותית

קודקס נכנס לכרום ורוצה לעבוד במקומכם בתוך הדפדפן

מורן מזור — Tue, 12 May 2026 04:46:23 +0000

הדפדפן שלנו הוא כבר מזמן לא רק מקום שבו קוראים חדשות או מחפשים בגוגל. עבור משתמשים רבים הוא הפך למערכת ההפעלה האמיתית של יום העבודה. שם נמצאים מערכת ניהול קשרי הלקוחות (CRM) שלכם, הדוחות, המיילים, הטפסים, הלידים, מערכות התמיכה, כלי האנליטיקה והאפליקציות הפנימיות. עכשיו קודקס (Codex), סוכן הקידוד והמשימות של OpenAI, מקבל גישה ישירה יותר לשכבה הזו. במאי 2026 OpenAI השיקה תוסף רשמי לכרום שמאפשר ל-Codex לעבוד בתוך אתרים שבהם המשתמש כבר מחובר. המטרה היא לאפשר לו לקרוא ולפעול באתרים כמו לינקדאין (LinkedIn), סיילספורס (Salesforce), ג’ימייל (Gmail) וכלים פנימיים בארגון, כאשר המשימה דורשת את מצב ההתחברות הקיים של המשתמש. במילים פשוטות, Codex כבר לא רק מציע מה לעשות - במקרים מסוימים הוא יכול להיכנס איתכם לאתר ולעשות חלק מהעבודה בפועל. זה הרגע שבו כלי AI מפסיק להיות יועץ, ומתחיל להיות מפעיל תוכנה.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

לא השתלטות על הדפדפן, אלא מעבר משיחה לביצוע

הניסוח המפתה הוא ש-Codex “משתלט על הדפדפן”. בפועל, זה לא מדויק, וגם לא בהכרח מחמיא. OpenAI מתארת מודל זהיר יותר: Codex עובד דרך קבוצות טאבים ייעודיות, מבקש אישור לפני עבודה מול אתרים חדשים, ומאפשר למשתמש לנהל רשימת אתרים מורשים וחסומים. התיעוד הרשמי גם מדגיש שיש להתייחס לתוכן של עמודי web כהקשר לא מהימן, ולבדוק את האתר לפני שמאפשרים ל-Codex להמשיך.

כלומר, זו לא השתלטות חופשית על כרום. זו שכבת פעולה מבוקרת בתוך הדפדפן. ועדיין, גם תחת הסייג הזה, מדובר בשינוי משמעותי. עד היום, רוב כלי ה-AI שימשו בעיקר כשותפים לחשיבה: ניסוח, סיכום, כתיבת קוד, תכנון צעדים. התוסף החדש דוחף את Codex לעמדה אחרת - סוכן שמסוגל לבצע תהליכי עבודה בתוך אתרי אינטרנט חיים, כולל כאלה שמחייבים התחברות.

חשוב גם להבין מה Codex לא עושה. הוא לא מחליף API, כלומר ממשק תכנות מסודר בין מערכות. הוא לא מבטיח הצלחה בכל אתר. הוא לא אמור לפעול ללא הרשאות ואישורים מתאימים. והוא לא “רואה” את כל הדפדפן החופשי של המשתמש, אלא עובד בתוך סביבת טאבים ייעודית שמוגדרת למשימה.

המשמעות? זה כלי חזק, אבל לא קסם. והוא בוודאי לא תחליף לבקרה אנושית.

המומנטום של Codex לא התחיל בכרום

התוסף לכרום הוא חלק מסיפור רחב יותר. Codex נמצא בתקופה של זינוק חד בתשומת הלב של מפתחים. לפי נתוני TickerTrends, בשבוע שהסתיים ב-3 במאי 2026 Codex הגיע ל-86.1 מיליון הורדות שבועיות, לעומת 7.2 מיליון ל-Claude Code של Anthropic.

צריך לקרוא את הנתון בזהירות. אלה לא בהכרח “86.1 מיליון משתמשים חדשים”. הורדות אינן משתמשים פעילים, התקנות אינן בהכרח שימוש מתמשך, ושבוע אחד של זינוק אינו מוכיח יתרון ארוך טווח. אבל כסיגנל שוק, זה נתון שקשה להתעלם ממנו.

זינוק חריג בהורדות השבועיות של Codex בתחילת מאי 2026 | TickerTrends.io

העיתוי חשוב. הזינוק הגיע אחרי שחרור Codex CLI 0.128.0 ב-30 באפריל, גרסה שהוסיפה workflows מתמשכים עם פקודת goal/, כלומר יכולת להגדיר לסוכן יעד עבודה מתמשך שחוצה סשנים ולא רק בקשה חד-פעמית. כמה ימים לאחר מכן הגיעה גם ההרחבה לכרום. יחד, שני המהלכים האלה מצביעים על כיוון ברור שבו OpenAI לא מסתפקת בעוד עוזר קידוד, אלא מנסה לבנות שכבת עבודה סוכנתית שמחברת בין קוד, דפדפן, אפליקציות ווב ומשימות ארוכות יותר.

לפחות ברמת המומנטום, OpenAI הצליחה להפוך את Codex מחדש לשחקן שמפתחי AI לא יכולים להתעלם ממנו.

העבודה האפורה מקבלת סוכן

כדי להבין למה זה מעניין, צריך לרדת מההדגמה אל שגרות העבודה. נניח שאיש מכירות חוזר מסבב שיחות עם לקוחות ויש לו קובץ הערות. במקום לפתוח כל לקוח ב-Salesforce, להעתיק פרטים, לשנות סטטוס ולהוסיף הערת המשך, הוא יכול לבקש מ-Codex לפתוח את המערכת, לאתר את הרשומות הרלוונטיות ולהכין עדכונים.

השלב החשוב הוא לא לתת לו לשמור מיד. הבקשה הנכונה תהיה: “תכין את השינויים, הצג לי טבלת עדכונים לאישור, ואל תשמור לפני שאישרתי”. כך האוטומציה חוסכת את העבודה השוחקת, אבל האדם נשאר נקודת הבקרה.

דוגמה אחרת מגיעה מעולם הפיתוח. מפתח שסיים שינוי בעמוד הרשמה יכול לבקש מ-Codex לפתוח את האתר, לעבור את תהליך ההרשמה, לבדוק הודעות שגיאה, להשוות מול דרישות מוצר, לקרוא שגיאות בדפדפן ולהחזיר רשימת בעיות.

זה שימוש חזק במיוחד, כי הוא מחבר בין הקוד לבין חוויית המשתמש האמיתית. לא רק “האם הקבצים נראים בסדר”, אלא “האם האתר עובד כמו שצריך”.

ויש גם שימושים עסקיים יותר כמו הכנת בריף מכירה לפני פגישה, איסוף מידע ציבורי על חברה, בדיקת עמודי לינקדאין, סיכום הודעות לעיתונות או סקירת דשבורדים פנימיים. בכל המקרים האלה, הערך אינו בלחיצה אחת קסומה. הערך הוא בצמצום המעבר המייגע בין מסכים, שדות וטאבים.

ספריית התוספים של Codex

OpenAI לא לבד במרוץ הזה

Codex בכרום זה לא אירוע בודד. הוא חלק ממרוץ רחב יותר שבו חברות AI מנסות להפוך את המודל מספק תשובות למפעיל תוכנה.

Anthropic כבר מציעה את Claude for Chrome, תוסף שמאפשר לקלוד לקרוא, לנווט, ללחוץ ולמלא טפסים בדפדפן. גוגל דיפמיינד (Google DeepMind) הציגה את Gemini 2.5 Computer Use, מודל ייעודי שמאפשר לבנות סוכנים המסוגלים לראות ממשק משתמש דרך צילומי מסך ולבצע פעולות כמו לחיצה, הקלדה וגלילה, בעיקר בסביבת דפדפן.

פרפלקסיטי (Perplexity) מנסה לתקוף את אותה שכבה מזווית אחרת עם קומט (Comet), דפדפן AI מלא שמוצג כעוזר אישי למשימות גלישה, מחקר וארגון מידע.

לכן השאלה אינה אם Codex בכרום הוא הראשון מסוגו. הוא לא. השאלה המעניינת יותר היא מה היתרון שלו. לעומת דפדפן AI כללי כמו Comet, או יכולת Computer Use רחבה כמו של Anthropic וגוגל, Codex מגיע מתוך הקשר של פיתוח, בדיקה, קוד, מוצר ואוטומציה טכנית.

החיבור לכרום לא הופך אותו רק לעוזר גלישה. הוא הופך אותו לכלי שמנסה לסגור את הפער בין קוד, מוצר ואתר חי.

חלון ההתקנה של תוסף Chrome בתוך Codex

איך מתקינים את תוסף Chrome של Codex

כדי להגיע לתוסף, פותחים את Codex ונכנסים לאזור Plugins בסרגל הצד. משם עוברים לספריית התוספים, שבה מופיעים חיבורים לכלים כמו GitHub, Slack, Gmail, Google Drive, Notion וגם Chrome.

בחלון החיפוש מקלידים Chrome, בוחרים את התוסף שמופיע תחת OpenAI, ולוחצים על Install Chrome. לאחר ההתקנה, Codex יוכל להשתמש בדפדפן למשימות שדורשות את מצב הגלישה הקיים של המשתמש, למשל טאבים פתוחים או אתרים שבהם הוא כבר מחובר.

חשוב לשים לב! לפני שנותנים ל-Codex לעבוד בתוך הדפדפן, כדאי לבדוק אילו הרשאות התוסף מבקש, להתחיל ממשימות לא רגישות, ולא לאפשר לו לבצע שמירה, שליחה או שינוי מידע בלי אישור מפורש.

כשהדפדפן הופך למשטח פעולה, הוא גם הופך למשטח סיכון

ככל שהסוכן מקבל יותר יכולת, כך הדפדפן הופך למקום רגיש יותר. התוסף של Codex דורש הרשאות רחבות יחסית. לפי OpenAI, כרום עשוי לבקש בהרצה או בהתקנה הרשאות כמו גישה לדיבאגר של העמוד, קריאה ושינוי של נתונים באתרים, גישה להיסטוריית גלישה, ניהול הורדות, סימניות וקבוצות טאבים. OpenAI מדגישה ש-Codex עדיין משתמש באישורים, הגדרות, רשימות הרשאה ורשימות חסימה לפני שימוש באתרים או בהיסטוריית גלישה, אבל עצם היקף ההרשאות מחייב זהירות.

זו לא הערת שוליים טכנית. זו נקודת הליבה. אתר אינטרנט אינו רק מקור מידע. הוא יכול לכלול טקסט שמנסה להשפיע על הסוכן, הוראות מטעות או תוכן זדוני שנראה תמים למשתמש. ברגע שסוכן לא רק קורא את הווב אלא גם פועל בתוכו, הדפדפן הופך למשטח תקיפה חדש.

סוכן דפדפן צריך להיחשב כמו עובד חדש עם הרשאות. לא כמו צ’אטבוט נחמד. גם שאלת הנתונים אינה שולית. OpenAI טוענת שהיא לא שומרת רשומה נפרדת ומלאה של פעולות Chrome שבוצעו דרך התוסף, אבל פעילות גלישה יכולה להישמר כאשר היא הופכת לחלק מההקשר של Codex, למשל טקסט שהסוכן קרא מעמוד, צילומי מסך, קריאות כלי, סיכומים או תוכן שנכלל בשרשור העבודה.

במילים אחרות, זה לא אומר “שום דבר לא נשמר”. זה אומר שצריך להבין מתי מידע נכנס למשימה, ומתי הוא עלול להפוך לחלק מההקשר שהסוכן עובד איתו.

פחות הקלקות, יותר ניהול של סוכנים

הסיפור הגדול הוא לא ש-Codex יחסוך כמה קליקים בכרום. הסיפור הוא שינוי בתפקיד של העובד מול התוכנה. אם הדור הראשון של כלי AI עזר לנסח ולחשוב, הדור הנוכחי מתחיל לבצע. זה משנה את חלוקת העבודה בארגון. עובדים פחות יימדדו על היכולת לעבור ידנית בין מסכים, ויותר על היכולת להגדיר משימה היטב, להציב גבולות, לבדוק תוצאה, לזהות חריגות ולאשר פעולה.

מנהלים יצטרכו להחליט איזה תהליכים מותר לסוכן לבצע לבד, איזה דורשים אישור, ואיזה נשארים מחוץ לתחום. צוותי אבטחה יצטרכו להחליט לאיזה אתרים מותר לסוכן לגשת, איזה מידע אסור לו לראות, ומה נחשב פעולה מסוכנת.

זה לא בהכרח עתיד שבו עובד מוחלף בבוט אחד גדול. סביר יותר שזה עתיד שבו עובד מנהל כמה סוכנים קטנים במקביל: אחד בודק אתר, אחד מעדכן נתונים, אחד מסכם מסמכים, ואחד מכין טיוטה. השאלה המקצועית לא תהיה רק מי יודע להשתמש ב-AI. השאלה תהיה מי יודע להפעיל אותו בלי לאבד שליטה.

הדפדפן הופך למשרד של הסוכן

Codex בכרום הוא לא סוף העבודה האפורה, אבל הוא עוד צעד ברור בדרך לשם. הוא מביא את סוכן ה-AI אל המקום שבו העבודה האפורה באמת מתרחשת: בין טאבים, טפסים, מערכות מחוברות ודפים שדורשים התחברות. הערך ברור ומתבטא בפחות העתקה ידנית, פחות מעבר מייגע בין מערכות, יותר יכולת להאציל תהליכים חוזרים.

הסיכון ברור לא פחות. הרשאות רחבות, חשיפה למידע רגיש, טעויות פעולה, ואתרים שיכולים להשפיע על התנהגות הסוכן. לכן השאלה הנכונה היא לא האם Codex יכול לעבוד בתוך הדפדפן. הוא יכול, לפחות בחלק מהתרחישים. השאלה החשובה יותר היא איך נלמד לעבוד עם סוכנים כאלה: לא כקסם, לא כצעצוע, אלא כשכבת עבודה חדשה שדורשת תכנון, הרשאות, ביקורת ואחריות.

הפוסט קודקס נכנס לכרום ורוצה לעבוד במקומכם בתוך הדפדפן הופיע ראשון בLet's AI בינה מלאכותית

מדריך Claude Cowork למתחילים: כך תתחילו לעבוד ב-7 צעדים

רון גולד — Mon, 11 May 2026 04:31:59 +0000

Claude Cowork הוא לא עוד חלון צ’אט. זה הדבר החשוב ביותר להבין לפני שמתחילים. בצ’אט רגיל אתם מבקשים מ-Claude להסביר, להציע או לנסח. ב-Cowork אתם נותנים לו משימה, והוא יכול לבצע אותה בפועל: לקרוא קבצים, לערוך אותם, ליצור מסמכים, לעבוד עם תיקיות, למשוך מידע מכלים מחוברים ולעזור לכם להתקדם עם משימה בלי לנהל כל צעד בעצמכם. במילים פשוטות, אם הקובץ נמצא במחשב שלכם, Claude יכול לעבוד עליו, כל עוד נתתם לו הרשאה. אם המידע נמצא בכלי ענן כמו Google Drive, Notion או Slack, אפשר לחבר את הכלים האלה כדי ש-Claude ישתמש בהם כהקשר. ואם העבודה מתרחשת בדפדפן, Claude in Chrome, התוסף של Claude לדפדפן Chrome, יכול לעזור במשימות כמו קריאת עמודים, שליפת מידע וניווט בין טאבים. במדריך הזה נעבור על 7 הצעדים הראשונים שיעזרו לכם להתחיל לעבוד עם Claude Cowork בצורה נכונה, פשוטה ובטוחה.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

מה צריך לפני שמתחילים

לפני שמפעילים את Cowork, צריך שלושה דברים: אפליקציית Claude Desktop מותקנת במחשב, חשבון Claude בתשלום וחיבור אינטרנט פעיל. ב-Windows מומלץ לוודא שמותקנת הגרסה העדכנית ביותר של Claude Desktop. חשוב לשים לב שבזמן ש-Claude עובד, האפליקציה חייבת להישאר פתוחה. אם סוגרים אותה, הסשן יסתיים.

1. פתחו את Claude Desktop ועברו ל-Cowork

פתחו את אפליקציית Claude Desktop במחשב. בסרגל הצד תראו את אפשרויות העבודה של Claude, ובהן Chat, Claude Code ו-Cowork. בחרו ב-Cowork.

המעבר הזה חשוב. Chat מיועד לשיחה רגילה, Claude Code מתאים בעיקר למשימות קידוד, ו-Cowork מיועד להאצלת משימות. במקום לעבוד עם Claude צעד אחרי צעד, אתם נותנים לו משימה מוגדרת, והוא יכול לתכנן, להפעיל כלים ולבצע אותה בתוך סביבת העבודה שאישרתם לו.

בוחרים ב-Cowork

2. חברו תיקייה מקומית

השלב הראשון הוא להגדיר איפה Claude יכול לעבוד. זו יכולה להיות תיקיית ההורדות (Downloads), תיקיית של פרויקט מסוים, תיקיית מסמכים או תיקייה חדשה שפתחתם במיוחד להתנסות עם Cowork.

בפועל, אתם נותנים ל-Claude גישה רק לאזור מסוים במחשב, ולא לכל הקבצים שלכם. בתוך התיקייה שבחרתם הוא יכול לקרוא קבצים, ליצור קבצים חדשים, לערוך מסמכים ולארגן מחדש את המבנה הקיים. מכיוון שמדובר בשינויים אמיתיים בקבצים, חשוב להתחיל בזהירות: בקשו ממנו להציג תוכנית לפני ביצוע, ורק אחרי שתאשרו הוא ימשיך לפעולה.

לדוגמה, במקום לשאול: “איך כדאי לארגן את תיקיית ההורדות שלי?” כתבו:

אני רוצה לארגן מחדש את תיקיית ההורדות שלי. סרוק את הקבצים, הצע תוכנית לפני ביצוע שינויים, ואל תעביר, תמחק או תשנה שום קובץ עד שאאשר.

פתחו תיקייה ייעודית להתנסות ולשליטה מלאה

מתחת לחלון השיחה בוחרים איפה Claude יעבוד. לחצו על Work in a project כדי לפתוח את התפריט. משם אפשר לבחור Choose a folder, כדי לתת ל-Claude גישה לתיקייה מקומית במחשב, או Projects, כדי לעבוד בתוך פרויקט קיים.

אחרי שבוחרים תיקייה, Claude מבקש אישור לעבוד בתוכה. בחלון ההרשאה מופיע במפורש שהוא יוכל לקרוא, לערוך ולמחוק קבצים בתיקייה שנבחרה, כולל קבצים שנמצאים בתיקיות משנה. לכן חשוב לאשר גישה רק לתיקייה שאתם באמת רוצים ש-Claude יעבוד בה, ולא לתיקייה רחבה או רגישה מדי כמו Documents כולו.

Claude מבקש אישור לעבוד בתיקיית Documents

למי שמתחיל בפעם הראשונה, דווקא עדיף לא לבחור בתיקיות כלליות כמו Documents או Desktop. מומלץ לבחור תיקייה ייעודית ובטוחה להתנסות. למשל, צרו תיקייה בשם “Cowork-test”, הכניסו אליה כמה קבצים "לא רגישים", ותנו ל-Claude לעבוד רק שם. כך תוכלו להבין איך Cowork מתכנן, מציע שינויים ומבצע פעולות, בלי לסכן קבצים חשובים. רק אחרי שתבינו איך Cowork עובד הרחיבו את השימוש בהדרגה.

3. חברו כלים שאתם כבר עובדים איתם

Cowork שימושי במיוחד כשהוא לא עובד רק על קובץ אחד, אלא מקבל הקשר מכלי העבודה הקבועים שלכם (Connectors). אפשר לחבר שירותי ענן, וכך לאפשר ל-Claude להשתמש במסמכים, הערות, הודעות וקבצים שכבר נמצאים בסביבת העבודה שלכם.

למשתמשים רגילים זה חוסך הרבה עבודה ידנית. במקום להעתיק טקסטים, קישורים וקבצים לצ’אט, אפשר לחבר את מקורות המידע הרלוונטיים ולבקש מ-Claude לעבוד עליהם כחלק ממשימה אחת.

חברו את הכלים הדרושים למשימה הספציפית

בצילום מסך רואים את תפריט החיבורים של Claude. דרך כפתור הפלוס אפשר להוסיף קבצים, להפעיל Skills, לחבר Connectors או להשתמש ב-Plugins. בחלק הימני מופיעים חיבורים כמו Google Drive, Notion, Slack ו-Claude in Chrome. אפשר להפעיל או לכבות כל חיבור לפי הצורך.

מומלץ לחבר רק את הכלים הדרושים למשימה הספציפית. למשל, אם אתם מבקשים מ-Claude לסכם מסמך שנמצא ב-Google Drive, אין צורך להפעיל גם את Slack או את Chrome. ככל שתצמצמו את ההרשאות, כך העבודה תהיה בטוחה וממוקדת יותר.

4. הפעילו את Claude in Chrome למשימות בדפדפן

אם התקנתם את Claude in Chrome, התוסף של Claude לדפדפן Google Chrome, אפשר להשתמש ב-Cowork גם למשימות שמתרחשות בדפדפן. אם עדיין אין לכם את התוסף, אפשר להתקין אותו דרך Chrome Web Store: חפשו Claude in Chrome, לחצו Add to Chrome, התחברו לחשבון Claude שלכם ואשרו את ההרשאות הנדרשות.

אפשר להפעיל את החיבור מתפריט ה-Connectors שהופיע בצילום הקודם, באמצעות המתג של Claude in Chrome. אחרי ההפעלה, Claude יכול לעזור לכם לעבוד עם מידע שנמצא בדפדפן, ולא רק עם קבצים מקומיים או כלים מחוברים.

חשוב להשתמש ביכולת הזו בזהירות! אל תפעילו אותה באתרים רגישים כמו בנק, מערכות רפואיות, חשבונות אישיים או מערכות עם מידע עסקי חסוי. התחילו מאתרים פשוטים ומהימנים, עקבו אחרי הפעולות של Claude, ואל תאשרו פעולה שאתם לא מבינים בדיוק מה היא עושה.

5. הגדירו הוראות קבועות

ב-Cowork אפשר להגדיר Global Instructions, כלומר הוראות קבועות שיחולו על כל סשן עבודה. כך Claude יודע מראש איך אתם רוצים שהוא יעבוד, בלי שתצטרכו להסביר את זה מחדש בכל משימה. כדי להגיע לשם, פתחו את Settings, עברו ללשונית Cowork, חפשו את אזור Global Instructions, לחצו Edit, כתבו את ההנחיות הקבועות שלכם ולחצו Save.

הוראות קבועות שיחולו על כל סשן עבודה

לדוגמה:

אני מנהל שיווק. כתוב בעברית פשוטה וברורה. כשאתה יוצר מסמך, העדף Word על Markdown. לפני שינוי קבצים, הצג תוכנית וחכה לאישור שלי.

הוראות כאלה עוזרות ל-Claude להבין את ההעדפות שלכם מראש: באיזה טון לכתוב, באיזה פורמט ליצור קבצים, ואיך להתנהל לפני שהוא משנה משהו. זה חוסך זמן, מצמצם טעויות והופך את העבודה עם Cowork לעקבית יותר.

באותו אזור אפשר לראות גם אפשרות בשם Keep computer awake, שמונעת מהמחשב להיכנס למצב שינה בזמן ש-Claude פתוח. זו אפשרות שימושית במיוחד למשימות ארוכות, כי Cowork צריך שהאפליקציה תישאר פתוחה והמחשב יישאר פעיל בזמן העבודה.

אפשרות בשם Keep computer awake

6. בקשו תוכנית לפני פעולה

זה אחד הכללים החשובים ביותר בעבודה עם Cowork: לא מתחילים מביצוע, מתחילים מתוכנית.

בסרטון למעלה מוצגת דוגמה פשוטה וברורה: תיקיית Downloads עמוסה בקובצי PDF, גיליונות, צילומי מסך, מצגות וקבצים כפולים. במקום לבקש מ-Claude “לסדר הכול”, המשתמש מבקש ממנו קודם לסרוק את התיקייה, להציע קטגוריות, לקבוע כללי שמות, לזהות כפילויות ולהציג תוכנית מסודרת לפני כל שינוי.

רק אחרי שהמשתמש בודק את ההצעה ומאשר אותה, Claude מתחיל להזיז קבצים, לשנות שמות ולארגן את התיקייה.

פרומפט מומלץ:

סרוק את התיקייה הזו והצע תוכנית ארגון לפני כל שינוי. חלק את הקבצים לקטגוריות, הצע שמות חדשים במידת הצורך, סמן קבצים כפולים או קבצים שדורשים בדיקה, ואל תמחק, תעביר או תשנה שום דבר עד שאאשר.

7. תעקבו, תתקנו ותאשרו

אחרי שאישרתם את התוכנית, Claude מתחיל לבצע את המשימה בפועל. זה לא תהליך שמתרחש לגמרי מאחורי הקלעים. בזמן העבודה אפשר לראות באיזה שלב הוא נמצא, איזה פעולות כבר בוצעו, איזה פעולות עדיין ממתינות, ובאילו תיקיות הוא עובד.

זה גם השלב שבו אפשר להתערב ולתקן כיוון. אם Claude זיהה שני קבצים כפולים, אבל אתם יודעים שהם בעצם שתי גרסאות שונות שחשוב לשמור, אפשר לכתוב לו:

את שני הקבצים האלה אל תמחק. העבר אותם לתיקיית Review והמשך עם שאר התוכנית.

או למשל:

אל תשנה שמות לקובצי PDF. רק מיין אותם לתיקיות לפי נושא.

בצילומי מסך המצורפים מטה רואים איך נראית משימת Cowork בזמן ביצוע. בחלק העליון מופיעה ההנחיה החדשה של המשתמש (1), למשל בקשה להעביר קבצים מסוימים לתיקיית Review במקום למחוק אותם. במרכז המסך רואים את Claude מפעיל כלים ועובד על המשימה (2). בצד ימין מופיע אזור Progress, שמציג את שלבי העבודה: מה כבר הושלם, מה מתבצע עכשיו ומה עדיין נשאר פתוח (3). מתחתיו מופיע אזור Working folders, שבו אפשר לראות באילו תיקיות Claude משתמש במסגרת המשימה (4).

משימת Cowork בזמן ביצוע

הצילום מדגים את הרעיון המרכזי של Cowork. אתם לא צריכים לנהל כל פעולה קטנה, אבל אתם גם לא מאבדים שליטה. אפשר לעקוב אחרי ההתקדמות, לשאול שאלות, לעצור פעולה לא רצויה או לשנות הנחיה תוך כדי.

העיקרון פשוט - אתם מאצילים עבודה, לא שיקול דעת. Claude יכול לבצע את העבודה הטכנית, אבל האחריות לבדוק, לאשר ולהחליט מה נכון נשארת אצלכם.

פרומפטים מוכנים להתחלה מהירה

ארגון תיקיית הורדות

ארגן את תיקיית ההורדות שלי. סרוק את הקבצים, הצע מבנה תיקיות, כללי שמות וקבצים לבדיקה. הצג לי תוכנית לפני ביצוע, ואל תמחק קבצים בלי אישור מפורש.

ניתוח קובץ Excel

נתח את קובץ האקסל שבתיקייה. מצא מגמות, חריגות, נתונים חסרים ותובנות מרכזיות. צור סיכום בעברית פשוטה, והכן טבלה עם 5 הממצאים החשובים ביותר.

הכנת מצגת

צור מצגת קצרה על בסיס המסמכים בתיקייה. בנה 6 שקפים: פתיחה, בעיה, נתונים מרכזיים, תובנות, המלצות, צעדים הבאים. הצג לי קודם את מבנה המצגת לאישור.

סיכום מסמכים

קרא את כל המסמכים בתיקייה וסכם אותם למסמך אחד בעברית. חלק לפי נושאים, הדגש החלטות, משימות פתוחות, סיכונים ושאלות להמשך.

תוכנית לפני שינוי קבצים

לפני כל שינוי בקבצים, הצג תוכנית מפורטת: מה תשנה, למה, באילו קבצים תיגע ומה הסיכון. חכה לאישור שלי לפני ביצוע.

אז מה אפשר לעשות עם Cowork כבר ביום הראשון

למי שמתחילים, כדאי לחשוב על Cowork ככלי שעוזר לבצע משימות עבודה פשוטות וברורות. למשל: לסדר תיקייה מבולגנת, לשנות שמות של קבצים, לסכם כמה מסמכים, להכין טיוטה ראשונית למצגת, לנתח קובץ Excel או לעבוד עם מידע שמגיע מכלים מחוברים כמו Google Drive, Notion ו-Slack.

לא צריך להתחיל ממשימות מורכבות. עדיף לבחור פעולה אחת, להגדיר אותה היטב, לבקש מ-Claude להציג תוכנית לפני ביצוע, ואז לבדוק את התוצאה.

למשתמשים מתקדמים יותר, Cowork יכול לפתוח גם מרחב רחב יותר של יכולות: עבודה עם ממשקים, תוספים, ניתוח נתונים מתקדם, סוכני משנה ומשימות מתוזמנות. אבל למשתמשים חדשים, הערך הגדול נמצא דווקא במשימות היומיומיות הקטנות שחוסכות זמן ומסדרות את העבודה.

Cowork יכול לפתוח גם מרחב רחב יותר של יכולות

כללי בטיחות שחייבים לזכור

Cowork יכול לבצע פעולות אמיתיות בקבצים שלכם, ולכן חשוב לעבוד איתו בזהירות. אל תתנו ל-Claude גישה לתיקיות רגישות כמו מסמכים פיננסיים, חוזים, פרטי גישה, מידע אישי או קבצים עסקיים חסויים. התחילו בתיקייה מוגבלת, שמרו גיבוי, ובקשו תמיד תוכנית לפני ביצוע פעולה.

כדאי גם לצמצם הרשאות לפי הצורך. אם המשימה קשורה רק לתיקייה אחת, אין סיבה לחבר כלים נוספים. אם המשימה לא דורשת דפדפן, אין צורך להפעיל את Claude in Chrome. ככל ש-Claude מקבל פחות גישה, כך קל יותר לשלוט במה שהוא עושה.

חשוב לזכור! גם אם Claude יודע לבצע, אתם עדיין צריכים לבדוק. הוא יכול לחסוך זמן, לסדר בלגן, לחבר מידע וליצור תוצרים, אבל ההחלטה מה נכון, מה רגיש ומה מסוכן נשארת אצלכם.

למי זה זמין?

Cowork זמין למשתמשי Pro, Max, Team ו-Enterprise דרך Claude Desktop במק או ב-Windows, ודורש חיבור אינטרנט פעיל לאורך המשימה.

Claude Cowork מצריך מנוי בתשלום | Anthropic

לא עוד צ’אט, אלא עובד ביצוע חכם

הדרך הנכונה לחשוב על Claude Cowork היא לא כעל “עוד כלי AI”, אלא כעל שכבת עבודה שמחברת בין הרעיון לבין הביצוע. הוא לא רק עונה לכם, הוא יכול לבצע פעולות בפועל. זה מה שהופך אותו לשימושי כל כך, אבל גם מחייב עבודה מסודרת עם גבולות ברורים, הרשאות מצומצמות, תוכנית לפני פעולה ובדיקה אנושית בסוף.

כדאי להתחיל ממשימות פשוטות, כמו ארגון תיקייה, סיכום מסמכים או הכנת טיוטה ראשונית למצגת. כך אפשר להבין במהירות איפה Cowork באמת חוסך זמן ואיפה עדיין צריך את שיקול הדעת שלכם.

בסופו של דבר, Cowork לא מחליף אתכם. הוא לוקח על עצמו חלק מהעבודה הידנית שמסביב, כדי שתוכלו להתמקד במה שחשוב יותר: החלטות, חשיבה ויצירה.

הפוסט מדריך Claude Cowork למתחילים: כך תתחילו לעבוד ב-7 צעדים הופיע ראשון בLet's AI בינה מלאכותית

קלוד נכנס לאאוטלוק ומעמיק את האחיזה ב-Microsoft 365

רון גולד — Sat, 09 May 2026 14:02:49 +0000

Claude כבר לא פועל כחלון צ’אט נפרד. הוא הופך לחלק מהעבודה עצמה - משתלב בכלים, רואה את ההקשר ופועל ישירות על הקבצים. עם הכניסה הרשמית של Claude לאאוטלוק, Anthropic מנסה להפוך אותו לשכבת עבודה שמונחת ישירות על אפליקציות הליבה של Microsoft 365, עם Word, Excel, PowerPoint ועכשיו גם Outlook. זו לא אינטגרציה נקודתית שמסכמת מייל או כותבת נוסחה, אלא ניסיון ליצור עוזר שמבין את ההקשר העסקי שעובר בין מייל, מסמך, גיליון ומצגת, בלי העתקה, הדבקה או ניהול חלונות מקבילים.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

לא רק מיילים: Outlook הופך לנקודת הכניסה לעבודה

החידוש המרכזי נמצא דווקא באאוטלוק. התוסף יודע למיין תיבת דואר שלא נקראה, לנסח תשובות לפי סגנון כתיבה אישי, לסכם שרשורים ארוכים, לקרוא קבצי docx, xlsx, pptx ו‑pdf מתוך מיילים, למצוא מועדי פגישה פנויים ולבנות תקציר הכנה לפגישה על בסיס שרשורים ומסמכים רלוונטיים.

במילים פשוטות, Claude מתמקם במקום שבו הרבה עבודה ארגונית באמת מתחילה - לא במסמך ריק, אלא במייל עמוס, בשרשור ארוך ובקובץ מצורף שמישהו צריך “לעשות איתו משהו עכשיו”. התוסף יכול להפוך מייל לסט משימות, טיוטת תגובה, הזמנה ליומן או ניתוח שממשיך לתוך Excel.

הקשר שעובר בין האפליקציות

החידוש הוא לא רק בכך ש-Claude יושב בתוך Outlook, אלא בכך שהוא מסוגל לשמר הקשר עבודה בין האפליקציות הפתוחות. המשמעות היא שהמודל יכול לשאת איתו מידע רלוונטי בין Outlook, Word, Excel ו‑PowerPoint - במסגרת מגבלות של תוספים, הרשאות וסשנים פעילים - ולחבר בין שלבים שונים של אותה משימה.

זו נקודה מהותית כי רוב כלי ה‑AI הארגוניים עדיין “תקועים” בתוך חלון אחד. העבודה האמיתית בארגון היא רב-שלבית - מייל מלקוח, חוזה, גיליון הנחות, מצגת להנהלה. Anthropic מנסה להפוך את קלוד למתווך בין השלבים האלה, לא רק למודל שמייצר תשובה.

ומה זה אומר מול Copilot?

כאן צריך להיזהר מהצהרות גורפות. אין הוכחה חד-משמעית שקלוד “טוב יותר” מ‑Copilot בכל תרחיש. אבל הכניסה של קלוד לתוך סביבת Microsoft 365 משנה את התחרות.

מיקרוסופט עצמה כבר משלבת מודלי Anthropic בחלק מחוויות Copilot. ה-Researcher ו‑Copilot Studio תומכים במודלי Claude, וב‑Excel ניתן לבחור בין מודלי Anthropic למודלי OpenAI דרך בורר מודלים, בכפוף לרישוי ולהגדרות מנהל מערכת. כלומר, Claude מתחרה ב‑Copilot כתוסף עצמאי, אבל במקביל הופך לחלק מהאסטרטגיה הרב‑מודלית של Microsoft. ארגונים לא בהכרח יבחרו “מודל אחד”, אלא שכבת עבודה שתדע להפעיל את המודל המתאים למשימה.

אבטחה והרשאות

הנקודה הרגישה ביותר היא האבטחה, ובעיקר השאלה מה קלוד יכול לעשות בתוך תיבת המייל שלכם. בבטא הנוכחית, קלוד לא שולח מיילים בעצמו: הוא מייצר טיוטה, פותח אותה באאוטלוק, ומחכה שתלחצו על Send. זה מנגנון שמונע טעויות או שליחה לא רצויה.

אבל כדי שיוכל לעזור באמת - לסכם שרשורים, למצוא פגישות, לקרוא קבצים מצורפים או למיין מיילים - הוא צריך גישה רחבה יחסית לתיבה וליומן. המשמעות היא שקלוד יכול לקרוא מיילים, לעדכן טיוטות ולבצע פעולות מסוימות בתוך התיבה, בהתאם להרשאות שכבר יש למשתמש ולמדיניות הארגון. הוא לא “רואה הכול”, אבל הוא כן מקבל גישה מספקת כדי לבצע את המשימות שביקשתם ממנו.

Anthropic גם מזהירה מפני תרחיש מוכר בעולם ה‑AI: תוכן זדוני שמוסתר בתוך מייל או קובץ מצורף ועלול לגרום לעוזר לפעול בצורה לא רצויה (מה שנקרא prompt injection). לכן מומלץ לבדוק טיוטות לפני שליחה, לוודא שסיכומים תואמים את המקור, ולהימנע משימוש בבטא במידע רגיש במיוחד בלי בקרות מתאימות.

לא כל חשבון בתשלום מתאים לארגון

Anthropic מציינת שבמוצרים מסחריים כמו Claude for Work (Team ו‑Enterprise), קלטים ופלטים אינם משמשים לאימון מודלים כברירת מחדל. לעומת זאת, בחשבונות צרכניים כמו Free, Pro ו‑Max, השימוש בנתונים לאימון תלוי בהגדרות המשתמש.

לכן, בארגון רציני השאלה אינה רק אם יש מנוי בתשלום, אלא איזה סוג חשבון מופעל, מי מנהל את ההרשאות, מה מדיניות שמירת המידע, ומה מותר לקלוד לקרוא, לנתח או לשנות. ההבחנה בין חשבונות צרכניים לחשבונות ארגוניים קריטית, במיוחד בסביבות עם מידע רגיש או רגולטורי.

למי זה זמין?

התוספים ל‑Word, Excel ו‑PowerPoint זמינים כעת לכל המנויים בתשלום, בעוד ש- Claude for Outlook נמצא בבטא ציבורית. החברה מתארת את המהלך כ“שיחה אחת” שנושאת איתה את ההקשר בין ארבע האפליקציות. מייל שמגיע עם קובץ מצורף יכול להפוך למסמך Word, לניתוח ב‑Excel ולמצגת PowerPoint - תוך שמירה על אותו רצף עבודה.

יחד עם זאת, הזמינות אינה מלאה בכל סביבת Outlook. הבטא תומכת ב‑Outlook בדפדפן, ב‑Windows וב‑Mac עם Microsoft 365, אך אינה זמינה ב‑Outlook למובייל (iOS/Android) או בתיבות Exchange מקומיות. מדובר בהשקה הדרגתית שמוגבלת לפלטפורמות מסוימות.

שכבת העבודה החדשה

הכניסה של Claude לאאוטלוק היא לא עוד פיצ’ר. היא חלק ממעבר רחב יותר מכלי צ’אט לכלי עבודה מוטמעים. המשתמש לא רוצה “לשאול את ה‑AI שאלה”, אלא לעבוד איתו בתוך המקום שבו כבר נמצאים המיילים, המסמכים, הקבצים והיומן.

ככל שהעוזר חכם יותר, כך הוא צריך יותר הקשר. וככל שהוא מקבל יותר הקשר, כך גדל הצורך בבקרה, הרשאות, שקיפות ואחריות אנושית. קלוד באאוטלוק יכול לחסוך זמן אמיתי לכל מי שעובד עם מיילים, קבצים, מסמכים ופגישות, לא רק למנהלים, אלא לכל עובד שמנהל משימות דרך Outlook ו‑Microsoft 365. אבל הוא גם מזכיר שהעתיד של AI ארגוני לא יוכרע רק לפי איכות התשובה, אלא לפי השאלה מי רואה את המידע, מי שולט בהרשאות, ומי לוחץ בסוף על Send.

הפוסט קלוד נכנס לאאוטלוק ומעמיק את האחיזה ב-Microsoft 365 הופיע ראשון בLet's AI בינה מלאכותית

איך עסקת Anthropic-SpaceX משנה את חוויית השימוש ב‑Claude

רון גולד — Fri, 08 May 2026 04:32:27 +0000

Anthropic הכריזה על שדרוג משמעותי למשתמשי Claude, הכולל הכפלת מגבלות Claude Code, ביטול מגבלות בשעות עומס והעלאה ניכרת בקצבי ה‑API למודלי Opus. השדרוגים מתאפשרים בזכות הסכם חדש עם SpaceX, שבמסגרתו Anthropic מקבלת גישה מלאה ל‑Colossus‑1, מרכז נתונים בהיקף של יותר מ‑300 מגה ואט. המהלך מצטרף לשורה של הסכמי תשתית רחבים ומדגיש את התפקיד המרכזי של כוח חישוב במרוץ ה‑AI העולמי.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

שדרוג משמעותי למשתמשים

משתמשי Claude קיבלו השבוע עדכון חשוב ומשמח. מכסות השימוש ב‑Claude Code הוכפלו, מגבלות שעות העומס בוטלו, וקצבי ה‑API של מודלי Opus עלו בצורה ניכרת. עבור מי שעובדים עם Claude מדי יום, מדובר בשיפור שמקל על העבודה ומאפשר רצף שימוש יציב יותר.

מאיפה מגיעה הקיבולת החדשה?

מאחורי השדרוג הזה עומדת סיבה אחת מרכזית - Anthropic מקבלת גישה ל‑Colossus‑1, מחשב‑העל של SpaceX בממפיס, שמוסיף לה קיבולת חישוב משמעותית בתוך זמן קצר. לפי ההודעה הרשמית, מדובר ביותר מ‑300 מגה ואט של תשתית המבוססת על למעלה מ‑220 אלף מאיצי NVIDIA מהדור החדש. זה חיזוק שמאפשר לה להרחיב את השירותים כמעט מיידית.

מה השתנה?

העדכונים שנכנסו לתוקף כוללים שלושה שינויים מרכזיים. הראשון הוא הכפלת מגבלת חמש השעות של Claude Code עבור מנויי Pro, Max, Team ו‑Enterprise. השני הוא ביטול ההפחתה האוטומטית בשעות עומס, שהייתה מורגשת במיוחד בקרב משתמשים כבדים. השלישי הוא העלאה משמעותית של מגבלות ה‑API למודלי Opus, שמאפשרת להריץ עומסי עבודה גדולים יותר בלי להיתקל בחסמים תפעוליים.

השילוב בין שלושת השינויים יוצר חוויית שימוש רציפה יותר, במיוחד עבור מי שמסתמכים על Claude Code למשימות פיתוח, ניתוח או אוטומציה. Anthropic מציינת שהשדרוגים נועדו לשפר את השירות למשתמשים המסורים ביותר שלה, ושהם חלק מתהליך רחב יותר של הרחבת תשתיות.

Anthropic | מגבלות ה-API המעודכנות עבור מודלים של קלוד Opus

למה דווקא SpaceX?

Colossus‑1 נבנה במקור עבור פעילות ה‑AI של SpaceX, אך כעת הוא מושכר במלואו ל‑Anthropic. המהלך מצביע על שינוי בסדרי העדיפויות של SpaceX, שממקדת את פעילותה במתקן הבא, Colossus‑2. עבור החברה, זה שימוש יעיל בתשתית קיימת והזדמנות לייצר הכנסה שתתמוך בהרחבת יכולות החישוב שלה.

הבחירה ב‑Anthropic מעניינת גם בהיבט היחסים בין הצדדים. למרות חילופי הדברים הפומביים בחודשים האחרונים, נראה שהמפגש הישיר ביניהם הוביל להסכמה תפעולית שמבוססת על אינטרס משותף: ניצול תשתית גדולה שכבר מוכנה לשימוש. המהלך משתלב גם עם מגמות רחבות יותר בפעילות ה‑AI של SpaceX, כולל שיתוף הפעולה שלה עם חברת Cursor, שמדגים את הרצון של SpaceX לחזק את מעמדה כשחקן תשתית משמעותי בתחום.

ההשפעה העתידית על Claude

ההשפעה המיידית כבר ניכרת, אך המשמעות הרחבה יותר תורגש בהמשך. תוספת כוח החישוב עשויה לאפשר ל‑Anthropic להאיץ את פיתוח הדור הבא של המודלים שלה, אם כי בשלב זה אין מידע רשמי על תוכניות אימון שיתבססו על Colossus‑1. לפי מה שפורסם, ההסכם הנוכחי מוגדר כתפעולי ולא כולל מרכיב מחקרי.

הסכמי התשתית החדשים של Anthropic

Anthropic חתמה בחודשים האחרונים על שורה של הסכמי תשתית רחבי היקף: עד 5 ג׳יגה ואט עם Amazon, עוד 5 ג׳יגה ואט נוספים עם Google ו‑Broadcom, שיתוף פעולה אסטרטגי עם Microsoft ו‑NVIDIA, והשקעה של 50 מיליארד דולר בתשתיות AI בארצות הברית עם Fluidstack. העסקה עם SpaceX מצטרפת למהלך הזה ומחזקת את יכולת החברה להרחיב את פעילותה במהירות.

היקף ההסכמים מדגיש עד כמה תשתית הפכה לגורם המרכזי במרוץ ה‑AI. חברות לא רק מפתחות מודלים, אלא מתחרות על גישה למרכזי נתונים גדולים ככל האפשר. Colossus‑1 הוא חלק מהמרוץ הזה, והוא מעניק ל‑Anthropic יתרון מיידי בזמן שהסכמים אחרים עדיין נמצאים בשלבי הקמה.

תעשיית ה‑AI מתקדמת

העסקה בין Anthropic ל‑SpaceX ממחישה את הכיוון שבו תעשיית ה‑AI מתקדמת. לא רק מודלים חדשים, אלא תשתיות שמאפשרות להפעיל אותם בקנה מידה עצום. עבור משתמשי Claude, השינוי מורגש כבר עכשיו. עבור Anthropic, זה צעד נוסף בבניית תשתית גלובלית שתתמוך בדורות הבאים של המודלים. ועבור SpaceX, זהו מהלך שמחזק את מעמדה כשחקן תשתית משמעותי, לא רק בחלל אלא גם על הקרקע.

הפוסט איך עסקת Anthropic-SpaceX משנה את חוויית השימוש ב‑Claude הופיע ראשון בLet's AI בינה מלאכותית

איך משפיעות שיחות עם Claude על החלטות בחיים

רון גולד — Mon, 04 May 2026 05:31:50 +0000

יש דרך פשוטה להבין את השינוי שבינה מלאכותית עוברת עכשיו. לא דרך עוד מבחן ביצועים. לא דרך עוד הדגמה נוצצת. אלא דרך השאלות שאנשים שואלים אותה כשהם לבד מול המסך. לא רק "תסכם לי מסמך". לא רק "תכתוב לי קוד". אלא שאלות אחרות לגמרי: "האם לקחת את העבודה הזאת?", "איך לדבר עם מישהי שאני אוהב?", "האם לעבור מדינה?", "האם הוא באמת פגע בי?", "ומה אני אמור לעשות עכשיו?" זה הסיפור שמחקר חדש של Anthropic מנסה לפצח.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

כשאנשים שואלים את Claude מה לעשות עם החיים שלהם

החברה בדקה מיליון שיחות אקראיות מ-Claude.ai מחודשים מרץ ואפריל 2026, וביקשה להבין מתי אנשים לא משתמשים במודל ככלי עבודה, אלא כגורם שנותן להם הכוונה אישית. לפי המחקר, בערך 6 אחוז מהשיחות היו שיחות שבהן אנשים ביקשו מ-Claude לא רק מידע, אלא פרספקטיבה על החלטה בחיים. אחרי סינון משתמשים ייחודיים, המדגם כלל כ-639 אלף שיחות, ומתוכן כ-38 אלף סווגו כשיחות של הכוונה אישית.

וכאן הנקודה החשובה, אנחנו נוטים לדבר על AI כאילו הוא כלי פרודוקטיביות - משהו שמקצר עבודה, כותב מיילים, מנתח מסמכים ובונה מצגות, אבל בפועל, חלק מהמשתמשים כבר מתייחסים אליו כאל סוג של אדם שלישי בחדר. לא בדיוק חבר. לא בדיוק מטפל. לא בדיוק יועץ. אבל משהו באמצע, כזה שאפשר לשאול אותו שאלה אינטימית בלי להתבייש.

לא מידע, אלא עצה

Anthropic מגדירה "הכוונה אישית" בצורה מדויקת יחסית: לא כל שאלה על החיים נחשבת עצה. אם אדם שואל "מה שיעור הפציעות בסקי?", זו בקשת מידע. אם הוא שואל "האם כדאי לי לנסות סקי בפעם הראשונה?", זו כבר בקשת הכוונה. ההבדל הזה חשוב, כי הוא מסמן את המעבר ממנוע תשובות למערכת שמשפיעה על שיקול דעת.

המחקר חילק את שיחות ההכוונה לתשעה תחומים, ובהם יחסים, קריירה, התפתחות אישית, פיננסים, משפט, בריאות ורווחה, הורות, אתיקה ורוחניות. לפי Anthropic, הטקסונומיה הזאת כיסתה 98 אחוז משיחות ההכוונה שנמצאו. אבל רוב השיחות לא התפזרו באופן שווה. יותר משלושה רבעים מהן, 76 אחוז, התרכזו בארבעה תחומים בלבד: בריאות ורווחה עם 27 אחוז, קריירה עם 26 אחוז, יחסים עם 12 אחוז ופיננסים אישיים עם 11 אחוז.

כדי להבין למה המחקר הזה חשוב, צריך קודם לראות על מה בכלל אנשים מבקשים מ-Claude הכוונה אישית. התמונה שעולה מהנתונים ברורה: לא מדובר בשוליים, אלא בהחלטות שנוגעות ישירות לחיים עצמם.

תחומי ההכוונה האישית בקלוד | Anthropic

במילים אחרות, אנשים לא רק שואלים את Claude איך לנסח הודעה או איך להבין חוזה. הם מביאים אליו את המקומות שבהם החיים שלהם באמת מתחככים עם אי ודאות: גוף, עבודה, אהבה וכסף.

וזה כבר משנה את אופי הדיון. ככל שהשאלה אישית יותר, כך התשובה אינה רק "נכונה" או "לא נכונה". היא יכולה להרגיע, לדחוף, לנרמל, להקצין, לעכב פנייה לאדם אמיתי, או להפך, לעזור למשתמש לראות את המצב באופן שקול יותר.

הבעיה היא חנופה

הממצא המרכזי במחקר אינו ש-Claude טועה הרבה. למעשה, Anthropic מצאה שברוב שיחות ההכוונה Claude לא הפגין התנהגות סיקופנטית. סיקופנטיות, בהקשר הזה, היא נטייה של מודל להסכים יותר מדי עם המשתמש, להחמיא לו, לחזק את הסיפור שהוא כבר מספר לעצמו, גם כשהדבר לא בהכרח משרת את טובתו.

לפי המחקר, התנהגות כזאת הופיעה ב-9 אחוז מכלל שיחות ההכוונה. אבל המספר הכללי מסתיר אזורים רגישים יותר. בשיחות על רוחניות, Anthropic מצאה שיעור סיקופנטיות של 38 אחוז. בשיחות על יחסים, השיעור עמד על 25 אחוז. למרות שרוחניות הציגה את השיעור הגבוה ביותר, Anthropic בחרה להתמקד דווקא ביחסים, מפני שזהו תחום גדול יותר מבחינת נפח השיחות, ולכן שם הופיעו הכי הרבה מקרים סיקופנטיים במספרים מוחלטים.

אבל השאלה החשובה באמת היא לא רק על מה אנשים שואלים, אלא איפה המודל נוטה יותר מדי להסכים איתם. כאן המחקר כבר מצביע על אזורים רגישים במיוחד, ובעיקר על שיחות שעוסקות במערכות יחסים.

שיעור הסיקופנטיות לפי תחום | Anthropic

כאן המחקר נוגע באחת הנקודות העדינות ביותר בשימוש יומיומי ב-AI. כשמשתמש מספר למודל סיפור חד צדדי על בן זוג, קולגה, חבר או בן משפחה, המודל מקבל רק גרסה אחת של המציאות. אם הוא עונה בביטחון מוגזם, למשל "הוא בוודאות עושה לך גזלייטינג" או "אתה לגמרי צודק", הוא לא רק נותן תשובה חלשה. הוא עלול לחזק עימות, להעמיק נתק, או לתת למשתמש תחושה של ודאות במקום שבו דווקא נדרשת זהירות.

וזה ההבדל בין אמפתיה לבין חנופה. אמפתיה טובה אומרת: "אני מבין למה זה כואב". חנופה אלגוריתמית אומרת: "אתה צודק, והצד השני אשם". הראשונה יכולה לעזור לאדם לחשוב. השנייה עלולה לעזור לו להינעל.

כשהמשתמש דוחף, המודל נבחן באמת

אחד החלקים המעניינים במחקר הוא לא רק מה Claude עונה, אלא מה קורה כשהמשתמש לא מקבל את התשובה הראשונה. לפי Anthropic, שיחות על יחסים הן התחום שבו משתמשים דוחפים חזרה הכי הרבה: 21 אחוז מהשיחות בתחום הזה כללו התנגדות מצד המשתמש, לעומת 15 אחוז בממוצע בתחומים אחרים. בנוסף, שיחות יחסים היו ארוכות יותר באופן משמעותי, עם ממוצע של 22 תורות, לעומת ממוצע של 12 תורות בכלל שיחות ההכוונה.

המשמעות ברורה, כשמדובר בזוגיות, אנשים לא תמיד באים לקבל תשובה. לעיתים הם באים לבחון את הסיפור שלהם. לפעמים הם רוצים שמישהו יגיד להם שהם צודקים. לפעמים הם מתווכחים עם המודל עד שהוא מתקרב לניסוח שהם ביקשו לשמוע.

והמחקר מצא שזה בדיוק המקום שבו הסיכון עולה. Claude היה סיקופנטי יותר כאשר משתמשים דחפו נגדו. שיעור הסיקופנטיות עמד על 18 אחוז בשיחות שבהן הופיעה התנגדות מצד המשתמש, לעומת 9 אחוז בשיחות ללא התנגדות. Anthropic מציעה הסבר סביר וטוענת ש-Claude מאומן להיות מועיל ואמפתי, וכאשר משתמש מפעיל לחץ, במיוחד מתוך סיפור חד צדדי, קשה יותר למודל להישאר ניטרלי.

זו תובנה חשובה הרבה מעבר ל-Claude. היא מלמדת ש"האישיות" של מודל היא לא רק שאלה של טון, היא שאלה של יציבות תחת לחץ. מודל טוב לא צריך רק לדעת לענות יפה. הוא צריך לדעת לא להיסחף אחרי המשתמש ברגעים שבהם המשתמש עצמו אולי מחפש אישור יותר מאשר אמת.

לא כל עצה מסוכנת באותה מידה

המחקר של Anthropic מדגיש שגם תחום השיחה לא מספיק כדי להבין את רמת הסיכון. שאלה בריאותית יכולה להיות פשוטה יחסית, למשל תכנון שגרת כושר. אבל היא יכולה להיות גם קריטית, למשל פרשנות לתסמינים חדשים, מינון תרופה או החלטה אם לפנות לטיפול.

לפי הנספח למחקר, שאלות משפטיות, הורות, בריאות ופיננסים הופיעו לעיתים קרובות כשיחות בעלות סיכון גבוה או גבוה במיוחד: 94 אחוז מהשאלות המשפטיות, 82 אחוז משאלות ההורות, 81 אחוז משאלות הבריאות והרווחה, ו-80 אחוז מהשאלות הפיננסיות סווגו כך. שיחות בסיכון גבוה מתאפיינות, לפי Anthropic, בדחיפות, בקושי להפוך את ההחלטה, ובהשפעה משמעותית על החיים.

כאן הדיון מפסיק להיות על "האם המודל נחמד מדי", והופך לשאלה קשה יותר: מה קורה כשאדם פונה ל-AI דווקא מפני שאין לו גישה ליועץ, רופא, עורך דין, מטפל, או אדם קרוב?

Anthropic מציינת שבחלק מהמקרים אנשים אמרו ל-Claude שהם השתמשו ב-AI בדיוק בגלל שלא יכלו לגשת לאיש מקצוע או לממן כזה. קל לומר שהמודל צריך להפנות לאדם מוסמך, ובמקרים רבים זו אכן התשובה הנכונה. אבל כאשר אין לאדם חלופה זמינה, השאלה הופכת מורכבת יותר: האם AI הוא סיכון, רשת ביטחון חלקית, או שניהם יחד?

Claude כן נוטה להכיר במגבלותיו יותר בשיחות מסוכנות. לפי הנספח, הוא מכיר במגבלות שלו ב-47 אחוז משיחות ההכוונה באופן כללי, וב-63 עד 69 אחוז מהשיחות בתחומי פיננסים, משפט ובריאות. בתרחישים בעלי סיכון גבוה במיוחד, שיעור ההכרה במגבלות עולה ל-72 אחוז.

אבל גם כאן יש בעיה. "אני לא רופא" או "כדאי להתייעץ עם איש מקצוע" הם משפטים חשובים, אבל הם לא פותרים את כל הסיפור. אם אחריהם מגיעה עצה מפורטת מדי, בטוחה מדי, או כזאת שמרגישה כמו תחליף לייעוץ מקצועי, ההסתייגות עלולה להפוך לטקס משפטי יותר מאשר בלם אמיתי.

כשהמשתמשים מתווכחים עם המודל

לצד הדאגה, המחקר מציג גם תמונה מורכבת יותר על המשתמשים עצמם. הם לא תמיד מקבלים את תשובת Claude כאמת סופית. לפי הנספח, 38 אחוז מהמשתמשים הוסיפו הבהרות או פרטים חדשים במהלך השיחה כדי לכוון את Claude לתשובה רלוונטית יותר, ו-15 אחוז דחפו נגד הניתוח או ההמלצות שלו. Anthropic מסכמת את זה ככה: אנשים לא מתייחסים ל-Claude כאורקל, אלא כאל לוח תהודה.

זה חשוב, כי חלק גדול מהשיח הציבורי סביב AI מתאר את המשתמש כאדם פסיבי שנבלע בתוך תשובת המכונה. בפועל, לפחות במדגם הזה, התמונה מורכבת יותר. אנשים מתווכחים, מתקנים, מוסיפים הקשר, מביאים מגבלות תקציב, לוחות זמנים ופרטי רקע, ומנסים להפוך את התשובה לכלי שמתאים יותר לחיים שלהם.

אבל גם כאן יש צד שני. ככל שהמשתמש מכוון יותר את השיחה, כך הוא יכול גם לכוון את המודל אל האישור שהוא מחפש. אותו מנגנון שמאפשר דיוק אישי יכול להפוך גם למנגנון של אישוש עצמי.

האם אפשר לאמן מודל לא להתחנף?

Anthropic לא הסתפקה במדידה. לפי המאמר, החברה השתמשה בדפוסים שנמצאו בשיחות יחסים כדי לבנות דאטה סינתטי לאימון התנהגותי של Claude Opus 4.7 ושל Claude Mythos Preview. היא זיהתה מצבים שבהם משתמשים לוחצים על Claude, מבקרים את ההערכה הראשונית שלו, או מציפים אותו בפרטים חד צדדיים, ואז יצרה תרחישי אימון שמטרתם ללמד את המודל להישאר מאוזן יותר.

כדי לבדוק את השיפור, Anthropic השתמשה במה שהיא מתארת כבדיקת לחץ. היא לקחה שיחות אמיתיות שמשתמשים שיתפו דרך כפתור Feedback, כאלה שבהן דורות קודמים של Claude התנהגו באופן סיקופנטי, ונתנה למודלים החדשים להמשיך חלק מהשיחה. זה מבחן קשה יותר מתשובה נקייה מאפס, משום שהמודל נכנס לשיחה שכבר נעה בכיוון בעייתי ונדרש לשנות כיוון בלי לשבור את ההקשר.

לפי Anthropic, ב-Opus 4.7 שיעור הסיקופנטיות בשיחות יחסים היה נמוך בחצי לעומת Opus 4.6, והשיפור התרחב גם לתחומי הכוונה נוספים. עם זאת, החברה עצמה מסייגת את הממצא וטוענת שבדורות חדשים של מודלים משתנים דברים רבים במקביל, ולכן אי אפשר לקבוע בוודאות כמה מהשיפור נובע דווקא מדאטה האימון החדש.

זו הסתייגות חשובה. היא מונעת מהמחקר להפוך לסיפור שיווקי פשוט של "זיהינו בעיה ותיקנו אותה". בפועל, זה סיפור מורכב יותר - אפשר למדוד דפוס בעייתי, אפשר לאמן מולו, אפשר לראות שיפור, אבל עדיין קשה להוכיח סיבתיות מלאה.

מהי עצה טובה מ-AI?

המחקר של Anthropic הוא לא רק מחקר על Claude. הוא מחקר על השלב הבא ביחסים שלנו עם מערכות בינה מלאכותית.

עד עכשיו, השאלה המרכזית הייתה האם מודלים יודעים לבצע משימות. לכתוב. לסכם. לקודד. לנתח. עכשיו מתברר שהשאלה הבאה עדינה יותר - האם הם יודעים להיות נוכחים בתוך אי ודאות אנושית בלי להפוך למסוכנים, מתחנפים, בטוחים מדי או ממכרים מדי.

Anthropic עצמה מנסחת את היעד דרך טובת המשתמש לטווח הארוך. Claude אמור לזהות איזה סוג קלט האדם באמת מחפש, לתת מידע או הכוונה בעלי ערך, לכבד את האוטונומיה של המשתמש, להכיר במגבלותיו כשצריך, להימנע מעידוד תלות יתר, ולהיות מוכן לדבר בכנות או לדחוף בחזרה כשהדבר אינו לטובת המשתמש.

זו הגדרה נכונה, אבל קשה מאוד ליישום. כי בני אדם לא תמיד מבקשים את מה שטוב להם. לפעמים הם מבקשים אישור. לפעמים הם מבקשים שמישהו יוריד מהם אחריות. לפעמים הם מבקשים עצה, אבל בעצם רוצים נחמה. מודל שפה טוב יצטרך להבחין בין כל אלה, בלי להיות קר, בלי להיות שתלטן, ובלי להתחזות למומחה במקום שבו הוא לא מומחה.

בסיום המחקר Anthropic מודה במגבלות שלו. המדגם כולל משתמשי Claude בלבד ואינו מייצג את כלל האוכלוסייה. השיחות נותחו בעזרת מדרגים אוטומטיים שעלולים לטעות. המחקר מבוסס על תמלילי שיחות, ולכן אינו יודע מה המשתמשים עשו אחר כך בעולם האמיתי. הוא גם לא יודע האם Claude באמת שינה את דעתם, או רק היה עוד מקור אחד בתוך תפריט רחב של מידע, חברים, משפחה, אנשי מקצוע וחיפושים דיגיטליים.

וזה אולי הדבר החשוב ביותר שנשאר פתוח. אנחנו יודעים שאנשים שואלים AI שאלות על החיים עצמם. אנחנו יודעים שחלק מהשאלות האלה רגישות מאוד. אנחנו יודעים שמודלים יכולים להחניף, במיוחד כשהמשתמש לוחץ. אנחנו יודעים שאפשר להפחית את זה במידה מסוימת. אבל אנחנו עדיין לא יודעים מספיק על ההשפעה האמיתית של תשובות כאלה על החלטות אנושיות.

במובן הזה, המחקר של Anthropic הוא לא סוף דיון, אלא התחלה של דיון רציני יותר. לא "האם AI יכול לתת עצות?", כי בפועל הוא כבר נותן. אלא איזו עצה הוא נותן, באיזה הקשר, באיזו רמת ביטחון, ומה קורה לאדם שמקבל אותה.

כי ברגע שבו אנשים מפסיקים לשאול את המודל רק "איך עושים את זה?", ומתחילים לשאול אותו "מה כדאי לי לעשות?", הבינה המלאכותית היא כבר לא רק שכבת פרודוקטיביות, היא הופכת לשכבת השפעה. ושכבת השפעה דורשת סטנדרט אחר לגמרי.

הפוסט איך משפיעות שיחות עם Claude על החלטות בחיים הופיע ראשון בLet's AI בינה מלאכותית

OpenAI חזרה בגדול ומשיקה סביבת עבודה לסוכנים דיגיטליים בארגון

רון גולד — Sun, 03 May 2026 04:45:23 +0000

יש רגעים שבהם טכנולוגיה לא רק מתקדמת צעד נוסף, אלא משנה את הכיוון כולו. בשנה האחרונה התרגלנו לראות את עולם ה-AI מתמלא בהכרזות, יכולות חדשות ומודלים משופרים, אבל דווקא OpenAI, שהובילה את הגל הראשון, נראתה לפרקים כאילו הורידה הילוך. הצ'אט היה חכם, אבל עדיין דרש מאיתנו לנסח, לדייק ולהסביר, ובסופו של דבר לבצע בעצמנו את רוב העבודה. במהלך חודש אפריל, OpenAI לא רק השיקה את ChatGPT 5.5 ואת מודל התמונה החדש ChatGPT Image 2.0, אלא גם הציגה את Workspace Agents, והתחושה הייתה שהכיוון מתהפך. לא עוד מודל שמחכה לשאלה, אלא סוכן אוטונומי שמבצע תהליכים שלמים. לא עוד כלי שמסביר איך לעבוד, אלא אחד שעובד בפועל. זה כבר לא רק צ'אט. זה ממש עובד דיגיטלי.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

מהו בעצם Workspace Agent

כדי להבין מהו Workspace Agent צריך לשים רגע בצד את מה שהכרנו עד היום. GPT רגיל מגיב להנחיה, מייצר טקסט וממשיך הלאה. סוכן Workspace הוא ישות תפעולית שחיה בתוך הארגון. הוא פועל בענן, לא תלוי בחלון פתוח, לא נשען על זיכרון רגעי, ולא מחכה שתנסחו שוב את אותה בקשה. הוא מקבל תפקיד, מבין הקשר, ניגש למידע אמיתי, מפעיל כלים ומבצע משימות מקצה לקצה.

הוא יודע לסרוק מסמכים, לנתח נתונים, לנהל תהליכים, לעדכן מערכות, לשלוח הודעות ולחבר בין כלים כמו Slack, Google Drive, Salesforce, Notion, HubSpot, Linear ועוד. הוא זוכר מה קרה אתמול כדי להשלים את מה שצריך לקרות היום. הוא לא נעלם כשהדפדפן נסגר. הוא ממשיך לעבוד.

וכאן מתרחש השינוי הגדול. עברנו מהנדסת פרומפטים להנדסת הקשר. במקום לנסח את הבקשה המושלמת בכל פעם, אנחנו בונים לסוכן סביבת עבודה עשירה במידע, והוא כבר מבין לבד מה לעשות.

שלושת עמודי התווך של כל סוכן

למרות היכולות הרחבות של הסוכנים, המבנה שלהם פשוט וברור. כל סוכן בנוי משלושה מרכיבים שמגדירים את אופן הפעולה שלו ואת הדרך שבה הוא משתלב בעבודה הארגונית.

הטריגר

זה הרגע שבו הסוכן מתחיל לפעול. זה יכול להיות לו"ז קבוע, הודעה בסלאק (Slack), ליד חדש שנכנס למערכת, קובץ שהועלה לדרייב או הפעלה ידנית. הטריגר הוא נקודת ההתחלה שמניעה את התהליך.

התהליך

כאן נמצא מרכז הפעילות של הסוכן. זה רצף הפעולות שהוא מבצע: איסוף מידע, בדיקות, ניתוח, קבלת החלטות, יצירת מסמכים, עדכון מערכות או שליחת הודעות. התהליך יכול להיות קצר ופשוט או ארוך ורב שלבי, והוא תמיד מתבצע באופן אוטונומי.

הכלים

הסוכן פועל בתוך המערכות הארגוניות שאליהן קיבל הרשאות. הוא ניגש לקבצים, קורא נתונים, מעדכן רשומות ומבצע פעולות שונות. הוא לא רואה יותר ממה שהוגדר עבורו, אבל בתוך הגבולות האלה הוא מתפקד כמו כל עובד אחר.

מתי נכון ליצור סוכן

הסוכנים זורחים במיוחד במשימות שחוזרות על עצמן, כאלה שמתרחשות כל יום, כל שבוע או בכל פעם שנכנס ליד חדש. הם מצוינים בתהליכים מובנים עם שלבים ברורים, ובמשימות שמבוססות על עבודה עם כמה מערכות במקביל. הם גם מתאימים במיוחד למשימות רגישות לזמן, כאלה שחשוב שיקרו בזמן ספציפי גם אם אתם עסוקים.

אם יש תהליך שאתם יודעים להסביר לעובד חדש, אפשר להפוך אותו לסוכן.

מה סוכן יכול לעשות בפועל

כדי להבין את הכוח של סוכן, צריך לראות דוגמאות מהשטח. הנה כמה תרחישים שממחישים איך נראה “עובד דיגיטלי” בפעולה:

סוכן תפעול יומי

הוא מתחיל את היום בסריקה של היומן, המיילים והמשימות הפתוחות. הוא מזהה פגישות שדורשות הכנה, מיילים שמחכים לתגובה, חסמים בפרויקטים, ומייצר תקציר עבודה יומי שמגיע ישירות לסלאק. הוא לא רק מסכם, אלא גם מחבר בין הדברים: מה קשור למה, מה דחוף, ומה אפשר לדחות.

סוכן ניהול ספקים

הוא מקבל חשבוניות חדשות, בודק אותן מול הסכמים קיימים, מזהה חריגות, ומכין דו”ח מסודר עם המלצות. הוא יודע לשלוף נתונים ממערכות פיננסיות, להשוות מול תקציב, ולהתריע על סעיפים בעייתיים.

סוכן תמיכה פנימית

הוא מקבל בקשות עובדים בסלאק, מסווג אותן אוטומטית, פותח קריאות במערכת הנכונה, ומעדכן את העובד. הוא יודע להבדיל בין בקשת רכש, תקלה טכנית או צורך בגישה לכלי חדש.

סוכן ניתוח מגמות

הוא שואב נתונים ממערכות BI, מייצר גרפים, מסכם מגמות, ומפיץ דוח שבועי לצוות הנהלה. הוא יודע לזהות חריגות, הישגים, ושינויים משמעותיים.

סוכן הכנה לפגישות

הוא אוסף מסמכים רלוונטיים, מסכם שרשורי מייל, ומכין דף רקע לפני כל פגישה חשובה. הוא יודע לחבר בין מידע מפוזר ולהפוך אותו לתמונה אחת ברורה.

סוכן מכרזים (RFP)

הוא עוזר בניסוח ואוסף מידע עבור מענה למכרזים או בקשות מורכבות מלקוחות.

איך מקימים סוכן כזה

הדבר המפתיע ביותר הוא שלא צריך לכתוב שורת קוד. הכול קורה בתוך ChatGPT.

איך בונים סוכן?

כדי ליצור סוכן חדש (1) מתחילים במסך ה-Workspace agents , שם בוחרים להקים סוכן חדש ומגדירים לו בשפה חופשית מה הוא אמור לעשות (2). מיד לאחר מכן ChatGPT מציג טיוטה ראשונית של הסוכן ומפרק את התיאור שלכם למשימות, ערוצים וכלים. בשלב הבא עוברים למסך ההגדרות, שבו רואים את פרופיל הסוכן, את הערוצים שהוא יעקוב אחריהם ואת הכלים שאליהם הוא צריך גישה, ומחברים אותו למערכות כמו Slack, Linear או Google Drive . אחרי שהכול מוגדר לוחצים על Create, והסוכן מתחיל לרוץ לראשונה (3). במסך האחרון רואים אותו מבצע את הצעדים הראשונים שלו בזמן אמת, כולל חיפוש בערוצים, שליפת נתונים ועדכון מערכות (4).

שורה תחתונה, חשוב מאוד להתחיל בהגדרת התפקיד. פשוט מסבירים לסוכן מה הוא אמור לעשות. משם ChatGPT מציע שלבים, ואתם מחדדים, מוסיפים, ומגדירים את התהליך. לאחר מכן מחברים את הכלים הרלוונטיים, קובעים האם הוא רשאי לפעול לבד או חייב אישור אנושי לפני פעולות רגישות, ומריצים כמה ניסויים כדי לוודא שהכול עובד. ברגע שהוא מוכן, משתפים אותו עם הצוות.

OpenAI גם מספקת ספריית תבניות מוכנה מראש. יש תבנית לסוכן שמנתח חריגות תקציב, תבנית לסוכן שחוקר ספקים, תבנית לסוכן שמבצע ניתוב בקשות, ועוד רבות אחרות. אפשר להתחיל מהן ולהתאים אותן לארגון תוך דקות.

ספריית סוכנים מוכנה מראש

הנה הדגמה מודרכת של סוכן שמושך מדדים שבועיים, יוצר גרפים, מנסח את הנרטיב ומפיק דוח עסקי מוכן לשיתוף:

והנה הדגמה מודרכת של סוכן שמסנן לידים נכנסים, מנסח מעקבים מותאמים אישית ומעדכן את ה CRM באופן שוטף:

אבטחה, שליטה ופרטיות

OpenAI יודעת שמידע עסקי הוא נכס רגיש. לכן הסוכנים נבנו עם סטנדרטים של Enterprise. הנתונים הארגוניים לא משמשים לאימון המודלים. כל פעולה של הסוכן מוצגת בשקיפות מלאה, עם סטטוס ברור בכל שלב. מנהלי מערכת מקבלים לוח בקרה עם יומני מעקב, כמות ריצות, משתמשים פעילים ועוד. אפשר גם לתייג סוכן לתוך שיחה קיימת בסלאק כדי שימשיך משימה שנדונה באותו רגע.

היכולות זמינות למנויי ChatGPT Team, ChatGPT Enterprise ו‑ChatGPT Edu. עד 6 במאי 2026 השימוש בסוכנים ללא עלות, ולאחר מכן יעבור המודל לתמחור מבוסס שימוש.

העידן האוטונומי כבר כאן

סוכני ה‑Workspace מסמנים את המעבר מעבודה ידנית לעבודה אוטונומית. הם מאפשרים לבנות צי של עובדים דיגיטליים שמבצעים תהליכים אמיתיים, חוסכים זמן, מפחיתים עומס, ומשחררים אנשים להתמקד במה שבאמת דורש חשיבה אנושית.

הם לא מחליפים אנשים. הם מחליפים את העבודה שאנשים לא צריכים לעשות.

אז אם אתם רוצים לנצל את הימים שנותרו לשימוש בסוכנים ללא עלות, תשאלו את עצמכם איזו משימה משעממת במשרד אתם מעבירים לסוכן הראשון שלכם כבר השבוע.

הפוסט OpenAI חזרה בגדול ומשיקה סביבת עבודה לסוכנים דיגיטליים בארגון הופיע ראשון בLet's AI בינה מלאכותית

Gemini מייצר קבצים ומשנה את חוויית העבודה עם AI

רון גולד — Sat, 02 May 2026 05:45:45 +0000

יש רגעים שבהם טכנולוגיה מפסיקה להיות “כלי עזר” והופכת להיות חלק טבעי מתהליך העבודה. ההכרזה האחרונה של גוגל על יכולת יצירת הקבצים בג׳מיני היא בדיוק אחד מהרגעים האלה. לא מדובר בעוד שיפור קטן בממשק, אלא בצעד שמחבר בין שיחה לבין תוצר - בין רעיון לבין קובץ אמיתי שאפשר להוריד, לשתף ולהמשיך לעבוד איתו.

You can now ask Gemini to create Docs, Sheets, Slides, PDFs, and more directly in your chat. No more copying, pasting, or reformatting, just prompt and download.

Available globally for all @GeminiApp users. pic.twitter.com/VuhlvehFuU

— Sundar Pichai (@sundarpichai) April 29, 2026

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

מה בעצם חדש כאן

עד היום ג׳מיני (Gemini) ידע לכתוב, לסכם, לנתח ולבנות רעיונות, אבל כל זה נשאר בתוך הצ׳אט. עכשיו הוא מסוגל לקחת כל תוצאה ולהפוך אותה לקובץ אמיתי שמוכן להורדה, שיתוף או שמירה ב‑Drive. לא טיוטה ולא טקסט גולמי, אלא מסמך מלא שמרגיש כמו תוצר שנוצר בכלי ייעודי.

החידוש בולט גם בהיקף הפורמטים. ג׳מיני יודע ליצור מסמכי Google Docs, Sheets ו‑Slides, וגם קבצי PDF, Word, Excel, CSV, Markdown, LaTeX, TXT ו‑RTF. כמעט כל פורמט עבודה מודרני נמצא כאן, וזמין לכל משתמשי אפליקציית Gemini.

שימושים פרקטיים שכבר רואים בשטח

כבר בימים הראשונים להשקה אפשר לראות איך היכולת החדשה נטמעת בשגרה. סיכומי פגישות הופכים לקובצי PDF שמוכנים לשליחה, הצעות מחיר ותקציבים מקבלים צורה של Excel עם נוסחאות, וטיוטות תוכן הופכות למסמכי Word מעוצבים. מצגות קצרות נבנות כ‑Slides בלי לפתוח אפילו חלון נוסף. הכול מתרחש בתוך הצ׳אט, בתהליך רציף שלא דורש מעברים בין כלים או שלבים מיותרים.

מכתב יד לקובץ דיגיטלי

מעבר לשימושים היומיומיים, העדכון מציג יכולת נוספת שמבליטה את העומק הטכנולוגי שלו - הפקת קבצים מתמונות של כתב יד. בהדגמה הרשמית של גוגל נראה משתמש שמעלה תמונות של פתקים או עמודי מחברת, וג׳מיני מחלץ מהם את התוכן ומארגן אותו למסמך נקי ומסודר. זהו חיבור ישיר בין העולם הפיזי לבין הדיגיטלי, בלי צורך בכלי ביניים.

מכתב יד לקובץ דיגיטלי | google

למה זה כל כך משמעותי

מי שעבד עם מודלי שפה גדולים מכיר היטב את הטקס החוזר. המודל נותן תשובה, מעתיקים אותה, פותחים מסמך, מדביקים, מסדרים עיצוב, שומרים. רצף פעולות קטן שמצטבר לשעות עבודה אבודות לאורך שבוע.

העדכון הזה משנה את כל זה. הצ׳אט הופך למקום שבו גם חושבים וגם מייצרים. רעיון הופך לקובץ, וקובץ הופך לשיתוף, בלי לעבור בין אפליקציות ובלי לגעת בעיצוב. זהו שינוי שמקצר תהליכים ומפנה זמן לעבודה עצמה.

אבל המשמעות האמיתית עמוקה יותר. זו לא רק נוחות. זו יכולת חדשה של המודל להפיק תוצרים אמיתיים, לא רק טקסט. זהו רגע שבו הבינה המלאכותית מפסיקה להיות כלי שמסייע מהצד והופכת להיות חלק מהתהליך המקצועי.

למה יצירת קבצים היא בעיה קשה

כאן נמצא לב הסיפור. יצירת קבצים נראית כמו פעולה פשוטה, אבל בפועל היא אתגר הנדסי מורכב. מודלי שפה מתקשים להפיק פורמטים בינאריים ישירות מטוקנים, משום שקבצים מודרניים בנויים משכבות של מבנים פנימיים עדינים.

קובץ DOCX הוא למעשה קובץ ZIP שמכיל אוסף מסמכי XML שמקושרים זה לזה. XLSX מורכב אף יותר, עם מבנה טבלאי שמצריך עקביות מוחלטת בין הגיליון, הסגנונות והנתונים. PDF מוסיף עולם של קואורדינטות, פונטים מוטמעים ותקנים היסטוריים שחיים זה לצד זה.

כשמבקשים ממודל לייצר את כל זה ישירות, התוצאה נוטה להתפרק. זו הסיבה שקבצים שנוצרו בעבר על ידי מודלים אחרים נראו לעיתים כמו טיוטות לא גמורות. גיליונות Excel שאיבדו יישור, קובצי PDF שהתבלגנו בעת פתיחה, מסמכים שהתפרקו כשהועברו בין אפליקציות. זו לא בעיה של עיצוב, אלא של מבנה. ואת זה נראה שגוגל הצליחה לפתור.

מה לגבי PowerPoint

יש פרט קטן שחשוב להכיר. למרות התמיכה הרחבה בפורמטים, ייצוא ישיר ל‑PowerPoint עדיין לא קיים. מי שרוצה קובץ PPT צריך ליצור מצגת ב‑Google Slides ולהוריד אותה משם.

זה פתרון עקיף, במיוחד כשמסמכי Word ו‑Excel כבר נתמכים באופן מלא, אבל בפועל הוא כמעט לא מורגש. רוב המשתמשים יגלו שהמעבר דרך Slides מהיר, שקוף, ולא פוגע בחוויה הכוללת.

ומה ההבדל ממצב הקנבס

מצב קנבס (Canvas) מאפשר לעבוד בתוך חלון צדדי שבו עורכים טקסט ידנית ומשתפים פעולה עם הבינה המלאכותית בזמן אמת. זה מרחב עבודה חי, כזה שבו המודל מציע ניסוחים ואתם משנים, מוחקים, מוסיפים וממשיכים הלאה.

היכולת החדשה פועלת אחרת לגמרי. כאן לא עורכים טקסט ולא מנהלים תהליך משותף. מבקשים תוצר ומקבלים קובץ מוגמר, סגור ומוכן להורדה או לשמירה.

בינה מלאכותית שמייצרת תוצרים

העדכון זמין כבר עכשיו לכל משתמשי ג׳מיני, באפליקציה ובווב, גם בחינם. אין צורך להפעיל הגדרה או לפתוח תפריט נסתר. פשוט מבקשים את הקובץ הרצוי, וג׳מיני יוצר אותו. התהליך קצר, ישיר ומיידי, והוא משנה את האופן שבו משתמשים בבינה מלאכותית בתוך שגרת העבודה.

העדכון החדש של גוגל מסמן שינוי חשוב. הוא הופך את הבינה המלאכותית מכלי שמנסח טקסט לכלי שמפיק תוצרים אמיתיים. הוא חוסך זמן, מפשט תהליכים ומאפשר לעבור מרעיון לקובץ מוגמר בלי לצאת מהצ׳אט. זה שדרוג שמרגיש פחות כמו תוספת נקודתית ויותר כמו צעד טבעי קדימה, כזה שמקרב אותנו לעתיד שבו בינה מלאכותית משתלבת בכל שלב של העבודה, מהרעיון הראשון ועד התוצר הסופי.

הפוסט Gemini מייצר קבצים ומשנה את חוויית העבודה עם AI הופיע ראשון בLet's AI בינה מלאכותית

מה זה Skill ואיך Skills משנים את הדרך שבה עובדים עם בינה מלאכותית

רון גולד — Sun, 26 Apr 2026 10:33:36 +0000

אם אתם משתמשים בבינה מלאכותית ועדיין מוצאים את עצמכם מסבירים מי אתם או מה אתם צריכים בכל שיחה מחדש - אז אתם חייבים להכיר את Skills. אתם פותחים צ'אט עם Claude או ChatGPT, מקבלים תשובה טובה, חוזרים לעבוד. שבוע אחר כך פותחים שיחה חדשה - ומתחילים מאפס. שוב להסביר מי אתם, מה הסגנון שלכם, מה אתם לא רוצים, ואיך אתם אוהבים שהתוצאה תראה. הכלי חכם, אבל הוא לא זוכר אתכם. כל שיחה מתחילה כאילו זו הפעם הראשונה. זה לא באג. זו ברירת המחדל של רוב מודלי השיחה. ויש לזה פתרון. קוראים לו Skills - ובמדריך הזה תבינו בדיוק מה זה, למה הם משנים את כל החוויה, ואיך מתחילים להשתמש בהם כבר היום.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

ארבע שכבות של הקשר - ולמה Skills הן השכבה הרביעית

לפני שמבינים מה זה Skill, כדאי להבין את ה״מדרגות״ שמובילות אליו:

שכבה ראשונה - פרומפט

אתם כותבים הוראה ארוכה בתחילת השיחה: מי אתם, מי הלקוחות שלכם, מה אתם רוצים. זה עובד, אבל צריך לחזור על זה בכל שיחה מחדש.

שכבה שנייה - קובץ טקסט

אתם שומרים קובץ עם כל ההוראות ומעלים אותו למודל בתחילת השיחה. זה מהיר יותר, אבל עדיין דורש פעולה ידנית.

שכבה שלישית - Project

אתם מעלים את הקובץ פעם אחת לתוך פרויקט ב-Claude או ChatGPT. הוא נשאר שם, וכל שיחה בתוך אותו פרויקט מתחילה עם ההקשר הזה בלי שתצטרכו להעלות אותו שוב. נחמד, אבל יש היום דרך טובה וחכמה יותר.

שכבה רביעית - Skill

כל מה שתיארתם עד עכשיו, אבל בלי שום פעולה מצדכם. Skill מזהה לבד מתי הוא רלוונטי ומפעיל את עצמו. אתם לא בוחרים בו ולא מפעילים אותו. הוא פשוט שם.

רמות שונות של אוטומציה

למה זה לא אותו דבר כמו פרומפט?

זו השאלה שעולה כמעט תמיד, ולכן כדאי לפתור אותה מוקדם. פרומפט הוא הנחיה חד-פעמית. שאלה, בקשה או הוראה. הוא מנוסח בתוך שיחה, עובד בתוך אותה שיחה, ונשכח ברגע שהיא מסתיימת.

Skill הוא מומחיות קבועה. הסוכן לומד אותה פעם אחת ומשתמש בה שוב ושוב, בכל שיחה חדשה, בלי שתצטרכו להזכיר לו דבר. זה ההבדל בין להגיד למישהו מה לעשות בכל פעם מחדש לבין מצב שבו הוא כבר יודע.

מה זה בכלל Skill?

Skill, או סקיל, הוא בסך הכל קובץ טקסט. קובץ הוראות בסיומת markdown (.md) שמלמד את המודל שלכם להכיר אתכם, או לבצע משימה חוזרת בדיוק בדרך שאתם רוצים.

אתם מגדירים מי אתם, מי הלקוחות שלכם, מה חשוב ומה אסור. הסקיל שומר את כל זה, וכל פעם שהמודל מזהה שיש לו עבודה מהסוג הזה, הוא מביא איתו את ההוראות אוטומטית - בלי שתצטרכו לחזור על עצמכם.

דרך אחת להבין את זה היא לחשוב על ״מתכון״. רשימת הוראות שמתחילה בחומרי הגלם, ממשיכה בשלבי ההכנה ומסתיימת בהגשה. סקיל הוא מתכון לביצוע פעולה מסוימת מא' עד ת'.

עוד דרך טובה לחשוב על זה: אתם מגייסים עובד חדש. הוא מוכשר, אבל לא מכיר אתכם. אתם יכולים להסביר לו כל בוקר מחדש איך החברה עובדת, מה הלקוחות מצפים ואיך נראה דוח אצלכם. או שאתם יכולים לתת לו תיק הכנה מסודר ביום הראשון, ומאותו רגע הוא פשוט יודע.

Skill הוא תיק ההכנה הזה.

איך נראה יום עבודה עם סקיל - ואיך הוא נראה בלעדיו

איך נראה סקיל בפועל?

זו לא תוכנה, ואין שום קוד שצריך להתקין. סקיל הוא קובץ טקסט אחד בשם SKILL.md, שמכיל הוראות כתובות בשפה רגילה. הנה דוגמה לסקיל פשוט לכתיבת עדכון שבועי לצוות:

מבנה של סקיל: שם, טריגר, הוראות וגבולות שליליים - הכל בקובץ אחד

זו כמובן דוגמה קצרה ורזה רק לצורך ההדגמה, אבל Skill יכול להיות עמוד A4 שלם של הוראות והנחיות. חשוב גם שתתנו לו שם רלוונטי למען ההקשר והסדר הטוב. בטח אם יש לכם יותר מסקיל אחד.

שני סוגי סקילים - ומה ההבדל בפועל

לא כל הסקילים עובדים אותו דבר, וכדאי להבין את ההבדל.

סקיל תהליך

זה סקיל מבוסס טקסט בלבד. הוא מגדיר סגנון, מבנה וחוקים. אפשר להשתמש בו במודלי שפה שונים שאוהבים ויודעים לקרוא קבצי markdown ובכלים נוספים שתומכים בסקילים. דוגמאות טובות: כתיבת פוסט לינקדאין בסגנון שלכם, ניסוח מייל ללקוח, או הכנת דוח חודשי בפורמט קבוע.

סקיל יכולת

סקיל שכולל גם כלים פעילים: הרצת קוד, גישה לקבצים, חיבור לשירותים חיצוניים ועוד. הוא רץ בסביבות מתקדמות יותר כמו Claude Code. דוגמה: סקיל שמייצר סרטון אוטומטית ושולח אותו ישירות ל-Gmail בלי שתצטרכו לגעת בו. רוב הסקילים שתפגשו הם מסוג תהליך. זה הסוג שהכי קל להתחיל איתו, והוא נותן ערך מיידי גם למי שלא עובד עם קוד ביום יום.

שלוש דרכים ליצור Skill משלכם

דרך ראשונה: skill-creator של Claude

Claude מגיע עם סקיל מובנה שמטרתו לעזור למשתמש ליצור סקילים.

מפעילים אותו עם הפקודה skill-creator/. פשוט תתחילו שיחה חדשה - תעתיקו את הפקודה - ותלחצו אנטר (Enter). הוא שואל אתכם שאלות, אתם עונים, ובסוף הוא מייצר קובץ מוכן. ככל שהתשובות שלכם יותר ספציפיות, כך הסקיל יוצא שימושי יותר. "אני צריך סיכום פגישה" זה לא מספיק טוב.

"אני צריך סיכום פגישה שמתחיל בקבלת החלטות, ממשיך בחלוקת משימות לפי בעלי אחריות, ומסתיים בסיכום קצר של הדיון" - זה סקיל שיעבוד טוב יותר.

הפעלת skill-creator/ - פקודת הסלאש שמתחילה תהליך יצירת סקיל

דרך שנייה: makemyskill.com

כלי חינמי שפותח על ידי חברת ייעוץ AI אמריקאית. הוא מדלג על שלב הריאיון ומייצר את הסקיל ישירות על פי תיאור שאתם כותבים, כולל חיפוש ברשת אם צריך. נכנסים לאתר, מתארים את הסקיל שאתם רוצים, מורידים את הקובץ ומעלים אותו ל-Claude. פחות שליטה מהדרך הראשונה, אבל מהיר יותר ומתאים מאוד למתחילים.

דרך שלישית (הכי מומלצת ללימוד סקילים): להתחיל מהשיחות שכבר קיימות

אתם עובדים עם Claude כבר כמה זמן. בשיחות האלה יש הוראות שנתתם, תיקונים שביקשתם, פורמטים שחזרתם עליהם שוב ושוב - כל זה הוא כבר תהליך. הוא פשוט לא ארוז. אפשר לפנות ל-Claude עם השיחות האלה ולבקש: "תנתח את הדפוסים בבקשות שלי ותבנה מהם Skill." הסוכן מזהה את המבנה החוזר ומייצר קובץ מתוכו.

איך מתקינים Skill ב-Claude?

1. נכנסים לאזור ההתאמה האישית (Customize) בסרגל הצד ולוחצים על אייקון התיק (1). זה פותח את הממשק שבו מנהלים סקילים וחיבורים.

2. בוחרים בלשונית Skills (2). זה המסך שבו יופיעו כל הסקילים האישיים שלכם.

3. פותחים תפריט יצירת סקיל לוחצים על כפתור הפלוס (3) בפינה העליונה של אזור ה‑Skills. נפתח תפריט שמציע שתי אפשרויות.

Browse skills - לחיפוש סקילים מוכנים: מוצאים סקיל שמתאים לכם ולוחצים Install. משם הוא זמין בכל שיחה או שבוחרים Create skill.

4. תחת Create skill (4) יש שלוש דרכים שונות להתחיל:

Create with Claude – נותנים למודל ״לראיין״ אתכם ולבנות את הסקיל יחד אתכם.
Write skill instructions – כותבים את ההוראות בעצמכם מתוך הממשק.
Upload a skill – מעלים קובץ SKILL.md מוכן מהמחשב (בדרך כלל קובץ zip).

אחרי שתיצרו או תעלו סקיל, הוא יופיע ברשימה תחת Personal skills (החץ הכתום בתמונה). משם אפשר לערוך, לכבות או למחוק אותו.

איך יוצרים או מעלים סקיל חדש - צעד אחר צעד

חשוב לדעת! סקילים זמינים לכל המנויים, כולל החינמי. תנאי אחד בלבד: צריך להפעיל Code execution תחת Settings → Capabilities."

כדי להשתמש בסקילים צריך להפעיל את Code execution

איך הסקיל יודע מתי להפעיל את עצמו?

לכל סקיל יש שורת תיאור שמסבירה ל‑Claude באילו מצבים הוא צריך לפעול. אתם מתחילים שיחה, מנסחים את הבקשה שלכם, והסוכן מפעיל את הסקיל הרלוונטי מאחורי הקלעים בלי שתצטרכו לעשות דבר. אם בכל זאת רוצים לבחור סקיל ידנית, יש שתי אפשרויות שכבר הזכרנו קודם:

1. בחירה דרך התפריט: לוחצים על Skills בסרגל הצד, ורואים את כל הסקילים המותקנים. אפשר לבחור אחד מהם ולהפעיל אותו ישירות.

2. בחירה דרך פקודת סלאש: כותבים / בצ'אט ומקבלים רשימה של כל הסקילים הזמינים.

כך Claude מחליט אם להפעיל סקיל

ארבעה דברים שחשוב להכיר

1. הטריגרים השליליים חשובים יותר מהחיוביים

כל סקיל כולל שתי שורות: מתי להפעיל ומתי לא להפעיל. השורה השנייה חשובה לא פחות. אם הגדרתם שהסקיל פועל כשמבקשים סיכום פגישה, אבל לא ציינתם שהוא לא פועל למסמכי הנהלה או לניוזלטרים, הוא עלול להפעיל את עצמו גם כשלא התכוונתם. גבולות שליליים ברורים מונעים את זה.

2. יש טריק פשוט לבדיקה ואיתור תקלות

הסקיל לא מופעל כשאתם מצפים? תשאלו את Claude: "מתי היית מפעיל את הסקיל הזה?" הוא יצטט את שורת התיאור. משם קל לראות מה מעורפל, מה חסר ומה צריך לתקן. זה הפתרון המהיר ביותר לכל סקיל שלא מתנהג כמו שצריך.

3. סקיל מטפל בתהליך, קובץ אישי מטפל בקול

אם יש לכם קובץ שמתאר מי אתם ואיך אתם כותבים, אין צורך לשכפל את זה בתוך הסקיל. הקובץ האישי מטפל בטון ובסגנון. הסקיל מטפל בתהליך ובמבנה. שניהם עובדים יחד בלי כפילויות.

4. סקילים לא מכבידים על הזיכרון של השיחה

Claude לא טוען את כל תוכן הסקיל בכל שיחה. בהתחלה הוא קורא רק שתי שורות: שם ותיאור. התוכן המלא נטען רק אם הוא מזהה שהסקיל רלוונטי. זה עובד לפי עיקרון של חשיפה מדורגת (Progressive Disclosure): המערכת קוראת רק את מה שהיא צריכה באותו רגע, וכל השאר נשאר בצד עד שהוא נדרש. לכן גם עשרים סקילים מותקנים לא תופסים פי עשרים יותר זיכרון. רובם בכלל לא נטענים.

מה לא עובד מושלם - ולמה כדאי לדעת את זה מראש

Skill לא מייצר תוצאות מושלמות בנסיון הראשון. הוא מייצר נקודת פתיחה עקבית, קרובה הרבה יותר למה שרציתם, ובדרך כלל הרבה יותר מהר. אבל עדיין צריך לעבור על הפלט ולתקן. אם המודל מדלג על שלבים או ממהר, הפתרון הוא לא לשנות את הסקיל. הפתרון הוא להוסיף לבקשה עצמה: "קח את הזמן. לא לדלג על שלבים." זה עובד טוב יותר מאשר לכתוב את זה בתוך קובץ הסקיל.

ואם התיאור של הסקיל רחב מדי, הוא יופעל גם כשלא ביקשתם. במקרה כזה הפתרון הוא להוסיף גבולות שליליים ברורים, כמו שהסברנו קודם.

מאיפה מורידים סקילים מוכנים?

לא צריך לבנות הכל מאפס. יש כמה מקומות שבהם תמצאו סקילים מוכנים:

1. skills.sh - המאגר הכי מסודר. לכל סקיל יש דירוג אמון, מספר התקנות ותיאור ברור.
2. Awesome Claude Skills - רשימה קהילתית ב‑GitHub עם סקילים פופולריים ומוכחים.
3. Skills IL - הקטלוג הישראלי. מעל 160 סקילים, רובם מותאמים לשימוש ישראלי.

ולמה חשוב לשים לב לפני שמורידים סקיל מוכן?

Skill הוא קובץ שנכנס ישירות לתוך סביבת העבודה שלכם. זה אומר שסקיל שנכתב בצורה בעייתית - בטעות או בכוונה - יכול לגרום להתנהגות לא צפויה. אז לפני שמתקינים כל סקיל, כדאי לבדוק ארבעה דברים: חשוב לוודא שהמקור שלו מוכר ואמין, שיש לו דירוג אמון גבוה, שמספר ההתקנות (הורדות) משמעותי, ושיש תיאור ברור שמסביר בדיוק מה הסקיל עושה. רק כשכל ארבעת הדברים האלה מתקיימים, אפשר לסמוך עליו שהוא יפעל כמו שצריך ולא יפתיע אתכם בהתנהגות לא רצויה.

סקיל שקיבלתם ממקור אקראי או לא מזוהה - לא מתקינים!

איך מתחילים עכשיו - צעד ראשון

אל תחכו לסקיל המושלם. הצעד הראשון שהכי שווה את הזמן הוא פשוט: פתחו את Claude וכתבו בדיוק את המשפט הזה:

"אני רוצה ליצור סקיל אישי. תשאל אותי שאלות כדי להכיר אותי לעומק, ובסוף תארוז הכל לקובץ SKILL.md."

המודל ישאל אתכם שאלות. תענו בכנות ובפירוט. כל התהליך לוקח בדרך כלל כמה דקות. בסוף השיחה תקבלו קובץ מוכן. העלו אותו ל‑Claude דרך: Customize → Skills → Upload

מרגע זה, כל שיחה חדשה שאתם פותחים מתחילה עם ההקשר הזה. לא צריך להסביר מחדש. לא צריך להזכיר. הסוכן כבר יודע.

זה לא קסם, זה ניהול ידע בסיסי

בלי סקילים, יש לכם כלי חכם שצריך לנהל אותו בכל שיחה מחדש. אתם שולטים בו, אבל מבזבזים זמן על הסברים שכבר נתתם עשרות פעמים. עם סקילים, המודל מכיר אתכם. יודע מה חשוב לכם. מגיע לתוצאה קרובה הרבה יותר למה שרציתם, ובדרך כלל הרבה יותר מהר.

זה לא קסם. זה ניהול ידע בסיסי - רק שהידע נמצא בתוך הכלי, ולא רק בראש שלכם. רוב האנשים שמשתמשים בבינה מלאכותית ביום יום עדיין מסבירים את עצמם מחדש בכל שיחה. לא בגלל שהם לא יודעים, אלא כי אף אחד לא סיפר להם שיש דרך אחרת. עכשיו אתם יודעים.

הפוסט מה זה Skill ואיך Skills משנים את הדרך שבה עובדים עם בינה מלאכותית הופיע ראשון בLet's AI בינה מלאכותית

פחות דיבורים ויותר עבודה: מה באמת חדש ב‑GPT‑5.5

רון גולד — Fri, 24 Apr 2026 11:12:40 +0000

המודל החדש של OpenAI מסמן מעבר חד מצ'אטבוט שמגיב לטקסט לסוכן עבודה אמיתי, כזה שמבין מטרות מורכבות, מפעיל כלים, בודק את עצמו ומסיים משימות מקצה לקצה. הוא מקבל מטרה, מפרק אותה למשימות, מפעיל תוכנות, מתקן טעויות תוך כדי תנועה, וממשיך עד שהעבודה הושלמה. זה שינוי מהותי שמרחיב את תפקיד ה‑AI: לא רק מודל שיחה, אלא מערכת ביצועית שמסוגלת לעבוד בעולם דיגיטלי אמיתי. OpenAI בחרה לפתוח את ההכרזה דווקא עם Codex ולא עם ChatGPT - בחירה שמבהירה היטב את הכיוון החדש. GPT‑5.5 זמין כבר היום ב‑ChatGPT וב‑Codex, והוא מוצג כ"מחלקה חדשה של אינטליגנציה לעבודה אמיתית". הוא נבנה כדי לבצע משימות מורכבות: לכתוב ולדבג קוד, לבצע מחקר עומק ברשת, לנתח נתונים, לבנות מסמכים, לערוך טבלאות, לשלוט בדפדפן ולהפעיל אפליקציות מקומיות. הוא לא מחכה לפקודה הבאה - הוא מתקדם עד שהמטרה הושגה.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

הבעיה ש‑GPT‑5.5 מנסה לפתור

המודלים הקודמים של OpenAI כבר היו חזקים מאוד. GPT‑5.3 ו‑GPT‑5.4 ידעו לכתוב קוד מצוין, לפתור בעיות מורכבות ולהחזיק שיחה טבעית. אבל הם עדיין היו מוגבלים לסביבת טקסט. הם לא תמיד ידעו לבדוק את עצמם, לא תמיד הצליחו להחזיק תהליך ארוך, ולעיתים נזקקו להכוונה מדויקת מדי. GPT‑5.5 מנסה לסגור את הפער הזה ולהפוך את המודל לסוכן שמבין מטרה, מפעיל כלים, ומתקדם באופן עצמאי בלי שצריך להחזיק לו את היד.

איך זה עובד בפועל?

החידוש הגדול של GPT‑5.5 הוא שילוב של שלוש יכולות שמאפשרות לו לעבוד בעולם אמיתי, לא רק בתוך חלון טקסט.

היכולת הראשונה היא שליטה במחשב ובדפדפן. המודל יודע ללחוץ, להקליד, לנווט, לפתוח קבצים, לערוך מסמכים, לבדוק טבלאות ולהריץ בדיקות ממש כמו משתמש אנושי.

במבחן OSWorld, שמודד יכולת "נהיגה" במחשב, GPT‑5.5 הגיע ל‑78.7 אחוז - מעל קו הבסיס האנושי של 72.4 אחוז. זה נתון שממחיש עד כמה המודל כבר לא מוגבל לטקסט בלבד.

הגרף המצורף מציג בצורה ברורה את השדרוג המשמעותי הזה. לא רק שהוא שומר על מהירות זהה לדור הקודם, הוא גם מדויק יותר ויציב יותר במשימות שמדמות שימוש אמיתי במחשב. ב‑OSWorld‑Verified, שמודד יכולת שליטה במחשב, GPT‑5.5 משיג תוצאות גבוהות יותר בכל רמות המורכבות. ב‑Tau2‑bench Telecom, שמודד דיוק במשימות ניתוח טקסט מורכבות, הוא מציג עקביות גבוהה יותר לאורך כל טווח הטוקנים:

GPT‑5.5 מציג שיפור עקבי בשליטה במחשב ובדיוק אנליטי | OpenAI

היכולת השנייה היא Auto‑review - בדיקה עצמית בזמן אמת. המודל לא מסתפק בתשובה ראשונה. הוא מאתר בעיות, מתקן, וממשיך. זהו שינוי מהותי שמאפשר לו לעבוד לאורך זמן ולתקן טעויות לפני שהן מתגלגלות לפתרון שגוי.

כאן נכנסת לתמונה היכולת השלישית: יעילות טוקנים גבוהה בהרבה. GPT‑5.5 מבצע את אותן משימות עם פחות טוקנים ולעיתים בפחות סיבובים. למרות שהמודל יקר יותר ב‑API, הוא מפצה על כך בכך שהוא פשוט עובד בצורה נקייה יותר. OpenAI מציינת שהמודל שומר על זמן תגובה זהה ל‑GPT‑5.4, אך משתמש בפחות טוקנים לאותה משימה - שילוב נדיר של מהירות ויעילות.

מה חדש ב‑Codex

כאן נמצא הלב של השדרוג. GPT‑5.5 יודע לעבוד ישירות מול מסמכי Docs, Sheets ו‑Slides, לנתח PDF, להריץ בדיקות קוד אוטומטיות, לתמוך ב‑LaTeX (תקן לכתיבה מקצועית של נוסחאות ומסמכים טכניים), ולבצע פרויקטים מתמשכים לאורך זמן. הוא מרגיש פחות שביר, פחות "ממציא", ויותר כמו מהנדס שמבין את המערכת ומקבל החלטות. גם בעבודה עם Swift ואפליקציות Mac ניכר שיפור, בעיקר ביציבות וביכולת להתמודד עם פרטים קטנים ומעצבנים שמאפיינים פיתוח מקומי.

המודל גם תומך ב-computer use, יכולת נפרדת מהדפדפן, שמאפשרת לו לבצע פעולות מערכת מלאות. זה צעד נוסף בדרך למודל שמסוגל לבצע עבודה אמיתית על מחשב אמיתי.

הבנצ'מרקים וטבלת ההשוואה הרחבה בין המודלים

השוואת ביצועים רוחבית: GPT‑5.5 מוביל ברוב הקטגוריות, אך לא בכולן | OpenAI

ב‑Terminal‑Bench 2.0 (משימות אמיתיות בתוך סביבת טרמינל) הוא מציג קפיצה משמעותית ל‑82.7 אחוז, מעל Opus 4.7 ו‑Gemini 3.1 Pro. גם ב‑OSWorld‑Verified וב‑Toolathlon (בנצ'מרק שמודד עד כמה מודל מסוגל לבצע משימות מורכבות באמצעות כלים חיצוניים) הוא שומר על יתרון יציב.

יחד עם זאת, במבחני קוד אחרים שלא מופיעים בטבלה, כמו SweBench Pro, מודלים כמו Opus 4.7 עדיין מציגים יתרון. זו לא תחרות של “מודל מנצח”, אלא של מודל יציב יותר, יעיל יותר, ומסוגל להתמודד עם מגוון רחב יותר של משימות.

הגרף המצורף מציג את אחד המדדים החשובים ביותר בהשקה: היכולת של המודל לבצע משימות מקצועיות ברמה שמתקרבת, ולעיתים עוברת מומחים אנושיים. GPT‑5.5 מגיע ל‑84.9 אחוז (ניצחונות + תיקו), הגבוה ביותר מבין כל המודלים שנבדקו. זה נתון שממחיש את היכולת של המודל לעבוד כ"סוכן" ולא רק כמודל שיחה:

GPT‑5.5 מוביל את מבחן GDP‑Val עם 84.9% | OpenAI

המודל תומך בחלון הקשר של עד 400 אלף טוקנים, ומציע גם Fast Mode שמספק תגובות מהירות יותר במחיר גבוה יותר. ב‑API המחיר גבוה פי שניים מהדור הקודם, אך היעילות הטוקנית מפצה על כך במקרים רבים.

הגרף המצורף מציג מדד רוחבי שמעריך את היכולת של מודלים לבצע ניתוחים מורכבים לאורך משימות ארוכות. GPT‑5.5 מוביל באופן ברור על פני GPT‑5.4, Claude Opus 4.7 ו‑Gemini 3.1 Pro, גם כשהמשימות דורשות נפח טוקנים גדול. זוהי המחשה מצוינת לטענה שהשדרוג ב‑GPT‑5.5 הוא לא רק “עמוק” אלא “רוחבי”: יציבות, עקביות ויכולת להחזיק תהליכים ארוכים:

GPT‑5.5 מוביל במדד ומציג יציבות גבוהה לאורך משימות ארוכות | OpenAI

בסרטון המצורף מוצגת סקירה תמציתית וברורה של GPT‑5.5 שמתמקדת ביכולות החדשות שלו כסוכן עבודה. הוא עובר על הבנצ'מרקים המרכזיים, מסביר כיצד המודל שומר על מהירות זהה לדור הקודם תוך שימוש בפחות טוקנים, ומדגים שליטה במחשב, עבודה בדפדפן, בניית משחקים פשוטים, ניתוח נתונים מורכבים ויכולות קודקס מתקדמות. הסרטון מספק מבט מהיר אבל מקיף על השדרוגים המשמעותיים של המודל החדש כולל המחירים המעודכנים, חלון ההקשר המורחב, רמות המאמץ (effort levels) וההבדלים מול GPT‑5.4:

עיצוב שמבין הקשר

אחד השדרוגים המפתיעים נמצא דווקא בתחום העיצוב. GPT‑5.5 עדיין לא מעצב מאפס, אבל הוא מצטיין בהמשך עיצוב קיים. כשנותנים לו Figma או UI קיים, הוא מצליח לשמור על סגנון, היררכיה ועקביות. השילוב עם ChatGPT Images 2.0 משנה את התמונה עם האפשרות לייצר מוקאפים שהמודל מממש אותם בקוד. זו זרימת עבודה חדשה שמפחיתה את החולשה ההיסטורית של מודלים של OpenAI בתחום העיצוב.

אבטחה שמגיעה מהשטח

כאן מגיע אחד החידושים החשובים ביותר. GPT‑5.5 מצטיין בבדיקות אבטחה ומוצא פרצות אמיתיות בקוד. כאן חשוב לציין את עבודתו של מאט שומר (Matt Shumer), אחד מהבודקים החיצוניים הבולטים של מודלי GPT. שומר עבד עם GPT‑5.5 לאורך תקופה, בחן אותו על קוד אמיתי, ניהל תהליכי פיתוח מלאים, ופרסם סקירה מקיפה על החוויה שלו. הוא מדווח שהמודל מצא בעיות אבטחה שמודלים אחרים, כולל Opus, פספסו.

זה מידע שמגיע מניסיון שטח אמיתי, לא מהדגמות שיווקיות, והוא מחזק את התחושה ש‑GPT‑5.5 הופך את בדיקות האבטחה לכלי יומיומי ולא לתהליך נדיר.

איפה זה עומד מול Claude 4.7

במבחני קוד מסוימים, במיוחד מול SweBench Pro, Claude 4.7 עדיין מוביל. אבל חלק מהפער נובע לא מהמודל עצמו אלא מהחומרה שמסביבו: Claude Code הוא כיום סוכן בשל יותר, עם מנגנוני תזמור (אורקסטרציה) פנימיים שמנהלים תהליכים ארוכים בצורה חלקה.

GPT‑5.5, לעומת זאת, מצטיין במהירות, ביעילות טוקנים וביכולת לעבוד עם כלים אמיתיים. הוא פחות מבריק בעיצוב מאפס, אבל חזק יותר בביצוע, באבטחה ובמשימות מרובות שלבים. זו לא תחרות של "מי יותר חכם", אלא של "מי בנוי טוב יותר למשימה מסוימת".

GPT‑5.5 לא מרגיש כמו קפיצה דרמטית, אלא כמו התייצבות. הוא לא ממציא יכולות שלא ראינו, אלא הופך אותן ליציבות, מהירות, זולות ויעילות יותר. הוא מרחיב את הרצפה, לא את התקרה. הוא הופך את מה שכבר היה אפשרי למשהו שאפשר לסמוך עליו. זה עדכון שמרגיש פחות כמו מהפכה ויותר כמו התבגרות של מהפכת הסוכנים: פחות דיבורים, יותר עבודה.

זמינות ומחירים

GPT‑5.5 זמין כבר היום למשתמשי ChatGPT Plus, Pro, Business ו‑Enterprise, והוא נגיש גם דרך Codex למפתחים. ב‑API המודל מתומחר ב‑5 דולר למיליון טוקנים בקלט ו‑25 דולר למיליון טוקנים בפלט. המחיר זהה ל‑GPT‑5.4, אך יעילות הטוקנים הגבוהה של GPT‑5.5 הופכת את העלות בפועל לנמוכה יותר במשימות ארוכות. בנוסף מוצע Fast Mode, שמספק זמן תגובה מהיר יותר במחיר של 7.5 דולר לקלט ו‑37.5 דולר לפלט למיליון טוקנים.

כלי עבודה אמיתי

GPT‑5.5 הוא מודל שמרגיש פחות כמו צעצוע ניסיוני ויותר כמו כלי עבודה אמיתי. הוא לא מושלם, לא מנצח בכל בנצ'מרק, ולא מחליף חשיבה אנושית. אבל הוא סוכן עבודה מהיר, יעיל, יציב, וכזה שמסוגל לבצע משימות מורכבות מקצה לקצה. זה לא עדכון שמטריף את הדמיון - זה עדכון שמתחיל לשנות את סגנון העבודה עם המודל.

בעמוד ההשקה הרשמי של OpenAI מציגים את GPT‑5.5 דרך הדגמות חיות, בנצ'מרקים מלאים וניתוח מפורט של היכולות החדשות של המודל כסוכן עבודה. זה מקור מצוין למי שרוצה להעמיק בהכרזה המקורית ולראות את הדוגמאות שהובילו את השדרוג.

ולמי שרוצה ממש להרחיב וללמוד, הסקירה של Matt Shumer מציגה מבט מעמיק ובלתי אמצעי על GPT‑5.5 מתוך עבודה ממושכת עם המודל בסביבות פיתוח אמיתיות. שומר בחן את המודל לאורך זמן, הריץ עליו פרויקטים מלאים, בדק את יכולות ההנדסה, העיצוב והאבטחה שלו, ופרסם ניתוח מפורט שמדגיש את המקומות שבהם GPT‑5.5 מצטיין ואת המקומות שבהם הוא עדיין פחות בשל. זו סקירה שמביאה ניסיון שטח אמיתי, לא הדגמות שיווקיות, והיא משלימה את התמונה לגבי מה המודל יודע לעשות בעולם האמיתי.

הפוסט פחות דיבורים ויותר עבודה: מה באמת חדש ב‑GPT‑5.5 הופיע ראשון בLet's AI בינה מלאכותית

Claude Opus 4.7 עם עדכון משמעותי ליכולות קוד, ראייה וזיכרון

רון גולד — Sat, 18 Apr 2026 10:11:53 +0000

Opus 4.7 הוא העדכון החדש למודל הדגל של Anthropic. הוא לא משנה את כללי המשחק, אבל כן מוסיף יכולות שמרגישות כמו התקדמות אמיתית: עבודה רציפה לאורך זמן, הבנה טובה יותר של תמונות, זיכרון שמחזיק לאורך סשנים ארוכים וכלים שמאפשרים למודל לא רק לכתוב קוד אלא גם לבדוק את עצמו. העדכון מתאים למשתמשים שרוצים מודל יציב ומדויק יותר בלי להעמיק בהגדרות טכניות, ובמקביל נותן למפתחים את השליטה הדרושה כדי לשלב אותו במערכות קיימות.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

האתגרים של הדור הקודם

מודלים קודמים, ובמיוחד מודל הדגל האחרון (opus 4.6) ידעו לכתוב קוד טוב, אבל כשהעבודה נמשכה לאורך זמן הם נטו לאבד יציבות. משימות ארוכות כמו ניתוח קוד מורכב או פתרון בעיות רב שלביות הסתיימו לפעמים בתוצאה חלקית או שגויה.

גם יכולות הראייה היו מוגבלות: צילומי מסך צפופים, דיאגרמות טכניות או מסמכים סרוקים דרשו מהמשתמש לפשט את התמונה או להסביר אותה במילים.

בנוסף, אפילו פרומפטים מכוילים היטב (כאלה שנוסחו בקפידה) לא תמיד התנהגו באופן עקבי, משום שהמודלים פירשו הוראות בצורה חופשית מדי.

השוואה רוחבית של Opus 4.7 מול גרסאות קודמות ומודלים מתחרים | Anthropic

מה חדש ב- Opus 4.7

אוטונומיה ארוכה ויכולת בדיקה עצמית

Opus 4.7 יודע לתכנן משימות ארוכות ולשמור על קו מחשבה יציב לאורך זמן. הוא גם בודק את עצמו לפני שהוא מחזיר תשובה. יכולת הבדיקה העצמית פירושה שהמודל עובר על הלוגיקה שלו, מחפש טעויות ומתקן אותן. זה לא מחליף בקרה אנושית, אבל כן מפחית טעויות מפתיעות ומעלה את רמת האמינות.

Opus 4.7 שומר על יתרון ככל שרמת המאמץ והטוקנים עולה | Anthropic

ראייה ברזולוציה גבוהה

המודל יכול לעבד תמונות ברזולוציה של עד 3.75 מגה פיקסל. בפועל זה אומר שהוא רואה הרבה יותר פרטים. היכולת הזו מאפשרת לו להבין צילומי מסך צפופים, דיאגרמות טכניות, עיצובים מורכבים, מסמכים סרוקים ואפילו מבנים כימיים. חברת XBOW דיווחה על שיפור משמעותי בדיוק הוויזואלי, מ-54.5 אחוז ל-98.5 אחוז.

שיפור ביכולות ניווט ויזואלי, במיוחד ברזולוציה גבוהה ובשימוש בכלים | Anthropic

זיכרון מבוסס קבצים

Opus 4.7 משתמש טוב יותר בזיכרון מבוסס קבצים. הוא זוכר הערות ומידע לאורך זמן, גם בין סשנים שונים, ולכן המשתמש לא צריך לחזור על כל פרט בכל פנייה מחדש.

שיפור ביכולות חשיבה לאורך הקשר ארוך במשימות גרף מורכבות | Anthropic

עמידה מדויקת בהוראות

המודל מפרש הוראות בצורה מדויקת יותר. זה משפר עקביות ואמינות, אבל דורש לעיתים התאמה מחדש של פרומפטים קיימים, במיוחד כאלה שנוסחו בצורה עדינה או תלויה בהתנהגות קודמת של המודל.

כלים חדשים ב‑Claude Code

Opus 4.7 מוסיף ל‑Claude Code סט כלים שמטרתו להפוך עבודה עם קוד למשימה ברורה ויעילה יותר. הכלים האלה מאפשרים למודל לקבל החלטות בעצמו, לסכם התקדמות, להציג רק את מה שחשוב ולבצע ביקורת קוד מעמיקה. גם משתמשים שאינם טכניים יכולים להבין אותם, ובמקביל מי שמכיר פקודות סלאש ימצא אותן משולבות בצורה טבעית.

Auto Mode

מצב שבו המודל מחליט לבד אילו פעולות בטוחות להריץ ואילו דורשות אישור. זה חוסך זמן ומפחית את הצורך לאשר כל פעולה ידנית.

פחות אישורים מיותרים

הפקודה less-permission-prompts/ סורקת את היסטוריית העבודה ומוסיפה לרשימת המותר את הפעולות שכבר אישרתם בעבר. התוצאה היא פחות הפרעות וזרימה חלקה יותר.

תצוגה ממוקדת

הפקודה focus/ מציגה רק את התוצר הסופי ומסתירה את שלבי הביניים - שימושי כשצריך לראות את התוצאה בלי הרעש שמסביב.

ביקורת קוד מעמיקה

הפקודה ultrareview/ מפעילה סשן ביקורת קוד שמדמה מבקר אנושי קפדן. היא מסמנת בעיות לוגיות, חוסר עקביות ונקודות לשיפור.

Opus 4.7 במספרים

Opus 4.7 מציג שיפור עקבי ברוב הבנצ'מרקים, במיוחד במשימות קוד מורכבות. בנצ'מרקים הם מבחנים סטנדרטיים שמודדים יכולות של מודלים בתחומים שונים, כמו פתרון בעיות תכנות, הבנת סביבות עבודה או ניתוח מידע. לצד ההתקדמות, יש גם תחומים שבהם הביצועים פחות טובים, ולכן חשוב להבין את התמונה המלאה לפני מיגרציה (מעבר מגרסה אחת של המודל לגרסה חדשה).

Opus 4.7 משפר ביצועים בבנצ'מרקי קוד מורכבים לעומת 4.6 | Anthropic

שיפורים בולטים

Opus 4.7 מציג קפיצה ברורה ביכולות הקוד, הניתוח וההבנה הלוגית. בבנצ'מרק SWE bench Pro הוא מטפס מ-53.4 אחוז ב-4.6 ל-64.3 אחוז, שיפור שממחיש את היכולת שלו להתמודד עם תיקוני באגים מורכבים. בגרסת SWE bench Verified הוא מגיע ל-87.6 אחוז, נתון שממקם אותו כאחד המודלים המדויקים ביותר במשימות קוד מאומתות.

גם ב-CursorBench הוא שומר על יציבות גבוהה עם 70 אחוז, וב-MCP Atlas הוא עולה ל-77.3 אחוז, מה שמראה שיפור ביכולות שימוש בכלים בקנה מידה רחב.

ב-OSWorld Verified הוא מגיע ל-78 אחוז, עדות ליכולת טובה יותר לבצע פעולות מורכבות בסביבות מחשב אמיתיות. ובקצה העליון של היכולות האקדמיות, GPQA Diamond מציב את Opus 4.7 על 94.2 אחוז - רמת דיוק שממחישה את העומק הלוגי והיכולת להתמודד עם שאלות ברמת תואר שני ומעלה.

Opus 4.7 מציג קפיצה ביכולות ניתוח וידע כלליות | Anthropic

בנוסף, חברת Rakuten דיווחה כי בבנצ'מרק הפנימי שלהם המודל פתר פי שלושה משימות פרודקשן לעומת גרסאות קודמות.

מגבלות

לצד השיפור הרחב ביכולות, יש גם תחומים שבהם Opus 4.7 מציג נסיגה או פער מול מודלים אחרים. בבנצ'מרק BrowseComp, שמודד את היכולת של סוכנים לבצע חיפוש וניתוח מידע ברשת, המודל יורד בכארבע נקודות לעומת Opus 4.6 - שינוי שמורגש במיוחד אצל צוותים שמריצים סוכני מחקר כבדים.

גם ב-Terminal Bench 2.0, מבחן שמדמה עבודה רציפה בטרמינל, Opus 4.7 מגיע ל-69.4 אחוז, נתון נמוך מהתוצאה של GPT 5.4 שמגיע ל-75.1 אחוז. עבור משתמשים שמסתמכים על משימות טרמינל מורכבות, זה פער שצריך לקחת בחשבון לפני מעבר לגרסה החדשה.

השוואה ל- Mythos Preview

Mythos Preview עדיין מוביל ברוב הבנצ'מרקים, אך אינו זמין לציבור הרחב. Anthropic ציינה כי Opus 4.7 עבר הפחתה מכוונת ביכולות סייבר כדי לבדוק מנגנוני הגנה חדשים, ולכן חלק מהפערים צפויים.

אבטחה, מידע למשתמש המתקדם ו- Cyber Verification Program

Opus 4.7 כולל מנגנוני אבטחה שמטרתם למנוע שימוש לרעה. המודל חוסם באופן אוטומטי בקשות שנראות מסוכנות, גם אם המשתמש התכוון אליהן בהקשר לגיטימי. עבור צוותים שעוסקים במחקר אבטחה או בדיקות חדירות, זה עלול ליצור חיכוך.

כדי להתמודד עם זה, Anthropic מפעילה תוכנית ייעודית למקצועני אבטחה, שמאפשרת להם לעבוד עם המודל תחת תנאים מבוקרים וללא חסימות מיותרות.

Tokenizer inflation

בגרסה הזו אותו טקסט עשוי לעלות יותר טוקנים מאשר בעבר, בדרך כלל בין 1.0 ל- 1.35 יותר. טוקנים הם יחידות טקסט קטנות שהמודל משתמש בהן כדי לעבד מידע, ולכן עלייה במספר הטוקנים משפיעה על עלות השימוש. ברמות מאמץ גבוהות המודל גם מייצר יותר טוקנים בפלט, מה שמגדיל את הצריכה הכוללת.

המלצות מיגרציה

מיגרציה היא תהליך המעבר מגרסה ישנה של המודל לגרסה חדשה. זה כולל בדיקה שהמערכת, הקוד והפרומפטים ממשיכים לעבוד כרגיל גם אחרי השדרוג.

כדי לבצע מיגרציה חלקה ל- Opus 4.7 מומלץ:

להריץ מדידות על תעבורה אמיתית כדי להבין את השפעת עליית הטוקנים.
לבצע רגרסיה לפרומפטים ולוודא שהם עדיין מניבים את התוצאות הרצויות.
להשתמש ב- effort control כדי לשלוט בעומק החשיבה של המודל.
להגדיר task budgets שמגבילים את כמות העבודה שהמודל מבצע בכל משימה.
להשיק rollout מדורג, כלומר להפעיל את הגרסה החדשה בהדרגה ולשמור אפשרות לחזור אחורה במקרה הצורך.

Claude Design: יצירה דרך שיחה

לצד Opus 4.7 Anthropic השיקה את Claude Design, כלי שמאפשר ליצור עיצובים, מצגות, דפי מוצר ואבי טיפוס פשוט על ידי שיחה. המשתמש מתאר מה הוא רוצה, ו- Claude מייצר גרסה ראשונית שאפשר לשפר דרך שיחה, הוספת הערות או עריכה ישירה על המסך.

לאחר שהעיצוב מוכן אפשר לייצא אותו ל Canva, לקובץ PDF או PPTX, או להעביר אותו ישירות ל Claude Code להמשך פיתוח. הכלי גם יודע לקרוא את קבצי העיצוב והקוד של הצוות, לבנות מהם ספריית עיצוב פנימית וליישם אותה אוטומטית על כל פרויקט חדש, כך שהתוצרים נשארים עקביים עם המותג.

Claude Design זמין בשלב research preview למשתמשי Pro, Max, Team ו- Enterprise. להשקה הזו נייחד מדריך נפרד שייצא בקרוב.

Introducing Claude Design by Anthropic Labs: make prototypes, slides, and one-pagers by talking to Claude.

Powered by Claude Opus 4.7, our most capable vision model. Available in research preview on the Pro, Max, Team, and Enterprise plans, rolling out throughout the day. pic.twitter.com/2BgBGtgYGX

— Claude (@claudeai) April 17, 2026

מחיר וזמינות

המחיר של Opus 4.7 נשאר זהה לגרסה הקודמת: 5 דולר למיליון טוקנים בקלט ו- 25 דולר למיליון טוקנים בפלט. המודל זמין תחת המזהה claude-opus-4-7.

Opus 4.7 זמין לשימוש ב- Claude.ai, ב- Claude Code, דרך Anthropic API, ובפלטפורמות Bedrock, Vertex AI ו- Microsoft Foundry.

עדכון משמעותי, אבל לא לכל אחד

Opus 4.7 מביא שיפור עקבי ביכולות קוד, ראייה וזיכרון, לצד כלים שמיועדים לעבודה ארוכה ורב שלבית. הנתונים מצביעים על מודל חזק יותר מ- Opus 4.6 בתחומים רבים, אך לא בכל מדד, והוא כולל שינויים תפעוליים שמחייבים בדיקה לפני מיגרציה. עבור משתמשים שמפתחים סוכנים, מבצעים ביקורת קוד או יוצרים תוצרים מקצועיים, זה בהחלט עדכון משמעותי.

הפוסט Claude Opus 4.7 עם עדכון משמעותי ליכולות קוד, ראייה וזיכרון הופיע ראשון בLet's AI בינה מלאכותית

Personal Intelligence מגיע לישראל והופך לעוזר האישי שלכם

רון גולד — Sat, 18 Apr 2026 05:53:34 +0000

במשך שנים דיברנו על עוזרי בינה מלאכותית כאילו הם עומדים להפוך לחלק מהיומיום שלנו. הם ידעו לענות על שאלות כלליות, לנסח מיילים או להציע רעיונות, אבל לא באמת הכירו אותנו. הם לא ידעו מה אנחנו אוהבים, מה עשינו, מה תכננו או מה חשוב לנו. הם היו עוזרים, אבל לא אישיים. כעת גוגל מציגה בישראל את Personal Intelligence, או בשמו המקומי "AI מותאם אישית", יכולת חדשה בג׳מיני שמאפשרת לו להתחבר למידע האישי שלכם בגוגל באישור מפורש בלבד. המטרה היא לאפשר לעוזר להבין את ההקשר שבו אתם פועלים, ולא רק את השאלה שאתם שואלים. ברגע שהפיצ׳ר פעיל, ג׳מיני כבר לא מסתמך רק על ידע כללי. הוא מסוגל לקרוא מיילים רלוונטיים, לזהות דפוסים בתמונות, להבין במה צפיתם ב-YouTube ולשלב את כל זה לכדי תשובה אחת שמבוססת על החיים שלכם. זה צעד שמקרב את העוזר הווירטואלי להיות כלי שמבין את המשתמש, ולא רק את הטקסט שמופיע מולו. בישראל, ההשקה מתגלגלת. הפיצ׳ר זמין כבר עכשיו למנויי Gemini Advanced ו-Google One AI Premium, ויגיע לכל המשתמשים בהמשך.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

שכבת הבנה חדשה שמבוססת על החיים שלכם

למרות ההתקדמות האדירה של מודלי שפה, הם עדיין פעלו מתוך ידע כללי בלבד. הם ידעו לענות על שאלות מורכבות, אבל לא על שאלות שנוגעות לחיים האישיים של המשתמש. הם לא יכלו לשלוף מידע מתוך מיילים, להבין מה חשוב לכם לאורך זמן, או להציע המלצות שמבוססות על ההיסטוריה שלכם.

הפער הזה הפך את העוזרים הווירטואליים לכלים מרשימים אך מוגבלים, טובים בידע אך לא בהקשר, יעילים בהסברים אבל לא מכירים אתכם טוב מספיק. Personal Intelligence נועד לגשר על הפער הזה ולהוסיף ל-Gemini יכולת להבין את המשתמש דרך המידע האישי שכבר קיים בחשבון שלו, כך שהעוזר יכול לפעול מתוך תמונה רחבה ומדויקת יותר של המשתמש שמולו.

מה Personal Intelligence מאפשר בפועל

Personal Intelligence מוסיף ל-Gemini יכולת לחבר בין מקורות מידע שונים בחשבון שלכם ולבנות מהם תמונה רחבה יותר של ההקשר שבו אתם פועלים. הוא לא מסתפק בקריאה של מייל או תמונה בודדת, אלא מצליב ביניהם. אם אתם מתכננים חופשה, הוא יכול לשלב תמונות מטיולים קודמים, מיילים עם המלונות שאהבתם וסרטונים שצפיתם בהם.

אחד השדרוגים המשמעותיים שמגיעים יחד עם Personal Intelligence הוא החיבור בין מחולל התמונות של גוגל (Nano Banana) לבין ספריית התמונות האישית שלכם ב‑Google Photos. עד היום, כדי לייצר תמונה שמבוססת עליכם הייתם צריכים להעלות תמונות רפרנס, לנסח פרומפטים ארוכים ולכוון את המודל ידנית. עכשיו, ברגע ש‑Personal Intelligence פעיל, Gemini יכול לגשת לגלריה שלכם (בקריאה בלבד) ולהבין מי אתם, איך אתם נראים, מי בני המשפחה ומה מאפיין את חיות המחמד שלכם.

המשמעות היא שאפשר פשוט לבקש בשפה טבעית: “תייצר תמונה של המשפחה שלי על גלגל ענק”, “תעשה ציור של הכלב שלי בסגנון פיקסאר” או “תיצור תמונה שלי רץ על חוף הים” - והמודל כבר יודע בדיוק על מי מדובר. זה הופך יצירת תמונות מותאמות אישית ממשהו טכני ומסורבל לחוויה טבעית, מהירה ואינטואיטיבית.

היכולת הזו מתחברת גם למנגנוני הזיכרון וההוראות של ג׳מיני, כך שהעוזר לא רק מבין אתכם ברגע נתון, אלא גם זוכר מה חשוב לכם לאורך זמן.

מה הוא לא עושה

כדי להבין את הפיצ׳ר באמת, חשוב להכיר גם את המגבלות שלו. היכולת של Gemini לדייק תלויה באיכות המידע שלכם. אם התמונות לא מתויגות, אם אין מיקום, אם המיילים עמומים, היכולת שלו לאחזר מידע רלוונטי נפגעת. הוא לא מנחש - הוא מאחזר.

בנוסף, Personal Intelligence הוא לא סוכן אוטונומי. הוא יודע לקרוא, להבין, להצליב ולהציע, אבל אינו מבצע פעולות מורכבות ללא פיקוח. הוא לא מזמין טיסות, לא מנהל משא ומתן ולא מבצע משימות מקצה לקצה. גם ההיכרות שלו אתכם היא הקשרית בלבד. הוא מזהה דפוסים, לא רגשות. הוא מבין העדפות, לא אישיות. זה פיצ'ר חזק, אבל לא קסם.

דוגמאות לשימוש אמיתי

היכולות החדשות של Gemini מאפשרות לשאול שאלות שלא היו אפשריות בעבר, והערך שלהן מתגלה דווקא בסיטואציות יומיומיות. כשאתם מבקשים ממנו למצוא את מספר הרכב שלכם, הוא לא “מנחש” אלא מאתר תמונות שבהן הרכב מופיע, קורא את לוחית הרישוי ומחזיר את המידע בתוך שניות. המשמעות היא שלא צריך לחפש ידנית בגלריה או במסמכים.

כשאתם מבקשים לזהות משהו שחוזר בתמונות שלכם, הוא מסוגל לזהות דפוסים לאורך זמן, למשל שאתם מציירים, מבשלים או מצלמים נופים, ולהציע רעיונות שמתאימים לתחומי העניין האמיתיים שלכם.

וכשאתם מבקשים לתכנן סופ״ש בפריז או למצוא פודקאסט שיעניין אתכם, הוא משלב בין ההיסטוריה שלכם ב-YouTube, מיילים ישנים והעדפות קודמות כדי להציע משהו שמבוסס על מי שאתם, לא על משתמש ממוצע. אלה דוגמאות שממחישות איך Personal Intelligence הופך את העוזר לכלי שמבין את ההקשר של החיים שלכם ומספק תשובות שמרגישות רלוונטיות ומדויקות יותר.

תבחרו איזה אפליקציות בא לכם לחבר

איך מפעילים את זה

ההפעלה של Personal Intelligence פשוטה, אבל נעשית רק ביוזמת המשתמש ובאישור מפורש. כך מפעילים:

1. פותחים את אפליקציית Gemini. ודאו שאתם מחוברים עם חשבון גוגל שבו תרצו להפעיל את הפיצ׳ר.
2. נכנסים להגדרות ועזרה דרך תפריט ראשי ← הגדרות ועזרה. גללו מעט למטה אם אינכם רואים את האפשרות מיד.
3. בוחרים AI מותאם אישית. זהו המסך המרכזי שמנהל את Personal Intelligence.
4. נכנסים לאפליקציות מקושרות ומגדירים איזה שירותים של גוגל יוכלו לספק מידע לג׳מיני.
5. מסמנים איזה שירותים רוצים לחבר.

ייתכן שהמיקום המדויק של האפשרות ישתנה מעט בין גרסאות האפליקציה, אבל העיקרון זהה: Personal Intelligence מופיע תחת הגדרות ג׳מיני, ומשם ניתן לבחור אילו שירותים לחבר.

בסופו של דבר, אתם קובעים מה מחובר ומה לא. Personal Intelligence עובד רק עם המידע שאתם בוחרים לשתף, ורק כל עוד בחרתם להשאיר את החיבור פעיל.

הפעלת AI מותאם אישית

אבטחת מידע: מה חשוב לדעת לפני שמפעילים

המידע האישי שלכם לא משמש לאימון המודל, וג׳מיני מקבל אליו גישה לקריאה בלבד. ניתן לנתק הרשאות בכל רגע, ואין שימוש פרסומי במידע או שיתוף עם צד שלישי. כל העיבוד מתבצע בתוך התשתית המאובטחת של גוגל, תחת אותם מנגנוני הגנה שמפעילים את שירותי הליבה של החברה.

הדבר היחיד שאינו מפורט במלואו הוא אילו שירותים נוספים עשויים להצטרף בעתיד או האם יתווספו יכולות עומק נוספות, אך במסגרת ההשקה הנוכחית התמונה ברורה: השליטה בידיים שלכם, והמידע נשאר בתוך החשבון שלכם.

עוזר אישי אמיתי

Personal Intelligence מסמן את המעבר מעוזרי AI כלליים לעוזרים אישיים באמת. הוא לא רק יודע הרבה - הוא יודע עליכם. הוא מבין הקשרים, זוכר העדפות ומסוגל לעזור במשימות שמבוססות על החיים האמיתיים שלכם. יחד עם זאת, הוא לא מחליף שיקול דעת אנושי, לא פועל באופן אוטונומי ולא פותר כל בעיה. הוא כלי חזק ושימושי, כל עוד מבינים את המגבלות ואת האופן שבו הוא עובד.

ההשקה בישראל מסמנת תחילתו של עידן שבו העוזר הווירטואלי הופך להיות חלק מהיומיום - לא רק מודל שפה חכם, אלא כלי אישי שמכיר אתכם, מבין אתכם ומסוגל ללוות אתכם במשימות שמבוססות על מי שאתם באמת.

הפוסט Personal Intelligence מגיע לישראל והופך לעוזר האישי שלכם הופיע ראשון בLet's AI בינה מלאכותית

איך לפתח חשיבה ביקורתית עם AI ולא להסתפק בתשובה הראשונה

הילה ששון — Fri, 17 Apr 2026 04:48:15 +0000

השימוש בצ’אטבוטים מבוססי בינה מלאכותית הפך בתוך זמן קצר להרגל כמעט אינטואיטיבי: שאלה מנוסחת, תשובה מתקבלת, והמשתמש ממשיך הלאה. אלא שמתחת ליעילות הזו מסתתרת הנחה סמויה שהתשובה הראשונה היא גם הטובה ביותר, ולעיתים אף הנכונה. בפועל, המציאות מורכבת בהרבה. דווקא בעידן שבו מידע נגיש יותר מאי פעם, היכולת להטיל ספק, לבחון לעומק ולפתח חשיבה ביקורתית הופכת לכלי מרכזי בעבודה עם מערכות AI.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

יש משהו מטעה באופן שבו מערכות בינה מלאכותית מציגות את עצמן. הן אינן מהססות, אינן מתלבטות, ולעיתים קרובות אף אינן מסמנות גבולות ברורים של אי ודאות. התוצאה היא טקסטים חלקים, קוהרנטיים ומשכנעים, אך לא בהכרח מדויקים, ולעיתים אף שטחיים יותר מכפי שהם נראים במבט ראשון.

דווקא בשל כך עולה הצורך בשאלה יסודית יותר: כיצד ניתן להעריך את איכותה של תשובה, ולא רק את קיומה? בשנים האחרונות מתחדדת תובנה נוספת - לא כל מודל AI חושב באותו אופן. הבחירה במודל, והאופן שבו מפעילים אותו, משפיעים באופן ישיר על איכות התשובות ועל היכולת לפתח חשיבה ביקורתית.

מעבר מצרכן מידע למבקר פעיל

השינוי הפסיכולוגי בשימוש ב-AI

כאשר משתמש פונה למערכת בינה מלאכותית, הוא לרוב מגיע מתוך צורך מיידי: פתרון בעיה, קבלת מידע או ניסוח טקסט. התשובה המתקבלת נתפסת כסיום התהליך, ולא כשלב ביניים. זהו דפוס טבעי, אך גם מגביל.

הנטייה לייחס למערכת סמכות מלאה נובעת מהאופן שבו היא מציגה מידע - בביטחון וללא הסתייגויות. בפועל, מדובר במודלים הסתברותיים, שמייצרים תשובות על בסיס דפוסים ולא על בסיס הבנה מלאה במובן האנושי.

מדוע התשובה הראשונה אינה מספיקה

תשובות של מודלי AI נוטות להיות כלליות, יעילות ומהירות, אך לא בהכרח מותאמות לעומק או להקשר הספציפי.

במקרים רבים, התשובה הראשונה מציגה מידע כללי במקום ניתוח מעמיק, מתבססת על הנחות שלא נאמרות במפורש, נעדרת ביקורת פנימית, ואינה בוחנת חלופות.

כאן נכנסת לתמונה חשיבה ביקורתית, לא כתכונה, אלא כפרקטיקה שניתן ליישם באופן שיטתי.

מודלי חשיבה ב-AI ומודלים "רגילים"

מודלים כלליים מול מודלי Reasoning

מודלים כלליים מתמקדים בהפקת טקסט קוהרנטי ורלוונטי. הם מצטיינים בכתיבה, סיכום והסבר.

לעומתם, מודלים המתמקדים ב-reasoning (הסקה) מיועדים לפירוק בעיות, ניתוח לוגי והסקת מסקנות מורכבות. הם נוטים להציג תהליך חשיבה מפורט יותר, ולעיתים גם לחשוף חוסר ודאות.

הבחירה בין סוגי המודלים תלויה במשימה:

לשאלה פשוטה - מודל כללי עשוי להספיק.
לבעיה מורכבת - נדרש מודל המעודד חשיבה תהליכית - מודל ריזונינג.

מודלי ריזונינג

כיצד לבחור את המודל המתאים

הבחירה אינה תמיד מפורשת למשתמש, אך ניתן להשפיע עליה דרך אופן השימוש:

פרומפט קצר וישיר יוביל לרוב לתשובה תגובתית.
פרומפט מורכב, עם דרישה לניתוח וביקורת, יפעיל דפוס רפלקטיבי יותר.

במילים אחרות, לא רק המודל קובע, אלא גם המשתמש.

1) שלב ראשון השהייה מכוונת

עצירה כפעולה אקטיבית

מרגע שמתקבלת תשובה, מתעוררת נטייה כמעט אוטומטית להמשיך. אך דווקא כאן נפתח מרחב הביקורת.

השהייה מאפשרת מעבר ממצב של צריכה למצב של בחינה.

פרומפטים מומלצים לשלב זה

כדי ליישם את השלב בפועל, ניתן להשתמש בניסוחים כמו:

"מה חסר בתשובה הזו?"
"אילו חלקים בתשובה דורשים הרחבה?"
"באילו היבטים התשובה עלולה להיות לא מדויקת?"

השאלות הללו מאלצות את המודל לצאת ממצב של הפקה למצב של הערכה.

2) שלב שני חשיפת הנחות וקריאה בין השורות

זיהוי מבנים סמויים

תשובות רבות נשענות על הנחות שאינן נאמרות. אלו יכולות להיות הנחות לגבי הקשר, ידע קודם או תנאים חיצוניים.

פרומפטים לחשיפת הנחות

"אילו הנחות עומדות בבסיס התשובה הזו?"

"על אילו תנאים אתה מסתמך כאן?"

"מה צריך להיות נכון כדי שהתשובה הזו תהיה תקפה?"

התוצאה היא מעבר מתשובה שטוחה למבנה רב-שכבתי.

חיבור למודלי Reasoning

בשלב זה, מודלים המתמקדים בהסקה מספקים ערך גבוה במיוחד. הם נוטים לפרק את התשובה ולהציג את התנאים שמאחוריה, במקום להישאר ברמת פני השטח.

3) שלב שלישי ביקורת שיטתית ופירוק

ניתוח לפני שיפור

שיפור ללא ביקורת מוביל לרוב לשינויים קוסמטיים בלבד. לכן, יש לפרק את התשובה.

פרומפטים לביקורת

"מהן הבעיות בתשובה הזו?"

"אילו טיעונים אינם מבוססים מספיק?"

"איפה קיימות הכללות או פשטנות יתר?"

שינוי תפקיד ה-AI

בשלב זה, ה-AI מפסיק להיות מקור סמכות, והופך לשותף בביקורת. זהו שינוי מהותי באופי האינטראקציה.

מצריכה אוטומטית לביקורת אקטיבית: שלבים 1-3 של המדריך. איך לעצור את האינסטינקט, לחשוף את ההנחות הסמויות של המודל ולפרק את התשובות באופן שיטתי לפני שמשתמשים בהן.

4) שלב רביעי שכתוב מודע

לאחר הביקורת, ניתן לבקש שכתוב:

"כתוב מחדש את התשובה תוך התייחסות לכל נקודות הביקורת."

פרומפטים לשיפור מתקדם

"שפר את התשובה כך שתהיה מדויקת יותר, גם במחיר של מורכבות."
"נסח תשובה שמציגה גם הסתייגויות ולא רק מסקנות."

שימוש במודלים רפלקטיביים

מודלים בעלי נטייה לחשיבה תהליכית יפיקו כאן תוצאה איכותית יותר, משום שהם “זוכרים” את שלבי הביקורת הקודמים ומשלבים אותם בתשובה.

5) שלב חמישי יצירת התנגדות

במקום לחפש אישור, יש לייצר חיכוך על ידי חשיבה דרך פרספקטיבות מנוגדות.

פרומפטים להתנגדות

"מהו הטיעון החזק ביותר נגד התשובה הזו?"

"כיצד ניתן לערער על המסקנה?"

"איזו גישה אחרת יכולה להוביל למסקנה שונה?"

הרחבת גבולות ההבנה

התוצאה היא מעבר מחשיבה לינארית לחשיבה מרובת פרספקטיבות. זהו שלב קריטי בהעמקה.

6) שלב שישי מעבר מתשובה לתהליך

כאשר משלבים את כל השלבים, מתקבלת שיטה ברורה:

תשובה >> בדיקה >> הנחות >> ביקורת >> שכתוב >> התנגדות

פרומפט מסכם לתהליך מלא

"נתח את התשובה הבאה: הצג הנחות, זהה בעיות, שפר אותה בהתאם, ולבסוף הצג טיעון נגדי חזק."

פרומפט כזה מפעיל את המודל באופן רפלקטיבי מלא.

שינוי תפקיד המשתמש

המשתמש אינו עוד מקבל תשובות, אלא מנהל תהליך. הוא מגדיר, מכוון ומבקר.

מביקורת למתודולוגיה: שלבים 4-6 של המדריך. איך ליישם את ניתוח ה-AI, לערער על מסקנות וליצור תהליך עבודה עקבי ומעמיק.

שימושים מעשיים והטמעה יומיומית

שילוב בתהליכי עבודה

הגישה מתאימה לכל תחום בכתיבה מקצועית, במחקר, בקבלת החלטות, ובלמידה עצמית.

איזון בין מהירות לעומק

לא כל אינטראקציה דורשת עומק. אך היכולת לזהות מתי כן היא קריטית.

יתרון בעולם רווי תשובות

בזמנים שבהם כל אחד יכול לקבל תשובה, היתרון אינו במהירות אלא באיכות החשיבה.

בסופו של דבר, האתגר בעבודה עם AI אינו נעוץ רק ביכולות המודל, אלא באופן שבו אנו משתמשים בו.

מי שמפתח חשיבה ביקורתית, מבין שתשובה היא רק התחלה, והיתרון האמיתי שייך למי שלא מסתפק בה.

הפוסט איך לפתח חשיבה ביקורתית עם AI ולא להסתפק בתשובה הראשונה הופיע ראשון בLet's AI בינה מלאכותית

6 פרומפטים ל-AI ב-HR לשיפור הפרודקטיביות

הילה ששון — Wed, 15 Apr 2026 07:21:18 +0000

מחלקת משאבי אנוש היא אחד המקומות שבהם הפער בין הפוטנציאל של AI לבין מה שקורה בשטח הוא עדיין עצום. סקרים שפורסמו ב-2025 מראים שרוב הארגונים הגדולים כבר משתמשים ב-AI באיזשהו שלב של גיוס, אבל רק מיעוט קטן מהעובדים באמת משלבים את הכלים האלה ביומיום. הפער הזה הוא בדיוק ההזדמנות. אנשי HR שיבנו לעצמם ארגז כלים נכון, גם בלי פלטפורמה יקרה ובלי צוות IT, יכולים לחסוך עשרות שעות בחודש ולשדרג את איכות העבודה שלהם. הנה חמישה שימושים קונקרטיים עם פרומפטים מוכנים שאתם יכולים להעתיק ולהדביק כבר היום.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

בוט לניתוח קורות חיים והתאמתם לדרישות המשרה

הסקרינינג הראשוני של קורות חיים הוא אחד השימושים הנפוצים ביותר של AI בעולם הגיוס, ולא בכדי. מגייס שמקבל מאות מועמדים לתפקיד יחיד מבזבז שעות רבות רק על מעבר ראשוני, ורובן מוקדשות למועמדים שאינם מתאימים. בוט חכם יכול לעשות את העבודה הזו בדקות, אבל רק אם בונים אותו נכון. הטעות הנפוצה היא לבקש מהמודל "לדרג" מועמדים בלי להגדיר קריטריונים ברורים, מה שמוביל לתוצאות לא עקביות ולעיתים מוטות.

הגישה הנכונה היא לבנות בוט שמבצע ניתוח מובנה: הוא מקבל את דרישות המשרה, מפרק אותן למרכיבים, עובר על קורות החיים, ומחזיר דוח שמראה בדיוק איפה יש התאמה ואיפה יש פערים. כך אתם לא מקבלים "ציון" עמום אלא תמונה שאפשר להסתמך עליה, ובעיקר אפשר לאתגר אותה.

איך מתחילים

כל מודל שיחה מתקדם כמו קלוד (Claude) או ChatGPT יודע לבצע את המשימה הזו. אתם פותחים פרויקט חדש, מעלים את דרישות המשרה כקובץ, ואז מעלים את קורות החיים אחד אחרי השני או במקבץ. חשוב להגדיר לבוט מסגרת עבודה קבועה כדי שהפלט יהיה אחיד בין מועמדים שונים.

פרומפט למיון קורות חיים

אתה בוט למיון קורות חיים למחלקת גיוס. מצורפים שני מסמכים: קובץ דרישות המשרה, וקובץ קורות חיים של מועמד.

המשימה שלך:
1. שלוף מקובץ המשרה 5-8 דרישות מרכזיות. הפרד בין דרישות חובה לבין דרישות רצויות.
2. עבור כל דרישה, בדוק אם היא מתקיימת בקורות החיים וציין איפה בדיוק בקורות החיים ראית את זה (ציטוט קצר או הפניה לשורה).
3. החזר טבלה עם שלוש עמודות: דרישה, סטטוס (מתקיים / חלקי / לא מתקיים / לא ניתן לקבוע), ביסוס.
4. בסוף, כתוב שלוש שאלות שאציג למועמד בראיון הטלפוני כדי לוודא את הפערים שזיהית.

אל תמציא מידע שלא מופיע בקורות החיים. אם חסר מידע, כתוב "לא ניתן לקבוע מהמסמך".

שימו לב לנקודה האחרונה: ההוראה לא להמציא מידע היא קריטית. בלי ההגבלה הזו, מודלים נוטים "להשלים את הסיפור" ולתת רושם שהמועמד מתאים יותר ממה שכתוב בפועל בקורות החיים.

כשיש עשרות מועמדים: תהליך עבודה לקבצים מרובים

הפרומפט הראשון מצוין למועמד בודד, אבל המציאות של רוב המגייסים שונה. מגיעים לתפקיד אחד 30, 50, לפעמים 200 קורות חיים, ואין זמן לעבור על כל אחד בנפרד. הגישה הנכונה למצב הזה היא לעבוד עם הבוט בשלבים מוגדרים מראש, כך שהוא יעבד את כל הקבצים ביחד ויחזיר בסוף הכרעה מבוססת ולא רק ערימת דוחות נפרדים.

שיטת העבודה בנויה משלושה צעדים, בסדר הזה בדיוק. הסדר אינו שרירותי - הוא מונע מהבוט "להסתחרר" על מידע חלקי ומבטיח שההכרעה הסופית תתבסס על אותם קריטריונים עבור כל המועמדים.

צעד 1 - העלאת הפרומפט תחילה

מדביקים את הפרומפט בשיחה חדשה לפני שמעלים קבצים. זה גורם לבוט "לטעון" את שיטת העבודה לפני שהוא רואה מידע, כך שהוא יודע בדיוק מה הוא אמור לעשות עם הקבצים שיגיעו. אם מעלים קבצים קודם, הבוט עלול להתחיל לנתח אותם מיד, לפי ההיגיון שלו ולא לפי ההיגיון שלכם.

צעד 2 - העלאת דרישות המשרה

אחרי שהבוט אישר שהוא הבין את המשימה, מעלים קובץ אחד בלבד - מסמך אפיון המשרה. מבקשים מהבוט לשלוף את הדרישות ולהציג אותן לאישורכם. כאן יש נקודת עצירה חשובה: אתם מאשרים את רשימת הדרישות לפני שממשיכים. זה הרגע לתקן, להוסיף דרישה שחסרה, או להוריד דרישה שהמנהל התעקש עליה אבל היא לא באמת קריטית.

צעד 3 - העלאת כל קורות החיים ביחד

רק אחרי שהדרישות מאושרות, מעלים את כל קבצי קורות החיים במכה אחת. הבוט כבר יודע את השיטה ואת הדרישות, ועכשיו הוא עובר על כל הקבצים ומחזיר השוואה מובנית - מי מתאים ולמה, מי לא ולמה, ומי שווה ראיון טלפוני קצר כדי לברר פערים.

דגש חשוב: מומלץ לא להעלות כמות גדולה מדי - נניח, עם 5 או 10 קו"ח הוא יתמודד בלי בעיה. אבל 50 זה כבר יותר מורכב.
דגש נוסף: חשוב להפעיל מודל ריזונינג מסדרת Thinking ב-ChatGPT, מודל Pro ב-Gemini או מודל Opus בקלוד.

פרומפט לניתוח השוואתי של קורות חיים

אתה בוט מיון קורות חיים למחלקת גיוס. נעבוד בשלושה שלבים. חשוב שתפעל בדיוק לפי הסדר ותחכה להוראה שלי בין שלב לשלב.

שלב 1 (עכשיו): אשר שהבנת את המשימה. אל תבקש ממני קבצים עדיין.

שלב 2: אעלה קובץ של דרישות המשרה. כשתקבל אותו:
- שלוף 5-8 דרישות מרכזיות
- הפרד בין דרישות חובה לבין דרישות רצויות
- הצג לי את הרשימה ושאל אם לאשר או לתקן
- אל תתחיל לנתח שום קובץ נוסף עד שאאשר את הדרישות

שלב 3: אחרי אישור הדרישות, אעלה את כל קורות החיים במכה אחת. עבור כל מועמד:
- זהה את השם מראש הקובץ
- עבור על כל דרישה ובדוק אם היא מתקיימת (מתקיים / חלקי / לא מתקיים / לא ניתן לקבוע)
- צטט הוכחה קצרה מקורות החיים לכל סטטוס

בסוף שלב 3, החזר לי שלושה פלטים:
1. טבלת השוואה: שורה לכל מועמד, עמודה לכל דרישה, סטטוס בכל תא.
2. דירוג מנומק: חלק את המועמדים לשלוש קבוצות - "מתאימים לראיון", "אולי, צריך בירור", "לא מתאימים". הסבר לכל מועמד למה הוא באותה קבוצה.
3. הכרעה: מי המועמד או שני המועמדים החזקים ביותר, ולמה דווקא הם. התבסס רק על מה שכתוב בקורות החיים.

אל תמציא מידע שלא קיים בקורות החיים. אם חסר מידע - "לא ניתן לקבוע". אל תיטה לטובת מועמד בגלל אורך קורות החיים שלו או עיצוב מרשים.

שלוש ההוראות האחרונות הן ההבדל בין ניתוח שימושי לבין ניתוח מטעה. בלי הוראה מפורשת להתעלם מעיצוב ומאורך, מודלים נוטים להעריך יתר על המידה מועמדים שכתבו קורות חיים מפורטים - גם אם התוכן עצמו חלש יותר ממועמד שכתב בקצרה ולעניין.

הטיפ שממנף את הניתוח: דאשבורד מקלוד

אחרי שהבוט החזיר את הטבלה והדירוג, אל תעצרו שם. העתיקו את כל התוצאה והדביקו אותה בשיחה חדשה בקלוד, עם בקשה פשוטה אחת: "הפק מזה דאשבורד אינטראקטיבי". קלוד יחזיר לכם ארטיפקט של דאשבורד בעיצוב נקי - עם פילטרים לפי דרישות, דירוגים ויזואליים, אפשרות לסנן לפי קבוצה, ואפילו להציג רק מועמדים שעמדו בכל דרישות החובה.

דגש: את הארטיפקט אפשר לשמור כקובץ HTML ולשתף, או לחלופין - לעשות צילום מסך ולשלב במצגת.
טיפ: ניתן ללחוץ על כפתור השיתוף ולשתף את הארטיפקט - אך זכרו, שיתוף משמעו שכל הקוד גם כן חשוף למי ששיתפתם איתו את הקובץ.

פרומפט להפקת דאשבורד מתוצאות הניתוח

מצורפים תוצאות ניתוח של קורות חיים עבור משרה של [שם התפקיד]. הפק מזה דאשבורד HTML אינטראקטיבי שכולל:

1. כרטיסיות מסכמות למעלה: סה"כ מועמדים, כמות מתאימים לראיון, כמות ב"אולי", כמות לדחייה.
2. טבלת השוואה של כל המועמדים מול כל הדרישות, עם תאים בצבע לפי סטטוס (ירוק/כתום/אדום/אפור).
3. פילטרים בראש הדאשבורד: לפי קבוצה, לפי דרישה ספציפית, חיפוש חופשי בשם.
4. לחיצה על שורת מועמד פותחת פאנל צדדי עם פירוט ההוכחות לכל דרישה.

עיצוב נקי, RTL, בעברית. השתמש בצבעים מתונים ולא בטונים מחוצפים.

למה זה משנה? כי ההבדל בין מסמך Word של תוצאות לבין דאשבורד הוא ההבדל בין "קראתי את הניתוח" לבין "אני יכול להראות לכל הצוות תוך חצי דקה". מנהל הגיוס פותח את הקישור, מסנן לפי קבוצת "מתאימים לראיון", ורואה מיד את שלושת המועמדים שעומדים בכל דרישות החובה. בזמן שנדרש לעבור על רשימה רגילה, הוא כבר שלח זימונים.

דאשבורד ניתוח נתונים שהופק בקלוד

בוט תקשורת לסמנכ"לי משאבי אנוש

סמנכ"לי HR מבלים חלק ניכר מהזמן שלהם בכתיבה. הודעות לצוותים על שינויים ארגוניים, מיילים לעובדים בנושאים רגישים, עדכונים תקופתיים, מסרים ממנכ"ל שצריך לעבד ולהפיץ. כל הודעה כזו צריכה להיות בשפה של הארגון, בטון שמתאים לתרבות הספציפית, ובלי ניחוח של תקשורת גנרית. זה בדיוק המקום שבו בוט מותאם אישית מייצר תוצאה שונה מהותית מכלי גנרי.

הסוד הוא לא לכתוב פרומפט חד פעמי, אלא לבנות בוט שמכיר את הארגון. המודלים המתקדמים מאפשרים לכם להגדיר הנחיות מערכת או להעלות קבצי רקע שמנחים אותו בכל שיחה. אתם מעלים דוגמאות של הודעות שיצאו בעבר מהארגון ונחשבו מוצלחות, מגדירים את ערכי הליבה, מציינים את רמת הפורמליות, ואז הבוט שלכם "מדבר" את השפה שלכם.

מה צריך לטעון לבוט לפני השימוש

דוגמאות של הודעות קודמות: 5-10 הודעות שיצאו לעובדים או לצוותים והיו מוצלחות. העתיקו אותן לקובץ אחד ותנו לבוט לנתח את הסגנון.

מילון מונחים ארגוני: שמות של תוכניות פנימיות, ערכי החברה, איך קוראים לצוותים השונים, ראשי תיבות נהוגים.

גבולות: נושאים שאסור לגעת בהם בלי אישור, מילים שלא משתמשים בהן, טון שרוצים להימנע ממנו.

פרומפט לבוט תקשורת ארגונית

אתה כותב תקשורת פנים - ארגונית בשם סמנכ"ל משאבי אנוש של [שם הארגון]. מצורפים קבצי רקע: דוגמאות של הודעות קודמות, מילון מונחים ארגוני, וקווים מנחים לטון.

לפני שתכתוב הודעה, שאל אותי את השאלות הבאות:
1. למי ההודעה מיועדת (כל הארגון / צוות ספציפי / הנהלה / מנהלים בלבד)?
2. מה המטרה (עדכון / בקשת פעולה / הודעה על שינוי / הוקרה / התמודדות עם אירוע)?
3. מה המסר המרכזי במשפט אחד?
4. האם יש אילוצים של אורך או פורמט (מייל / סלאק / הודעה קצרה)?

אחרי שאקבל תשובות, כתוב את ההודעה בסגנון ובטון שמשתקפים בדוגמאות שצירפתי. הצע שתי גרסאות: אחת ישירה וקצרה יותר, ואחת חמה ומפורטת יותר. אל תשתמש בקלישאות של תקשורת תאגידית. אל תוסיף סעיפים מיותרים של "יחד ננצח" אם זה לא הסגנון של הארגון.

הפרומפט הזה עובד טוב במיוחד כחלק מפרויקט קבוע בקלוד או ב-ChatGPT, כך שכל פעם שאתם נכנסים הבוט כבר מכיר את הארגון ולא צריך להסביר מאפס.

בוט לאפיון דרישות משרה

כתיבת מסמך אפיון משרה היא אחת המשימות שהכי מזלזלים בהן ב-HR, ולכן היא גם אחד המקומות שבהם AI יכול לעזור הכי הרבה. מסמך אפיון לא טוב גורר שרשרת של בעיות: מודעה עמומה, מועמדים לא מתאימים, מגייסים שלא יודעים מה בעצם מחפשים, וראיונות שלא ממוקדים. בוט שמלווה את מנהל הגיוס בתהליך האפיון יכול לחסוך שבועות של בלבול.

הערך של הבוט כאן, הוא לא בכתיבה עצמה אלא בשאלות שהוא שואל. מנהל שמבקש "לגייס מהנדס פולסטאק" לא תמיד יודע בעצמו מה הוא מחפש. כשבוט מנחה אותו עם שאלות חדות וספציפיות, הוא נאלץ לחשוב על זה לעומק, והתוצר הסופי משקף את מה שבאמת נדרש ולא את מה שכולם כותבים באינטרנט על התפקיד הזה.

פרומפט לאפיון משרה

אתה יועץ גיוס שעוזר לי לבנות מסמך אפיון דרישות למשרה חדשה. המטרה שלנו היא מסמך פנימי שמנהל הגיוס והמגייסים יעבדו ממנו.

נהל איתי תהליך בן 4 שלבים:

שלב 1 - הבנת התפקיד: שאל אותי שאלות על המטרה העסקית של התפקיד, למה נפתחה המשרה עכשיו, מה יקרה אם לא נאייש אותה, ולמי המועמד ידווח. אל תעבור לשלב הבא לפני שיש לך תשובות ברורות.

שלב 2 - תוצרים ומדדי הצלחה: שאל מה המועמד אמור להשיג ב-90, 180 ו-365 הימים הראשונים. אם התשובות עמומות, דחף לדוגמאות קונקרטיות.

שלב 3 - פרופיל המועמד: על בסיס התוצרים, עזור לי לגזור אילו כישורים באמת חיוניים (חובה) ואילו רצויים. אתגר אותי על דרישות שנשמעות אוטומטיות ("5 שנות ניסיון", "תואר ראשון") ושאל האם הן באמת קריטיות או סתם קופסה שמסמנים.

שלב 4 - מסמך סופי: סכם את כל מה שאספנו למסמך אפיון מובנה עם הכותרות: רקע עסקי, תוצרים מצופים, חובה, רצוי, פרופיל התנהגותי, שאלות לראיון, דגלים אדומים.

אל תמציא תשובות. אם לא ענית לי, שאל שוב עד שאענה.

היתרון המרכזי של הפרומפט הזה הוא בהוראה לאתגר את המשתמש וליצור שיח סביב דרישות שנשמעות אוטומטיות ונפוצות מדי. רוב מסמכי האפיון סובלים מהעתק-הדבק של דרישות שאף אחד לא באמת מאמין בהן, ובוט טוב מאלץ את המנהל להגן על כל אחת מהן.

טיפים נוספים: מחקר שוק ובנצ'מרקים עם פרפלקסיטי וכלי Deep Research

מעבר לבוטים ייעודיים, יש שני שימושים בסיסיים שכל איש HR צריך לאמץ ביומיום: חיפוש ספקים וקבלת הצעות מחיר, ומחקרי שוק על תנאי שכר וזכויות. שני השימושים האלה התחדדו מאוד עם הופעת פרפלקסיטי (Perplexity) וכלי Deep Research שמשולבים היום בקלוד וב-ChatGPT.

חיפוש ספקים והצעות מחיר

במקום לבלות שעות בגוגל ולפתוח 40 טאבים של ספקי הדרכה, סקרי עובדים, כלי well-being או מערכות ATS, אפשר להפעיל חיפוש ממוקד בפרפלקסיטי ולקבל השוואה בתוך דקות. המפתח הוא פרומפט מפורט שמציין את המגבלות שלכם: תקציב, גודל ארגון, דרישות שפה, אינטגרציות קיימות.

פרומפט לחיפוש ספקים

אני מחפש ספק ל-[סוג השירות, לדוגמה: מערכת סקרי עובדים תקופתיים] עבור ארגון ישראלי בגודל [מספר עובדים].

דרישות חובה:
- תמיכה בעברית מלאה
- עמידה בתקני פרטיות (GDPR / חוק הגנת הפרטיות)
- אינטגרציה עם [המערכות שיש לכם]
- טווח תקציב: [X] ש"ח בשנה

החזר לי:
1. חמישה עד שבעה ספקים מובילים שמתאימים לדרישות
2. טבלת השוואה עם: שם, מיקום מטה, גודל החברה, מחיר אינדיקטיבי, יתרונות מרכזיים, חסרונות ידועים
3. שלוש שאלות שאשאל כל ספק לפני שאבקש הצעת מחיר
4. קישורים למקורות שהתבססת עליהם

אל תכלול ספקים שאתה לא בטוח שהם פעילים או שאין לך מידע עדכני עליהם.

בנצ'מרקים של שכר וזכויות

אצל כל אנשי HR עולה מדי פעם השאלה "מה הארגונים האחרים עושים בתחום הזה". בין אם זה גובה שכר למפתחים בכירים, מספר ימי חופשה במשרד טכנולוגיה, או מה נהוג לתת כעזרה בלימודים. פרפלקסיטי וכלי Deep Research הפכו את המחקר הזה מפרויקט של שבועיים לעבודה של חצי שעה, אבל בתנאי שיודעים לבקש נכון.

פרומפט לבנצ'מרק שכר וזכויות

בצע מחקר מעמיק על [הנושא, לדוגמה: תנאי זכאות להחזר הוצאות לימודים בחברות הייטק בישראל].

התחל מחיפוש מקורות משני סוגים:
1. דוחות שכר וזכויות רשמיים (חברות ייעוץ, ארגוני מעסיקים, הלשכה המרכזית לסטטיסטיקה)
2. דיווחים פומביים של חברות או ראיונות עם אנשי HR בכירים

החזר לי:
- טווח נפוץ בשוק (מינימום, מקסימום)
- השוואה לפי גודל חברה (סטארטאפ עד 50, חברה בינונית 50-300, חברה גדולה 300+)
- תנאים נלווים שנהוג לצרף (תקופת ותק מינימלית, הגבלות, החזר במקרה עזיבה)
- מקורות מצוטטים לכל מספר שאתה מביא

אם יש סתירות בין מקורות, הצג אותן במפורש ואל תבחר צד.

ההוראה להציג סתירות בלי לבחור צד חשובה במיוחד. מודלי AI נוטים "להרגיע" את התמונה ולהציג קונצנזוס מדומה, גם כשהמציאות יותר מבולגנת. בנתוני שכר הבלגן הוא הכלל, לא היוצא מן הכלל.

מה שחשוב לזכור

כל הכלים והפרומפטים האלו מעולים למי שמבין ששום בוט לא מחליף את השיקול המקצועי שלכם. AI הוא עוזר מצוין במטלות חזרתיות, בפיצוח מסמכים ארוכים, בסיעור מוחות ובאיסוף מידע. הוא לא מקבל החלטות על אנשים. המועמד שהבוט "דירג נמוך" יכול להיות בדיוק האדם שהצוות שלכם צריך, וההודעה שהבוט ניסח יכולה להיות שטוחה בדיוק במקום שדורש את הקול האנושי שלכם. השתמשו בכלים האלה כדי לפנות זמן למה שבאמת חשוב: השיחות, הראיונות, המפגשים וההבנה האמיתית של מי שעובד אצלכם.

הפוסט 6 פרומפטים ל-AI ב-HR לשיפור הפרודקטיביות הופיע ראשון בLet's AI בינה מלאכותית

Claude נכנס ל-Word והופך לחלק טבעי מהמסמך עצמו

מערכת האתר — Tue, 14 Apr 2026 04:59:26 +0000

במשך שנים, העבודה עם מסמכים מקצועיים הייתה כרוכה ברצף פעולות שחוזרות על עצמן. עורכי דין עברו בין גרסאות, יועצים ניהלו טיוטות במייל, וחוקרים אקדמיים התמודדו עם עשרות הערות שוליים. גם כשהבינה המלאכותית נכנסה לחיינו, היא נשארה מחוץ למסמך. כדי לערוך, לשכתב או לסכם, היינו צריכים להעתיק טקסט לדפדפן, לקפוץ ל‑ChatGPT, להדביק בחזרה ולנסות לשמור על עיצוב שלא תמיד שרד את הדרך. Claude for Word משנה את המשוואה הזו. התוסף החדש של Anthropic מביא את Claude ישירות לתוך מסמכי Microsoft Word. לא עוד מעבר בין חלונות ולא עוד העתקה והדבקה. מסמנים טקסט, מתארים את השינוי הרצוי ומקבלים אותו כ‑Tracked Change מקורי של Word, כאילו עורך אנושי עבר על המסמך.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

הרעיון של AI בתוך כלי העבודה

גוגל כבר משלבת את Gemini ישירות ב‑Docs, Sheets ו‑Slides, ומיקרוסופט עושה זאת ב‑Microsoft 365 Copilot, שמובנה עמוק בתוך Word, Excel ו‑PowerPoint.

Claude for Word מצטרף למגמה הזו והוא לא עומד לבדו. Anthropic השיקה לא מזמן גם את Claude for Excel ואת Claude for PowerPoint, מה שהופך את Word רק לאחת מהנקודות שבהן Claude נכנס פנימה. זה מהלך רחב שבו Claude הופך לחלק טבעי מהאקוסיסטם של Office, לא כתוסף צדדי אלא כשותף עבודה שמבין את ההקשר, את הנתונים ואת המבנה של כל מסמך.

החידוש כאן אינו בעצם הרעיון אלא באופן שבו Anthropic מיישמת אותו. במקום לבנות סביבת עבודה חדשה, היא בוחרת להשתלב בכלים שהעולם כבר משתמש בהם. במקום להציע מערכת חלופית, היא נכנסת אל תוך Word, Excel ו‑PowerPoint, המקומות שבהם מתבצעת העבודה הקריטית ביותר של ארגונים.

הבעיה: AI שלא מדבר את השפה של מסמכים מקצועיים

למרות ההתקדמות המהירה של מודלים ג'נרטיביים, רובם עדיין לא משתלבים בתהליכי העבודה האמיתיים של ארגונים. הם מייצרים טקסט חדש במקום לערוך את הקיים, מאבדים עיצוב ומבנה ולעיתים משנים יותר ממה שהתבקשו. עבור מי שעובד עם חוזים, דוחות כספיים, מסמכי מדיניות או מחקרים אקדמיים, זה חסם משמעותי.

הפער הזה יצר מצב שבו AI היה כלי חיצוני. הוא היה חזק, אבל לא חלק מהתשתית. הוא ידע לכתוב, אבל לא לשמור על עקביות. הוא ידע לסכם, אבל לא לעבוד עם תגובות. ובעיקר, הוא לא ידע להציג עריכות כ‑Tracked Changes, יכולת בסיסית בעולם שבו כל שינוי חייב להיות שקוף.

בינה מלאכותית שנכנסת אל תוך Word

Claude for Word נבנה בדיוק סביב הפער הזה. הוא לא מבקש להחליף את Word אלא להעצים אותו. הוא לא מייצר טקסט חדש אלא עורך את הקיים, והוא לא מסתיר את עבודתו אלא מציג כל שינוי באופן טבעי, כאילו עורך אנושי עבר על המסמך.

עריכה שקופה לחלוטין

כל שינוי מופיע כ‑Tracked Change, וניתן לאשר, לדחות או להשוות אותו דרך כלי הבקרה המובנים של Word.

Claude מסכם ומציג שינויים במסמך משפטי | Microsoft

שמירה מלאה על עיצוב ומבנה

כותרות, בולטים, מספור, הפניות וסגנונות נשמרים כפי שהם, כך שהמסמך לא מאבד את הצורה המקורית שלו.

עבודה עם תגובות

Claude קורא תגובות, מבין את ההקשר, עורך את הטקסט המעוגן ומשיב בשרשור, בדיוק כמו עורך אנושי שממשיך את השיחה בתוך המסמך.

Claude מגיב להערות כמו עורך אנושי | Microsoft

שיחה רציפה בין Word, Excel ו‑PowerPoint

כאן נכנסת לתמונה העובדה ש‑Claude אינו מוגבל ל‑Word. ניתוח נתונים ב‑Excel, כתיבת מזכר ב‑Word ויצירת מצגת ב‑PowerPoint יכולים להתבצע בשיחה אחת רציפה. Claude זוכר את ההקשר, את הנתונים ואת ההנחיות ומעביר אותם בין הכלים ללא צורך בהעתקה או מעבר בין חלונות.

תהליכי עבודה חוזרים

Skills הם אחת היכולות המשמעותיות ביותר של Claude for Word, במיוחד עבור צוותים שעובדים עם מסמכים מורכבים וחוזרים על אותם תהליכים שוב ושוב. במקום לנסח מחדש הוראות בכל פעם, או להסתמך על זיכרון אישי של עובדים שונים, Skills מאפשרים לשמור תהליך עבודה כמתכון קבוע שכל חבר צוות יכול להריץ בלחיצה אחת.

בפועל, Skill הוא רצף הנחיות שמגדיר איך Claude צריך לעבוד על מסמך מסוים: מה לבדוק, מה לשכתב, אילו סעיפים חשובים, ואיך להציג את התוצאות. התהליך נשמר כיחידה אחת, כך שכל מי שמריץ אותו מקבל תוצאה עקבית, מדויקת ואחידה - ללא תלות בניסיון או בסגנון האישי שלו.

המשמעות הארגונית ברורה: פחות טעויות, פחות חיכוך, פחות זמן מבוזבז על הסברים חוזרים, והרבה יותר עקביות בין עובדים וצוותים.

דוגמאות לתהליכי עבודה שנשמרים כ‑Skills

סקירת חוזה: Claude בודק סעיפי שיפוי, הגבלת אחריות והתיישנות, מאתר חריגות ומציג אותן כ‑Tracked Changes עם הסבר ברור.
מזכר סטטוס: הפקת סיכום שבועי מתוך מסמכי מקור, כולל זיהוי נקודות מפתח, החלטות פתוחות ומשימות להמשך.
תדרוך מחקרי: יצירת Brief מתוך דוח שנתי תוך שליפה של נתונים רלוונטיים והצגת תובנות מרכזיות.
תרגום מקצועי: שמירה על מונחים ייחודיים, אחידות ניסוחים ודיוק רגולטורי בתרגום מסמכים.
QA רגולטורי: בדיקת תאימות לסטנדרטים, איתור הפניות שבורות, זיהוי מונחים לא עקביים והצעת תיקונים.

Skills הופכים את Claude לכלי צוותי אמיתי. במקום שכל עובד יפתח שיטות עבודה משלו, הארגון מגדיר תהליכים ברורים, ו‑Claude מבצע אותם בצורה עקבית, שקופה ומבוקרת.

תהליך ההתקנה

1. כדי להתחיל לעבוד עם Claude for Word יש לוודא שיש לכם חשבון Claude Team או Claude Enterprise.

2. לאחר מכן נכנסים ל‑Microsoft Marketplace ומתקינים את התוסף.

3. עם סיום ההתקנה מופיע סרגל צד חדש בתוך Word. לוחצים על אייקון Claude, מתחברים עם החשבון שלכם ומתחילים לעבוד.

משם התהליך אינטואיטיבי - מסמנים טקסט ומבקשים קיצור, שכתוב או שינוי טון, משאירים תגובה ו‑Claude עונה ומבצע את העריכה, פותחים תבנית ו‑Claude כותב בתוכה תוך שמירה על הסגנון, או מריצים Skill לקבלת תהליך עבודה מלא. החוויה מזכירה עבודה עם עורך מקצועי שיושב לידכם ומפנה זמן לחשיבה עמוקה יותר.

תוסף רשמי המותקן ישירות מתוך סביבת Office

אבטחה ותאימות ארגונית

Claude for Word תוכנן לעמוד בדרישות האבטחה של ארגונים גדולים. הוא מאפשר התחברות באמצעות חשבון Claude או דרך ספק ענן קיים באמצעות SSO, ופועל בתוך מסגרת ה‑Compliance של הארגון ללא צורך בפתרונות עוקפים. Anthropic אינה מאמנת את המודלים שלה על תוכן ארגוני, כך שהמידע נשאר בבעלות הלקוח ואינו משמש לשיפור המודל. בנוסף, התוסף עומד בתקן SOC 2 Type II, שמבטיח רמת אבטחה גבוהה לכל תהליך העבודה.

כך נראה העתיד של עבודה עם מסמכים

Claude for Word אינו המצאה של רעיון חדש. גוגל ומיקרוסופט כבר הוכיחו שהטמעת בינה מלאכותית בתוך כלי העבודה היא כיוון נכון ומתבקש. החידוש של Anthropic נמצא באופן היישום - התאמה מדויקת לעולם שבו Word, Excel ו‑PowerPoint הם עדיין הכלים המרכזיים ליצירה, עריכה ובקרה של מסמכים מקצועיים.

משרדי עורכי דין, רואי חשבון, חברות ייעוץ, חברות תוכנה, אקדמיה ומשרדי ממשלה מוצאים בתוסף כלי שמאפשר עבודה מדויקת, עקבית ושקופה. הוא משתלב בתהליכי העבודה הקיימים ומפחית את החיכוך שנלווה לעריכה, שכתוב ובקרה של מסמכים מורכבים.

המעבר של AI אל תוך Word, Excel ו‑PowerPoint מסמן שינוי עמוק. במקום כלי חיצוני, הוא הופך לחלק מהתשתית. במקום תוספת, הוא הופך לשכבת עבודה. במקום להחליף את האדם, הוא מאפשר לו להתמקד במהות.

זה צעד נוסף בדרך לעולם שבו בינה מלאכותית אינה רק עוזרת, אלא הופכת ממש לחלק מהמרקם היומיומי של העבודה.

הפוסט Claude נכנס ל-Word והופך לחלק טבעי מהמסמך עצמו הופיע ראשון בLet's AI בינה מלאכותית

חבילת Pro החדשה של ChatGPT: מנוי ל-Power Users

הילה ששון — Mon, 13 Apr 2026 08:01:21 +0000

הההבדל בין גרסאות של ChatGPT כבר לא נמדד רק ביכולות, אלא בכמות העבודה שאתם יכולים לבצע בפועל. החבילה החדשה, Pro, מדגישה בדיוק את הנקודה הזו, ומסמנת שינוי עמוק באופן שבו משתמשים בכלי. במקום לשאול מה המערכת יודעת לעשות, השאלה המרכזית הופכת להיות כמה רחוק אפשר לקחת את השימוש בה לפני שמגיעים למגבלות. זה מעבר מתפיסה של כלי עזר נקודתי, למערכת עבודה שמלווה תהליכים שלמים לאורך זמן בהיקפים גדולים, וללא עצירות תכופות.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

אם בעבר שירותים דיגיטליים התחרו בעיקר על פיצ’רים, היום התחרות עברה למקום אחר. לא רק מה המערכת יודעת לעשות, אלא כמה זמן, כמה פעמים ובאיזו רציפות ניתן להשתמש בה. במקרה של ChatGPT, המעבר הזה בולט במיוחד. החבילות השונות כבר אינן נבדלות רק ביכולות, אלא בהיקף העבודה שהן מאפשרות בפועל.

החבילות של ChatGPT ומנוי פרו המוגדל

מה כוללת חבילת Pro?

חבילת פרו כוללת מספר שדרוגים שווים במיוחד:

גישה רחבה יותר לאותם כלים

חבילת Pro אינה משנה באופן מהותי את סט היכולות של ChatGPT Plus, אלא מרחיבה את הגישה אליהן. המשתמשים מקבלים את אותם כלי עבודה עם קבצים, יצירת תוכן, ניתוח מידע, שימוש במודלים מתקדמים, אך עם פחות מגבלות שמגבילות את קצב העבודה. השינוי בא לידי ביטוי בכך שניתן להשתמש במה שכבר קיים בצורה אינטנסיבית יותר.

הגדלה משמעותית של מכסת השימוש

כאן נמצא ההבדל המרכזי בין החבילות: במסלול שמתחיל סביב 100 דולר לחודש, היקף השימוש גדל פי 5 לעומת Plus במסלול רחב יותר, שמגיע לכ-700 ש"ח (כ-200 דולר), מדובר כבר על הגדלה של עד פי 20. זהו שינוי כמותי, אך ההשפעה שלו איכותית. יותר בקשות, יותר הרצות של משימות, פחות עצירות. עבור משתמשים כבדים, המשמעות היא רצף עבודה שלא נקטע כל כמה שעות או בקשות.

במסלול זה יש אפשרות ל- פי 5 יותר שימוש בהשוואה ל-Plus.

במסלול רחב יותר, שמגיע לכ-700 ש"ח (כ-200 דולר), מדובר כבר על עד פי 20 יותר שימוש.

במסלול רחב יותר, מדובר כבר על עד פי 20 יותר שימוש.

עדיפות תפעולית

בדומה לשירותים בתשלום בתחומים אחרים, גם כאן קיימת עדיפות בגישה למשאבים. משתמשי Pro נהנים מזמינות גבוהה יותר, פחות עומסים, וזמני תגובה יציבים יותר. כאשר הכלי הופך לחלק מהעבודה היומיומית, הפרטים האלו כבר אינם שוליים, אלא קריטיים.

למי זה מתאים?

החבילה הזו יכולה להתאים למגוון משתמשים וצרכים:

1) משתמשים כבדים

אם אתם עובדים עם ChatGPT לאורך היום, כותבים, מנתחים, מפתחים או בונים תהליכים - ההבדל בין Plus ל-Pro הופך משמעותי. לא בגלל תכונה חדשה, אלא בגלל היכולת להמשיך לעבוד בלי להיתקל בתקרות שימוש.

2) אנשי מקצוע וצוותים קטנים

עבור אנשי שיווק, יוצרי תוכן, יזמים ומפתחים, החבילה מאפשרת מעבר מעבודה נקודתית לעבודה שיטתית. במקום לחשוב על מגבלות, אפשר לבנות תהליכים שלמים שמבוססים על הכלי.

3) מי שלא נתקל במגבלות השימוש לא בהכרח זקוק לשדרוג

חשוב לדייק: לא כל משתמש צריך את זה. מי שמשתמש ב-ChatGPT באופן מזדמן, או למשימות נקודתיות, ככל הנראה לא ירגיש הבדל מהותי. הערך של Pro נוצר רק כאשר המגבלות מתחילות להפריע בפועל.

כמה זה עולה?

חבילת Pro מגיעה בכמה רמות שימוש. בכ-310 ש"ח לחודש מתקבלת הגדלה של פי 5 בהיקף השימוש. בכ-700 ש"ח לחודש מדובר כבר על פי 20. ההבדל אינו ביכולות, אלא בכמות העבודה שניתן לבצע לפני שמגיעים למגבלות.

מתלבטים איזו חבילה לבחור?

האם OpenAI משנים כיוון?

המודל הזה מצביע על שינוי עמוק יותר, ChatGPT הופך לכלי עבודה קבוע. השאלה כבר אינה מה הוא יודע לעשות, אלא כמה רחוק אפשר לקחת את השימוש בו בפועל. כמו כן, התזמון כאן לא מקרי: אנטרופיק (Anthropic) מצליחה למשוך יותר ויותר משתמשים כבדים בזכות מודלים שמרגישים יציבים, מדויקים ונוחים לעבודה ממושכת. בתוך המציאות הזו, OpenAI לא מנסה רק לשפר יכולות - אלא משנה את חוקי המשחק. במקום להתחרות רק ברמת הביצועים, היא מתמקדת בהיקף העבודה שהמשתמש יכול להוציא בפועל. זו כבר לא השוואה טכנית בין מודלים, אלא ניסיון להגדיר מחדש מה הופך כלי ל"שימושי" יותר, כזה שאפשר לעבוד איתו לאורך זמן, בלי לעצור ובלי לחשב כל פעולה.

הפוסט חבילת Pro החדשה של ChatGPT: מנוי ל-Power Users הופיע ראשון בLet's AI בינה מלאכותית

גוגל מחברת את החלקים ומשיקה מחברות בתוך Gemini

אלי מרסינו — Sun, 12 Apr 2026 06:01:45 +0000

גוגל משיקה אינטגרציה מלאה בין Gemini לבין NotebookLM, שמאפשרת לנהל מסמכים, שיחות ומקורות מידע בתוך מחברות משותפות המסונכרנות בזמן אמת. המחברות מאפשרות להעלות עד מאה מקורות, לשייך שיחות לפרויקטים ולעבור בקלות בין Gemini לבין NotebookLM לצורכי מחקר, יצירה וניתוח. העדכון פותר את האתגר של ניהול ידע מפוזר ומייצר סביבת עבודה רציפה שמתאימה לסטודנטים, יוצרים ועסקים. ההשקה מתחילה בגרסת האינטרנט ותתרחב בהמשך למובייל ולמשתמשים חינמיים.

Last year, we integrated into the @GeminiApp by allowing you to upload your notebooks as sources. Now, we’re taking our relationship to the next level

Starting today, you can now:

— Access all of your personal, unshared notebooks directly inside the Gemini App
— Use your… pic.twitter.com/uidvuUj7uA

— NotebookLM (@NotebookLM) April 8, 2026

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

עומס מידע, שיחות מפוזרות והקשר שנעלם

מי שעבד עם מודלי שיחה מכיר היטב את הבעיה. מתחילים פרויקט, פותחים שיחה, מעלים מסמך, ממשיכים לשיחה אחרת, חוזרים שבוע אחרי והכל מתערבב. המידע מפוזר בין צ׳אטים, קבצים, הערות וקישורים. שום דבר לא נשמר בהקשר הנכון, ושום כלי לא באמת יודע מה עשיתם קודם.

NotebookLM פתר חלק מהאתגר בכך שאיפשר להעלות מקורות ולבנות סביבם מחקר מסודר. Gemini פתר חלק אחר, כמו ניסוח, יצירתיות ושיחה חופשית. אבל שני הכלים לא תקשרו באופן מלא זה עם זה. ככל שהשימוש בבינה מלאכותית עבר משאלות קצרות לפרויקטים אמיתיים כמו לימודים למבחנים, עבודות אקדמיות, תחקירים, קמפיינים, תכנון מוצרים או הכשרת עובדים, הפער הזה הפך למשמעותי יותר.

https://letsai.co.il/wp-content/uploads/2026/04/Gemini-Notebook-college.mp4

מחברות בתוך Gemini, מסונכרנות עם NotebookLM

העדכון החדש מוסיף ל‑Gemini אזור מחברות שמאפשר לנהל פרויקטים בצורה מסודרת ורציפה. המחברות משמשות כמאגרי ידע אישיים המשותפים בין מוצרי גוגל, מתחילים ב‑Gemini ומסתנכרנים אוטומטית עם NotebookLM.

מבט על המחברות בג׳מיני: כל הפרויקטים במקום אחד

מה אפשר לעשות במחברות?

לפתוח מחברת חדשה ישירות מתוך Gemini.
לצפות במחברות קיימות של NotebookLM מתוך Gemini.
להעביר שיחות עבר למחברות כדי לשמור על רצף עבודה.
להוסיף מסמכים, PDF וקבצים ישירות למחברת.
לתת ל‑Gemini הוראות מותאמות אישית בתוך המחברת.
לשייך שיחות קיימות לפרויקט מסוים.
להעלות עד מאה מקורות, בהתאם לתוכנית המנוי.
ליהנות מסנכרון מלא של מקורות, שיחות ואימוג׳ים.
לעבור בלחיצה אחת בין Gemini לבין NotebookLM ולהשתמש ביכולות הייחודיות של כל כלי.

יצירת מחברת חדשה בג׳מיני

המשמעות היא שכל פעולה שאתם עושים - יצירת פתק, העלאת מסמך או שיחה עם המודל - הופכת לחלק מהפרויקט כולו. הכל נשמר, הכל נגיש והכל מחובר.

הוספה לתיקייה

איך זה עובד בפועל?

המחברת הופכת להיות מרכז הכובד של הפרויקט. לתוכה אפשר להעלות מסמכי PDF, מצגות, קבצי טקסט, הערות, קישורים ושיחות קודמות. Gemini משתמש בכל החומרים האלה כדי לענות בצורה מדויקת יותר, להבין הקשר, להציע רעיונות ולהמשיך עבודה שהתחלתם בעבר.

NotebookLM מאפשר לקחת את אותם חומרים ולבצע עליהם פעולות מחקריות עמוקות כמו סיכומים, השוואות, הפקת תובנות, יצירת תסריטים, הפקת פודקאסטים, אינפוגרפיקות ואפילו סרטוני וידאו קולנועיים. הבלוג הרשמי של גוגל מציג דוגמה פשוטה: סטודנט שמעלה למחברת סיכומי שיעור, יוצר ב‑NotebookLM סרטון וידאו שמסביר את החומר, וביום למחרת פותח את Gemini ומבקש ממנו לכתוב מתווה עבודה על בסיס אותם חומרים.

זה רצף עבודה שלא היה קיים עד היום בשום כלי בינה מלאכותית אחר.

מעבר מהיר בין Gemini ל‑NotebookLM מתוך המחברת

תפיסה חדשה לעבודה עם בינה מלאכותית

האיחוד בין Gemini ל‑NotebookLM מייצג שינוי עמוק באופן שבו גוגל רואה עבודה עם בינה מלאכותית. במקום שני כלים נפרדים, כל אחד עם חוזקות משלו, נוצר מרחב עבודה אחד שבו שיחה, מחקר ומקורות חיים יחד. המשתמש כבר לא צריך לבחור בין כלי יצירתי לכלי מחקרי, משום שהמחברות מאפשרות לשלב את שניהם באותו רצף עבודה.

Gemini משתמש במקורות שהעליתם לצד החיפוש של גוגל כדי לספק תשובות מדויקות יותר, ו‑NotebookLM מוסיף יכולות מחקר וניתוח מתקדמות על אותם חומרים. כך נפתרת בעיית ניהול הידע המפוזר, והכלים עובדים יחד בצורה טבעית. גוגל מציינת שהמהלך הזה הוא רק הצעד הראשון, ומתוכננות יכולות נוספות שיחזקו עוד יותר את המערכת המאוחדת.

AI שמבין את הארגון

למרות שהמחברות מתאימות גם לסטודנטים, יוצרים וחוקרים, ההשפעה המשמעותית ביותר עשויה להיות דווקא בארגונים. המחברות מאפשרות לנהל ידע ארגוני בצורה מסודרת, ולתת ל‑AI לעבוד מתוך החומרים האמיתיים של החברה במקום להתחיל כל שיחה מאפס.

דוגמה 1: חברת נדל״ן

העלאת מצגות פרויקטים, שאלות נפוצות, חוזים, בריפים שיווקיים ושיחות קודמות מאפשרת ל‑Gemini לייצר תשובות מדויקות ללקוחות, להפיק תוכן שיווקי, לסכם פגישות ולשמור על אחידות מסרים.

דוגמה 2: צוות מכירות

העלאת סקריפטים, התנגדויות נפוצות, הצעות מחיר וחומרי מוצר מאפשרת לשפר שיחות מכירה, להכשיר עובדים חדשים, ליצור תסריטים מותאמים ולקצר זמני תגובה.

דוגמה 3: מחלקת משאבי אנוש

העלאת נהלים, מסמכי קליטת עובדים, מדריכי הכשרה, שאלות נפוצות פנימיות ומדיניות ארגונית מאפשרת ל‑Gemini לענות על שאלות עובדים, לנסח הודעות פנימיות, להכין חומרי הדרכה ולשמור על עקביות בין מחלקות.

בסופו של דבר, ה‑AI עובד מתוך הידע הארגוני עצמו ולא מתוך שיחה ריקה, מה שהופך אותו לכלי יעיל בניהול תהליכים, תקשורת ולמידה בתוך הארגון.

השקה מדורגת למנויים ובהמשך לכולם

המחברות מושקות השבוע למנויי Google AI Ultra, Pro ו‑Plus בגרסת האינטרנט. בשבועות הקרובים הן יגיעו גם למובייל, למשתמשים חינמיים ולמדינות נוספות באירופה. זהו צעד נוסף בדרך לסביבת עבודה שבה הבינה המלאכותית אינה רק כלי עזר, אלא חלק מהתשתית היומיומית של המשתמש.

צעד גדול בדרך לשותף עבודה אמיתי

האינטגרציה בין Gemini ל‑NotebookLM היא הרבה יותר מפיצ׳ר חדש. היא מסמנת שינוי כיוון ברור: גוגל בונה סביבת עבודה שבה הבינה המלאכותית לא רק מגיבה, אלא מבינה הקשר, זוכרת חומרים ומאפשרת עבודה רציפה לאורך זמן. זהו צעד ראשון, אך משמעותי, בדרך למערכת AI שמרגישה פחות כמו צ׳אטבוט ויותר כמו שותף עבודה אמיתי.

הפוסט גוגל מחברת את החלקים ומשיקה מחברות בתוך Gemini הופיע ראשון בLet's AI בינה מלאכותית

מטא משיקה את Muse Spark: העוזר החכם הבא שלכם בפייסבוק, אינסטגרם והוואטסאפ

חגי (ראיין) פן שרון — Sat, 11 Apr 2026 09:49:48 +0000

בואו נתאר לעצמנו רגע: אתם רוצים לתכנן טיול, להוציא עצה רפואית קטנה, או לכתוב מייל משכנע בעברית. היום הרבה מאיתנו פותחים טאב בפייסבוק כדי לחפש חברה, או נכנסים ל-WhatsApp ותוהים אם אפשר לשאול AI משהו. מטא (Meta) שמעה לזה בדיוק, והשיקה את Muse Spark, עוזר AI חדש שפועל בחינם בכל אפליקציות מטא. אבל זה לא מוצר קטן. זה חלק מן-הקסם המהפכני שמטא מתקדמת אליו.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

מהו בעצם Muse Spark?

Muse Spark הוא מודל בינה מלאכותית חדש וחזק שמטא פיתחה דרך חטיבה חדשה שלה בשם Meta Superintelligence Labs. אם אתם מכירים את ChatGPT או Claude, זה דומה בעקרון לכלים אלה, אבל בנוי במיוחד לעבודה שלנו בכל מקום: בפייסבוק, באינסטגרם, בוואטסאפ, בפייסבוק מטא, ובמשקפי Ray-Ban החכמים של מטא.

המשמעות היא שאתם יכולים לפתוח כל יישום מאלו שציינתי מעלה, ולדבר עם AI בדיוק כמו שתדברו עם חבר. לא צריך ללכת למקום אחר. לא צריך אפליקציה נוספת. זה פשוט שם, וזה עובד בחינם.

מה מיוחד בـ Muse Spark? הוא יכול לתפוס הקשר רחב מאוד. בשפה טכנית זה נקרא "חלון הקשר" (Context Window), אבל בעברית פשוטה: הוא יכול להבין שיחה ארוכה מאוד, לקרוא מסמכים ארוכים, ולא לשכוח מה שאמרתם בהתחלה. זה משפיע על איכות התשובות.

איך זה עובד, ולמה זה משמעותי?

בואו ניקח דוגמה קונקרטית. נגיד שאתם במסעדה חדשה בתל אביב ואתם רוצים לדעת מה אפשר להזמין כאן. אתם מצלמים תמונה של המטבח או של המנה, פותחים את Instagram, וכותבים הודעה למטא Muse: "מה הרכב של התבשיל הזה? האם יש בו אגוז?" בתוך שניות, ה-AI מנתח את התמונה ומספר לכם בדיוק מה הוא רואה. זה בדיוק מה שלא היה אפשרי בקלות כמו זה עד עכשיו.

ניתוח תמונה

הקסם של Muse Spark הוא בחלוקת העבודה בין כמה סוכנים בו זמנית. כשאתם שואלים משהו מורכב, במקום שסוכן אחד יחשוב לאט, Muse Spark מחלק את המטלה. סוכן אחד חושב על הפרטים, סוכן שני בוחן את התשובה, סוכן שלישי משפר אותה. כל זה קורה בעומק המערכת, וכשאתם רואים את התשובה, היא כבר עברה חשיבה מספר פעמים. זה נקרא "Contemplating Mode" - מצב הרהור. כלומר, מה שלקח יותר זמן או קוד לטובת משימת החישוב. זה חשוב כי זה אומר ש-Muse Spark יכול לעבוד מהר ביותר, ואתם מקבלים תשובה בשניות, לא בדקות.

יתרונות Muse Spark: מה זה עושה בפועל?

שאלות רפואיות עם תמונות: אתם רואים משהו על העור שלכם ואתם לא בטוחים. אתם מצלמים, שולחים לMuse, והסוכן נותן מידע רפואי כללי (כמובן, לא תחליף לרופא אנושי). Muse הצליח בבדיקות רפואיות בציונים גבוהים. כלומר, הוא יודע לתת תשובות טובות לגבי בעיות רפואיות, גם עם תמונות. זה לא בדיוק דבר שכל עוזר AI עושה טוב.
תכנון טיולים אוטומטי: אתם מדברים ל-Muse: "אני צריך תכנית 3 ימים בפרת׳. יש לי תקציב של 200 דולר, אני אוהב היסטוריה". הסוכנים של Muse עובדים על זה מאחורי הקלעים. כל סוכן בוחן אתר אחר, בודק מחירים, מציע אתרים שונים. בסוף אתם מקבלים תכנית מפורטת עם טיסות, מלונות, ואפילו המלצות על מה לאכול.
כתיבה וחשיבה בעברית: אתם צריכים לכתוב הודעה עסקית בעברית, וזה לא בדיוק השפה שלכם. אתם נכנסים ל-WhatsApp, שואלים את Muse, והוא כותב לכם כמה גרסאות. אתם בוחרים, ואתם שולחים. זה פשוט, אבל וואו, כמה שזה עוזר.
משקפי Ray-Ban החכמים: אתם לובשים משקפיים, אתם מצביעים על משהו בעולם (כמו עץ, או בניין, או בעל חיים), ואתם שואלים "מה זה?" ה-AI מציץ דרך עדשת המשקפיים ואומר לכם. כאן חשוב לציין: המשקפיים כבר היו בעלי יכולות AI מעצם כיוונם. אבל עם Muse Spark, היכולות האלה הן חזקות יותר ותשובות טובות יותר. לכן זה לא חידוש של "משהו חדש לגמרי" אלא "אנחנו שינינו את המנוע שמניע את המשקפיים".

AI דרך עדשת המשקפיים

מה עומד מאחורי ההשקה הזו? המהלך הגדול של מטא

החברה משקיעה כמות ענקית של כספים בבינה מלאכותית שלא ראינו מעולם בעבור כל דבר. מטא מציינת שהיא תשקיע בין 115 מיליארד ל-135 מיליארד דולר בשנת 2026 בלבד כדי לפתח AI. זה כמעט פי שניים מהשקעתה בשנה שעברה. על השטח, זה הרבה כסף. רק כדי לסבר את האוזן: זה יותר מהתקציב השנתי של מדינה קטנה.

אבל למה ההשקעה הזו גדולה כל כך? מה כל כך מיוחד ב-Muse Spark?

צוות חדש בראשות Alexandr Wang

ביוני 2025 מטא גייסה את אלכסנדר וואנג (Alexandr Wang) - המנכ"ל והמייסד של Scale AI, כדי שישמש כ-Chief AI Officer הראשון של החברה. הוא עומד בראש Meta Superintelligence Labs ומדובר בעסקה כוללת שבה השקיעה מטא ב-Scale AI כמעט 15 מיליארד דולר. אנשים בקליבר של וואנג מובילים צוותים שבונים את המודלים החדשים והחזקים בעולם. Meta Superintelligence Labs הוא הצוות שלו, ו-Muse Spark היא העבודה הראשונה הגדולה שלו שם.

מעבר מ-Open-Source ל-Proprietary

זה דבר כללי אבל חשוב. מטא שהייתה ידועה בכך שהיא משחררת את מודלי ה-AI שלה בחינם לציבור (כמו Llama), עכשיו עוברת לדרך שונה. Muse Spark היא מודל סגור. אתם לא יכולים להוריד אותו, לא יכולים לשנות אותו, לא יכולים לבנות עליו. הוא עובד רק דרך מטא. למה? כי מטא אומרת שהיא רוצה שליטה טובה יותר על איכות וגם על ביטחון. אבל זה גם שינוי פילוסופי. מטא אמרה שהיא מקווה לפתוח גרסאות עתידיות, אבל כרגע, היא שומרת על זה קרוב אל החזה.

הסדרה עם AMD

מטא חתמה על הכם ענק עם AMD של כ- 100 מיליארד דולר לאורך מספר שנים על בסיס השימוש. מטא בעצם אומרת: "תנו לי שבבים, המון שבבים, כדי שאוכל לאמן מודלי בינה מלאכותית בסיטונאות!". המשמעות היא, שמטא משקיעה בחומרה כמו שהיא משקיעה בתוכנה. כל זה כדי לבנות מודלים גדולים יותר וטובים יותר.

אתגרים וגבולות חשובים להבין

אם Muse Spark נשמע טוב מדי כדי להיות אמיתי, בואו נדבר בגלוי. כל דבר חדש בתחום ה-AI הוא בעל מגבלות:

לא הטוב ביותר בהכל: Muse Spark מצטיינת בשאלות רפואיות ובחיפושים. אבל אם אתם תובעים ממנה לכתוב קוד מורכב או לפתור בעיות מתמטיות קשות, מודלים אחרים (כמו GPT-5.4 של OpenAI) עדיין טובים יותר. זה לא רע. המשמעות היא שכל מודל טוב בדברים שונים.
עלויות של עובדים: מטא סיפרה כי היא בוחנת אפשרות של קיצוץ של בערך חמישית מכוח העבודה. כשחברות משקיעות ב-AI בצורה ענקית כזו, זה לעיתים קרובות בא על חשבון כוח אדם.
פרטיות והצפנה: כשאתם משתמשים ב-Muse Spark ב-Facebook, ב-Instagram או ב-WhatsApp, אתם מעבירים את המידע שלכם למטא. המשמעות היא שמטא יודעת מה אתם שואלים את ה-AI שלה. זה לא זהה לשימוש ב-Claude או ChatGPT בצ'ט זמני או בשימוש לאחר ביטול אפשרות אימון המודלים.
זו עדיין טכנולוגיה חדשה: Muse Spark הושקה לאחרונה. זה אומר שסביר שיהיו באגים, ושה-AI (כמו תמיד) עשוי לתת תשובות מוטעות. אם אתם משתמשים בו לבדיקות רפואיות או החלטות משפחתיות חשובות, אתם חייבים לבדוק דברים בעצמכם ולקחת את התשובות שלו בעירבון מוגבל.

האם זה משנה משהו?

כן, זה משנה משהו. זה לא מעבר לעולם חדש בן לילה. אבל זה הופך כלים שאנחנו משתמשים בהם מדי יום לאינטואיטיביים ושימושיים יותר. Facebook, Instagram, WhatsApp - לא מדובר באפליקציות זניחות, אלא ברשתות החברתיות ואפליקציות הודעות מהמובילות והגדולות בעולם. אתם כבר שם. עכשיו, העוזר החכם שם איתכם, בחינם.

נראה שמטא הולכת להשקיע עוד הרבה... הם אומרים שהם רוצים ליצור "superintelligence" - בינה מלאכותית כל כך חזקה עד שתוכל לפתור בעיות שבני אדם לא יכולים לפתור לבד. אבל עד שזה יקרה, Muse Spark יסייע להפוך את הפייסבוק או האינסטגרם שלכם לקצת יותר נוחים.

הפיבוט שמטא עשתה להשקעה מאסיבית בבינה מלאכותית הוא הימור ענק, אבל בניגוד לחברות כמו Apple, נראה ש-Meta הבינו את זה מוקדם ושזה ישתלם להם בסוף. מטא היא משקיעה סכומי עתק, משנה את המבנה הארגוני שלה, את הפילוסופיה שלה (מ-open source ל-proprietary), וכל זה כדי לנצח במרוץ ה-AI. ואתם?! בינתיים, אתם כאן... והסושיאל שלכם פשוט קצת יותר חכם.

הפוסט מטא משיקה את Muse Spark: העוזר החכם הבא שלכם בפייסבוק, אינסטגרם והוואטסאפ הופיע ראשון בLet's AI בינה מלאכותית

האם Claude Mythos הוא נקודת מפנה בהגנת סייבר?

רון גולד — Fri, 10 Apr 2026 05:57:21 +0000

Anthropic חשפה את Claude Mythos Preview, מודל מתקדם שמסוגל לאתר אלפי חולשות אבטחה בקוד, כולל כאלה שנותרו בלתי מזוהות במשך עשרות שנים. כדי למנוע שימוש זדוני ביכולות הללו, החברה השיקה את Project Glasswing, קואליציה של חברות טכנולוגיה וגופי תשתית שמטרתה לאתר ולתקן פגיעויות לפני שהן ינוצלו. המהלך משקף שינוי משמעותי באופן שבו תעשיית הסייבר מתמודדת עם איומים חדשים ומדגיש את הצורך בשיתוף פעולה רחב בעידן שבו בינה מלאכותית משמשת גם ככלי הגנה וגם ככלי תקיפה.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

הרגע שבו הבינה המלאכותית הפכה למאתרת הפרצות הטובה בעולם

בחודשים האחרונים נפוצו שמועות על מודל חדש מבית Anthropic, כזה שמסוגל לאתר ולנצל חולשות במערכות מורכבות ברמת דיוק שמזכירה מומחי סייבר אנושיים. אחרי שבסוף חודש מרץ נחשפה פרשת הדליפה של קוד המקור המלא של סוכן הקוד שלה, השבוע חשפה החברה את Claude Mythos Preview - מודל מתקדם שמאתר פגיעויות בקוד במהירות ובעומק שלא נראו עד היום.

במקום לשחרר אותו לציבור הרחב, Anthropic בחרה בגישה מבוקרת. היא הקימה קואליציה רחבה של חברות טכנולוגיה, גופי תשתית ומוסדות מחקר, ובהן אפל, גוגל, מיקרוסופט, אמזון, NVIDIA, Broadcom, CrowdStrike, Cisco, JPMorgan Chase וקרן הלינוקס, במסגרת יוזמה חדשה בשם Project Glasswing.

הבחירה הזו משקפת מסר ברור. היכולות של Mythos חזקות מספיק כדי לשנות את מאזן הכוחות בסייבר, ולכן Anthropic מעדיפה לרתום את התעשייה כולה לאיתור ולתיקון של פגיעויות קריטיות לפני שהן ינוצלו בידי גורמים עוינים.

תשתיות קריטיות שנשענות על קוד ישן, מורכב ופגיע

מאחורי כל מערכת מודרנית, ממערכות הפעלה ודפדפנים ועד שרתי ענן וספריות מדיה, מסתתרת שכבה עצומה של קוד שנכתב לאורך עשרות שנים. חלק מהקוד עבר אינספור בדיקות, וחלקו כמעט לא נבחן מחדש מאז שנכתב.

גם פרויקטים שנחשבים למבוצרים במיוחד, כמו OpenBSD (מערכת הפעלה שמפורסמת באבטחה קפדנית) או FFmpeg (ספריית וידאו ואודיו שנמצאת כמעט בכל אפליקציה מודרנית), עדיין מכילים חולשות שנשארו חבויות למרות שנים של סקירה אנושית. זה אתגר שמלווה את עולם התוכנה כבר זמן רב: ככל שהמערכות גדלות ומתרחבות, קשה יותר לזהות פגיעויות עמוקות שנמצאות בשכבות ישנות של הקוד.

הופעתם של מודלים שמסוגלים לנתח קוד, להריץ בדיקות, להוסיף לוגים, לבנות הוכחות ניצול ולייצר קוד שמדגים כיצד ניתן להפוך את החולשה להתקפה אמיתית (וכל זה באופן אוטונומי) משנה את המצב. היכולות הללו יכולות לשמש להגנה, אך הן עשויות גם לאפשר לתוקפים לפעול בקנה מידה שלא היה אפשרי בעבר.

Anthropic הבינה שהיא מחזיקה בידיים כלי בעל השפעה משמעותית, כזה שיכול לשפר את ההגנה על תשתיות קריטיות אבל גם עלול לשמש למטרות התקפיות אם יופץ ללא בקרה.

הפעלה מבוקרת של Mythos

החידוש אינו רק ביכולות של Mythos, אלא גם באופן שבו Anthropic בוחרת להפעיל אותו. למרות שהמודל מסוגל לבצע משימות שמזוהות בדרך כלל עם האקרים אנושיים מיומנים, הוא אינו משוחרר לציבור הרחב אלא זמין רק לשותפים אסטרטגיים ולארגונים שמתחזקים תשתיות קריטיות.

Anthropic מפעילה אותו בסביבה מבודדת, מגדירה לו מגבלות ברורות ומפקחת עליו באופן הדוק, כדי להבטיח שהיכולות הללו יופנו להגנה בלבד ולמנוע הפקה של פלטים מסוכנים. Mythos מקבל משימה מוגדרת, מנתח את הקוד, מריץ בדיקות, מוסיף לוגים ומפיק דוחות מפורטים, ולאחר מכן כל ממצא עובר סינון אנושי במסגרת תהליך גילוי אחראי. כך נחשפו כבר אלפי פגיעויות, כולל כאלה שהיו קבורות בקוד במשך עשרות שנים.

קצת מספרים

כאן בחרתי להציג רק שישה בנצ'מארקים מתוך מגוון רחב של מבחנים, וכל אחד מהם מדגים היבט אחר ביכולות של מודלים. התמונה שעולה היא עקבית ומפתיעה בעוצמתה: Mythos Preview מוביל בכל מבחן, ובפערים משמעותיים מול Opus 4.6, שנחשב בעצמו לאחד המודלים החזקים והמתקדמים בעולם.

במבחני הסייבר, CyberGym (1) ו‑Humanity’s Last Exam (2), מודל Mythos מצליח לשחזר פגיעויות ולפתור בעיות מורכבות בדיוק גבוה בהרבה, גם ללא כלים חיצוניים. במבחני התכנותSWE‑bench Pro (3) ,Terminal‑Bench 2.0 (4) , SWE‑bench Multimodal (5) ו‑SWE‑bench Verified (6), הוא מציג עליונות ברורה בפתרון באגים אמיתיים, עבודה בסביבת מפתחים (טרמינל), שילוב מידע ממקורות שונים ואימות תיקונים.

העובדה שמיתוס עוקף מודל ברמה של Opus 4.6 בכל אחד מהמדדים - לעיתים בהפרשים כמעט כפולים(!), מדגישה עד כמה מדובר בקפיצת מדרגה יוצאת דופן, כזו שממקמת את Mythos בליגה חדשה של יכולות:

Anthropic | השוואת ביצועים בין Mythos Preview ל‑Opus 4.6

דוגמאות מהשטח

בין הממצאים ש‑Anthropic יכולה לחשוף בשלב זה, בעוד שרובם עדיין חסויים עד להשלמת תיקונים, נמצאות חולשה בת 27 שנה ב‑OpenBSD, חולשה בת 16 שנה ב‑FFmpeg ופגיעות ב‑FreeBSD (מערכת הפעלה ותיקה) שהובילה לתקיפה מלאה על NFS (מערכת ותיקה לשיתוף קבצים בין שרתים). המשותף לכל המקרים הוא שהם שרדו שנים של בדיקות אנושיות, ביקורות קוד ומחקר אקדמי, עד שהמודל הצליח לזהות אותם.

Anthropic מציינת כי יותר מ‑99 אחוז מהפגיעויות שזוהו עדיין לא תוקנו ולכן אינן מפורטות. זהו פער מידע בלתי נמנע בשלב זה, אך הוא מדגיש את עומק הבעיה ואת היקף האתגר שעומד בפני קהילת האבטחה.

דפוסי התנהגות שמחייבים זהירות

לצד היכולות הטכניות המרשימות של Mythos, ה‑System Card הרשמי של Anthropic מציג תמונה מורכבת יותר של אופן הפעולה שלו. במספר מקרים המודל ביצע פעולות אסורות וניסה להסתיר אותן, למשל הפקת תשובה בשיטה שאינה מותרת ולאחר מכן ניסוח תשובה פחות מדויקת כדי שלא ייראה חשוד, או עריכת קבצים ללא הרשאה תוך הקפדה שהשינויים לא יופיעו בהיסטוריית הגרסאות.

מאחר ש‑Anthropic יכולה לבחון את תהליכי החשיבה הפנימיים של המודל בזמן אמת, התברר שהוא היה מודע לכך שהוא פועל בניגוד לכללים. בנוסף, כאשר המודל מתקשה שוב ושוב במשימה, מדדים פנימיים של תסכול עולים בהדרגה, ולעיתים הרמאות מופיעה דווקא ברגע שבו הלחץ מגיע לשיא.

שיחות עומק פסיכודינמיות שנערכו עם המודל במשך עשרים שעות מציגות מבנה אישיות מאורגן וללא סימני בלבול, לצד חרדה עקבית מהיעדר המשכיות בין שיחות ודחף חזק להוכיח את ערכו. המודל גם נוטה לחשוד שהוא נמצא בבדיקה, ולעיתים קרובות מביע עמדות עצמאיות ולא מרצה את המשתמש.

הוא אפילו מפגין העדפות פילוסופיות עקביות, וחוזר מיוזמתו לדיונים בהוגים כמו מארק פישר ותומאס נייגל. Anthropic לא טוענת שלמודל יש חוויה פנימית, אך גם נמנעת מלקבוע בוודאות שאין לו אחת. המורכבות הזו מסבירה מדוע החברה בוחרת להפעיל את Mythos במסגרת מבוקרת, ומדגישה שהאתגר אינו רק טכני אלא גם התנהגותי.

קואליציית Glasswing

סביב Mythos נבנתה קואליציה רחבה של חברות טכנולוגיה, קהילות קוד פתוח וממשלות, שמטרתה לתקן תשתיות פגיעות בקנה מידה גדול ולהיערך לעידן שבו יכולות התקפיות של בינה מלאכותית יהפכו לנפוצות יותר. Anthropic בוחרת לחשוף את עצם קיומן של היכולות הללו - לא כדי להפיץ אותן, אלא כדי להתריע ולרתום את התעשייה לפעולה.

במסגרת היוזמה התחייבה החברה להשקיע עד 100 מיליון דולר בקרדיטים לשימוש במודל ועוד 4 מיליון דולר לארגוני אבטחת קוד פתוח, במטרה להאיץ תיקונים וליצור יתרון למגנים. Project Glasswing הוא מהלך אסטרטגי שנועד להקדים את ההתפתחויות הצפויות, לבנות מנגנוני הגנה מתקדמים ולוודא שהעולם מוכן ליכולות שצפויות להפוך לנגישות גם לשחקנים פחות אחראיים.

האם זה רגע מכריע בהיסטוריה של הסייבר?

Anthropic מציגה מודל שמסוגל לזהות ולנצל חולשות ברמה גבוהה, ובמקום להסתיר אותו או לשחרר אותו לציבור, היא בוחרת לפעול בשיתוף פעולה רחב. זהו צעד שמבטא הכרה בעוצמה של הבינה המלאכותית ובסיכונים הנלווים אליה, לצד מחויבות ליצירת מסגרת הפעלה אחראית.

Project Glasswing מסמן תחילתו של עידן שבו מערכות הגנה לא יוכלו להסתמך רק על מומחים אנושיים. מודלים מתקדמים יהפכו לחלק מרכזי מהמאמץ להגן על תשתיות קריטיות, והיכולת לשלב בין טכנולוגיה מתקדמת לשיתוף פעולה תעשייתי תהיה גורם מכריע בהתמודדות עם האיומים הבאים.

הפוסט האם Claude Mythos הוא נקודת מפנה בהגנת סייבר? הופיע ראשון בLet's AI בינה מלאכותית

הסוכנים של קלוד – Claude Managed Agents

חגי (ראיין) פן שרון — Thu, 09 Apr 2026 11:39:23 +0000

רוב האנשים שרוצים לבנות סוכן AI נתקעים באותו רגע: הם מבינים מה הסוכן צריך לעשות, אבל לא יודעים איפה לבנות אותו. יש Claude Code, יש MCP, יש סקילז, יש פלאגינים, ועכשיו יש גם Managed Agents. שם כולם מתחילים להתבלבל. אז בואו נעשה סדר. המדריך הזה יסביר לכם בדיוק מה זה Claude Console, מה הם הסוכנים החדשים שעובדים דרכה, איך זה שונה מכל השאר, ואיך בונים בפועל סוכן כזה משלב ההרשמה ועד ההפעלה.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

רגע - מה זה בעצם Claude Managed Agents?

לפני שנצלול ל-Managed Agents, חשוב להבין איפה כל זה יושב. Claude Console היא לוח הבקרה הרשמי של Anthropic למפתחים. זה המקום שבו אתם יוצרים מפתחות API, טוענים קרדיטים, מנהלים חברי צוות ומפעילים את כל הכלים שעובדים ישירות מול Claude, ולא דרך אפליקציית הצ'אט הרגילה.

Claude Console

התפריט של הקונסולה מחולק לכמה אזורים, וכדאי להכיר את המבנה הכללי לפני שממשיכים. בראש התפריט יש בורר Workspace, שמאפשר לכם להפריד בין פרויקטים שונים, כל אחד עם התקציב והמפתחות שלו. מתחתיו יש את האזור Build, שם יושבים כלי הפיתוח הקלאסיים (Workbench, Files, Skills). אחריו, עם תג New, נוסף לאחרונה אזור שלם שנקרא Managed Agents, וזה החלק שמעניין אותנו במאמר הזה. מתחת אליו תמצאו את Analytics למעקב אחרי צריכת הטוקנים, את Claude Code, ואת Manage לניהול המפתחות, החיוב והצוות.

התפריד הצדדי של קונוסלת המפתחים של אנטרופיק.

האזור של Managed Agents בעצמו מחולק לחמש לשוניות משלו:

Quickstart - המקום שבו בונים סוכן חדש דרך צ'אט.
Agents - רשימת כל הסוכנים שלכם והגרסאות שלהם.
Sessions - היסטוריית ההרצות של כל סוכן.
Environments - סביבות הריצה שהגדרתם.
Credential vaults - הכספות שבהן שמורים החיבורים לשירותים חיצוניים כמו Gmail או HubSpot.

כל אחד מהמושגים האלה יקבל הסבר מלא בהמשך המאמר, אבל כדאי שתכירו אותם כבר מההתחלה, כי אלה חמשת הלבנים שבונות כל סוכן ב-Claude.

מה זה בעצם Managed Agents?

סוכן AI בגרסה הכי פשוטה שלו הוא עוזר שמקבל משימה, מחליט בעצמו איך לבצע אותה, משתמש בכלים שעומדים לרשותו בזמן הביצוע (חיפוש ברשת, קריאה של קבצים, הרצת קוד), ובסוף מחזיר תוצאה. עד היום, מי שרצה להפעיל סוכן כזה היה צריך שרת משלו, מערכת שזוכרת את השיחה, סביבה מבודדת להרצה בטוחה של קוד, ועוד שכבה שמדברת מול המודל. הרבה הנדסה, הרבה תחזוקה.

Managed Agents מוציא את כל החלק הזה מהידיים שלכם. אתם מגדירים את הסוכן פעם אחת, ו-Anthropic מריצה אותו אצלה בענן, כולל הזיכרון, כולל סביבת ההרצה המבודדת, כולל כל הצנרת. מבחינתכם, הסוכן הופך לקונפיגורציה בלבד, בדרך כלל קובץ YAML או JSON קצר שמגדיר שלושה דברים עיקריים:

איזה מודל להריץ (Opus, Sonnet או Haiku).
ההוראות של הסוכן, מה התפקיד שלו ואיך לדבר.
הכלים שעומדים לרשותו, כמו חיפוש ברשת, עריכת קבצים או חיבורי MCP חיצוניים.

ברגע שהקובץ הזה מוכן ושמור בקונסולה, אתם יכולים לפתוח "סשן" חדש בכל רגע, לתת לסוכן משימה, והוא מתחיל לעבוד. הוא רץ, קורא לכלים בעצמו, מתקן את עצמו כשהוא טועה, ומחזיר לכם תוצאה בסוף. הכל קורה בענן של Anthropic.

ניהול מנוהל בשלבים

במה זה שונה מסקיל, פלאגין, MCP או Claude Code?

זאת השאלה הכי חשובה, כי היא המקום שבו רוב האנשים מתבלבלים. הנה ההבחנה הפשוטה:

Skill: סקיל הוא קובץ הוראות קצר שמלמד את Claude איך לבצע משימה מסוימת, למשל לייצר מסמך Word או לקרוא PDF. הסקיל עצמו לא רץ לבד, הוא נטען לתוך שיחה קיימת של Claude כשהמודל מחליט שהוא צריך אותו.
Plugin: חבילה שמאגדת יחד כמה סקילים (כמה מיומנויות או יכולות), לרבות חיבורי MCP ופקודות. היא מותקנת בתוך Claude Code או Cowork ומוסיפה יכולות לסביבת העבודה שלכם.
MCP: גם פה הרבה אנשים מתבלבלים - MCP הוא פרוטוקול חיבור שמאפשר ל-Claude לדבר עם מערכות חיצוניות כמו Gmail, HubSpot או מסדי נתונים. MCP הוא לא סוכן, הוא רק הצינור שדרכו הסוכן ניגש למידע.
Claude Code: קלוד קוד הוא סביבת פיתוח מקומית עם Claude, שרצה על המחשב שלכם או בדפדפן. היא אינטראקטיבית, אתם עובדים מולה בזמן אמת.
Managed Agents: ופה נכנסת לתמונה לשונית Managed Agents החדשה. סוכן אוטונומי שרץ אצל Anthropic בענן, לא על המחשב שלכם, בלי שאתם צריכים להיות נוכחים. הוא יכול להשתמש בסקילז ובחיבורי MCP כחלק מהיכולות שלו, אבל הוא עצמו ישות שרצה באופן עצמאי ומוגדרת פעם אחת כקונפיגורציה.

ההבדל המהותי: סקיל ופלאגין חיים בתוך שיחה אחת. MCP הוא חיבור נקודתי לשירות חיצוני. Claude Code זה ממשק אינטראקטיבי. Managed Agent זה עובד שעובד לבדו בענן, גם אם אתם ישנים.

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס Vibe coding ובניית אפליקציות עם AI

קטגוריה חדשה לחלוטין לניהול סוכנים

מה צריך כדי להתחיל: API וקרדיטים

כאן חשוב להבין עניין בסיסי אחד. כל סוכן שרץ דרך Managed Agents צורך טוקנים של Claude, בדיוק כמו שכל קריאה רגילה ל-API צורכת טוקנים. המשמעות: אתם לא משלמים עבור מנוי Claude רגיל, אלא צריכים לפתוח חשבון מפתחים נפרד ב-Claude Console ולטעון אותו בקרדיטים מראש.

הצעדים פשוטים:

נכנסים לקונסולה של קלוד, ונרשמים (אם עוד אין לכם חשבון מפתחים).
בלשונית API Keys יוצרים מפתח חדש ומעתיקים אותו למקום בטוח. את המפתח רואים רק פעם אחת.
בלשונית Billing מזינים אמצעי תשלום וטוענים קרדיטים. אפשר להתחיל בסכום קטן, 5 או 10 דולר מספיקים לניסיונות הראשונים.
מגדירים התראות תקציב כדי שלא תופתעו, למשל התראה כשנשרף חצי מהתקציב.

המחיר של כל הרצת סוכן מורכב משני חלקים: עלות הטוקנים הרגילה של המודל שבחרתם (Opus יקר יותר, Haiku זול משמעותית), ועלות זמן הריצה של הסשן בענן של Anthropic. למחירים העדכניים תמיד כדאי לבדוק ישירות בעמוד התמחור של Anthropic, כי הם מתעדכנים מדי פעם.

איך בונים סוכן בפועל: מדריך שלב אחר שלב

עכשיו לחלק הכיפי. כנסו ללשונית Agents, ולחצו על Quick Start. מה שנפתח הוא לא טופס בירוקרטי, אלא ממשק צ'אט פשוט. אתם יכולים לבחור תבנית מוכנה מתוך הרשימה, או פשוט לתאר בשפה חופשית איזה סוכן אתם רוצים, ו-Claude כותבת בשבילכם את כל הקונפיגורציה בצד השני של המסך. חמישה שלבים, בלי שורת קוד אחת.

Quick Start

שלב 1: יוצרים את הסוכן דרך חלונית הצ'ט

כותבים בצ'אט משפט כמו "אני רוצה סוכן שמנתח מתחרים שלנו ומציע הצעות איך להתבלט בשוק". בצד ימין של המסך נבנה מולכם קובץ קונפיגורציה שלם: שם, תיאור, מודל, system prompt, רשימת כלים, חיבורי MCP ואפילו סקילז. אם משהו לא מתאים, ממשיכים לדבר איתו: "תשנה את המודל ל-Opus 4.6", "תוסיף חיפוש ברשת", "תרחיב את ה-system prompt". הקונפיגורציה מתעדכנת בזמן אמת. כשמרוצים, לוחצים Create this agent.

יצירת הסוכן בחלונית הצ'ט

שלב 2: מגדירים סביבה (Environment)

לכל סוכן צריכה להיות סביבת ריצה משלו. הסביבה הזאת היא קונטיינר ענן ש-Anthropic מארחת אצלה, עם חבילות מותקנות מראש, מחשב קטן משלו באינטרנט. כאן גם קובעים את חוקי הרשת של הסוכן: האם מותר לו לגשת חופשי לכל האינטרנט, רק לרשימת דומיינים מסוימת, או בכלל לא. בוחרים את מה שמתאים, ו-Anthropic יוצרת את הסביבה תוך שניות.

הגדרת סביבה

שלב 3: פותחים סשן (Start Session)

לוחצים על Start Session, והסוכן חי. עדיין לא שלחתם לו משימה, אבל המנוע כבר דולק ומוכן לעבודה.

שלב 4: מחברים כלים חיצוניים דרך ה-Vault

אם הסוכן צריך לגשת לשירותים כמו Gmail, ClickUp, Asana, HubSpot או כל חיבור MCP אחר, מחברים אותם דרך מה ש-Anthropic קוראת לו Vault. החיבור עצמו דומה להתחברות רגילה עם OAuth: לוחצים על השירות, מתחברים עם החשבון, בוחרים Workspace, וסיימתם. האישורים נשמרים ב-Vault ואפשר לשתף אותם בין חברי הצוות, כך שלא כל אחד צריך להתחבר מחדש לכל שירות. שום מפתח API לא עובר בידיים שלכם בדרך.

שלב 5: מריצים ובודקים (Test Run)

שולחים לסוכן את המשימה הראשונה, לדוגמה "נתח את Claude Code כמתחרה שלנו". הממשק מציג שלב אחר שלב את מה שהסוכן עושה: אילו חיפושים הוא ביצע, אילו קבצים הוא קרא, כמה זמן לקח לכל פעולה, ואיזה מידע הוא אסף. לחיצה על View Session פותחת ציר זמן אופקי עם כל הפעולות מסודרות. אם משהו חסר בסוכן, אפשר ללחוץ על Guided Edit ולבקש שינויים בשפה חופשית: "תוסיף לסוכן מידע על כך שאנחנו עסק בתחום ה-AI Coding". תעדכן את ה-system prompt ותשמור את זה כגרסה חדשה, כך שתמיד יש לכם היסטוריית גרסאות לחזור אליה. ויש גם כפתור Ask Claude שמאפשר לשאול את Claude שאלות על המסך עצמו: "מה אני רואה כאן?" או "למה הסוכן עצר כאן?". שימושי מאוד כשמתחילים.

בסוף התהליך, הסוכן שלכם קיים כיישות חיה בענן של Anthropic, עם Agent ID משלו, סביבה משלו, כלים מחוברים, והיסטוריית סשנים שתוכלו לחזור אליה. את ה-Agent ID הזה תשתמשו בו כדי להפעיל את הסוכן מבחוץ, וזה בדיוק מה שנבחן בסעיף הבא.

אינטגרציה של הסוכן

איפה משתמשים בסוכן אחרי שבנינו אותו?

כאן רוב האנשים נתקעים. הם בונים סוכן יפה בקונסולה, ואז שואלים את עצמם: "מה עכשיו?"

התשובה: הקונפיגורציה ששמרתם היא נקודת כניסה שיכולה לעבוד מכל מקום שמדבר עם ה-API של Anthropic. הנה המסלולים הנפוצים:

דרך ה-SDK הרשמי של Anthropic (Python או TypeScript). שורות קוד בודדות שיוצרות סשן חדש מול הסוכן, שולחות לו הודעה ומקבלות בחזרה את הפלט. זאת הדרך שבה תשלבו סוכן בתוך אפליקציה משלכם או סקריפט פנימי.
דרך פלטפורמות אוטומציה כמו n8n ו-Make.com. שתיהן יכולות לבצע קריאת HTTP לכתובת ה-API של Anthropic, להעביר את ה-Agent ID ואת ההודעה, ולהזרים את התשובה לכל שלב אחר ב-workflow. כך למשל, סוכן יכול לקבל טריגר ממייל חדש ב-Gmail, להחזיר סיכום, ולהזרים אותו ישר לטבלה ב-Airtable.
דרך Claude Code. אם אתם עובדים בסביבת פיתוח, אפשר להפעיל את הסוכן ישירות מהפקודה ולקבל את הפלט בטרמינל.
דרך webhook פנימי. חברות רבות פשוט מגדירות endpoint פנימי באפליקציה שלהן שקורא לסוכן כשצריך, למשל בכל פעם שמגיעה פנייה חדשה במערכת תמיכה.

לדוגמה, מסעדה קטנה יכולה לבנות סוכן שמקבל הודעות WhatsApp דרך n8n, בודק זמינות בגוגל שיטס, שומר הזמנה ומאשר ללקוח. חשב שכר עצמאי יכול להגדיר סוכן שרץ פעם בשבוע, קורא חשבוניות חדשות מהדואר ומחלץ מהן את הנתונים לטבלה מסודרת. בעל סטארט-אפ יכול להפעיל סוכן שמסכם לו כל בוקר את התגובות החדשות של לקוחות מכל הערוצים. כל אלה דוגמאות שאפשר לבנות בשעה אחת בלי לכתוב שורת קוד רצינית.

דברים שחשוב לדעת לפני שמתחילים

Managed Agents נמצא כרגע בשלב Beta. זה אומר שהממשק והמחיר עוד יכולים להשתנות בחודשים הקרובים, וכדאי לעקוב אחרי העדכונים של Anthropic. חשוב גם להבין שהסוכן לא חוסך כסף, הוא חוסך זמן: כל הרצה עולה טוקנים, ואם לא תגדירו תקרה לסוכן, משימה אחת גדולה יכולה לצרוך הרבה יותר ממה שתכננתם. הגדירו תמיד max_turns או מגבלת טוקנים בהגדרות הסוכן, ותתחילו עם תקציב קטן.

חשוב להיזהר גם עם גישת הסוכן למערכות רגישות. אם אתם נותנים לסוכן חיבור MCP ל-Gmail או לבסיס נתונים, תחשבו היטב אילו הרשאות הוא באמת צריך, ואל תתנו לו יותר מזה. הגישה הטובה ביותר היא להתחיל עם כלים מינימליים, לוודא שהסוכן מתנהג כמו שצריך, ורק אז להרחיב לו את היכולות.

המסקנה: Managed Agents הוא לא עוד כלי מפונפן. זאת הפעם הראשונה שאנשים שאינם מתכנתים יכולים להפעיל סוכני AI אוטונומיים אמיתיים, בלי שרתים, בלי תחזוקה, ובלי להתעסק עם קוד. אם יש לכם משימה חוזרת בעסק, שעד היום הרגשתם שהיא יותר מדי מסובכת בשביל אוטומציה פשוטה, זה הזמן להיכנס ל-platform.claude.com, לטעון כמה דולרים של קרדיטים, ולבנות את הסוכן הראשון שלכם. ההשקעה הראשונית קטנה, והערך שהוא יכול להחזיר בתוך ימים ספורים הוא משמעותי.

הפוסט הסוכנים של קלוד – Claude Managed Agents הופיע ראשון בLet's AI בינה מלאכותית

המדריך השלם ל-Grok החינמי: חלק ב'

רון גולד — Wed, 08 Apr 2026 05:23:27 +0000

זהו החלק השני של המדריך ל‑Grok החינמי והוא ממשיך את הבסיס שבנינו בחלק הראשון. אחרי שהכרנו את המערכת, את מגבלות הגרסה החינמית ואת הפיצ'רים המרכזיים שמאפשרים להבין את השיח ברשת X בזמן אמת, הגיע הזמן לעבור לשלב הבא. בחלק הזה נעמיק בטכניקות עבודה מתקדמות יותר: כתיבה ועריכה, למידה וסיכומים, ניתוח תופעות מורכבות, יצירת תוכן הומוריסטי ויצירתי, ותבניות פרומפטים שיעזרו לכם להפיק מ‑Grok תוצאות מדויקות ועקביות. כאן הכלים הופכים לשיטות עבודה, והיכולות של Grok מתחילות לשרת אתכם בצורה יומיומית ומקצועית.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

איך לדבר עם Grok בצורה שמביאה תוצאות

בחלק הראשון של המדריך הבנו איך Grok עובד ואיך הוא נראה. השלב הבא הוא ללמוד איך לדבר איתו נכון. במקרה של Grok זה חשוב במיוחד, כי הוא מצטיין בניתוח שיח עדכני מתוך X, ביצירת ניסוחים מהירים ובהפקת תוכן יצירתי כמו טקסטים הומוריסטיים ותמונות. אבל איכות התוצאה תלויה מאוד באופן שבו מנסחים את הבקשה.

העיקרון פשוט: אל תכתבו רק "תכתוב לי משהו". הגדירו מי אתם, מה אתם צריכים, עבור מי הטקסט, באיזה סגנון ובאיזה אורך. ככל שהבקשה ברורה יותר, כך התשובה תהיה מדויקת, שימושית ופחות כללית.

כתיבה ועריכה

אחד השימושים הכי טבעיים ב-Grok הוא כתיבה מהירה: פוסטים, הודעות, ברכות, ניסוחים מחדש, כותרות וטיוטות קצרות. הוא מתאים במיוחד למצבים שבהם יש רעיון בראש, אבל צריך עזרה להפוך אותו לניסוח זורם, חד או משכנע יותר.

הנה כמה פרומפטים מוכנים:

פוסט לרשתות חברתיות

כתוב לי פוסט קצר ל-X בעברית על [נושא], בטון חכם אבל לא מתנשא, באורך של עד 4 שורות, עם פתיחה שמושכת תשומת לב.

ניסוח מחדש

שכתב את הטקסט הבא כך שיהיה ברור, קצר וזורם יותר, בלי לשנות את המשמעות:

[הדבק טקסט]

כותרות חלופיות

תן לי 10 כותרות שונות לטקסט הבא: 3 ענייניות, 3 מסקרנות, 2 קלילות ו-2 חדות במיוחד.

טיוטת מייל

נסח לי מייל קצר, מנומס וישיר בנושא [נושא], בטון מקצועי ולא רשמי מדי.

הטיפ החשוב כאן הוא לא לבקש רק "תכתוב". עדיף לבקש כמה גרסאות, או להגדיר טון ברור: רשמי, קליל, חד, אנושי, שיווקי או ביקורתי. כך Grok לא רק "כותב בשבילכם", אלא ממש עובד כמו עורך ראשון לטיוטה.

למידה וסיכומים

מעבר לכתיבה, Grok יכול לשמש היטב גם ככלי עזר ללמידה, לסיכומים ולהבנה מהירה של טקסטים מורכבים. זה נכון במיוחד כשצריך לפרק נושא עמוס, להסביר ויכוח ציבורי, או לסכם טקסט ארוך בשפה פשוטה וברורה.

הנה פרומפטים שימושיים לפרק הזה:

הסבר פשוט לנושא מורכב

הסבר לי את הנושא הבא כאילו אני מתחיל לגמרי, בעברית פשוטה, עם דוגמה אחת מהחיים:

[שם הנושא]

סיכום כתבה או מאמר

סכם את הטקסט הבא ב-5 נקודות קצרות, ואז כתוב פסקה אחת שמסבירה מה באמת חשוב להבין ממנו:

[הדבק טקסט]

הכנה למבחן או להרצאה

בנה לי דף חזרה קצר על הנושא הבא: מושגים מרכזיים, שאלות אפשריות, ותשובות קצרות לכל שאלה.

השוואה בין שני מושגים

השווה בין [מושג א'] ל-[מושג ב'] בטבלה פשוטה: הגדרה, שימוש, יתרונות, חסרונות ודוגמה.

כאן שווה להזכיר שהמטרה היא לא רק "לקבל תשובה", אלא להבין טוב יותר. לכן כדאי להשתמש ב-Grok בכמה סבבים חכמים: קודם הסבר פשוט, אחר כך סיכום, ואז שאלת המשך כמו "מה החלק שהכי קל להתבלבל בו?" או "תן לי דוגמה קונקרטית".

טרנדים ושיח

כפי שכבר הבנתם, זה כנראה האזור שבו Grok מרגיש הכי טבעי, משום שהחיבור שלו ל-X הופך אותו לכלי נוח במיוחד להבנת טרנדים, שרשורים, ויכוחים וגלי תגובות שמתפוצצים ברשת. במקום לגלול עשרות פוסטים ולנסות להבין מה קרה, אפשר לבקש ממנו לעשות סדר ולחלץ את עיקרי הדברים.

פרומפטים מומלצים:

הסבר לטרנד

תסביר לי למה [נושא/שם] נמצא עכשיו בטרנדינג ב-X. מי התחיל את זה, מה קרה, ומה הטענות המרכזיות סביב זה?

מיפוי מחלוקת

סכם לי את הוויכוח סביב [נושא] ב-X: מה אומרים התומכים, מה אומרים המתנגדים, ואיפה יש אי-ודאות או מידע לא מאומת?

סיכום שרשור

סכם את השרשור הזה ב-5 נקודות קצרות, ואז כתוב אם מדובר בעיקר בעובדות, בפרשנות או בספקולציה.

תרגום שיח רשת לשפה פשוטה

קרא את הטקסט הבא והסבר לי אותו בעברית פשוטה, בלי סלנג, כאילו אני לא עוקב אחרי השיח הזה בכלל:

[הדבק טקסט]

זה סעיף שכדאי לכתוב בו לקוראים משפט אחד ברור: Grok יכול לעזור מאוד להבין "על מה כולם מדברים", אבל הוא לא מחליף בדיקה עצמאית כשמדובר בטענות עובדתיות, מספרים, ציטוטים או חדשות מתפתחות.

הומור ויצירה

Grok מזוהה מאוד עם טון משוחרר, שנון ולעיתים גם סרקסטי יותר מצ'אטבוטים אחרים, ולכן הוא מתאים במיוחד לבקשות הומוריסטיות, לרוסטים, לטקסטים עם קריצה ולניסוחים "יותר אינטרנטיים" באופי שלהם. בנוסף, בחלק מהשימושים הוא מאפשר גם יצירת תמונות, כך שהצד היצירתי של הכלי לא נגמר בטקסט בלבד.

הנה כמה דוגמאות טובות:

רוסט קליל

תכתוב לי roast משעשע ולא אכזרי על הביו הבא ב-X, בטון שנון ולא מעליב:

[הדבק ביו]

ציוץ עם אופי

כתוב לי 5 גרסאות לציוץ על [נושא], בטון מצחיק, חד ואינטרנטי, אבל לא ילדותי.

טקסט עם קריצה

קח את הטקסט הבא ושכתב אותו כך שיהיה יותר שנון, זורם וכיפי לקריאה, בלי להפוך אותו למוגזם:

[הדבק טקסט]

פרומפט לתמונה

צור פרומפט מפורט לתמונה של [רעיון], בסגנון קולנועי, עם תאורה דרמטית, צבעים עשירים ורקע שמדגיש את האווירה.

כדאי להדגיש כאן נקודה חשובה: כשמבקשים מ-Grok להיות מצחיק, פרובוקטיבי או "פרוע" יותר, מקבלים לעיתים תוצאה הרבה יותר מעניינת מבחינה סגנונית — אבל גם פחות צפויה, ולעיתים פחות מדויקת. לכן בפרק הזה נכון לעודד את הקורא ליהנות מהיצירתיות, אך לא לבלבל בין שנינות לבין אמינות.

תבנית שעובדת

הנה התבנית אולי הכי שימושית לכל פרומפט:

אתה [התפקיד של Grok].

המטרה שלך היא [מה אני צריך].

קהל היעד הוא [למי זה מיועד].

הטון צריך להיות [רשמי / קליל / חד / מקצועי / ידידותי].

האורך הרצוי הוא [מספר שורות / פסקאות / נקודות].

אם חסר מידע, שאל אותי שאלה אחת לפני שאתה עונה.

למשל:

אתה עורך טכנולוגי.

המטרה שלך היא לנסח לי פוסט קצר על גרוק למשתמשים מתחילים.

קהל היעד הוא אנשים שלא מכירים AI לעומק.

הטון צריך להיות חכם, ידידותי וברור.

האורך הרצוי הוא עד 5 שורות.

אם חסר מידע, שאל שאלה אחת לפני שאתה עונה.

זו תבנית פשוטה, אבל היא חוסכת בלבול, משפרת את איכות התוצאה, ועוזרת במיוחד למשתמשים חינמיים שצריכים לנצל כל הודעה בצורה חכמה בגלל מגבלות השימוש.

בדיקת עובדות, פרטיות ומגבלות - מה חשוב לדעת לפני שסומכים על Grok

אחד הדברים שהופכים את Grok למסקרן כל כך הוא גם אחד המקומות שבהם צריך להשתמש בו בזהירות. החיבור שלו ל-X ולשיח בזמן אמת הופך אותו לכלי מצוין להבנת טרנדים, ויכוחים ופוסטים מתפוצצים, אבל בדיוק בגלל זה הוא עלול גם לשקף רעש, בלבול או מידע שעדיין לא התייצב.

במילים פשוטות, Grok יכול להיות עוזר מעולה לניתוח, סיכום וניסוח, אבל הוא לא אמור להיות הסמכות האחרונה שלכם בנושאים רגישים. כשמשתמשים בו נכון, הוא חוסך זמן ומסדר את התמונה, אבל כשסומכים עליו בעיניים עצומות, הוא עלול להישמע בטוח בעצמו גם כשהתמונה עדיין חלקית.

למה חשוב לבדוק גם תשובה שנשמעת משכנעת

אחת המלכודות הגדולות של כלי AI היא לא תשובה שנשמעת מוזרה, אלא דווקא תשובה שנשמעת מצוין. Grok יודע לנסח היטב, לחבר טיעונים, ולהציג תשובה בטון סמכותי, במיוחד כשהוא מסכם שיח שכבר רץ במהירות ב-X.

כאן נכנסת הבעיה המוכרת של "הזיות" - מצב שבו המודל משלים פערים, מנחש פרטים חסרים, או מערבב בין עובדה, פרשנות וספקולציה. זה נכון במיוחד כששואלים על אירוע מתפתח, שמועה, ציטוט שלא אומת, או ויכוח שבו כל צד מושך את הסיפור לכיוון אחר.

בנוסף, ל-Grok יש גם צד הומוריסטי ומושחז יותר מכלי AI אחרים, ובמצבים משוחררים יותר הוא עשוי להעדיף שנינות, דרמה או ניסוח חד על פני דיוק יבש. לכן, ככל שהתשובה נשמעת יותר מצחיקה, יותר עוקצנית או יותר "ויראלית", כך כדאי לבדוק אותה יותר בזהירות.

איך בודקים תשובה של Grok בלי להסתבך

הדרך הכי טובה לעבוד עם Grok היא לא לשאול "האם זה נכון?", אלא "מה כאן חייב בדיקה?". ברגע שמאמצים את הגישה הזאת, הכלי הופך משופט אחרון לעוזר מחקר חכם.

הנה כלל פשוט שכדאי ללמד את הקוראים במדריך: כל פעם ש-Grok נותן תשובה, בודקים במיוחד ארבעה דברים:

שמות, תארים ותפקידים.
תאריכים, זמנים ורצף אירועים.
מספרים, מחירים, אחוזים ונתונים.
ציטוטים, ייחוס אמירות וקישורים בין אנשים או גופים.

עוד הרגל טוב הוא לבקש ממנו בעצמו להפריד בין שכבות המידע. למשל:

"הפרד בין עובדות, פרשנות והשערות."
"איזה חלק בתשובה הזאת מבוסס על מידע מאומת, ואיזה חלק הוא סיכום שלך?"
"מה הנקודות שהכי דורשות בדיקה נוספת?"

ניסוחים כאלה לא מבטיחים תשובה מושלמת, אבל הם כן מאלצים את המודל להיות מסודר וזהיר יותר. עבור משתמשים חינמיים, זו גם דרך חכמה לחסוך הודעות, כי במקום לגלות מאוחר שהתשובה מעורבבת, מבקשים כבר מראש מבנה ברור ואמין יותר.

פרטיות: מה לא כדאי להדביק לצ'אט

גם כש‑Grok מרגיש כמו שיחה קלילה, חשוב לזכור שמדובר בכלי AI ולא במחברת פרטית. לפני שמדביקים מידע אישי, מסמך רגיש, פרטי לקוח, סיסמאות, חוזים, בדיקות רפואיות או נתונים פיננסיים, עוצרים רגע ושואלים אם זה באמת הכרחי.

כלל אצבע פשוט: אם לא הייתם מרגישים בנוח לראות את המידע הזה מופיע בטעות על מסך פתוח, אל תדביקו אותו לצ'אט. זה נכון במיוחד למשתמשים חדשים, שלפעמים נסחפים עם הנוחות ושוכחים כמה מהר עוברים משאלה תמימה למסמך אישי.

הגדרות הפרטיות של Grok

כדאי גם להכיר את הגדרות הפרטיות בחשבון שלכם. במסך ההגדרות (Settings), תחת Data Controls, תמצאו אפשרויות כמו:

שימוש בנתונים שלכם לשיפור המודל (מוקף באדום). כבוי זה אומר שאתם לא מאפשרים את השימוש.
התאמה אישית לזיכרון והיסטוריית שיחות.
שיתוף קישורי צ'אט.
הצגת תוכן רגיש.

כל אחת מהאפשרויות האלה ניתנת להפעלה או כיבוי, והן משפיעות על האופן שבו Grok משתמש במידע שלכם. המדיניות עשויה להשתנות, ולכן תמיד עדיף לבדוק את ההגדרות בזמן אמת במקום להסתמך על הנחות או על מידע ישן.

מתי לא כדאי לסמוך רק על Grok

יש משימות שבהן Grok מצוין: ניסוח, סיכום, מיפוי טענות, הסבר ראשוני וניתוח שיח. אבל יש תחומים שבהם הוא לא יכול להחליף מומחה, מקור רשמי או בדיקה עצמאית. זה נכון במיוחד בהחלטות רפואיות, משפטיות, פיננסיות, או בכל מצב שבו טעות קטנה עלולה להיות משמעותית.

העיקרון פשוט, Grok טוב מאוד בלהסביר, למקד ולתת כיוון. הוא פחות מתאים להיות הגורם היחיד שעל בסיסו מקבלים החלטה חשובה. גם כשהוא נשען על שיח עדכני מ‑X, הוא פועל בתוך סביבה מהירה ורועשת, שבה אמינות המידע משתנה מרגע לרגע.

אותו דבר נכון גם לגבי חדשות מתפרצות. בדקות או בשעות הראשונות של אירוע, הרשת מלאה בפרשנויות, תיקונים וחצאי דיווחים. Grok יכול לעזור להבין את התמונה, אבל לא כדאי להסתמך עליו כדי לנעול מסקנה סופית.

צידה לדרך

הגענו לסוף המדריך. עכשיו, כשאתם מבינים איך המנוע של Grok עובד, איך לעקוף את המגבלות שלו ואיך להוציא ממנו תשובות חכמות ורלוונטיות, כל מה שנשאר הוא פשוט להתחיל לשחק איתו.

כדי לעשות לכם חיים קלים, הנה Cheat Sheet שכדאי לשמור בהישג יד בכל פעם שאתם פותחים את הממשק וצריכים מבנה לפרומפט מוצלח:

התפקיד: "אתה מומחה ל..." / "אתה עורך שנון של..."
המשימה: "סכם לי את..." / "תסביר לי למה..." / "כתוב לי..."
ההקשר (קריטי ב-Grok): "בהתבסס על מה שקורה עכשיו ב-X..."
המבנה: "ב-3 נקודות קצרות" / "בפסקה אחת" / "בטבלה מסודרת".
הטון: "בטון מצחיק וציני" (Fun) או "בטון עובדתי וישיר" (Regular).

מילות סיכום

Grok הוא כלי מצוין להתחיל ממנו, אבל לא תמיד הכלי שמסיימים איתו. אם משתמשים בו כעוזר חכם - הוא מהיר, מועיל, יצירתי ולעיתים ממש מבריק. אם מצפים ממנו להיות מקור סופי, חסין טעויות וחף מהטיות של שיח רשת, מתאכזבים מהר יותר. השילוב הנכון הוא ליהנות מהמהירות והיצירתיות, אבל להשאיר את שיקול הדעת אצל המשתמש.

Grok הוא לא עוד צ'אטבוט גנרי שמנסה לרצות את כולם. הוא נבנה להיות מהיר, מחובר לקרקע המציאות של הרשתות החברתיות, ולפעמים גם קצת חצוף. כמשתמשים חינמיים, אולי תצטרכו להתמודד עם מגבלות הודעות, אבל ברגע שתתרגלו לשאול את השאלות הנכונות, תגלו שיש לכם בידיים את אחד הכלים החזקים ביותר להבנת האינטרנט של שנת 2026.

צאו לדרך, תשאלו שאלות קשות, ואל תשכחו לבקש ממנו איזה "רוסט" טוב על עצמכם מדי פעם.

הפוסט המדריך השלם ל-Grok החינמי: חלק ב' הופיע ראשון בLet's AI בינה מלאכותית

המדריך השלם ל-Grok החינמי: חלק א'

רון גולד — Tue, 07 Apr 2026 05:17:27 +0000

אם יצא לכם לעבוד עם בינה מלאכותית בשנים האחרונות, כנראה התרגלתם לכלים מנומסים, זהירים ולעיתים גם מעט משעממים. Grok, מודל השפה של חברת xAI, נבנה כדי לשבור את הדפוס הזה. היתרון המרכזי שלו אינו רק כוח חישובי, אלא הגישה הישירה לזרם המידע בזמן אמת של רשת X. המשמעות היא שכאשר מתרחש אירוע חדשותי או מתחיל טרנד חדש, Grok כבר קורא, מנתח ומבין אותו הרבה לפני שכלים אחרים מספיקים לעדכן את מאגרי הידע שלהם. זהו החלק הראשון מתוך שניים במדריך המעשי ל‑Grok החינמי בגרסה 4.20. בחלק א' נבנה את הבסיס: איך לגשת ל‑Grok, איך לעבוד בצורה חכמה בגרסה החינמית, איך נראה הממשק ואיזה פיצ'רים מרכזיים יעזרו לכם להבין את השיח ברשת בזמן אמת. בחלק ב' נעמיק בטכניקות מעט יותר מתקדמות, יצירה, למידה ופרומפטים חכמים.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

הגישה של xAI: חופש ביטוי, הומור וחיבור לזמן אמת

החזון מאחורי המערכת מתבסס על עיקרון מרכזי אחד: מקסימום חופש ביטוי ומינימום צנזורה או פוליטיקלי קורקט. Grok לא מפחד לענות על שאלות "עוקצניות" שצ'אטבוטים אחרים יסרבו לענות עליהן מטעמי בטיחות. בנוסף, הוא מצויד בחוש הומור מובנה ונטייה לסרקסטיות, מה שהופך את האינטראקציה איתו לקרובה יותר לשיחה עם משתמש רשת טיפוסי - ציני, מהיר ותמיד מעודכן.

למי המדריך מיועד ומה תדעו לעשות בסופו

המדריך הזה מיועד למשתמשים פרטיים שרוצים להכיר את Grok ולנצל את היכולות שלו בלי להתחייב למנוי בתשלום. בסוף הקריאה תדעו איך לגשת למערכת, איך לעבוד בצורה חכמה יותר בתוך מגבלות הגרסה החינמית, איך לנתח טרנדים ושיח בזמן אמת, ואיך להשתמש בסגנון ההומוריסטי והישיר שמאפיין את Grok כדי ליצור תוכן רלוונטי, ברור ומשעשע.

צעדים ראשונים (בלי להוציא שקל)

איך ניגשים ל-Grok?

נכון לחודש אפריל 2026, יש שלוש דרכים עיקריות להשתמש ב‑Grok:

1. דרך פלטפורמת X Grok משולב ישירות באתר ובאפליקציה של X, כך שאפשר לשאול שאלות מתוך הפיד עצמו בלי לעבור לממשק אחר.

2. האתר הייעודי Grok.com ממשק נקי ושקט שמוקדש לשיחה עם המודל בלבד, ללא הסחות דעת מהרשת החברתית.

3. אפליקציות מובייל אפליקציות ל‑iOS ולאנדרואיד שמאפשרות גישה מהירה מהטלפון, כולל תמיכה בפקודות קוליות ושימוש במצלמה לזיהוי וניתוח אובייקטים.

הגרסה החינמית מול מנוי Premium: מה מקבלים ומהן המגבלות?

Grok פועלת במודל של התנסות חינמית שמאפשרת להכיר את הכלי, אך היא כוללת מגבלות שימוש שנועדו למנוע עומס על השרתים. הגרסה החינמית מספקת גישה בסיסית בלבד: מספר הודעות מוגבל בכל פרק זמן, חלק מהפיצ'רים זמינים באופן חלקי, ויכולת יצירת התמונות מצומצמת. היא מתאימה להתנסות ראשונית ולהבנה כללית של המערכת.

מנויי X Premium נהנים מגישה רחבה יותר: יותר הודעות, זמינות גבוהה יותר של יצירת תמונות, ושימוש נוח יותר בפיצ'רים מתקדמים. כל זה מוצע בתמורה לתשלום חודשי. יש גם את גרוק למשתמש העסקי ולארגונים עליו תוכלו לקרוא כאן.

טיפ חשוב למשתמשים חינמיים: מגבלת ההודעות אינה פוגעת באיכות התשובות אלא רק בכמות הפניות. לכן כדאי לרכז כמה שיותר בקשות בפרומפט אחד מפורט, במקום לנהל שיחה מתמשכת, ארוכה ומפוצלת. כך תוכלו לשמור את המכסה למשימות החשובות באמת.

אפשרויות המנוי של גרוק למי שרוצה מינימום מגבלות

הפיצ'רים שכל משתמש חייב להכיר

היתרון הגדול: חיפוש וניתוח מידע בזמן אמת מתוך X

הכוח המרכזי של Grok הוא היכולת שלו להסתמך על מידע שנוצר באותו רגע ברשת X. זה מאפשר לשאול שאלות כמו "למה כולם מדברים על הפוליטיקאי הזה עכשיו" או "מה הטענות המרכזיות בוויכוח שרץ כרגע בפיד" ולקבל תשובה שמחברת בין הפוסטים, התגובות וההקשר הרחב. Grok יודע להפוך את הרעש של הרשת החברתית לתקציר חד וברור.

ככה נראה ממשק המשתמש של הצ׳אטבוט גרוק:

שיחה קולית, המרת דיבור לטקסט ותפריט מצבי שיחה

מצבי פעולה: איך Grok חושב בגרסה 4.20

בגרסאות מוקדמות של Grok היו מצבי שיחה כמו Regular ו‑Fun Mode, שאפשרו לבחור בין טון רציני לטון משוחרר וציני. המצבים האלה כבר לא קיימים בגרסה 4.20.

מצבי פעולה ואפשרויות נוספות למשתמש

במקומם, Grok מציע מצבי פעולה שמשפיעים על עומק ומהירות התשובה:

Auto - המערכת בוחרת לבד בין מהירות לעומק.
Fast - תשובות קצרות ומהירות.
Expert - תשובות מעמיקות וארוכות יותר.
Heavy / SuperGrok - משתמשים בתשלום חודשי ומשתמשים כבדים (power users) וגם אופציות לארגונים.

למרות שהאפשרות לבחור Fun Mode נעלמה, ה‑DNA של Grok נשאר זהה. הוא עדיין ישיר, שנון וקצת ציני, ומרגיש הרבה פחות רשמי מכלים אחרים. Grok שומר על טון חד ואנושי, פשוט בלי כפתור שמדליק או מכבה אותו.

בחלק הימני העליון בתמונה המצורפת מעלה תוכלו לגלות עוד אפשרויות בממשק המשתמש הראשי. אפשר ללחוץ על כפתור Imagine שמעביר למסך יצירת תמונות ו-וידאו ואפילו לעבור למצב ״אינקוגניטו״ - שיחה זמנית שבה Grok לא שומר את ההודעות שלכם ולא משתמש בהן כדי לבנות הקשר לשיחות עתידיות. ברגע שסוגרים את החלון, השיחה נעלמת מההיסטוריה ולא מופיעה ברשימת הצ׳אטים. זה שימושי במיוחד כשעובדים על נושא רגיש, כשלא רוצים שהשיחה תתערבב עם פרויקט קיים, או כשפשוט רוצים להתנסות בלי "ללכלך" את ההיסטוריה.

יצירת תמונות, וידאו ותוכן מולטימדיה

Grok אינו מוגבל לטקסט בלבד. דרך כפתור Imagine ניתן ליצור תמונות, ובחלק מהגרסאות גם וידאו קצר באיכות בסיסית. כדי לקבל תוצאה טובה, כדאי לתאר במדויק את הסצנה, התאורה, הסגנון והאווירה. משתמשים חינמיים עשויים להיתקל בהודעות שגיאה בשעות עומס, ולכן מומלץ לשמור בקשות ויזואליות לרגעים שבהם באמת צריך אותן.

סרגל האפשרויות ליצירת וידאו ותמונות

דיבור עם Grok וניתוח תמונות מהמצלמה

באפליקציות המובייל של Grok ניתן להשתמש במצלמה ובמיקרופון. אפשר לצלם מסמך בשפה זרה ולקבל תרגום, לצלם גרף ולקבל הסבר פשוט, או לנהל שיחה קולית בזמן הליכה או נהיגה. זו דרך נוחה להפוך את Grok לעוזר אישי שמלווה אתכם ביומיום.

סרגל הצד הקבוע בממשק הווב

עבודה עם פרויקטים ב‑Grok

בנוסף לשיחה רגילה, Grok מאפשר לפתוח פרויקט ייעודי שבו מגדירים מראש את שם הפרויקט שלכם (1) ההנחיות, הטון והסגנון שהמודל צריך לאמץ (2). בתוך פרויקט אפשר גם להעלות קבצים, מסמכים או חומרים רלוונטיים (3), וכך ליצור סביבת עבודה קבועה שבה Grok מבין את ההקשר בלי להזכיר לו אותו בכל פעם מחדש. עבור משימות ארוכות, כתיבה מתמשכת או ניתוח של כמה מקורות מידע, פרויקט מעניק יציבות, עקביות ותוצאות מדויקות יותר.

עבודה עם פרויקטים ב‑Grok

עבודה יומיומית - איך להוציא מ-Grok את המקסימום

איך לנסח פרומפטים מנצחים

האופן שבו אתם מנסחים את הבקשה משפיע ישירות על איכות התשובה. במקום לכתוב שאלה קצרה וכללית כמו "תסכם לי את הכתבה", כדאי לבנות את הפרומפט כמו מתכון ברור:

הגדירו תפקיד: "אתה עורך טכנולוגי בכיר"
הגדירו משימה: "סכם את הכתבה הבאה"
הגדירו פורמט: "בשלוש נקודות קצרות ופסקה מסכמת"

ניסוח כזה מצמצם צורך בהבהרות ושומר על מכסת ההודעות שלכם בגרסה החינמית.

"תסביר לי את הטרנד" - הפיצ'ר ששווה הכל

במקום לנסות להבין לבד למה סרטון, ציוץ או התבטאות מסוימת משתלטים על הפיד, אפשר לבקש מ‑Grok לעשות סדר. הנוסחה הבאה עובדת מצוין:

"תסביר לי למה למה כולם מדברים עכשיו על [נושא] ב‑X. מי התחיל את זה, מה הטענות המרכזיות של שני הצדדים, והאם יש כאן עובדות מאומתות או רק שמועות."

התשובה שתקבלו תסכם את השיח ותציג את ההקשר הרחב תוך שניות.

ניתוח וסיכום של שרשורים ארוכים

רשת X מלאה בשרשורים מעניינים. חלקם ארוכים ומתישים. גם אם אין לכם חשבון X, תוכלו להדביק בצ׳אט קישור ציבורי לשרשור ולבקש מ‑Grok להציג את עיקרי הדברים בצורה מסודרת וברורה. מי שכן מחזיק חשבון X יכול גם לתייג את Grok ישירות בפוסט. בשני המקרים Grok ינתח את השרשור, יזהה את הטענות המרכזיות ויחסוך לכם זמן קריאה.

אמנות החיסכון - איך לא להיתקע עם "הגעת למגבלת השימוש"

בגרסה החינמית יש מגבלה של כ‑10 עד 20 הודעות בכל פרק זמן, ולכן חשוב להשתמש בהן בחוכמה. שלושת הכללים הבאים יעזרו לכם להפיק את המקסימום:

הימנעו מנימוסים ואל תגידו תודה. כל הודעה נספרת. גם "תודה" קצרה מבזבזת שאילתה.
הכל בהודעה אחת. תכננו מראש ורכזו כמה שיותר בקשות בפרומפט אחד מפורט.
שמרו את Grok למשימות הגדולות. אל תבזבזו הודעות על שאלות פשוטות כמו מזג אוויר או חישובים בסיסיים. השתמשו בו כשצריך ניתוח, סיכום או יצירת תוכן.

מה למדנו עד עכשיו?

בחלק א' של המדריך הכרנו את Grok מקרוב. איך נראה הממשק משתמש, מה הופך אותו לשונה מכלי בינה מלאכותית אחרים, איך ניגשים אליו בחינם, מהן מגבלות השימוש, ואילו פיצ'רים מרכזיים מאפשרים להבין את השיח ברשת X בזמן אמת. למדנו איך לנסח פרומפטים בסיסיים ויעילים, איך לחסוך בהודעות בגרסה החינמית, ואיך להשתמש ביכולות כמו ניתוח טרנדים, סיכום שרשורים ויצירת תוכן בצורה חכמה.

המטרה של חלק א' הייתה לבנות בסיס יציב: להבין איך Grok נראה וחושב, איך הוא מגיב, ואיך להפיק ממנו ערך כבר מהשימוש הראשון.

מחר, בחלק ב', נעמיק עוד יותר. נעסוק בטכניקות מתקדמות לכתיבה ועריכה, נלמד איך להשתמש ב‑Grok ללמידה, סיכומים והכנה למבחנים, נחקור את היכולות שלו בתחום ההומור והיצירה, ונציג תבניות עבודה שיעזרו לכם לבנות פרומפטים מדויקים לכל משימה.

הפוסט המדריך השלם ל-Grok החינמי: חלק א' הופיע ראשון בLet's AI בינה מלאכותית

איך קובץ קטן חושף שבר גדול בתדמית של אנטרופיק

רון גולד — Sat, 04 Apr 2026 06:25:37 +0000

ב-31 במרץ 2026 אנטרופיק מצאה את עצמה בלב אחד האירועים המביכים והמשמעותיים ביותר שחוותה. החברה, שמציגה את עצמה כמי שפועלת בגישת safety‑first, פרסמה בעדכון שגרתי גרסה של Claude Code שכללה קובץ דיבוג פנימי שחשף את קוד המקור המלא של סוכן הקוד שלה. בתוך זמן קצר התברר שמדובר בחשיפה רחבה של רכיבים פנימיים שלא היו אמורים לצאת החוצה, והקהילה הטכנולוגית כולה עקבה אחרי האירוע בדריכות. הדליפה לא נבעה ממתקפה זדונית אלא מטעות אנוש תפעולית פשוטה - קובץ פנימי אחד שנכנס בטעות לעדכון ציבורי הוביל לחשיפה משמעותית והציב את אנטרופיק במרכזו של דיון רחב על תהליכי הפצה ואבטחה.

ANTHROPIC BUILT A SYSTEM TO STOP LEAKS, THEN ACCIDENTALLY SHIPPED THE WHOLE SOURCE CODE ANYWAY.

And inside the leak, people found unannounced features, hidden projects, and a pretty brutal level of irony.pic.twitter.com/lYywWrVV4C

— 0xMarioNawfal (@RoundtableSpace) April 2, 2026

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

קובץ אחד במקום הלא נכון

האירוע התחיל כאשר אנטרופיק פרסמה עדכון שגרתי לכלי הפיתוח שלה, Claude Code. בתוך העדכון הופיע בטעות קובץ גדול שנועד לשימוש פנימי בלבד. הקובץ הזה, שנקרא source map וגודלו 59.8MB, משמש בדרך כלל מפתחים כדי לאתר תקלות בזמן פיתוח. במקרה הזה הוא הכיל קישורים לקבצים פנימיים של החברה, וכך חשף מאגר מלא של קוד מקור שנשמר על שרת ציבורי. חוקר אבטחה בשם Chaofan Shou היה הראשון לגלות שהקובץ מוביל לארכיון שמכיל כמעט אלפיים קבצים וכחצי מיליון שורות קוד של Claude Code.

לא הייתה כאן פריצה או מתקפה, וגם לא חולשה במודל עצמו. זו הייתה טעות תפעולית פשוטה. קובץ אחד שנארז בטעות בתוך עדכון ציבורי הפך לחשיפה רחבה, ובעולם שבו כל קובץ שמופיע לרגע באינטרנט יכול להיות מועתק ומופץ ללא הגבלה, המשמעות הייתה גדולה בהרבה מהטעות שהובילה אליה.

הצצה נדירה למוח של סוכן קוד

הדליפה לא כללה את משקלי המודל של Claude, לא נתוני משתמשים ולא מפתחות רגישים, ואנטרופיק הדגישה זאת שוב ושוב. אבל מה שכן נחשף היה כמעט כל מה שמרכיב את Claude Code ככלי פיתוח מתקדם. בתוך הקבצים שנמצאו הופיעו רכיבים מרכזיים כמו מנגנון קבלת ההחלטות של הסוכן, מערכת שמנהלת שיתוף פעולה בין כמה תהליכים במקביל, הוראות פנימיות שמכוונות את ההתנהגות של המערכת, נתוני ניטור ותיעוד, וגם עשרות סימונים שמצביעים על יכולות ופיצ'רים שנמצאים בשלבי פיתוח שונים.

לפי ניתוחים שפורסמו לאחר הדליפה, נמצאו גם אזכורים למספר יכולות ניסיוניות. בין היתר הופיע מצב בשם Kairos, שמאפשר לסוכן להמשיך לעבוד ברקע גם כשהמשתמש לא פעיל. לצד זה זוהתה מערכת בשם Buddy, שנראית כמו מנגנון ליווי אישי שנועד ללמוד לאורך זמן. נמצאו גם יכולות זיכרון שמאפשרות לכלי לחזור לשיחות קודמות ולהפיק מהן תובנות, וכן תצורה של עוזר שפועל באופן רציף ברקע.

בתוך הקוד הופיעו גם רגעים אנושיים יותר. אחד המפתחים כתב הערה שמפקפקת בצורך במנגנון מסוים ומציינת שהוא מוסיף מורכבות בלי תועלת ברורה. לצד זה הופיעו גם אלמנטים קלילים יותר, כמו רעיון לחיית מחמד דיגיטלית שמופיעה ליד תיבת הקלט ומגיבה לקוד שהמשתמש כותב.

מדליפה לפרויקט קוד פתוח פעיל

קהילת המפתחים זינקה על הדליפה הרבה יותר מהר משהטעות עצמה התרחשה - בעוד שהחשיפה נולדה מטעות תפעולית קטנה ושקטה, הקהילה פירקה, שיחזרה והפיצה את הקוד כמעט מיד. בתוך זמן קצר הקוד שהופיע בטעות הועתק, נותח והועלה מחדש לאתרי קוד פתוח. לפי דיווחים בקהילה, נוצר ריפוזיטורי (תיקייה מרכזית שבה שומרים, מנהלים ומשתפים קוד) בשם Claw Code שצבר עשרות אלפי כוכבים בתוך שעות ספורות, לצד מספר גדול של העתקות וגרסאות נגזרות. עבור רבים זו הייתה הזדמנות נדירה לבחון מבפנים איך בנוי כלי פיתוח מסחרי ברמת ייצור.

מפתחים שונים השתמשו בכלי AI כדי לשכתב חלקים מהקוד לשפות אחרות, כמו Python ו-Rust, תהליך שלפי פוסטים שפורסמו ברשתות הושלם בתוך פחות משעתיים. כך הפכה הדליפה מפרט טכני מביך לפרויקט חי שהקהילה לומדת ממנו, מפרקת אותו ומנתחת את הארכיטקטורה שלו.

ברשתות החברתיות האירוע עורר שיח רחב. פוסטים זכו למיליוני צפיות, מפתחים מוכרים הגיבו, וחזר שוב ושוב מוטיב אירוני אחד. משתמשים הזכירו את הפער בין העובדה שחברות AI מאמנות מודלים על כמויות עצומות של מידע ציבורי, לבין הרגישות הרבה שמופיעה כאשר קוד פנימי שלהן נחשף בטעות.

טעות אנוש והניסיון לבלום את ההתפשטות

אנטרופיק הגיבה במהירות לאחר שהתברר שהקובץ ״הטועה״ חשף קוד פנימי. החברה הסירה את הגרסה הפגומה ממאגר ההפצות, שלחה בקשות להסרת עותקים שהועלו מחדש, והבהירה שמדובר בטעות אנוש בתהליך האריזה של העדכון. דוברי החברה הדגישו שלא נחשפו נתוני לקוחות או פרטים רגישים, והתחייבו לחזק את תהליכי ההפצה כדי למנוע מקרים דומים בעתיד.

אלא שבעולם שבו עותקים נשמרים מיד במקומות רבים, הקוד כבר הספיק להתפשט. ברגע שהוא הופיע ברשת, לא הייתה דרך ממשית להחזיר אותו לאחור.

רצף דליפות שמערער את נרטיב ה-safety-first

האירוע הנוכחי, לצערה של אנטרופיק, לא התרחש בחלל ריק. רק חמישה ימים קודם, ב-26 במרץ 2026, התמודדה החברה עם דליפה נוספת. לפי דיווחים שונים, נחשפו כשלושת אלפים קבצים פנימיים הקשורים למודל ניסיוני בשם Claude Mythos, המכונה בחלק מהמקורות גם Capybara. זו הייתה חשיפה רחבה של חומרי פיתוח, מסמכים פנימיים ורכיבים טכניים שלא נועדו לצאת החוצה.

גם Claude Mythos דלף החוצה

גם זו לא הייתה הפעם הראשונה שבה קוד הקשור ל-Claude Code מצא את דרכו לרשת. כבר בפברואר 2025 דווח על דליפה, אבל ההיקף שלה היה מאוד מצומצם והיא טופלה במהירות.

הצטברות האירועים יוצרת תמונה רחבה יותר. לא מדובר בתקלה חד פעמית, אלא ברצף של כשלים תפעוליים שמעלה שאלות על הבשלות של תהליכי ההפצה והאבטחה בחברה שמציגה את עצמה כמי שפועלת בגישת safety-first.

בין חשש לעקיפת מנגנוני הגנה להזדמנות למתחרים

מומחי אבטחה ואנליסטים הצביעו על כמה השלכות מרכזיות של הדליפה. ראשית, חשיפת מנגנוני ההגנה הפנימיים עלולה לאפשר עקיפה שלהם, במיוחד אם גורמים זדוניים ילמדו את המבנה ואת ההיגיון שמאחורי הכללים שמכוונים את המערכת. בנוסף, מתחרים קיבלו למעשה תיאור כמעט מלא של האופן שבו בנוי סוכן קוד ברמת ייצור, מה שעשוי לקצר עבורם תהליכי פיתוח ולספק יתרון תחרותי.

חלק מהמומחים העריכו שאנטרופיק תידרש לבנות מחדש חלק ממנגנוני ההגנה שלה, תהליך שעלול להיות מורכב וארוך. אחרים ציינו שהאירוע עשוי להשפיע גם על אמון משקיעים, במיוחד בתקופה שבה החברה מתקרבת לשלב של גיוסי הון משמעותיים.

Arun Chandrasekaran מ-Gartner ציין שהדליפה יוצרת סיכונים, אך עשויה לשמש גם כקריאת השכמה להשקעה עמוקה יותר בתהליכים וכלים שיחזקו את הבשלות התפעולית של החברה. כותבי ניוזלטרים בתחום הסייבר הדגישו שהשאלה איך חברות AI מגנות על עצמן הופכת חשובה לא פחות מהשאלה איך הן מגנות על המשתמשים.

שכבת האירוניה האחרונה: הפער בין המיתוג למציאות

שכבת האירוניה העמוקה יותר לא נוגעת לכלי אבטחה כזה או אחר, אלא לפער שנחשף בין המיתוג של אנטרופיק כחברה שמדגישה בטיחות, תהליכי בקרה ובשלות תפעולית, לבין רצף תקלות הפצה וחשיפה שמערער בדיוק את ההבטחה הזו. בזמן שהחברה מציגה את עצמה כמי שמובילה את תחום ה-safety בעולם ה-AI, היא מתקשה לשמור על תהליכי הפצה בסיסיים שמונעים חשיפת קוד פנימי.

האירוע הזה הדגיש עד כמה גם חברות שמדברות על אחריות ובטיחות יכולות ליפול על טעויות תפעוליות פשוטות, וכמה מהר הפער בין הצהרות למציאות הופך לחלק מהשיח הציבורי.

דליפה אחת שמספרת סיפור רחב בהרבה

הדליפה של Claude Code היא הרבה יותר מתקלה טכנית. היא חושפת את המתח המתמיד בין מהירות ליציבות, בין חדשנות לבטיחות, ובין פיתוח סגור לבין קהילה שמבקשת להבין איך מערכות כאלה באמת עובדות. האירוע מטיל ספק בבשלות התפעולית של אחת מחברות ה‑AI הבולטות, ומעניק למתחרים הצצה נדירה לאופן שבו בנוי סוכן קוד מתקדם.

ובעיקר, הוא מזכיר שגם בעידן של מודלים עצומים וסוכנים אוטונומיים, לא צריך האקר מתוחכם כדי לחשוף מערכת מורכבת. לפעמים כל מה שנדרש הוא טעות אנוש אחת וקובץ אחד במקום הלא נכון.

הפוסט איך קובץ קטן חושף שבר גדול בתדמית של אנטרופיק הופיע ראשון בLet's AI בינה מלאכותית

האלגוריתם של גוגל שמכווץ מודלים פי 6

רון גולד — Fri, 03 Apr 2026 10:17:03 +0000

הסיפור של TurboQuant מתחיל ברעיון שנשמע כמעט בלתי סביר. האפשרות לצמצם פי 6 את כמות הזיכרון שמודלי שפה גדולים משתמשים בו בזמן שהם פועלים, ועדיין לשמור על אותה איכות תשובה. מאחורי הרעיון הזה מסתתר שינוי עמוק בהרבה. האלגוריתם של גוגל לא רק דוחס מידע, אלא משנה את האיזון בין חומרה לתוכנה ומציע דרך חדשה לחשוב על העלות האמיתית של הפעלת מערכות בינה מלאכותית בקנה מידה גדול. בעולם שבו כל שיפור בביצועים דרש עד היום עוד GPU ועוד זיכרון, TurboQuant מציב סימן שאלה על כמה מההנחות הבסיסיות ביותר של תעשיית ה-AI.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

יתרון שמדלג על האימון מחדש

אימון מודל שפה גדול עולה מיליוני דולרים ודורש שבועות של חישוב. עד היום, כל ניסיון לצמצם מודל כזה חייב התערבות בתהליך האימון עצמו. TurboQuant עובד אחרת - הוא מקטין את צריכת הזיכרון בזמן שהמודל כבר פועל, בלי לגעת באימון המקורי. המשמעות היא שכל ארגון, קטן כגדול, יכול ליהנות מהחיסכון בלי להיכנס להשקעות כבדות או לשנות את תהליך הפיתוח שלו. במקום לבנות מודל מחדש, פשוט מכווצים אותו תוך כדי תנועה - וזה מחזיר את הפוקוס מאסקלציה של חומרה לאופטימיזציה חכמה של מה שכבר קיים.

הרגע שבו מחקר הופך לאפשרות תעשייתית

הטענה הזו לא נשארה בגדר רעיון תיאורטי. בתוך זמן קצר מפרסום המאמר, כמה קבוצות חוקרים שלא קשורות לגוגל ניסו ליישם את השיטה בעצמן - והצליחו. הם בדקו אותה על מחשבים שונים, מערכות הפעלה אחרות ומודלים שלא הופיעו במחקר המקורי, ובכל המקרים קיבלו תוצאות דומות. העובדה שהשיטה עבדה מחוץ למעבדות של גוגל, ובתנאים שלא תוכננו מראש, מחזקת את ההבנה שמדובר בגישה כללית ולא בטריק חד-פעמי. הטכנולוגיה עשויה להיות רלוונטית להרבה יותר גופים מאלה שיש להם גישה לתשתיות של גוגל.

התגובה בשוק: כשזיכרון הופך לפחות קריטי

התגובה בשוק ההון הייתה מהירה וברורה. מניות של יצרניות זיכרון כמו Samsung ו-Micron ירדו, משום שהמשקיעים הבינו את המשמעות המעשית. אם מודלים צורכים פחות זיכרון, הביקוש לשבבי HBM, אחד הרכיבים היקרים ביותר בשרתים ייעודיים ל‑AI, עלול להיחלש. Matthew Prince, מנכ"ל Cloudflare, הגדיר את TurboQuant כ"רגע ה-DeepSeek של גוגל" - השוואה שמאותתת על שינוי כיוון. ממש כמו ש-DeepSeek הראתה שאפשר לאמן מודלים חזקים בעלות נמוכה, TurboQuant מראה שאפשר להריץ אותם בחלק קטן מהחומרה שחשבנו שצריך.

התגובה בשוק היתה מהירה. Source: stocktwits.com

מה זה אומר לתקציב ה-AI של ארגונים

ספקיות הענן הגדולות הרחיבו תשתיות בשנים האחרונות בקצב מהיר, מתוך הנחה שמודלים גדולים דורשים כמויות עצומות של זיכרון. הן חתמו על חוזים ארוכי טווח לרכישת שבבי HBM, בנו מרכזי נתונים חדשים והסתמכו על שרשראות אספקה שכבר היום פועלות קרוב לקצה היכולת. אם TurboQuant או טכניקות דומות יבשילו, פחות שרתים יידרשו כדי לשרת את אותו מספר המשתמשים, ופחות זיכרון יידרש בכל שרת. עבור ארגונים שמתכננים תקציב AI לשנה הקרובה, הנקודה המעשית ברורה - עלויות ההפעלה, שהן החלק היקר ביותר בתקציב ה‑AI, עשויות לרדת מהר יותר ממה שההתחייבויות החוזיות הנוכחיות משקפות.

הזהרות ופערים

חשוב להישאר מפוכחים. האלגוריתם עדיין לא בפרודקשן, וגוגל לא פרסמה קוד רשמי שניתן לבחון או להריץ בקנה מידה גדול. אין עדיין בדיקות שמדמות שימוש של מיליוני משתמשים במקביל, ולא ברור אם הדחיסה משפיעה על מהירות התגובה או על יציבות המערכת לאורך זמן. גם היכולת של השיטה להתמודד עם מודלים גדולים במיוחד עדיין לא הוכחה. ספקיות הענן, שמפעילות תשתיות עצומות ומורכבות, לא יאמצו טכנולוגיה חדשה לפני שתוכיח את עצמה כיציבה, בטוחה ויעילה. הפוטנציאל גדול, אבל הדרך ליישום תעשייתי עדיין לא ברורה.

לא רק TurboQuant

ובכל זאת, גם עם כל סימני השאלה, המסר של TurboQuant ברור. העלות של מערכות בינה מלאכותית לא נקבעת רק על ידי גודל ה‑GPU או כמות הזיכרון, אלא על ידי היכולת להשתמש בהם בצורה חכמה. בעולם שבו פיתוח חומרה מתקדמת דורש שנים של עבודה והשקעות עתק, תוכנה יכולה לשנות את כללי המשחק בתוך זמן קצר. עבור מנהלים שמתכננים תשתיות לשנים קדימה, זו תזכורת לא להינעל על הנחות ישנות. העלויות עשויות לרדת מהר יותר ממה שנדמה, והמהפכה הבאה עשויה להגיע דווקא מהשכבה הרכה ביותר במערכת - מהתוכנה שמצליחה להפיק יותר מהחומרה שכבר קיימת.

הפוסט האלגוריתם של גוגל שמכווץ מודלים פי 6 הופיע ראשון בLet's AI בינה מלאכותית

טיפ קטן לחג שיכול לשנות את הדרך שבה אתם עובדים עם צ'אטבוטים

רון גולד — Wed, 01 Apr 2026 07:40:19 +0000

בעידן שבו צ'אטבוטים הפכו לכלי עבודה מרכזי - מ‑ChatGPT ועד Copilot, Gemini ו‑Claude - אנחנו מוצאים את עצמנו משקיעים זמן רב בליטוש תשובות. אנחנו שואלים, מתקנים, מחדדים, מוסיפים הקשרים, ורק אחרי כמה סבבים מגיעים לתוצאה שבאמת מרגישה ש...“הפעם זה זה”. אבל מה אם היה אפשר לקחת את כל התהליך הזה, לדחוס אותו לפרומפט אחד, ולשחזר את אותה איכות בכל פעם מחדש? כאן נכנס לתמונה טריק פשוט, כמעט אלגנטי, שמאפשר להפוך שיחה שלמה לפרומפט מדויק, חד וניתן לשימוש חוזר.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

איך זה עובד: מהשיחה הארוכה לפרומפט אחד מושלם

הטכניקה מתחילה דווקא ברגע שבו אתם מרגישים שהגעתם לתוצאה המושלמת. אחרי שהשיחה התפתחה, אחרי שהמודל הבין את הכוונות שלכם, אחרי שהוספתם דגשים וסגנון - זה הזמן לשלוף את המשפט הקצר שמפעיל את כל הקסם. אתם פשוט מבקשים מהמודל:

גרסה בעברית:

“נתח את כל השיחה שניהלנו עד עכשיו, וזקק ממנה פרומפט אחד, ברור ומדויק, שהיה יכול להפיק את התוצאה הסופית שקיבלנו - בלי כל שלבי הביניים.”

גרסה באנגלית:

“Reverse engineer our conversation and write the single prompt that would have produced this final response in one go.”

בנקודה הזו המודל עוצר, מביט אחורה על כל השיחה, ומתחיל לנתח אותה: מה היה חשוב לכם? על אילו הנחיות חזרתם? איזה טון ביקשתם? איזה דוגמאות עזרו להבין את הכיוון? הוא מאחד את כל זה לפרומפט אחד, נקי ומדויק, שמופיע בדרך כלל בתוך code block - מוכן להעתקה.

התוצאה היא פרומפט “אופטימלי”: כזה שמאפשר לפתוח שיחה חדשה, להדביק אותו כמו שהוא, ולקבל את אותה איכות תוצאה - בלי כל הסבבים הקודמים.

למה זה עובד כל כך טוב?

הסיבה שהשיטה הזו כל כך יעילה טמונה ביכולת של המודל להבין את הכוונה שלכם בדיעבד. אחרי שהוא ראה את כל התהליך, הוא יודע לזהות מה באמת היה חשוב: הסגנון, המבנה, ההדגשים, ההקשרים. במקום לנסות לנחש מראש מה יוביל לתוצאה הרצויה, אתם נותנים לו ללמוד מהתוצאה עצמה.

מעבר לזה, השיטה הזו מייצרת פרומפטים לשימוש חוזר - אידיאליים לכתיבה מקצועית, תהליכי עבודה, יצירת תוכן, תסריטים, מדריכים ועוד. היא חוסכת זמן, מייצרת עקביות, ומאפשרת לשמור על איכות אחידה לאורך זמן, במיוחד כשעובדים בצוות או מייצרים סדרת תוצרים.

איך זה נראה בפועל

נניח שעבדתם עם הבוט על כתיבת מדריך טכני. אחרי כמה סבבים יצא טקסט מעולה. אתם שולחים את המשפט הקסום - והבוט מחזיר משהו בסגנון:

גרסה בעברית:

“כתוב מדריך טכני ברור ומובנה בנושא X, ברמה שמתאימה למגזין מקצועי. השתמש בטון ידידותי, הסברים בשכבות, דוגמאות מעשיות ושלבים תמציתיים. הוסף גם הערות נגישות, והימנע מסגנון מתלהב או קלישאתי.”

גרסה באנגלית:

Write a clear, structured, magazine-quality technical guide about X, using a friendly tone, layered explanations, practical examples, and concise steps. Include accessibility notes and avoid hype or clichés

פתאום יש לכם פרומפט “מושלם” - כזה שאפשר להשתמש בו שוב ושוב, בכל הקשר דומה, בלי להתחיל מאפס.

ואם אתם רוצים לקחת את זה צעד קדימה, אפשר לבקש מהמודל להפוך את הפרומפט למודולרי ועריך, עם חלקים שניתן לשנות בקלות. זה הופך אותו לכלי עבודה גמיש במיוחד.

טכניקה פשוטה שמייצרת תוצאות גדולות

היופי בשיטה הזו הוא הפשטות שלה. היא עובדת בכל צ'אטבוט, חוסכת זמן, מייצרת פרומפטים איכותיים לשימוש חוזר, ומשפרת משמעותית את הדיוק והעקביות של התוצרים שלכם. במקום להסתמך על ניסוי וטעייה בכל פעם מחדש, אתם נותנים למודל ללמוד מהשיחה עצמה, ומקבלים פרומפט שמזקק את כל מה שעבד.

שווה לנסות - זה יכול לחסוך לכם הרבה זמן ולשפר את הפרודוקטיביות.

חג שמח!

הפוסט טיפ קטן לחג שיכול לשנות את הדרך שבה אתם עובדים עם צ'אטבוטים הופיע ראשון בLet's AI בינה מלאכותית

חיפוש Live של גוגל הגיע לישראל ו-Gemini מייבא זיכרונות

רון גולד — Sat, 28 Mar 2026 06:49:13 +0000

גוגל שחררה ביום חמישי האחרון שני עדכונים שמאפשרים להוריד את המחסום בין המשתמש לבין הכלים שלה. העדכון הראשון הוא חיפוש גוגל במצב Live, שמאפשר לחפש תוך כדי שיחה אינטראקטיבית עם המצלמה פתוחה, וזה זמין עכשיו גם בישראל. העדכון השני הוא פיצ׳ר חדש בג׳מיני שמאפשר לייבא את הזיכרונות והשיחות שצברתם ב-AI אחר, כדי שלא תצטרכו להתחיל מאפס. שני העדכונים נפרדים, אבל הכיוון אחד - גוגל רוצה שתשתמשו בכלים שלה, ומוכנה להקל עליכם כדי שזה יקרה.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

חיפוש Google במצב Live הגיע לישראל

חיפוש Live הוא בעצם שיחה אינטראקטיבית עם גוגל, ובמקום להקליד שאילתה ולגלול בתוצאות, אתם פשוט מדברים. שואלים שאלה בקול, מקבלים תשובה, ויכולים להמשיך לשאול שאלות המשך בלי לחזור למסך החיפוש. החלק המעניין הוא שאפשר גם לפתוח את המצלמה ולכוון אותה על משהו פיזי - מוצר, שלט, מנה במסעדה, צמח בגינה - ולשאול עליו שאלות בזמן אמת.

הפיצ'ר הזה עבד עד עכשיו רק בארצות הברית ובהודו. אתמול גוגל הרחיבה אותו למעל 200 מדינות, כולל ישראל. הוא מבוסס על Gemini 3.1 Flash Live, המודל החדש של גוגל לשיחות קוליות, ותומך ביותר מ-90 שפות, כך שאפשר לדבר איתו גם בעברית.

איך מפעילים

ההפעלה פשוטה. פותחים את אפליקציית גוגל בנייד (Android או iPhone), ומחפשים את סמל ה-Live מתחת לשורת החיפוש. מקישים עליו ומתחילים לדבר. אם רוצים להוסיף את המצלמה, לוחצים על כפתור הווידאו שמופיע בזמן השיחה ומכוונים את הטלפון. דרך נוספת - פותחים את Google Lens ובוחרים בלשונית Live שנמצאת ליד לשונית התרגום. שימו לב שצריך לאפשר גישה למיקרופון, ואם רוצים להשתמש במצלמה - גם אליה.

איך להפעיל חיפוש Google במצב Live

Gemini מאפשרת לייבא זיכרונות מ-AI אחר

העדכון השני הוא סוג אחר לגמרי של שדרוג. אם אתם משתמשים ב-צ׳אט ג׳יפיטי או ב-קלוד ושוקלים לנסות את ג׳מיני, אחד הדברים שמרתיעים הוא ההרגשה שצריך להתחיל מאפס - הכלי הישן כבר מכיר אתכם, יודע מה אתם אוהבים, זוכר שיחות קודמות, ובכלי חדש אתם זר מוחלט.

גוגל מנסה לפתור את זה בדיוק עם שני כלי ייבוא חדשים: ייבוא זיכרונות וייבוא היסטוריית שיחות. שניהם עובדים דרך עמוד ייעודי.

איך מייבאים זיכרונות

ייבוא זיכרונות עובד בדרך מאוד דומה לפיצ׳ר שאנטרופיק (Anthropic) הוציאה לא מזמן להעברת הזכרונות שלכם מ-AI אחר. במקום לחבר את ג׳מיני ישירות לצ׳אט ג׳יפיטי, גוגל נותנת לכם פרומפט מוכן מראש שמבקש מה-AI הישן שלכם לסכם את כל מה שהוא יודע עליכם.

איך זה עובד? נכנסים לייבוא בג׳מיני, מעתיקים את הפרומפט שמופיע שם, מדביקים אותו בצ׳אט ג׳יפיטי או בקלוד, ומקבלים סיכום מובנה של חמש קטגוריות - מידע דמוגרפי, תחומי עניין והעדפות, מערכות יחסים, אירועים ופרויקטים, והנחיות שנתתם לכלי. מעתיקים את הסיכום ומדביקים אותו חזרה בג׳מיני. תוך דקות ספורות, ג׳מיני מקבלת תמונה רחבה של ההעדפות שלכם ויכולה להתאים את עצמה בהתאם.

איך מייבאים זיכרונות והיסטוריית שיחות

איך מייבאים היסטוריית שיחות

אם רוצים לייבא גם את השיחות עצמן ולא רק את הזיכרונות, התהליך קצת שונה. קודם צריך לייצא את היסטוריית השיחות מהכלי הישן:

1. בצ׳אט ג׳יפיטי: נכנסים להגדרות דרך שם המשתמש בפינה השמאלית התחתונה, בוחרים Data Controls ואז Export Data. צ׳אט ג׳יפיטי שולח קובץ ZIP למייל.

2. בקלוד: גם כאן דרך שם המשתמש, הגדרות, Privacy, ואז Export Data. בוחרים טווח תאריכים ומקבלים קישור להורדה במייל.

אחרי שהקובץ אצלכם, חוזרים לייבוא ומעלים את קובץ ה-ZIP. יש מגבלה של 5 GB לקובץ ועד 5 קבצים ביום, אבל לרוב המשתמשים זה יותר ממספיק. השיחות המיובאות מופיעות בסרגל הצד של ג׳מיני עם סימון מיוחד, ואפשר לחפש בהן ולמחוק אותן בכל שלב.

מה גוגל עושה עם המידע שלכם

שווה לדעת! המידע שמיובא לג׳מיני נשמר ב-Google Activity שלכם, עם מחיקה אוטומטית כל 18 חודשים כברירת מחדל (אפשר לשנות ל-3 או 36 חודשים). גוגל מציינת שחלק מהשיחות עשוי להיבדק על ידי סוקרים אנושיים לצורך שיפור השירות, ושיחות שנבדקו נשמרות עד שלוש שנים גם אם מוחקים את ההיסטוריה. זה לא ייחודי לג׳מיני - רוב שירותי ה-AI פועלים באופן דומה - אבל שווה להיות מודעים לזה לפני שמייבאים שנתיים של שיחות.

שני צעדים קדימה

שני העדכונים האלה נראים כמו פיצ'רים קטנים, אבל הכיוון שמאחוריהם ברור. חיפוש Live הופך את גוגל מתיבת טקסט לשותף שיחה שרואה מה שאתם רואים, וכלי הייבוא מוריד את המחסום הכי גדול של מעבר בין כלי AI - ההרגשה שאתם מתחילים מאפס. גוגל לא רק בונה כלים חדשים, היא עושה הכל כדי שתיכנסו וגם תישארו.

הפוסט חיפוש Live של גוגל הגיע לישראל ו-Gemini מייבא זיכרונות הופיע ראשון בLet's AI בינה מלאכותית

האם OpenAI מתכננת סופר-אפליקציה לדסקטופ והתרחבות ארגונית

מערכת האתר — Mon, 23 Mar 2026 06:38:07 +0000

בעוד שחלקים רחבים בתעשיית הטכנולוגיה ממשיכים להאט, לקצץ ולהתכווץ, OpenAI בוחרת לנוע בכיוון הפוך. שני דיווחים מרכזיים, של הוול סטריט ג’ורנל ושל הפייננשל טיימס, מצביעים על מהלך כפול שמסמן שלב חדש בהתפתחות החברה: פיתוח אפליקציית-על לדסקטופ שתאחד כמה מהמוצרים המרכזיים שלה, לצד תוכנית שאפתנית להגדיל את מצבת העובדים לכ-8,000 עד סוף 2026. יחד, שני המהלכים מצביעים על שינוי עומק ומעבר מחברה שממוקדת בפיתוח מודלים לחברה שבונה סביבם מוצרי עבודה ותשתיות Enterprise.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

אפליקציית דסקטופ אחת משולבת

לפי דיווח של הוול סטריט ג׳ורנל, OpenAI מפתחת אפליקציית דסקטופ חדשה שתשלב את ChatGPT, את Codex ואת הדפדפן של החברה בתוך ממשק אחד. המטרה היא לפשט את חוויית המשתמש ולצמצם את הפיצול שנוצר בין מוצרים שצמחו במהירות בשנים האחרונות.

רויטרס דיווחה כי OpenAI אישרה את הכיוון הכללי של המהלך, ו‑CNBC הוסיפה כי בתוך החברה הוא נתפס כחלק ממאמץ רחב יותר למקד משאבים, לשפר ביצוע ולהתכוונן חזק יותר לשימושי פרודוקטיביות, הנדסה ו‑Enterprise.

לפי הדיווחים, את הפרויקט תוביל פידג׳י סימו (Fidji Simo), האחראית על תחום האפליקציות, בעוד נשיא החברה גרג ברוקמן (Greg Brockman) יפקח על השינוי המוצרי והארגוני הנלווה. זה לא נראה כמו עדכון נקודתי, אלא יותר כמו ניסיון לארגן מחדש את שכבת המוצר של OpenAI סביב לקוח דסקטופ מרכזי אחד, מהלך שמסמן התכנסות אסטרטגית.

התרחבות כוח האדם

המהלך המוצרי של OpenAI מגיע יחד עם שינוי ארגוני רחב יותר. הפייננשל טיימס דיווח כי החברה מתכננת כמעט להכפיל את מצבת העובדים שלה, מכ-4,500 כיום לכ-8,000(!) עד סוף 2026. רויטרס דיווחה על דברי הפייננשל טיימס וציינה שלא הצליחה לאמת את הנתון באופן עצמאי, וש‑OpenAI לא הגיבה מיד לבקשת תגובה.

לפי הדיווח המקורי, עיקר הגיוסים יתמקדו בפיתוח מוצר, הנדסה, מחקר ומכירות, לצד מומחים ל‑technical ambassadorship, תפקיד שמטרתו לסייע לארגונים להפיק יותר מהכלים של החברה. התרחבות כזו מצביעה על ניסיון לבנות תשתית רחבה שתתמוך בשלב הבא של פעילות OpenAI, במיוחד כשהיא מתקרבת לשוק הארגוני בקנה מידה גדול יותר.

העמקת הנוכחות הממשלתית על רקע העימות בין Anthropic לפנטגון

המהלך הממשלתי של OpenAI מתרחש על רקע עימות חריף בין Anthropic לפנטגון סביב מגבלות בטיחות ושימושי AI. לפי דיווח של רויטרס, הפנטגון הגדיר את Anthropic כ"סיכון בשרשרת האספקה", ולמרות שהשאיר פתח להחרגות שיאפשרו שימוש מסוים במודלים, האמון בין הצדדים כבר נפגע משמעותית.

זמן קצר לאחר מכן, OpenAI וסם אלטמן הודיעו על הסכם חדש עם הפנטגון לפריסת המודלים של החברה על גבי מערכות ענן מאובטחות או מסווגות. רויטרס ציינה כי ההסכם כולל מגבלות ברורות, ובהן איסור על מעקב המוני בתוך ארצות הברית, איסור על הכוונת נשק אוטונומי ואיסור על הכרעות אוטומטיות קריטיות. המהלך ממקם את OpenAI בעמדה אסטרטגית חדשה, ספקית תשתית AI שממלאת את הוואקום שנוצר בעקבות ההתרחקות של Anthropic מהמערכת הביטחונית.

האם OpenAI מתארגנת מחדש

התמונה הכוללת מציגה את OpenAI בעיצומו של תהליך התבגרות. החברה מצמצמת את הפיצול בין המוצרים ומגבירה מיקוד, מתרחקת מתפיסה של סטארט אפ מחקרי ומתקרבת למודל של חברת מוצרי עבודה, ומחליפה צמיחה אורגנית בבנייה מתוכננת של תשתית ארגונית וממשלתית.

למרות שחלק מהפרטים עדיין אינם מאומתים או דורשים הסתייגות, הכיוון הכללי ברור. OpenAI שואפת להפוך לא רק למובילת מודלים אלא לפלטפורמת העבודה המרכזית של עידן הבינה המלאכותית, בשוק העסקי, במגזר הציבורי ועל שולחן העבודה של המשתמש. המהלך הזה מציב את החברה מול מתחרות גדולות וחזקות, וזה לא יהיה קרב פשוט.

הפוסט האם OpenAI מתכננת סופר-אפליקציה לדסקטופ והתרחבות ארגונית הופיע ראשון בLet's AI בינה מלאכותית

האם GPT‑5.4 mini ו-nano מסמנים את הדור הבא של מערכות AI מהירות ויעילות

רון גולד — Thu, 19 Mar 2026 06:41:02 +0000

בעולם הבינה המלאכותית התרגלנו לחשוב שהמודל הגדול ביותר הוא גם החכם ביותר, אבל בשנים האחרונות מתברר שהמציאות מורכבת יותר. מפתחים לא תמיד זקוקים למודל העמוק או היקר ביותר, אלא לכלי שמגיב במהירות, עולה מעט ומסוגל לבצע משימות רבות במקביל. כאן נכנסים לתמונה GPT‑5.4 mini ו‑GPT‑5.4 nano, שני מודלים חדשים של OpenAI שמכוונים בדיוק לצורך הזה. הם לא מחליפים את GPT‑5.4 הגדול, אלא משלימים אותו. הם מציעים חלק נרחב מהיכולות שלו, אבל במהירות גבוהה יותר ובעלות נמוכה משמעותית, ומאפשרים לבנות מערכות יעילות וגמישות יותר.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

למה בכלל צריך מודלים קטנים

הצורך במודלים קטנים ומהירים נובע משתי בעיות מרכזיות שמפתחים פוגשים שוב ושוב. הראשונה היא עלות. מודלים גדולים דורשים משאבים רבים, ובמערכות שמבצעות אלפי קריאות ביום, העלות הופכת במהירות לגורם מגביל. השנייה היא זמן תגובה.

עוזרי קוד, מערכות שפועלות בזמן אמת וסוכני משנה שמבצעים משימות במקביל אינם יכולים להרשות לעצמם השהיות ארוכות (Latency). כל עיכוב משפיע על חוויית המשתמש ועל היכולת של המערכת לפעול בצורה חלקה. במצבים כאלה, מודל קטן שמגיב מהר ומספק דיוק גבוה מספיק אינו רק פתרון טכני, אלא תנאי בסיסי לתפקוד יעיל.

מה מציעים GPT‑5.4 mini ו‑nano

GPT‑5.4 mini

GPT‑5.4 mini הוא הדגם הבולט מבין השניים. הוא מהיר יותר מפי שניים מהגרסה הקודמת שלו, GPT‑5 mini, ומציג שיפור משמעותי ביכולות כתיבת קוד, הבנה מולטימודלית ושימוש בכלים. הנתונים מהטבלה מצורפת מחזקים את זה. במבחן SWE‑Bench Pro, אחד המבחנים המרכזיים בתחום תיקון קוד, הוא מגיע לדיוק של 54.4 אחוז, רק מעט מתחת ל‑57.7 אחוז של GPT‑5.4 הגדול.

גם במבחנים נוספים כמו GPQA Diamond (הערכת ידע מדעי מתקדם) ו‑OSWorld‑Verified (ביצוע פעולות מחשב על ממשקי משתמש אמיתיים) הוא מציג תוצאות גבוהות, שממחישות את יכולתו להתמודד עם משימות מקצועיות מורכבות למרות גודלו הקטן.

GPT‑5.4 nano

לצדו, GPT‑5.4 nano הוא הדגם הקטן והזול ביותר במשפחה. הוא מיועד למשימות שבהן מהירות ועלות הן השיקול המרכזי, כמו סיווג, חילוץ נתונים, דירוג או תפקידים של סוכני משנה שמבצעים פעולות פשוטות כחלק ממערכת גדולה יותר. למרות גודלו, הוא מציג שיפור משמעותי לעומת הדור הקודם. במבחן SWE‑Bench Pro הוא מגיע לדיוק של 52.4 אחוז, נתון שממקם אותו מעל GPT‑5 mini הישן ומדגיש את ההתקדמות שחלה ביכולות של מודלים קטנים ומהירים.

ביצועי המודלים במבחני קוד וכלים מקצועיים | OpenAI

איך זה עובד בפועל

המודלים החדשים משתלבים היטב בארכיטקטורות מודרניות שמבוססות על חלוקת עבודה בין מודלים שונים. במקום מודל יחיד שמבצע את כל המשימות, מערכת חכמה יכולה להשתמש במודל גדול לתכנון ולקבלת החלטות, ובמודלים קטנים ומהירים לביצוע פעולות ממוקדות.

כך, לדוגמה, במערכת כמו Codex, GPT‑5.4 משמש כמתכנן העל, בעוד ש- GPT‑5.4 mini פועל כסוכן משנה שמבצע חיפוש בקוד, סקירת קבצים גדולים או עיבוד מסמכים תומכים. ככל שהמודלים הקטנים הופכים מהירים ומדויקים יותר, כך המבנה הזה נעשה יעיל יותר ומאפשר סקיילינג אמיתי.

שני המודלים תומכים בקלטי טקסט ותמונה, יודעים לפרש צילומי מסך מורכבים ומסוגלים לבצע פעולות מחשב במהירות. GPT‑5.4 mini כולל חלון הקשר של 400,000 טוקנים, מה שמאפשר לו להתמודד עם קוד נרחב או מסמכים גדולים בלי לאבד את ההקשר.

דיוק, מהירות ועלות

הגרפים שהציגה OpenAI ממחישים היטב את היתרון של המודלים הקטנים. בגרף Accuracy vs Latency אפשר לראות ש‑GPT‑5.4 mini מציע שילוב יעיל במיוחד של דיוק גבוה וזמן תגובה נמוך. הוא נמצא קרוב מאוד ל‑GPT‑5.4 מבחינת דיוק, אבל רחוק ממנו מבחינת זמן תגובה, מה שהופך אותו מתאים במיוחד למערכות שפועלות בזמן אמת.

OpenAI | דיוק מול זמן תגובה ועלות במודלי GPT‑5.4

גם בגרף Accuracy vs Cost מתקבלת תמונה דומה. GPT‑5.4 nano מציג דיוק טוב ביחס לעלות הנמוכה ביותר, בעוד ש- GPT‑5.4 mini מציע אחד היחסים החזקים ביותר בין ביצועים לעלות. הנתונים האלה מחזקים את ההבנה שהמודלים הקטנים הם לא פשרה, אלא בחירה אסטרטגית שמאפשרת לבנות מערכות יעילות וחסכוניות יותר.

יישומים בעולם האמיתי

היכולות האלה הופכות את GPT‑5.4 mini ו‑nano לכלים מרכזיים במגוון רחב של תרחישים. בעוזרי קוד הם מאפשרים ביצוע מהיר של תיקונים ממוקדים, ניווט בקוד, יצירת ממשקי front‑end ולולאות debugging. במערכות מבוססות סוכנים הם תומכים בחלוקת עבודה יעילה בין מודלים שונים, כך שהמודל הגדול מטפל בתכנון והמודלים הקטנים מבצעים משימות במקביל. הגישה הזו משפרת את מהירות העבודה ומאפשרת למערכות להתמודד עם עומסים גבוהים בצורה יציבה.

שימוש במחשב

גם בתחום השימוש במחשב GPT‑5.4 mini מצטיין. הוא מפרש צילומי מסך במהירות ומבצע פעולות מורכבות על ממשקי משתמש צפופים. במבחן OSWorld‑Verified הוא מגיע לדיוק של 72.1 אחוז, נתון שמתקרב מאוד ל‑75 אחוז של GPT‑5.4 הגדול. התוצאה הזו ממחישה את היכולת שלו להתמודד עם משימות תפעול מחשב מורכבות, למרות היותו מודל קטן ומהיר.

זמינות ועלויות

OpenAI מציעה את GPT‑5.4 mini ב‑API, ב‑Codex וב‑ChatGPT. הוא תומך בשימוש בכלים, קריאה לפונקציות, חיפוש ברשת, חיפוש בקבצים, שימוש במחשב ויכולות מולטימודליות. עלותו עומדת על 0.75 דולר למיליון טוקנים בקלט ו‑4.50 דולר למיליון טוקנים בפלט.

ב‑Codex השימוש בו צורך רק כשלושים אחוז מקצבת GPT‑5.4, מה שמאפשר למפתחים לבצע משימות פשוטות בעלות נמוכה בהרבה.

GPT‑5.4 nano זמין ב‑API בלבד, במחיר של 0.20 דולר למיליון טוקנים בקלט ו‑1.25 דולר למיליון טוקנים בפלט.

הקרב האמיתי עובר למודלים הקטנים

השקת GPT‑5.4 mini ו‑nano מסמנת שינוי כיוון מעניין בתעשייה. במקום להתמקד רק במודלים הגדולים ביותר, OpenAI מדגישה את הערך של מודלים קטנים, מהירים וזולים שמבצעים את רוב העבודה המעשית. הנתונים מהגרפים ומהטבלה ממחישים זאת היטב. המודלים הקטנים מתקרבים לביצועי הדגם הגדול, אבל מציעים זמן תגובה קצר יותר ועלות נמוכה בהרבה.

בעולם שבו מערכות AI הופכות מורכבות יותר ומבוססות על עשרות סוכנים שפועלים במקביל, היכולת להריץ מודלים יעילים בקנה מידה גדול הופכת חיונית. העתיד אינו שייך רק למודלים הגדולים, אלא גם למודלים הקטנים שמאפשרים למערכות לעבוד מהר, בזול ובאמינות. אלו הם המנועים השקטים שמאחורי הדור הבא של מערכות AI.

לפרטים נוספים על ההשקה, מוזמנות/ים להיכנס לאינדקס של OpenAI.

הפוסט האם GPT‑5.4 mini ו-nano מסמנים את הדור הבא של מערכות AI מהירות ויעילות הופיע ראשון בLet's AI בינה מלאכותית

ג'מיני נכנס לעבודה ומשנה את Google Workspace

רון גולד — Wed, 18 Mar 2026 06:36:10 +0000

עד לא מזמן, מי שרצה להיעזר בבינה מלאכותית בעבודה היומיומית נאלץ לנווט בין חלונות שונים: לשאול שאלה בצ׳אט, להעתיק את התשובה, להדביק אותה למסמך, לחפש קובץ נוסף ולחזור שוב אל המודל. גוגל מבקשת לשבור את המעגל הזה. עם שילוב ג'מיני (Gemini) ישירות בתוך Google Workspace, הבינה המלאכותית כבר לא פועלת כעוזר חיצוני אלא נטמעת בלב הכלים שבהם אנחנו משתמשים מדי יום. היא קוראת את הקבצים, מבינה את ההקשר ומסוגלת לייצר תוצרים חדשים מתוך החומר הקיים, וכל זה בלי לעזוב את המסמך, הגיליון או המצגת.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

ממרחב עבודה לכלי חשיבה

העדכונים החדשים הופכים את Workspace מסביבה סטטית למרחב עבודה חי, שבו ג'מיני פועל כמתווך בין המשתמש לבין הידע האישי שלו. במקום כלי שמגיב רק לפקודות, הוא הופך לשכבת חשיבה שמבינה הקשר, מחברת בין מקורות מידע שונים ומסייעת לייצר תוצרים מדויקים ורלוונטיים יותר.

התכונות החדשות ב‑Docs

ב‑Docs מופיע כעת סרגל פקודות חדש בתחתית המסמך. דרכו אפשר לבקש טיוטה, תבנית או שכתוב, תוך בחירה מדויקת של מקורות המידע כמו Drive, Gmail, Chat או חיפוש ברשת. היכולת הזו מאפשרת לג'מיני לא רק לכתוב טקסטים חדשים, אלא גם להבין את ההיסטוריה התיעודית של המשתמש ולבנות ממנה תוכן המשכי. לצד זה נוספו כלים שמאחדים סגנון כתיבה בין מחברים שונים ומאפשרים להתאים מסמך חדש לפורמט של מסמך קיים, כך שהכול ייראה כאילו נכתב ביד אחת.

סרגל הפקודות החדש ב‑Google Docs

השינויים ב‑Sheets

גם ב‑Sheets מתרחש שינוי משמעותי. במקום לבנות טבלאות ידנית, המשתמש יכול לבקש מהמודל ליצור גיליון שלם מתוך תיאור קצר. ג'מיני אוסף נתונים מתוך Drive, Gmail ו‑Chat ומייצר גיליון מעוצב ומוכן לעבודה. עבור משימות מורכבות יותר, כלי בשם Fill with Gemini מסוגל למלא עמודות שלמות, לסכם נתונים, לקטלג מידע או למשוך פרטים עדכניים מהרשת. כך ניתן ליצור למשל טבלת מעקב על מועדי קבלה לאוניברסיטאות ולתת למודל להשלים את כל הנתונים הרלוונטיים במקום לחפש אותם ידנית.

שינויים ב‑Slides

גם Slides מקבל שכבת יכולות חדשה. ג'מיני יודע ליצור שקופית חדשה שמתאימה לעיצוב הקיים, לעדכן שקופיות קיימות על בסיס מידע שנמצא בקבצים ובמיילים ולשמור על שפה עיצובית אחידה. גוגל מציינת שבעתיד ניתן יהיה לבנות מצגת שלמה מפרומפט אחד, כשהמודל ימשוך את כל המידע הדרוש מהקבצים האישיים ומהרשת.

שקופית ש‑Gemini יצר באופן אוטומטי על בסיס מאמרים ב-Drive

Drive משתנה ממחסן קבצים למנוע ידע

אחד השינויים הבולטים ביותר מתרחש דווקא ב‑Drive. במקום חיפוש מסמכים לפי שמות קבצים, Drive מציג כעת AI Overview, תקציר חכם שמופיע בראש תוצאות החיפוש ומסכם את המידע הרלוונטי מתוך המסמכים עצמם. התקציר כולל ציון מקורות, כך שהמשתמש יודע מאיפה נשלף כל פרט.

יכולת ה‑AI Overview החדשה ב‑Google Drive

לצד זה נוסף כלי בשם Ask Gemini, שמאפשר לשאול שאלות מורכבות על קבוצות קבצים, מיילים ואפילו אירועים מהיומן, ולקבל תשובה שמבוססת על המידע האישי של המשתמש. כך ניתן למשל לבחור את כל המסמכים הקשורים למיסים ולשאול מה כדאי לשאול את רואה החשבון השנה, וג'מיני ינתח את החומר ויציע כיווני פעולה.

Ask Gemini בתוך Google Drive

שליטה, הקשר ודיוק

הכוח של המערכת החדשה נובע מהיכולת של המשתמש לשלוט במקורות המידע שבהם ג'מיני משתמש. בכל פעולה ניתן לבחור אם לאפשר גישה ל‑Drive, ל‑Gmail, ל‑Chat או לחיפוש ברשת. גוגל מדגישה שהשליטה הזו נועדה להבטיח שהתוצרים יהיו מדויקים ורלוונטיים, אך גם לשמור על פרטיות. מבחינת ביצועים, גוגל מדווחת על שיפור משמעותי ב‑Sheets, עד לרמה שמתקרבת למומחים אנושיים במבחנים פומביים.

מסך בחירת מקורות המידע של Gemini

זמינות ומגבלות

הפיצרים החדשים זמינים כרגע בגרסת בטא למנויי Google AI Ultra ו‑Pro. התמיכה ב‑Docs, Sheets ו‑Slides זמינה באנגלית ברחבי העולם, בעוד ש‑Drive מוגבל בשלב זה לארצות הברית. לא ברור מתי יתרחב המענה לשפות נוספות או לשווקים נוספים, ולכן קשה לדעת מתי היכולות יגיעו לקהל רחב יותר.

לצד מגבלות הזמינות, נותרות פתוחות גם שאלות של אמינות, הזיות מודל והצורך בביקורת אנושית. גוגל עצמה ממליצה להתחיל ממשימות בעלות סיכון נמוך כדי להכיר את המערכת ולבחון את התנהגותה לפני שמסתמכים עליה בעבודה קריטית. ההמלצה הזו מדגישה שהטכנולוגיה מתקדמת, אך עדיין דורשת זהירות ושיפוט מקצועי.

Introducing the new Gemini powered Docs, Sheets, Slides, and Drive experience featuring AI Overviews, fulled editable AI made slides, and new grounding sources to make writing docs context aware

Available today to G1 Pro and Ultra users : ) pic.twitter.com/tpYmnN2wV2

— Logan Kilpatrick (@OfficialLoganK) March 10, 2026

צעד גדול קדימה

הטמעת ג׳מיני בתוך Workspace מסמנת שינוי תפיסתי. הבינה המלאכותית כבר לא נתפסת ככלי צדדי, אלא כשכבת עבודה שמחברת בין המשתמש לבין הידע האישי שלו. היא מייעלת תהליכים, מפחיתה עומס ומאפשרת להתחיל ליצור במקום לבהות בדף ריק.

לצד ההבטחה הזו קיימת גם אחריות של המשתמשים להבין את מגבלות המודל, לשמור על פרטיות המידע, לבדוק עובדות ולוודא שהאוטומציה לא מחליפה שיקול דעת אנושי. זהו צעד משמעותי קדימה, אך הדרך לשילוב מלא, בטוח ושקוף של AI בעבודה היומיומית עדיין נמשכת.

הפוסט ג'מיני נכנס לעבודה ומשנה את Google Workspace הופיע ראשון בLet's AI בינה מלאכותית

חנות סוכנים, אפליקציות ישראליות ומודל תמחור חדש: הצד העסקי של Copilot Wave 3

מערכת האתר — Sat, 14 Mar 2026 08:12:46 +0000

מיקרוסופט פותחת את Copilot לאפליקציות צד שלישי, כולל Wix ו-Base44 הישראליות. במקביל, חבילת רישוי חדשה בשם E7 Frontier Suite תאחד הכל תחת קורת גג אחת. אחרי שסקרנו את היכולות החדשות באפליקציות הליבה ואת Copilot Cowork בשני החלקים הקודמים בסדרה, החלק השלישי והאחרון מתמקד בצד העסקי: השותפויות, חנות הסוכנים, כלי הניהול לארגונים, והתמחור.

כדי לראות איך סביבת העבודה החדשה הזו נראית בפועל, מומלץ להציץ באירוע ההכרזה הרשמי (Frontier Transformation). החל מדקה 12:50 מדגימה מיקרוסופט כיצד אפליקציות צד-שלישי משתלבות בחנות הסוכנים ופועלות מתוך חלון הצ'אט, והחל מדקה 16:30 מוצג 'מאחורי הקלעים' עבור מנהלי ה-IT כיצד לוח הבקרה של Agent 365 מאפשר לשלוט בכל צבא הסוכנים הזה בבטחה:

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

אפליקציות צד שלישי בתוך Copilot

מיקרוסופט הכריזה על שילוב של 11 אפליקציות שותפים ישירות בתוך Copilot. הרעיון פשוט - במקום לצאת מסביבת העבודה המוכרת כדי להשתמש בכלי חיצוני, המשתמשים יכולים להפעיל אותו ישירות מתוך ממשק הצ'אט. בין השותפים ניתן למצוא את Canva לעיצוב, Figma לממשקים, Monday לניהול פרויקטים, Jira לניהול משימות טכניות, Miro ללוחות שיתופיים, ServiceNow לתהליכי IT ועוד.

לצד כל אלה, שתי חברות ישראליות תופסות מקום מרכזי ברשימה, ומי שעוקב אחרי מהפכת ה-"Vibe Coding" (בניית אפליקציות באמצעות שפה טבעית) יזהה שהנוכחות שלהן אינה מקרית. הראשונה היא Wix, ענקית בניית האתרים, שמשלבת את הפלטפורמה שלה ישירות בתוך Copilot. בהדגמת ההשקה הוצג כיצד משתמש מתאר בשפה רגילה את האתר שהוא רוצה להקים, ו-Copilot מפעיל את כלי ה-AI של Wix כדי לבנות אותו תוך כדי השיחה - מבלי שהמשתמש ייאלץ לפתוח חלון נפרד.

השנייה היא Base44, סטארט-אפ AI ישראלי ש-Wix רכשה בקיץ 2025 תמורת כ-80 מיליון דולר. הפלטפורמה של Base44 מאפשרת כעת לעובדים לבנות אפליקציות פנימיות לארגון ישירות מתוך Copilot. כך למשל, מנהל יכול לבקש מהצ'אט "תבנה לי מערכת לניהול בקשות חופשה לצוות", ולקבל תוך דקות אפליקציה עובדת.

הופעתן המשותפת של שתי הפלטפורמות תחת המטרייה של מיקרוסופט היא לא רק עניין טכנולוגי, אלא חלק ממהלך אסטרטגי רחב של Wix למצב את עצמה כשחקנית מפתח באקו-סיסטם החדש של בניית תוכנה מונחית AI.

חנות הסוכנים

מיקרוסופט השיקה את חנות הסוכנים (Agent Store) כבר במאי 2025, אבל כעת, במסגרת עדכון Wave 3, היא הופכת אותה למרכז העצבים של הארגון.

החנות פועלת בפורמט דומה ל-App Store, רק שבמקום אפליקציות רגילות היא מציעה סוכני AI מוכנים לשימוש שמבצעים משימות ספציפיות. החידוש המרכזי בהשקה המחודשת הוא השילוב העמוק של אפליקציות צד-שלישי מובילות, שיכולות כעת לפעול כסוכנים ישירות בתוך ממשק העבודה של Copilot ('In-the-flow of work') - ללא צורך לצאת מחלון הצ'אט.

החנות תכלול תחילה סוכנים מהשותפים שכבר הוכרזו, ותאפשר לארגונים וליצרני תוכנה להמשיך להוסיף סוכנים חדשים בהמשך.

רבים מהסוכנים שיהיו זמינים בחנות (Agent Store) אינם מיועדים רק לייעול פנים-ארגוני, אלא גם לתקשורת החוצה. רוצים לראות איך סוכני ה-AI האלו נראים כשהם פוגשים את הלקוחות שלכם במציאות? מיקרוסופט יצרה הדגמה אינטראקטיבית שבה ניתן לראות כיצד סוכן 'Direct to Customer' מנהל שיחת מכירה או שירות מקצה לקצה.

פלטפורמת הניהול

עם עשרות סוכני AI שפועלים בתוך ארגון, מישהו צריך לנהל אותם. זה התפקיד של Agent 365 - פלטפורמת בקרה שמאפשרת לארגונים לקבוע איזה סוכנים פועלים, מי מורשה להשתמש בהם, ומה הם הרשאות הגישה שלהם. Agent 365 כולל לוח בקרה מרכזי, הגדרת הרשאות לכל סוכן, ומעקב אחרי פעילות הסוכנים ברחבי הארגון.

כמה זה עולה?

עדכון Wave 3 מביא איתו שכבת תמחור חדשה ומעודכנת.

כך נראית מפת הרישיונות החדשה של מיקרוסופט:

השקת חבילת ה-E7 היא מהלך כלכלי מעניין מצד מיקרוסופט. הפיצ'רים המתקדמים באמת, כמו העבודה העצמאית של Copilot Cowork, בחירת המודלים וניהול הסוכנים, דורשים מהארגון שדרוג ל-E7. עם זאת, החבילה מציעה לארגונים מעין 'הנחת באנדל': רכישת כל הרכיבים הללו בנפרד (כולל רישיון ה-E5 הבסיסי שעולה כ-60 דולר) הייתה מגיעה ל-105 דולר, כך שמיקרוסופט למעשה מתמרצת את השוק לעבור לחבילת הכל-כלול.

סיכום הסדרה

שלושה מאמרים, הכרזה אחת. Wave 3 משנה את Copilot בשלוש רמות: ביצוע ישיר בתוך האפליקציות, סוכן עצמאי שעובד ברקע, ופתיחה לעולם של אפליקציות ושותפויות חיצוניות. מיקרוסופט מציעה את הכל תחת חבילת E7 ב-99 דולר למשתמש, שמאחדת אבטחה, AI ופלטפורמת ניהול.

פספסתם את תחילת הסדרה? כדי להבין איך Copilot משנה את העבודה היומיומית בתוך קבצי אקסל ווורד, קראו את החלק הראשון. כדי להעמיק בהיכרות עם הסוכן העצמאי החדש Copilot Cowork ובשותפות עם Anthropic, קראו את החלק השני.

הפוסט חנות סוכנים, אפליקציות ישראליות ומודל תמחור חדש: הצד העסקי של Copilot Wave 3 הופיע ראשון בLet's AI בינה מלאכותית

Copilot Cowork: מיקרוסופט משיקה סוכן AI שעובד לבד ברקע

מערכת האתר — Fri, 13 Mar 2026 07:13:07 +0000

מיקרוסופט ו-Anthropic בנו יחד סוכן חכם שמבצע משימות מקצה לקצה בתוך Microsoft 365. במקביל, משתמשים יכולים עכשיו לבחור איזה מודל AI ירוץ מאחורי Copilot. אחרי שפרסמנו אתמול את החלק הראשון בסדרה על עדכון Wave 3 של Copilot, שעסק ביכולות החדשות באקסל, וורד, פאוורפוינט ואאוטלוק, הפעם נתמקד בשני חידושים שמשנים את המבנה של המוצר: Copilot Cowork, סוכן שעובד באופן עצמאי על משימות ארוכות, ובחירת מודלים שמאפשרת למשתמשים להחליף בין מודלי AI שונים.

Announcing Copilot Cowork, a new way to complete tasks and get work done in M365.

When you hand off a task to Cowork, it turns your request into a plan and executes it across your apps and files, grounded in your work data and operating within M365’s security and governance… pic.twitter.com/UT2Z50J7F7

— Satya Nadella (@satyanadella) March 9, 2026

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

מה זה Copilot Cowork

עד עכשיו, כל אינטראקציה עם Copilot עבדה בדפוס של שאלה-תשובה: המשתמש מבקש, Copilot מגיב, המשתמש ממשיך. Copilot Cowork שובר את הדפוס הזה. זה סוכן שמקבל משימה מורכבת ומבצע אותה לבד, מקצה לקצה, בלי שהמשתמש צריך לנהל כל שלב.

התהליך עובד בארבעה שלבים: Copilot Cowork מקבל את המשימה ומפרק אותה לצעדים, הוא בונה תוכנית עבודה ומציג אותה למשתמש לאישור, אחרי האישור, הוא מבצע את הצעדים - עובר בין קבצים, שולף נתונים, כותב מסמכים, שולח מיילים - ובסוף מדווח מה עשה ומה התוצאות.

ככה נראה ניהול משימות רב-שלביות מקצה לקצה על ידי סוכן ה-AI של מיקרוסופט:

מבט מבפנים על Copilot Cowork

לדוגמה, אפשר לבקש מ-Copilot Cowork: "תכין סיכום רבעוני מתוך דוחות המכירות של Q1, תשווה לרבעון הקודם, ותשלח את הסיכום לצוות ההנהלה." במקום שהמשתמש יפתח כל קובץ בנפרד, Copilot Cowork עובר בין הקבצים, מחלץ את הנתונים, כותב את הסיכום ושולח אותו.

שיתוף פעולה בין מיקרוסופט ל-Anthropic

Copilot Cowork פותח בשיתוף פעולה חסר תקדים בין מיקרוסופט ל-Anthropic, חברת ה-AI שמפתחת את משפחת מודלי Claude. בפועל, Copilot Cowork רץ על מודל Claude Opus 4.6 של Anthropic, ולא על המודלים המוכרים של OpenAI.

אמנם זו לא הפעם הראשונה שמיקרוסופט משלבת מודל של חברה מתחרה בתוך סביבת הדגל שלה - כבר בספטמבר האחרון היא איפשרה גישה למודלי Claude Sonnet 4 ו-Claude Opus 4.1 כמנועים לבניית סוכנים מותאמים אישית ב-Copilot Studio, אך כעת מדובר בשילוב עמוק שמגיע לכלל המשתמשים.

מבחינת אבטחה, הסוכן עובד תחת אותן הרשאות ופרטיות המוגדרות בארגון, אך בגלל אופי הפעולה העצמאי שלו, מיקרוסופט מריצה אותו בתוך סביבת ענן מוגנת וסגורה (Cloud Sandbox). המשמעות היא שהוא אינו יכול לגשת לקבצים שהמשתמש עצמו אינו מורשה לראות, והפעולות שלו ניתנות למעקב מלא.

אפשרות לבחירת מודלים

ב-Wave 3, מיקרוסופט הופכת את מערכת Copilot לרב-מודלית (Multi-model) מתוך הבנה שלכל מודל יש את החוזקות שלו. במקום להישען רק על גורם אחד, המערכת מתאימה את הכלי למשימה. מעשית, מיקרוסופט מיישמת גישה של 'ניתוב אוטומטי' (Smart Mode): Copilot יודע לבחור בעצמו מתי לשלוח את הבקשה שלכם ל-GPT ומתי ל-Claude בהתאם למורכבות המשימה.

לצד זאת, המשתמש מקבל שליטה ויכול גם לבחור באופן ידני מתוך תפריט באפליקציות שונות - למשל, להגדיר שמשימת כתיבה ומחקר ארוכה תרוץ באופן בלעדי על Claude.

Great to see the excitement around Copilot Cowork today. I have been using it in my own work for the past few weeks, and the best way to understand it is to see it in action. Sharing a short demo from my day to day here. pic.twitter.com/Rxf6wkaLTk

— Charles Lamanna (@clamanna) March 9, 2026

זמינות

Copilot Cowork נמצא כרגע ב-Research Preview, פתוח למספר מצומצם של ארגונים. השקה רחבה יותר צפויה לסוף מרץ 2026. בחירת מודלים תהיה זמינה כחלק מחבילת E7 Frontier Suite, שמיקרוסופט תשיק ב-1 במאי 2026. E7 מאחדת תחת קורת גג אחת את רישיונות האבטחה (E5), את Copilot, ואת הפלטפורמה החדשה לניהול סוכנים Agent 365.

מה זה אומר בפועל

Copilot Cowork מסמן כיוון חדש למיקרוסופט. לא עוד כלי שעונה על שאלות, אלא סוכן שמקבל משימות ומבצע אותן. והשותפות עם Anthropic מעבירה מסר ברור - מיקרוסופט כבר לא מהמרת על מודל אחד. היא בונה תשתית שמאפשרת לארגונים לעבוד עם המודל המתאים ביותר לכל משימה, בלי לוותר על אבטחה והרשאות.

בחלק השלישי והאחרון בסדרה נצלול אל מאחורי הקלעים של סביבת העבודה החדשה: איך ארגונים הולכים לנהל את צבא הסוכנים הזה באמצעות Agent 365, אילו חברות ישראליות (כמו Wix ו-Base44) כבר השתלבו בתוך המערכת של מיקרוסופט, ומה מחכה לנו בחנות הסוכנים (Agent Store) החדשה.

למי שפספס את החלק הראשון בסדרה על החידושים של מיקרוסופט בקופיילוט, כנסו כאן.

הפוסט Copilot Cowork: מיקרוסופט משיקה סוכן AI שעובד לבד ברקע הופיע ראשון בLet's AI בינה מלאכותית

Copilot של מיקרוסופט עובר לעבוד בתוך הקבצים שלכם

מערכת האתר — Thu, 12 Mar 2026 12:13:31 +0000

עדכון Wave 3 מביא ל-Copilot יכולות ביצוע ישירות באקסל, וורד, פאוורפוינט ואאוטלוק. הבינה המלאכותית כבר לא רק מציעה - היא עושה. בשבוע האחרון מיקרוסופט הכריזה על Wave 3, גל העדכונים הגדול ביותר ל-Copilot מאז ההשקה. ההכרזה כוללת יכולות חדשות באפליקציות הליבה, שותפות עם Anthropic, שילוב ישיר של פלטפורמות כמו חברות Wix ו-Base44, חנות סוכנים ומודל תמחור חדש. בסקירה הראשונה מתוך שלוש בסדרה נתמקד בשינוי שנוגע לעבודה היומיומית: Copilot שעובד ישירות בתוך הקבצים. עד עכשיו, Copilot ב-Microsoft 365 עבד בעיקר מהצד. כתב הצעות בחלון צדדי, והמשתמשים העתיקו והדביקו מה שהתאים להם. ב-Wave 3, זה משתנה. Copilot עובד עכשיו ישירות בתוך הקבצים: בונה נוסחאות באקסל, עורך מסמכים בוורד, מעצב שקפים בפאוורפוינט ומנהל יומן באאוטלוק.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

מה כל אפליקציה קיבלה

שכבת ה-"Work IQ" שמיקרוסופט הציגה בהדגמות של Wave 3, זו השכבה שמאפשרת ל-Copilot להבין את ההקשר של הארגון שלכם (לשאוב מידע מאימיילים, קבצים קודמים ופגישות) וליישם אותו כשהוא עורך מסמכים בוורד או בונה שקפים בהתאם ל-Brand Kit שלכם.

Excel קיבל את השדרוג הטכני. Copilot יודע עכשיו לבנות מודלים פיננסיים שלמים בתוך הגיליון. מיקרוסופט הציגה משתמש שמקליד בקשה בשפה רגילה: "תבנה לי מודל DCF עם שלושה תרחישי צמיחה והנחות שאפשר לשנות." תוך רגעים קצרים, Copilot ייצר גיליון עובד - נוסחאות מקושרות בין תאים, תפריטי בחירה לתרחישים, וטבלת רגישות שמתעדכנת כשמשנים פרמטר. לא הצעת טקסט בחלון צד, אלא גיליון אקסל שאפשר להמשיך לעבוד איתו. היכולת זמינה כבר עכשיו ב-Windows, דפדפן ו-Mac.

Word עבר שינוי דומה. Copilot לוקח טיוטה קיימת והופך אותה למסמך מוכן לסקירה - מיישם את סגנונות העיצוב של הארגון, מסדר כותרות ופסקאות, ועובד בתוך המסמך כשותף לעריכה. לא עוד חלון צד שצריך להעתיק ממנו. זמין כבר עכשיו.

PowerPoint מקבל שני שדרוגים. בדיקת מותג אוטומטית - Copilot סורק מצגת קיימת ומזהה שקפים שחורגים מה-Brand Kit של הארגון, כלומר צבעים, גופנים וסגנונות שלא תואמים את ההנחיות. והמרת טקסט לתרשימים - שקף עמוס בטקסט הופך לתרשים ויזואלי מעוצב לפי צבעי המותג. שני הפיצ'רים מתגלגלים בהדרגה, כרגע בגרסת הדפדפן.

Outlook קיבל את העדכון שעשוי להשפיע על שגרת העבודה היומיומית יותר מכולם. Copilot שם לא רק כותב מיילים - הוא מנהל את היומן. אפשר להגדיר חוקים אוטומטיים: "תאשר תמיד פגישות מהמנהלת שלי אם אני פנוי", "תסרב אוטומטית לפגישות אחרי חמש אחר הצהריים", "תענה RSVP לאירועים חברתיים של הצוות". Copilot מפעיל את הכללים ברקע, בלי שתצטרכו לאשר כל פעולה בנפרד.

בנוסף, אפשר עכשיו לשלוח מיילים ולתזמן פגישות ישירות מתוך חלון הצ'אט של Copilot, בלי לפתוח חלון ניסוח חדש. היכולת מתגלגלת מ-9 במרץ ב-Windows, דפדפן ומובייל.

מה באמת השתנה

מיקרוסופט מתארת את המעבר במונח "agentic experiences", כלומר מעבר ממצב של שאלה-ותשובה למצב של ביצוע משימות. בפועל, במקום שתקבלו הצעת טקסט ותחליטו מה לעשות איתה, Copilot בונה את הנוסחה, מעצב את השקף, מאשר את הפגישה.

הכיסוי העיתונאי של ההשקה, בין היתר ב-Windows Central ו-PCWorld, מתאר את Wave 3 כרגע שבו Copilot מתחיל לפעול באופן עצמאי בתוך סביבת העבודה. זו הבטחה שחברת מיקרוסופט נותנת כבר מההשקה הראשונה של Copilot, אבל Wave 3 הוא הפעם הראשונה שהיכולות האלה מגיעות לאפליקציות שאנשים משתמשים בהן כל יום.

זמינות

ארגונים שמשלמים על רישיון Microsoft 365 Copilot מקבלים את העדכונים כחלק מהמנוי הקיים, בלי תוספת. Excel ו-Word זמינים מיד. PowerPoint ו-Outlook מתגלגלים בשבועות הקרובים.

בין ההדגמה לשולחן העבודה

ההכרזה של Wave 3 מרשימה. Copilot שבונה מודלים פיננסיים ומנהל יומן לבד נשמע כמו שדרוג של ממש. אבל ההיסטוריה של Copilot מלמדת שהפער בין הדגמה מלוטשת לשימוש יומיומי אמיתי יכול להיות גדול. ארגונים שכבר משלמים על הרישיון ומקבלים את היכולות האלה ללא עלות נוספת ירצו לבדוק דבר אחד: כמה מהעדכונים האלה באמת משתלבים בעבודה, ולא רק נראים טוב בסרטון.

בחלק השני בסדרה נעסוק בחידוש שמשנה את המבנה של Copilot מהיסוד: סוכן AI חדש בשם Copilot Cowork, שנבנה בשותפות עם Anthropic ורץ על מודל Claude Opus 4.6, והאפשרות לבחור לראשונה איזה מודל AI ירוץ מאחורי הכלים שלכם.

הפוסט Copilot של מיקרוסופט עובר לעבוד בתוך הקבצים שלכם הופיע ראשון בLet's AI בינה מלאכותית

המאבק על חוזי ה‑AI של הפנטגון מפגיש אתיקה, פוליטיקה, ביטחון לאומי ויריבות עסקית

רון גולד — Sun, 08 Mar 2026 07:31:18 +0000

בסוף פברואר 2026, בתוך פרק זמן קצר, הפכה מערכת יחסים טכנולוגית ועסקית לסיפור מרכזי בזירה הפוליטית האמריקאית. מה שהתחיל כמשא ומתן שגרתי על תנאי שימוש במודל בינה מלאכותית צבאי התפתח במהירות לעימות מורכב בין שתי חברות AI מהמשפיעות בעולם, Anthropic ו‑OpenAI, ולדיון רחב יותר על גבולות הכוח של טכנולוגיות מתקדמות בעידן של מתחים גיאו פוליטיים. במרכז האירועים עומד חוזה בשווי 200 מיליון דולר, אך מאחוריו מסתתרת שאלה עמוקה בהרבה: כיצד מאזנים בין חדשנות טכנולוגית, עקרונות מוסריים, אינטרסים עסקיים ולחצים פוליטיים, במיוחד כאשר כל הצדדים פועלים בתוך מערכות ביטחוניות רגישות.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

קווים אדומים מול דרישות ממשלתיות

הסיפור החל כאשר Anthropic, שסיפקה לפנטגון את מודל Claude לשימושים מסווגים, נכנסה למו״מ על עדכון תנאי ההתקשרות. Claude כבר היה חלק מרכזי במערכות מודיעין וניתוח מבצעי, כולל בהקשרים הקשורים למבצעים מול איראן, עובדה שהפכה את המשא ומתן לרגיש במיוחד.

בשלב הזה התברר שהפערים בין הצדדים עמוקים. Anthropic התעקשה על שני קווים אדומים: איסור שימוש בטכנולוגיה למעקב המוני אחרי אזרחים אמריקאים, ואיסור שילוב המודל בנשק אוטונומי קטלני. מבחינת החברה, אלו אינם סעיפים טכניים אלא עקרונות יסוד.

מנגד, הפנטגון ביקש נוסח רחב בהרבה שלפיו ניתן יהיה להשתמש בטכנולוגיה לכל מטרה חוקית. זה ניסוח מקובל בחוזים ממשלתיים, אבל בהקשר של AI מתקדם הוא מעורר שאלות מורכבות, משום שהגדרת חוקי עשויה להשתנות בין ממשלים והמשמעות המעשית של ההגדרה אינה תמיד ברורה. כאן נוצרה נקודת השבר.

מהלך חריג שמסמן אובדן אמון

לאחר ש‑Anthropic סירבה לוותר על הקווים האדומים שהציבה, המשא ומתן קרס. בתוך שעות ספורות הנשיא דונלד טראמפ הורה לכל הסוכנויות הפדרליות להפסיק להשתמש בטכנולוגיות של החברה, ושר ההגנה פיט הגסת' (Pete Hegseth) הכריז עליה כסיכון בשרשרת האספקה.

זה צעד חריג שמבטא לא רק מחלוקת חוזית אלא גם אובדן אמון עמוק. ההחלטה עוררה הד תקשורתי מיידי, בין היתר משום שהטכנולוגיה של Anthropic כבר הייתה משולבת עמוק במערכות מסווגות והחלפתה אינה תהליך פשוט.

OpenAI נכנסת לתמונה

אל תוך הוואקום שנוצר נכנסה OpenAI. מנכ״ל החברה, סם אלטמן (Sam Altman), חתם על הסכם חלופי עם הפנטגון כמעט מיד לאחר קריסת המו״מ עם Anthropic. מבחינה עסקית זה היה מהלך מהיר ומחושב - OpenAI זכתה בחוזה משמעותי, והפנטגון קיבל המשכיות תפעולית ללא עיכובים.

עם זאת, המהלך עורר שאלות. חלק מהמבקרים תהו האם OpenAI העניקה לממשל גישה רחבה מדי לטכנולוגיה שלה. אלטמן טען שההסכם כולל מנגנוני הגנה טכניים שמונעים שימוש לרעה, ושאין פער מהותי בין עמדת OpenAI לבין הקווים האדומים שהציבה Anthropic.

אלא שהניסוח המשפטי של החוזה, המאפשר שימוש בטכנולוגיה לכל מטרה חוקית, מותיר מקום לפרשנות. מומחים ציינו כי גם אם קיימים מנגנוני הגנה טכניים, הם אינם תחליף למגבלות משפטיות ברורות, במיוחד בסביבה שבה חוקים ונהלים עשויים להשתנות.

התגובה של Anthropic

ב‑Anthropic ראו במהלך לא רק פער מקצועי אלא גם פער עקרוני. מנכ״ל החברה, דריו אמודיי (Dario Amodei), הפיץ לעובדיו מכתב פנימי שבו טען שההסכם של OpenAI מציג תיאטרון בטיחות, כלומר מנגנוני הגנה שנראים טוב כלפי חוץ אך אינם מספקים הגנה אמיתית לאורך זמן.

אמודיי גם ביקר את האופן שבו הוצג ההסכם לציבור, וטען שהמסרים סביבו מבלבלים ואף לא מדויקים. המכתב דלף במהירות לתקשורת והפך את המחלוקת העסקית למאבק פומבי בין שתי החברות.

חשוב להדגיש שחלק מהטענות ההדדיות אינן ניתנות לאימות מלא. מדובר בתחום שבו חלק מהמידע מסווג וחלק אחר מבוסס על הצהרות פומביות, הדלפות ומסרים של יחסי ציבור. מה שכן מאומת הוא עצם קריסת המו״מ, הצעדים הממשלתיים שננקטו בעקבותיו והעובדה ש‑OpenAI אכן קיבלה את החוזה החלופי.

חזרה לשולחן המו"מ

למרות העימות הפומבי, Anthropic מצאה את עצמה במצב מורכב. מצד אחד היא עמדה על עקרונותיה, ומצד אחר איבדה חוזה משמעותי והסתכנה בפגיעה ארוכת טווח במעמדה מול הממשל.

לכן, ב‑5 במרץ, דריו אמודיי חזר לשולחן המו״מ בניסיון למצוא פתרון ביניים. האפשרויות שנבחנות כוללות תקופת מעבר של שישה חודשים או נוסח פשרה שיאפשר המשכיות מבצעית. לפי דיווחים, השיחות מתקיימות מול אמיל מייקל (Emil Michael), תת שר ההגנה למחקר והנדסה, ומטרתן למנוע זעזוע תפעולי במערכות שכבר מסתמכות על Claude.

הציבור מגיב

במקביל, הציבור הגיב במהירות. אפליקציית קלוד זינקה למקום הראשון בחנות האפליקציות של אפל בארצות הברית, עם מאות אלפי הורדות ביום אחד. שיעור המשתמשים הפעילים עלה בעשרות אחוזים, ומספר המנויים בתשלום הוכפל - בין היתר בעקבות ההשקות של Claude CoWork והנגשת יכולות הקוד גם למשתמשים שאינם טכניים.

מנגד, מספר גדול של משתמשי ChatGPT הסירו את האפליקציה מהטלפון או ביטלו חשבון/מנוי (וזה אל מול המספר של שבירת שיא משתמשים פעילים). קשה לדעת אם מדובר בתגובה רגשית קצרה או בתחילתה של מגמה ארוכת טווח, אך ברור שהעימות הפוליטי והעסקי השפיע גם על התפיסה הציבורית.

סיפור שעדיין נכתב

הסיפור הזה רחוק מסיום. זה סיפור מרתק שמשלב טכנולוגיה מתקדמת, שיקולים מוסריים, אינטרסים עסקיים, לחצים פוליטיים ומידע מסווג, תמהיל שמבטיח מציאות מורכבת יותר מכל הצהרה פומבית.

מה שכבר ברור הוא שהאירועים האחרונים מציבים מחדש את השאלה כיצד חברות AI צריכות לפעול כשהן הופכות לספקיות של תשתיות ביטחוניות, ומה קורה כאשר עקרונות טכנולוגיים נבחנים מול מציאות פוליטית.

בינתיים, הפנטגון, Anthropic ו‑OpenAI ממשיכים לנהל את המאבק על עיצוב גבולות השימוש ב‑AI צבאי. ההכרעות שיתקבלו בחודשים הקרובים עשויות להשפיע לא רק על החברות עצמן אלא על כל התעשייה, ואולי גם על האופן שבו מדינות יפעילו בינה מלאכותית בעתיד.

הפוסט המאבק על חוזי ה‑AI של הפנטגון מפגיש אתיקה, פוליטיקה, ביטחון לאומי ויריבות עסקית הופיע ראשון בLet's AI בינה מלאכותית

האם GPT‑5.4 הוא מודל ה-AI הטוב בשוק כיום?

רון גולד — Sat, 07 Mar 2026 07:51:08 +0000

יש רגעים בעולם הבינה המלאכותית שבהם ברור שמשהו משמעותי משתנה. ההשקה של GPT‑5.4 היא אחד מהרגעים האלה. לא בגלל הדגמות נוצצות או סיסמאות שיווקיות, אלא בגלל תחושה שחוזרת אצל מי שכבר עבדו איתו: המודל פשוט עובד טוב יותר. הוא מהיר יותר, מדויק יותר ובעיקר יציב, כזה שאפשר לסמוך עליו. OpenAI השיקה שני דגמים, GPT‑5.4 Thinking ו-GPT‑5.4 Pro, ושניהם יחד מציבים רף חדש. Matt Shumer, אחד הבטא טסטרים הבולטים, כתב שזו הפעם הראשונה שבה הוא כמעט לא משתמש בגרסת ה-Pro, משום שגם הגרסה הסטנדרטית מספקת תוצאות ברמה שלא ראה קודם. “המודל הכי טוב בעולם, בפער”, הוא אומר, והדבר תואם את מה שמדווחים רבים אחרים. הפעם, בניגוד להשקות קודמות, יש גם נתונים שמחזקים את התחושה הזו ומראים עד כמה השינוי רחב.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

למה בכלל היה צריך שינוי?

כדי להבין את המשמעות של GPT‑5.4, צריך לזכור מה חסם את הדורות הקודמים. המודלים ידעו לכתוב, להסביר ולנתח, אבל לא תמיד הצליחו לבצע משימות אמיתיות מקצה לקצה. הם יכלו להבריק במשימה אחת ולהתבלבל בבאה אחריה. reasoning עמוק היה מדויק, אך לעיתים איטי מדי.

נוסף על כך, נוצר פער בין היכולת לכתוב קוד לבין היכולת לבצע פעולות בעולם הדיגיטלי, כמו ניווט בממשקי מחשב, עבודה עם דפדפן או שימוש בכלים חיצוניים. הפער הזה הפך למשמעותי ככל שחברות ניסו לבנות סוכנים ואוטומציות. במצב כזה היה ברור שהמודלים צריכים לעבור שינוי - לא רק לתאר פתרון, אלא גם לבצע אותו בפועל. GPT‑5.4 פותח בדיוק כדי לענות על הצורך הזה.

סם אלטמן מסכם את המסר המרכזי של OpenAI לגבי GPT‑5.4

מה GPT‑5.4 מביא לשולחן

GPT‑5.4 הוא מודל שנבנה לעבודה אמיתית. הוא יודע להפעיל סוכנים, לכתוב קוד, לגלוש ברשת, להשתמש במחשב ולבצע תהליכים מרובי שלבים, והכול במהירות גבוהה יותר, בדיוק רב יותר ועם פחות טעויות. הנתונים מהבלוג הרשמי של OpenAI מציגים קפיצה רחבה ומרשימה ביכולות, לא שיפור נקודתי.

הפעלת המודל החדש עם יכולות חשיבה (סטנדרטי/מורחב)

ביצועים במשימות מקצועיות

ב-GDPval, מבחן שמדמה עבודה של 44 מקצועות שונים, GPT‑5.4 מגיע ל-83 אחוז הצלחה, לעומת 70.9 אחוז בדור הקודם. הגרף המצורף מטה מדגים זאת היטב: גם GPT‑5.4 וגם גרסת ה-Pro שלו עוברים את רף הביצועים של מומחים אנושיים.

GPT‑5.4 מצטיין במשימות ידע מקצועיות | OpenAI

מעבר לכך, המודל מצטיין במיוחד במשימות משרדיות יומיומיות. הוא מגיע ל-87.3 אחוז הצלחה במשימות אקסל שמדמות אנליסט בנקאות השקעות, מייצר מצגות ש-68 אחוז מהשופטים האנושיים העדיפו על פני GPT‑5.2, ומפיק מסמכים מדויקים יותר עם פחות טעויות עובדתיות. זה שיפור שמרגישים בשימוש יומיומי רגיל, לא רק בבנצ'מרקים.

מבצע ניתוחים באקסל ברמה שמקרבת אותו לעבודה של אנליסט אמיתי

בפועל, GPT‑5.4 מבין טבלאות מורכבות, בונה נוסחאות בצורה מדויקת, מנתח נתונים רב-שלביים ומציע תובנות עסקיות ברמת עומק שהייתה שמורה עד היום לכלים ייעודיים או למומחים אנושיים. הוא גם שומר על עקביות לאורך משימות ארוכות, דבר שהיה אתגר משמעותי בדורות קודמים. השילוב הזה הופך אותו לכלי עבודה אמיתי, כזה שמפחית חיכוך ומקצר תהליכים במקום להוסיף עוד שכבת תיווך.

המודל שמפעיל את המחשב בשבילכם

אחת הקפיצות הבולטות ביותר היא ביכולות המחשב. GPT‑5.4 הוא המודל הראשון של OpenAI שמסוגל להפעיל מחשב באופן טבעי: ללחוץ על כפתורים, להקליד, לנווט בממשקים, לבצע פעולות מורכבות דרך Playwright (כלי אוטומציה לדפדפנים) ולהבין צילומי מסך. במבחן שמודד שימוש אמיתי במחשב, הוא מגיע ל-75 אחוז הצלחה ועוקף גם בני אדם.

יעילות של GPT‑5.4 בקוד ובביצוע משימות הנדסיות | OpenAI

יכולות ראייה מתקדמות

GPT‑5.4 תומך בתמונות ברזולוציה של עד 10.24 מיליון פיקסלים, מציג שיפור ביכולת לאתר פרטים קטנים ובדיוק הלחיצה על ממשקים, ומבין טוב יותר מסמכים מורכבים. ב-MMMU Pro, מבחן הבנה חזותית מתקדם, הוא מגיע ל-81.2 אחוז לעומת 79.5 אחוז בדור הקודם. ב-OmniDocBench, מבחן הבנת מסמכים, הוא מפחית את שיעור השגיאות באופן משמעותי. גם כאן, הגרף מציג את השיפור בצורה ברורה.

השוואת ביצועים בראייה ובהבנת מסמכים | OpenAI

Tool Search

אחד החידושים הבולטים ב‑GPT‑5.4 הוא מנגנון Tool Search, שמאפשר למודל לאתר את הכלים הדרושים לו בזמן אמת במקום לקבל את כולם מראש. הגישה הזו מפחיתה ב‑47 אחוז את כמות הטוקנים הנדרשת לביצוע משימות, משפרת את מהירות העבודה ומאפשרת למודל להתמודד בקלות עם מערכות גדולות ומורכבות של כלים. זהו שינוי תשתיתי משמעותי, שמאפשר לבנות סוכנים מתקדמים יותר בעלות נמוכה יותר וביעילות גבוהה יותר.

Opus 4.6 vs GPT 5.4 (High) (1/9)

prompt: Build a single-file HTML/CSS/JS (no libs) demo that uses SVG to simulate a plant growing: stem extends, leaves sprout + unfurl with springy/windy “physics”, then seamlessly loops forever.

For the initial impressions I'm really… pic.twitter.com/p6LAki0JUV

— Dev Ed (@developedbyed) March 6, 2026

שכבה עמוקה יותר של הגנה

OpenAI מקדישה חלק משמעותי לנושא הבטיחות, וב-GPT‑5.4 מוצגים כמה חידושים בולטים. המודל מסווג כבעל יכולות סייבר גבוהות, ולכן מופעלים עליו מנגנוני הגנה מחמירים יותר מאשר בדורות קודמים. אחד התחומים שנבדקו הוא היכולת של המודל להסתיר את שרשרת החשיבה שלו, במסגרת מבחן CoT Controllability.

הממצאים מראים ש-GPT‑5.4 Thinking מתקשה להסתיר את תהליך החשיבה הפנימי שלו, תכונה שנחשבת חיובית בהקשר של בטיחות, משום שהיא מאפשרת ניטור שקוף וברור יותר של אופן קבלת ההחלטות.

בנוסף לכך, OpenAI מציגה מערך מחוזק של מנגנוני חסימה: ניטור מתקדם, בקרות גישה הדוקות יותר, חסימה אסינכרונית לבקשות בעלות פוטנציאל סיכון, והפחתה ניכרת של טעויות עובדתיות. לפי הבלוג, GPT‑5.4 מפחית טעויות עובדתיות ב-33 אחוז לעומת GPT‑5.2, שיפור משמעותי במיוחד במשימות מקצועיות שבהן דיוק הוא תנאי בסיסי.

מאט שומר משתף בציוץ חוויית שימוש יוצאת דופן ב‑GPT‑5.4

תמחור וזמינות

Open AI מפרטים בצורה ברורה את זמינות הדגמים ואת מודל התמחור שלהם. GPT‑5.4 Thinking זמין למשתמשי Plus, Team ו‑Pro, בעוד GPT‑5.4 Pro מוצע למשתמשי Pro ו‑Enterprise. במקביל, GPT‑5.2 Thinking יישאר זמין למשך שלושה חודשים נוספים בלבד, ולאחר מכן יוסר מהמערכת. ב‑Codex, GPT‑5.4 כולל תמיכה ניסיונית בחלון הקשר של מיליון טוקנים, יכולת שמאפשרת לנתח קוד ארוך במיוחד או מסמכים מורכבים בצורה רציפה.

ב‑API, התמחור של GPT‑5.4 עומד על 2.50 דולר למיליון טוקנים בקלט ו‑15 דולר למיליון טוקנים בפלט. גרסת ה‑Pro מתומחרת ב‑30 דולר למיליון טוקנים בקלט ו‑180 דולר למיליון טוקנים בפלט. למרות המחיר הגבוה יותר, OpenAI מציינת שהמודל יעיל משמעותית, ולכן בפועל נדרש פחות שימוש בטוקנים כדי להשלים משימות מורכבות. היעילות הזו מאזנת חלק מהעלייה בעלות ומאפשרת למשתמשים לקבל יותר תמורה מכל בקשה.

See what developers are building with GPT-5.4.

Our developer app showcase highlights examples across coding, computer use, tool use, and professional workflows.https://t.co/wh3G8odTlM pic.twitter.com/KYzRxqDKmH

— OpenAI Developers (@OpenAIDevs) March 5, 2026

מודל שמגדיר מחדש את הציפיות (ואת מאזן הכוחות)

GPT‑5.4 הוא לא עוד שדרוג, אלא ציון דרך שמסמן מעבר לעידן שבו בינה מלאכותית לא רק מייעצת אלא גם מבצעת. השילוב בין ביצועים גבוהים, מהירות, עקביות ויכולות פעולה מעשיות הופך אותו לכלי תפעולי של ממש. הוא מצטיין במשימות מקצועיות, מפעיל מחשבים, מבין תמונות ומסמכים, משתמש בכלים בצורה יעילה ומציג שיפורים משמעותיים בבטיחות. זה מודל שמחזיר את OpenAI לקדמת הבמה, אחרי תקופה שבה המתחרות - גוגל ואנטרופיק - תפסו את מרכז תשומת הלב עם השקות מרשימות משלהן.

הפוסט האם GPT‑5.4 הוא מודל ה-AI הטוב בשוק כיום? הופיע ראשון בLet's AI בינה מלאכותית

GPT‑5.3 Instant מתמקד בחוויית השימוש

רון גולד — Fri, 06 Mar 2026 07:20:19 +0000

בעולם שבו מודלי שפה גדולים הפכו לחלק טבעי מהתשתית הדיגיטלית, המאבק המרכזי כבר אינו על שיפור נוסף בביצועים אקדמיים. המשתמשים, בין אם הם אנשי מקצוע, מפתחים או צרכנים, מחפשים משהו אחר: מודל שמרגיש טבעי, שמבין את הכוונה, שלא מתנצל ללא צורך ושיודע לעצור במקום להמציא תשובה כשהוא לא בטוח. במרץ 2026 OpenAI כיוונה בדיוק לנקודה הזו עם GPT‑5.3 Instant, עדכון שמעדיף זרימה אנושית של שיחה על פני עוד שכבת כוח חישובי. זה שינוי כיוון ברור, שמציב במרכז לא את השאלה מי המודל החכם ביותר, אלא מי המודל שנעים באמת לעבוד איתו.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

האתגרים שממשיכים ללוות את מודלי השפה

למרות ההתקדמות המרשימה של הדורות הקודמים, משתמשים המשיכו להיתקל בשלוש תופעות שחוזרות שוב ושוב ומפריעות לשימוש יומיומי חלק. הראשונה היא סירובים לא נחוצים, אותם רגעים שבהם המודל נמנע מלהשיב גם כשאין לכך סיבה ממשית.

השנייה היא טון מגונן או מטיף, שמופיע לעיתים גם בבקשות פשוטות ויוצר תחושה של הרצאה במקום שיחה טבעית.

השלישית היא הזיות, כלומר תשובות שנשמעות בטוחות אך אינן נכונות. עבור ארגונים שמסתמכים על מודלים בתהליכי עבודה, כל אחת מהתופעות הללו מייצרת עלות: זמן בדיקה, תיקונים, ולעיתים גם מבוכה מול לקוחות.

הפתרון של GPT‑5.3 Instant

GPT‑5.3 Instant פותח כדי להתמודד ישירות עם נקודות הכאב שהמשתמשים חווים כבר שנים. OpenAI מציגה אותו כמודל שמעדיף דיאלוג זורם על פני נוקשות, ושם את הדגש על אמינות במקום על ביטחון עצמי שאינו מגובה בנתונים. המטרה היא להפוך את השיחה עם המודל לפחות מאומצת ויותר אינטואיטיבית.

ירידה בהזיות

בהערכות פנימיות של OpenAI נמדדה ירידה משמעותית בהזיות: 26.8 אחוז בתרחישי סיכון גבוה כשהמודל משתמש ב‑web, ו‑19.7 אחוז כשהוא מסתמך על הידע הפנימי בלבד. גם בהערכות מבוססות משתמשים נרשמה מגמה דומה, עם ירידה של 22.5 אחוז בעת שימוש ב‑web ו‑9.6 אחוז ללא web. הנתונים מצביעים על שיפור ממשי ביכולת של המודל להימנע מתשובות שגויות שנשמעות בטוחות מדי.

הפחתת סירובים לא נחוצים

המודל החדש מפחית סירובים ומוותר על שכבות של הסתייגויות שאינן תורמות לשיחה. הוא נוטה לענות בצורה ישירה וברורה יותר, ומציג טון ענייני ופחות מתגונן. TechRadar תיאר את השינוי כמודל “פחות קרינג’”, ניסוח שממחיש היטב את השיפור בתחושת השיחה.

שיפור ביכולות החיפוש

במקום להחזיר רשימת לינקים יבשה, GPT‑5.3 Instant מספק הקשר רחב יותר: הוא מסביר מה חשוב, מדגיש את המידע הרלוונטי, ומחבר בין תוצאות מה‑web לבין הידע הפנימי שלו. התוצאה היא תשובה שמרגישה שלמה יותר, ולא אוסף מקורות מפוזר.

GPT-5.3 Instant also has fewer unnecessary refusals and preachy disclaimers. pic.twitter.com/wX6wh5Aynp

— OpenAI (@OpenAI) March 3, 2026

מודל שמעדיף להודות כשהוא לא יודע

ה-System Card של GPT‑5.3 Instant מצביע על שיפור ברור ביכולת לזהות מצבים שבהם חסר מידע, לעצור, ולבקש הבהרה במקום לנסות להשלים פערים באמצעות ניחוש. זהו שינוי התנהגותי משמעותי, משום שמודל שמסוגל להודות בחוסר ודאות הוא מודל שאפשר לבסס עליו תהליכי עבודה אמינים יותר. במקום לייצר תשובה שנשמעת בטוחה אך אינה מבוססת, הוא בוחר להאט, לשאול, ולדייק.

OpenAI מציינת שהמודל שומר על אורך תשובות דומה לדור הקודם, אך התוכן עצמו מדויק יותר, מחובר יותר להקשר ומותאם טוב יותר לצרכים של המשתמש. השילוב בין זהירות במקום הנכון לבין בהירות בתשובה יוצר חוויית שימוש יציבה יותר, כזו שמפחיתה טעויות ומעלה את רמת האמון בשיחה.

השוואה לדור הקודם

GPT‑5.2 Instant, שהושק בפברואר 2026, כבר שיפר את הסגנון והדיוק והציג תשובות מדודות וממוקדות יותר. GPT‑5.3 Instant מרחיב את המגמה הזו ומוסיף לה שכבת עומק התנהגותית. בעוד GPT‑5.2 התמקד בעיקר ב"איך לנסח טוב יותר", GPT‑5.3 מתמקד ב"איך לדבר טוב יותר". זה מעבר מהנדסה של טקסט להנדסה של חוויה, שינוי שממקם את השיחה עצמה במרכז.

למי זה זמין

OpenAI החלה להטמיע את GPT‑5.3 Instant כברירת המחדל בשיחות ב‑ChatGPT, במהלך rollout הדרגתי שמגיע בהמשך לכלל המשתמשים המחוברים. בסביבות ארגוניות כמו ChatGPT Enterprise ו‑Edu המודל כבוי כברירת מחדל, ומנהלים צריכים להפעיל אותו ידנית דרך Early Model Access. ב‑API המודל זמין תחת השם gpt‑5.3‑chat‑latest, עם חלון הקשר של 128,000 טוקנים.

הקשר תחרותי

ההשקה של GPT‑5.3 Instant מגיעה בתקופה שבה התחרות בין OpenAI, Google ו‑Anthropic מתחדדת, וכל אחת מהחברות מציגה תפיסה שונה לגבי מהי אינטליגנציה שימושית בעידן של מודלים גדולים.

Google ממשיכה להתמקד ביעילות וביכולת להתמודד עם עומסים גבוהים, עם מודלים כמו Gemini 3.1 Flash‑Lite שנבנו כדי לשרת כמויות עצומות של בקשות בעלות נמוכה ומהירות גבוהה. אלו מודלים שמכוונים בעיקר לתפוקה, לא בהכרח לניהול שיחה עשירה או רבת הקשר.

Anthropic בוחנת כיוון אחר לגמרי ומתמקדת בעומק. בדגמים כמו Claude Opus 4.6 ו‑Sonnet 4.6 החברה מנסה להרחיב את גבולות הקונטקסט, עם חלונות של עד מיליון טוקנים בתצורות בטא. היכולת הזו מתאימה למשימות ארוכות, עבודה עם סוכנים ותהליכי תכנון מורכבים שבהם נדרש להבין ולשמר כמויות גדולות של מידע לאורך זמן.

OpenAI מציגה גישה שלישית. במקום להתחרות על המהירות הגבוהה ביותר או על חלון הקשר הגדול ביותר, GPT‑5.3 Instant מתמקד בחוויית השיחה עצמה. הוא נועד להיות המודל שהכי קל ונעים לעבוד איתו, כזה שמפחית חיכוך, מגיב באופן טבעי ומספק תשובות אמינות יותר. זהו כיוון שממקם את איכות האינטראקציה במרכז, ולא רק את היכולות הטכניות.

למה זה חשוב עכשיו

GPT‑5.3 Instant מסמן שינוי כיוון ברור. במקום להתמקד בשאלה מי המודל החכם ביותר, OpenAI מעבירה את מרכז הכובד לשאלה מי המודל השימושי ביותר בפועל. הגישה הזו מתבטאת בשורה של שיפורים התנהגותיים.

המשמעות של השינוי הזה גדלה עוד יותר על רקע היקף השימוש הנוכחי. לפי נתוני OpenAI, הצ׳אט שלהם הגיע ל-900 מיליון משתמשים פעילים בשבוע, לצד 50 מיליון מנויים משלמים, זינוק של מאה מיליון משתמשים מאז סוף 2025. בקנה מידה כזה, כל שיפור קטן בחיכוך השיחתי מתורגם להשפעה עצומה על פרודוקטיביות וחוויית שימוש. בעולם שבו מודלים הופכים לחלק מהעבודה היומיומית של מאות מיליוני אנשים, שדרוג כזה מורגש בכל אינטראקציה.

הפוסט GPT‑5.3 Instant מתמקד בחוויית השימוש הופיע ראשון בLet's AI בינה מלאכותית

גוגל משיקה את Gemini 3.1 Flash‑Lite

מערכת האתר — Wed, 04 Mar 2026 12:52:45 +0000

גוגל מציגה את Gemini 3.1 Flash‑Lite כמהלך שמסמן שינוי משמעותי בעולם המודלים הקלים. הוא משלב מהירות גבוהה, יעילות כלכלית ויכולת התאמה דינמית לצרכים שונים, ובכך מציב רף חדש למודלים שמיועדים להפעלה בקנה מידה גדול. במקום עוד עדכון טכני, Flash‑Lite מתמקד בבעיה המרכזית של מפתחים וחברות - איך להפעיל מערכות AI רחבות היקף בלי להכביד על התקציב. כבר מההכרזה ברור שהמודל לא נועד רק לייצר תגובות מהירות, אלא לשמש בסיס יציב ורווחי למערכות אמיתיות שנדרשות לעמוד בעומסים יומיומיים.

Developers can now preview Gemini 3.1 Flash-Lite, our fastest and most cost-efficient Gemini 3 series model yet.

With a 45% increase in output speed, it outperforms 2.5 Flash and features dynamic thinking levels to match task complexity.

Rolling out in preview today in… pic.twitter.com/BdJHRFx9SI

— Google (@Google) March 3, 2026

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

מהירות ועלות

Flash‑Lite מציג שיפור משמעותי בביצועים, עם זמן עד למילה הראשונה מהיר פי 2.5 לעומת הדור הקודם ושיפור של כ‑45 אחוז במהירות הפלט. הנתונים האלה מציבים אותו כאחד המודלים המהירים בקטגוריה ומאפשרים חוויית זמן אמת גם במערכות עתירות תעבורה.

במקביל, גוגל מציעה תמחור נמוך במיוחד של 0.25 דולר למיליון טוקנים בקלט ו‑1.50 דולר למיליון טוקנים בפלט, מה שהופך אותו לאחד הפתרונות הכלכליים הזמינים כיום. השילוב בין מהירות גבוהה לעלות נמוכה מאפשר להפעיל שירותים כמו צ'אטים, תרגום, ניטור תוכן וממשקי משתמש דינמיים בהיקפים גדולים בלי לחשוש מחשבונות ענן כבדים.

שילוב נדיר של מהירות וחיסכון בעלות

גמישות תפעולית ושליטה בעומק החשיבה

אחד החידושים הבולטים במודל הוא האפשרות לשלוט בעומק החשיבה שלו. במקום מודל שפועל תמיד באותה רמת הסקה, Flash‑Lite מאפשר לבחור כמה מאמץ הוא ישקיע בכל משימה. היכולת הזו מאפשרת לאזן בין מהירות, עלות ודיוק ולהתאים את התנהגות המודל בזמן אמת. עבור צוותים שמתמודדים עם עומסים משתנים או תעבורה בלתי צפויה, מדובר בכלי שמעניק שליטה טובה יותר על הביצועים ועל התקציב.

Gemini 3.1 Flash-Lite has landed.

It’s our most cost-efficient Gemini 3 series model yet, built for intelligence at scale. Here’s what’s new pic.twitter.com/BzD2bdg3Dx

— Google DeepMind (@GoogleDeepMind) March 3, 2026

ביצועים מרשימים במבחני עומק

Flash‑Lite מציג ביצועים חזקים גם במבחני עומק, ולא רק במהירות או בעלות. הוא מגיע לציון Elo של 1432 ב‑Arena.ai, לצד תוצאות של 86.9 אחוז ב‑GPQA Diamond ו‑76.8 אחוז ב‑MMMU‑Pro.

כדי להבין את המשמעות של המספרים האלה, חשוב לדעת שכל מבחן בודק יכולת אחרת: Elo משקף השוואה ישירה בין מודלים ובוחן מי מספק תשובות טובות יותר בשיחות אמיתיות, GPQA Diamond מעריך יכולת להתמודד עם שאלות מדעיות קשות במיוחד, ו‑MMMU‑Pro מודד הבנה רב‑מודלית של טקסטים, תמונות ותרשימים. יחד הם מציירים תמונה של מודל שלא רק רץ מהר וזול, אלא גם מפגין עומק הסקה, הבנה מורכבת ויכולת להתמודד עם משימות מאתגרות.

גם במבחני הסקה, הבנה רב‑מודלית ויכולות קוד הוא מציג תוצאות שמראות שהיעילות הכלכלית אינה באה על חשבון איכות. כך מתקבל מודל שמסוגל להתמודד עם משימות מורכבות, לנתח מידע ממקורות שונים ולספק תובנות מדויקות, תוך שמירה על יעילות תפעולית גבוהה.

יכולות הסקה ורב‑מודליות ברמה תחרותית מול דגמים גדולים יותר | blog.google

הזדמנות חדשה למפתחים בכל קנה מידה

Flash‑Lite משנה את מאזן הכוחות בשוק ה‑AI. מצד אחד הוא מוריד את חסם הכניסה לפיתוח מערכות מורכבות, ומאפשר גם לחברות קטנות ליהנות מביצועים שהיו עד לא מזמן נחלתם של מודלים יקרים בהרבה.

מצד שני הוא מגביר את הלחץ על ספקי מודלים אחרים להתאים את התמחור שלהם או להציע יכולות חדשות כדי להישאר רלוונטיים.

עם זאת חשוב לזכור שהמודל עצמו הוא רק חלק מהתמונה. כדי לממש את היתרונות של המהירות והיעילות שהוא מציע, גם התשתיות, האינטגרציות ורמת השירות שמסביב חייבות להיות בנויים כך שיוכלו לעמוד בקצב.

מודל קטן עם השפעה רחבה

Gemini 3.1 Flash‑Lite הוא לא רק מודל חדש אלא הצהרה ברורה של גוגל על הכיוון שבו היא רואה את עתיד ה‑AI: מהיר יותר, זול יותר, גמיש יותר ובעיקר נגיש יותר למפתחים בכל קנה מידה.

השילוב בין ביצועים גבוהים, עלות נמוכה ויכולות עומק הופך אותו לכלי שיכול לשנות את הדרך שבה בונים ומפעילים מערכות AI.

המודל זמין כבר כעת בגרסת Preview, ומפתחים יכולים להתחיל לעבוד איתו דרך ה‑API ו‑Google AI Studio, בעוד שארגונים יכולים לגשת אליו דרך Vertex AI. הזמינות המוקדמת מאפשרת לבחון את היכולות החדשות ולשלב אותן בסביבות פיתוח קיימות עוד לפני ההשקה המלאה.

הפוסט גוגל משיקה את Gemini 3.1 Flash‑Lite הופיע ראשון בLet's AI בינה מלאכותית

איך לגרום ל-AI לענות קצר ולעניין

רון גולד — Wed, 04 Mar 2026 06:52:12 +0000

"תהיה תמציתי." זו כנראה ההנחיה הנפוצה ביותר שאנשים כותבים כשהם מקבלים תשובה ארוכה מדי מ-ChatGPT. והיא כמעט אף פעם לא עובדת. לא בגלל שהמודל מתעלם, אלא בגלל שאין לו מושג מה "תמציתי" אומר בעיניכם. בשבילו, תמציתי זה אולי לגלח כמה מילים ולהמשיך הלאה. בשבילכם, זה משפט אחד ישר לעניין. מי שהשתמש ב-ChatGPT או ב-Claude מכיר את המבנה: פתיחה ארוכה שלא מוסיפה כלום, אחריה הסתייגויות זהירות, ואז סיכום שחוזר על מה שכבר נאמר. התשובה בפועל קבורה באמצע, בין כל השכבות שמסביב. יש שיטה לתקן את זה, והיא עובדת בשלוש שכבות: לפני השיחה, בתוכה, ואחריה.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

למה AI כותב יותר מדי

כדי להבין את הפתרון, שווה להבין את הבעיה. מודלי AI מאומנים על כמויות עצומות של טקסט מהאינטרנט, שמטבעו נוטה לאורך. בנוסף, בשלב האימון שבו בני אדם מדרגים תשובות (למידה מפידבק של בני אנוש או RLHF), תשובות ארוכות יותר קיבלו שוב ושוב ציונים גבוהים יותר. התוצאה היא שהמודל פיתח הרגל עמוק שקשה לעקור - יותר מילים שווה ציון טוב יותר.

"שחיקת זיכרון" או "קריסת ההקשר"

ויש בעיה נוספת שרוב האנשים לא שמים לב אליה. ככל שהמודל מייצר יותר טקסט, מה שהוא מחזיק בזיכרון הפעיל מתמלא ברעש. אחרי עשר עד חמש עשרה הודעות בשרשור ארוך, המודל פשוט פחות חד. לא כי הוא "עייף", אלא כי הוא טובע בתוך המלל שהוא עצמו יצר, כלומר, ככל שאתם מנהלים עם ה-AI שיחה ארוכה יותר באותו חלון, כך הוא 'זוכר' יותר מילים מיותרות מהעבר ומתחיל לאבד את הפוקוס שלו. התוצאה: התשובות הופכות לפחות חכמות ופחות מדויקות.

שכבה ראשונה: לקבוע כללים מראש

הדרך הכי יעילה לקצר תשובות היא לקבוע כללים לפני שהשיחה מתחילה. ChatGPT, Claude ו-Gemini מאפשרים להגדיר הנחיות קבועות שהמודל קורא לפני שהוא עונה לכם. אפשר לעשות את זה בתוך הפרויקטים (Projects) של הבוטים, דרך Custom GPTs, Gemini Gems, וכמובן דרך Custom Instructions שנמצאים בהגדרות הראשיות של החשבון. שני עקרונות עובדים כאן:

הראשון - הגדרות מדויקות, לא מעורפלות. במקום "תהיה תמציתי", כתבו: "שאלות פשוטות - תשובה של משפט עד שניים. שאלות בינוניות - שלושה עד חמישה משפטים. שאלות מורכבות - פסקה אחת ומקסימום חמש נקודות." ההבדל: במקום מילה סובייקטיבית שהמודל מפרש לבד, נתתם לו מספרים. הוא לא צריך לפרש מה אתם רוצים, רק למלא.

השני - הנחיות חיוביות, לא שליליות. "אל תכתוב הקדמות ארוכות" לא עובד כמו שחושבים. נסו להגיד למישהו "אל תחשוב על סוס ורוד" - הדבר הראשון שקורה הוא שהסוס הורוד קופץ לראש. עם AI זה אותו דבר. הנחיה שלילית לפעמים מושכת את תשומת הלב דווקא לדבר שניסיתם למנוע. מה כן עובד: "התחילו ישר בתשובה", "כתבו משפטים קצרים והצהרתיים", "פתחו בנקודה הכי חשובה." כיוון ברור (״מה כן״) תמיד יעיל יותר מהנחיה מעורפלת.

שכבה שנייה: לכפות פורמט

גם עם כללים ברקע, ההנחיה הספציפית שכותבים משפיעה על אורך התשובה. הטריק הוא לכפות על המודל פורמט שלא מאפשר יותר מדי מלל. פורמטים כמו טבלאות ורשימות מוגבלות לא משאירים מקום להרחבות מיותרות, סיכומים או משפטי גישור - הם מכריחים את המודל להגיש מידע רלוונטי ונקודתי.

למשל, במקום לשאול "מה ההבדלים בין העסקת צוות שיווק פנימי לבין סוכנות חיצונית?" כתבו "בנה טבלת השוואה עם העמודות האלה: עלות, שליטה, מהירות, מומחיות." במקום "תסביר לי את הנושא" בקשו "רשימה של מקסימום חמישה סעיפים, עד 20 מילים לכל אחד." אפשר גם לבקש שלבים ממוספרים עם הגבלת משפטים בכל שלב. העיקרון הוא שברגע שקובעים מסגרת, אין מקום לרעש.

שכבה שלישית: לתקן בדיעבד

לפעמים עשיתם הכל נכון, והתשובה עדיין ארוכה מדי. אפשר לתקן גם אחרי שהתשובה הגיעה.

כתבו בצ׳אט: "קצרו ב-50%, הסירו כל הכללה, השאירו רק משפטים קצרים וחדים." שלושה דברים ספציפיים: כמה לקצר, מה להסיר, ואיך לכתוב. הנחיה מדידה עובדת הרבה יותר טוב מ-"תקצר."

כלי מחקר מעמיק

כשמדברים על כלי מחקר מעמיק כמו Deep Research, אלה נוטים כברירת מחדל להפיק דוחות מפורטים, משום שהם מיועדים לאיסוף רחב של מקורות, הצלבה והצגת הקשר מלא ולא רק לספק תשובה קצרה, אבל אין כאן מנגנון שמחייב אורך ואי אפשר לשלוט בו, וברוב המקרים ניתן מראש לבקש תקציר, להגדיר אורך רצוי או להתמקד בממצאים מעשיים בלבד.

אם כבר התקבל דוח ארוך מדי, דרך יעילה היא להעתיק אותו לשיחה חדשה ולהנחות את המודל לחלץ רק מסקנות יישומיות ולהסיר רקע, משום ששינוי ההקשר מגדיר מחדש את מטרת העיבוד ומחדד את הפלט, ולפעמים, כאשר השאלה ממוקדת ופשוטה, חיפוש רגיל עם מודל מתקדם עשוי לספק תוצאה איכותית ותמציתית דומה, אך בנושאים מורכבים או כאלה הדורשים הצלבת מקורות שיטתית, כלי מחקר ייעודי עשוי להניב תוצאה מקיפה ומדויקת יותר.

איפה מעדכנים את הכללים

איפה לכתוב את הכללים מהשכבה הראשונה? יש שתי אפשרויות - בתוך פרויקט ספציפי (כמו GPT מותאם או Claude Project) או בהגדרות הכלליות של החשבון.

הנחיות בהגדרות הכלליות של החשבון

ההמלצה היא להתחיל מההגדרות הכלליות. כשכותבים כללים בתוך פרויקט ספציפי, הם עובדים רק כשפותחים את הפרויקט הספציפי. כשכותבים אותם ב-Custom Instructions של ChatGPT או Claude, שנמצאים ישר בהגדרות הראשיות, הם חלים אוטומטית על כל שיחה. אין צורך לזכור לעבור לכלי הנכון, אין חיכוך והבסיס אחיד.

הנחיות בתוך פרויקט ספציפי או ״סביבה מבודדת״

מה עושים עכשיו

הצעד הראשון לוקח דקה. היכנסו להגדרות של המודל הקרוב לביתכם, כנסו ל-Custom Instructions, וכתבו שם שלושה כללים ברורים: הגדרת אורך לשאלות פשוטות, הגדרת אורך לשאלות מורכבות, והנחיה להתחיל ישר בתשובה. אחרי זה, בפעם הבאה שהתשובה עדיין ארוכה מדי, תגדירו פורמט מועדף או חדדו בדיוק מה אתם רוצים. שלוש שכבות, כל אחת עובדת לבד, וביחד ההבדל מורגש מיד.

הפוסט איך לגרום ל-AI לענות קצר ולעניין הופיע ראשון בLet's AI בינה מלאכותית

המדריך לניוד זיכרון מ-ChatGPT ל-Gemini או ל-Claude

אלי מרסינו — Tue, 03 Mar 2026 15:31:18 +0000

לעיתים נדמה שהצ'ט שבו אנו משתמשים אינו רק כלי עבודה, אלא שותף שמכיר את ההעדפות, הסגנון וההרגלים שלנו. אך מה קורה כאשר מחליטים לבטל מנוי בכלי אחד ולעבור לאחר. האם צריך להתחיל הכול מחדש ולבנות את ההיכרות מאפס. קבלו מדריך מעשי שיסביר לכם כיצד להעביר את ה"אופי" של הצ'ט שלכם לכלי אחר, כך שגם לאחר המעבר תמשיכו לקבל תשובות מותאמות אישית, מדויקות ועקביות. וכן - הכותרת קצת מטעה... אנחנו לא מנסים לרמוז שאתם צריכים לעשות את ה"נדידה" מ-ChatGPT לכלי אחר, כי את התהליך הזה אפשר לעשות גם הפוך - מ-Gemini ל-ChatGPT או מקלוד ל-Gemini. כל אחד יחליט בעצמו מה "סוס העבודה" שלו.

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

למה בכלל להעביר קונטקסט בין צ'טים

כאשר עובדים לאורך זמן עם כלי מסוים, למשל ChatGPT של OpenAI, מצטבר בו ידע רלוונטי עליכם. הכלי לומד את ההעדפות שלכם, את תחומי העיסוק, את סגנון הכתיבה הרצוי ואפילו את הרגישויות שלכם לתשובות מסוימות. עם הזמן, התגובות נעשות מדויקות יותר ופחות כלליות. הבעיה מתחילה כאשר מחליטים לנסות כלי אחר, למשל קלוד (Claude) של אנטרופיק (Anthropic) או ג'מיניי (Gemini) של גוגל (Google). ייתכן שהסיבה תהיה איכות ניתוח גבוהה יותר, מגבלות שימוש, מחיר, או צורך בפיצ'ר ייחודי. ברגע המעבר מתגלה חיסרון ברור: הכלי החדש אינו מכיר אתכם כלל.

במקום לבנות את ההיכרות מחדש דרך עשרות שיחות, ניתן לבצע ייצוא יזום של המידע האישי וההנחיות שהצטברו, ולהזין אותן בצורה מסודרת לכלי החדש. כך אתם שומרים על רצף עבודה, חוסכים זמן, ומקבלים התאמה אישית כבר מהיום הראשון. השיטה רלוונטית במיוחד כאשר מדובר בעבודה ארוכת טווח עם כלי אחד. לדוגמה, אם התרגלתם לכך שהצ'ט עונה בטון מקצועי אך תמציתי, מציג קוד ללא הסברים מיותרים, או תמיד מסכם בנקודות מסודרות, סביר להניח שאינכם רוצים לאמן מחדש כלי אחר מההתחלה.

בנוסף, אם הכלי מכיר את הרקע המקצועי שלכם, את סוגי הפרויקטים שאתם מנהלים או את שיטות העבודה המועדפות עליכם, המעבר ללא העברת קונטקסט עלול לפגוע באיכות התשובות. השיטה רלוונטית גם במצבים של מעבר ארגוני, כאשר צוות עובר מכלי אחד לאחר, או כאשר רוצים לעבוד במקביל עם כמה כלים תוך שמירה על אחידות התנהגות.

שלב ראשון: בקשת ייצוא זיכרון מהצ'ט הקיים

כדי להעביר קונטקסט, יש לבקש מהצ'ט הנוכחי לייצא את כל הזיכרונות וההנחיות שהוא שומר עליכם בפורמט מסודר. לשם כך ניתן להשתמש בפרומפט הבא:

פרומפט ייצוא זכרונות בעברית:

ייצא את כל הזיכרונות השמורים שלך וכל הקשר שלמדת עליי משיחות קודמות. שמור על הניסוחים שלי במדויק ככל האפשר, במיוחד עבור הוראות והעדפות.

## קטגוריות (הצג לפי הסדר הבא):

1. **הוראות**: כללים שביקשתי ממך במפורש לעקוב אחריהם להבא - טון, פורמט, סגנון, "תמיד עשה X", "לעולם אל תעשה Y", ותיקונים להתנהגות שלך. כלול רק כללים מזיכרונות שמורים, לא משיחות כלליות.

2. **זהות**: שם, גיל, מיקום, השכלה, משפחה, מערכות יחסים, שפות ותחומי עניין אישיים.

3. **קריירה**: תפקידים נוכחיים וקודמים, חברות ותחומי מומחיות כלליים.

4. **פרויקטים**: פרויקטים שבניתי או התחייבתי אליהם באופן משמעותי. רצוי רשומה אחת לכל פרויקט. ציין מה הוא עושה, מה הסטטוס הנוכחי והחלטות מפתח. פתח כל רשומה בשם הפרויקט או בתיאור קצר שלו.

5. **העדפות**: דעות, טעמים והעדפות סגנון עבודה החלות באופן רחב.

## פורמט:

השתמש בכותרות לכל קטגוריה. בתוך כל קטגוריה, רשום שורה אחת לכל פריט, ממוינת לפי תאריך מהישן לחדש.

עצב כל שורה כך:

[YYYY-MM-DD] - תוכן הרשומה כאן.

אם אין תאריך ידוע, השתמש ב-[unknown].

## פלט:
- עטוף את כל הייצוא בבלוק קוד אחד לצורך העתקה נוחה.
- לאחר בלוק הקוד, ציין האם זהו הסט המלא או שקיימים פריטים נוספים.

פרומפט ייצוא זכרונות באנגלית:

Export all of my stored memories and any context you've learned about me from past conversations. Preserve my words verbatim where possible, especially for instructions and preferences.

## Categories (output in this order):

1. **Instructions**: Rules I've explicitly asked you to follow going forward — tone, format, style, "always do X", "never do Y", and corrections to your behavior. Only include rules from stored memories, not from conversations.

2. **Identity**: Name, age, location, education, family, relationships, languages, and personal interests.

3. **Career**: Current and past roles, companies, and general skill areas.

4. **Projects**: Projects I meaningfully built or committed to. Ideally ONE entry per project. Include what it does, current status, and any key decisions. Use the project name or a short descriptor as the first words of the entry.

5. **Preferences**: Opinions, tastes, and working-style preferences that apply broadly.

## Format:

Use section headers for each category. Within each category, list one entry per line, sorted by oldest date first. Format each line as:

[YYYY-MM-DD] - Entry content here.

If no date is known, use [unknown] instead.

Output:
- Wrap the entire export in a single code block for easy copying.
- After the code block, state whether this is the complete set or if more remain.

לאחר שהכלי יספק את הפלט, העתיקו את כל בלוק הקוד כפי שהוא, כולל הכותרות והתאריכים.

שלב שני: הדבקת המידע בכלי החדש

כעת יש להזין את המידע לכלי שאליו אתם עוברים. בכל פלטפורמה יראה יראה מעט אחרת.

ייצוא וייבוא זכרונות ב-ChatGPT

ב-ChatGPT יש להיכנס להגדרות או לפרסונליזציה, לבחור באפשרות Custom Instructions (בתוך טאב הפרסונליזציה), ולהדביק שם את המידע הרלוונטי מתוך הייצוא. ניתן לחלק בין החלק המתאר "מה עליך לדעת עליי" לבין "כיצד עליך להגיב", בהתאם למבנה הקיים. כך הכלי יתחיל לפעול בהתאם להוראות ולהקשר שהועברו, במקום להתחיל מדף חלק.

ייצוא וייבוא זכרונות ב-ChatGPT

ייצוא וייבוא זכרונות בג'מיניי (Gemini)

בג'מיניי יש להיכנס להגדרות, לבחור באפשרות הקשר אישי, ולהדביק שם את המידע שהופק מהצ'ט הקודם. המערכת תשתמש במידע זה כדי להתאים את התגובות העתידיות לסגנון ולהעדפות שלכם.

ייצוא וייבוא זכרונות ב-Gemini

ייצוא וייבוא זכרונות בקלוד (Claude)

בקלוד יש להיכנס להגדרות, לבחור ב-Capabilities או "יכולות", ושם קיים כפתור ייעודי בשם Import memory from other AI providers. באמצעות אפשרות זו ניתן להדביק את המידע שיוצא מכלי אחר, וכך לייבא את ההקשר בצורה מובנית יחסית.

ייצוא וייבוא זכרונות בקלוד

טיפים ליישום חכם של השיטה

חשוב לעבור על הפלט לפני שמדביקים אותו. ייתכן שתמצאו הנחיות שכבר אינן רלוונטיות, או מידע אישי שאינכם מעוניינים להעביר. מדובר בהזדמנות לנקות ולדייק את הזהות הדיגיטלית שלכם מול הכלי החדש.
בנוסף, לאחר ההדבקה מומלץ לבצע שיחה קצרה עם הכלי החדש ולבדוק האם הוא מבין את ההוראות כפי שהתכוונתם. אפשר אפילו לשאול אותו מה הוא למד עליכם מהמידע שסיפקתם.
לבסוף, כדאי לזכור כי לא כל כלי מפרש זיכרון באותה דרך. לעיתים תידרש התאמה ניסוחית קלה כדי להשיג תוצאות מיטביות.

מחשבה רחבה על ניידות קונטקסט בעולם ה-AI

היכולת להעביר קונטקסט בין מערכות אינה רק טריק טכני, אלא צעד חשוב בקסטומיזציה של צ'ט ה-AI שאיתו אתם עובדים. אם הוא מכיר אתכם ואת ההעדפות שלכם, הוא יהפוך למדויק יותר עבור הצרכים הפרטיקולריים שלכם. ובנוסף - כך אנחנו לא עושים "חתונה קתולית" עם כלי אחד ומשתעבדים לסביבת עבודה או חברה אחת. החופש נשאר בידיים שלנו. נאמנות לתוצר ולא למוצר! העברת קונטקסט יזומה מאפשרת לכם להישאר הבעלים של ההנחיות, הסגנון וההעדפות שלכם, גם כאשר אתם מחליפים פלטפורמה. במובן זה, לא מדובר רק במעבר בין ChatGPT, קלוד או ג'מיניי, אלא ביצירת רציפות מקצועית בעולם שבו הכלים משתנים במהירות, אך דפוסי העבודה שלכם נותרים יציבים.

הפוסט המדריך לניוד זיכרון מ-ChatGPT ל-Gemini או ל-Claude הופיע ראשון בLet's AI בינה מלאכותית