כתבות ומדריכים בנושא כתבות ומדריכים בנושא מודלי שפה | Let's AI בינה מלאכותית https://letsai.co.il/articles/language-models/ בינה מלאכותית Sat, 07 Feb 2026 20:27:05 +0000 he-IL hourly 1 https://wordpress.org/?v=6.8.3 https://letsai.co.il/wp-content/uploads/2024/03/cropped-logo-lets-ai-32x32.webp כתבות ומדריכים בנושא כתבות ומדריכים בנושא מודלי שפה | Let's AI בינה מלאכותית https://letsai.co.il/articles/language-models/ 32 32 Anthropic משיקה את Claude Opus 4.6 https://letsai.co.il/claude-opus-4-6/ https://letsai.co.il/claude-opus-4-6/#respond Sun, 08 Feb 2026 06:14:08 +0000 https://letsai.co.il/?p=69567 מי שעובד ברצינות עם בינה מלאכותית כבר מבין שהבעיה הגדולה של הדור הנוכחי אינה חוכמה. מודלי השפה יודעים לכתוב, לנתח, להסביר ולהרשים. הקושי האמיתי מתחיל כשמבקשים מהם לעבוד. לא לענות על שאלה אחת, אלא להחזיק תהליך. מחקר שנמשך שעות, מסמך שמתפתח לאורך גרסאות, קודבייס גדול, או משימה שמתפצלת לכמה כיוונים במקביל. בשלב הזה, גם המודלים […]

הפוסט Anthropic משיקה את Claude Opus 4.6 הופיע ראשון בLet's AI בינה מלאכותית

]]>
מי שעובד ברצינות עם בינה מלאכותית כבר מבין שהבעיה הגדולה של הדור הנוכחי אינה חוכמה. מודלי השפה יודעים לכתוב, לנתח, להסביר ולהרשים. הקושי האמיתי מתחיל כשמבקשים מהם לעבוד. לא לענות על שאלה אחת, אלא להחזיק תהליך. מחקר שנמשך שעות, מסמך שמתפתח לאורך גרסאות, קודבייס גדול, או משימה שמתפצלת לכמה כיוונים במקביל. בשלב הזה, גם המודלים החזקים ביותר מתחילים להיסדק. ההקשר נשחק, פרטים הולכים לאיבוד, שיקול הדעת מתערפל, והערך המעשי נשחק. זו לא בעיה של אינטליגנציה. זו בעיה של סיבולת, אמינות ויכולת להחזיק הקשר לאורך זמן. ההשקה של Claude Opus 4.6 מנסה להתמודד בדיוק עם נקודת הכשל הזו. לא דרך עוד קפיצה נקודתית ביכולת, אלא באמצעות שינוי עמוק באופן שבו מודל שפה מתכנן, זוכר, פועל וממשיך לעבוד גם כשהמשימה כבר אינה פשוטה. אם ההבטחות יעמדו במבחן המציאות, זהו צעד נוסף ומשמעותי בדרך שבה AI עובר מהדגמות מרשימות לעבודה אמיתית.

 

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

שינוי כיוון, לא רק שדרוג

Anthropic מציגה את Claude Opus 4.6 כגרסה המשופרת של המודל החזק ביותר שלה, אך הדגש הוא לא על שיפור נקודתי אלא על שינוי עמוק יותר באופן שבו המודל עובד לאורך זמן.

 

Opus 4.6 מתכנן בזהירות רבה יותר, שומר על רציפות במשימות אייג׳נטיות מורכבות, ומתפקד בצורה יציבה יותר בתוך קודבייסים גדולים. בנוסף, שופרו יכולות ביקורת הקוד והדיבוג, כולל היכולת של המודל לזהות טעויות שנוצרו במהלך העבודה ולא רק בדיעבד.

 

השוואת ביצועים רב־תחומית – Claude Opus 4.6 מול מודלים מובילים

Claude Opus 4.6 מול מודלים מובילים | Anthropic

 

התמונה שעולה מהבנצ׳מרקים אינה של יתרון נקודתי אחד, אלא של פרופיל יכולות רחב יותר: עבודה אייג׳נטית, שימוש בכלים, חיפוש, reasoning רב-תחומי ומשימות משרדיות. במובן הזה, השדרוג אינו מתבטא רק בציון כזה או אחר, אלא בהתרחבות היכולת של המודל להתמודד עם סוגים שונים של משימות במסגרת אותו מודל.

 

לצד זאת, זו הפעם הראשונה שמודל ממשפחת Opus מקבל חלון הקשר של מיליון טוקנים, גם אם בגרסת בטא. התמיכה בפלט של עד 128 אלף טוקנים מאפשרת להשלים משימות גדולות מבלי לפצל אותן לרצפים ארוכים של בקשות, מה שמקטין חיכוך ושומר על רציפות לוגית לאורך זמן.

 

חשוב לא פחות, Anthropic מדגישה שהיכולות האלו אינן מיועדות רק לעולמות הקוד. Opus 4.6 מוצג ככלי לעבודה יומיומית: ניתוחים פיננסיים, מחקר, עבודה עם מסמכים, גיליונות נתונים ומצגות, במיוחד דרך סביבת Cowork, שבה Claude יכול לבצע ריבוי משימות באופן אוטונומי כחלק מתהליך עבודה אחד.

 

 

חלון הקשר עצום, אבל הבעיה האמיתית היא הזיכרון

אז חלון הקשר של מיליון טוקנים הוא באמת אחד הנתונים הבולטים ביותר בהשקה של Claude Opus 4.6, אבל החשיבות האמיתית אינה בכמות המידע שניתן להזין למודל, אלא ביכולת שלו לשמור עליו ולהשתמש בו לאורך זמן. Anthropic מתייחסת במפורש לבעיה מוכרת בשם context rot, שבה איכות הביצועים יורדת ככל שהשיחה או המשימה מתארכת וההקשר הולך ומצטבר.

 

כדי להמחיש שיפור מהותי ולא רק הרחבת קיבולת, Anthropic מציגה נתונים ממבחן MRCR v2, הבודק את יכולת המודל לאתר פרטים חבויים בתוך כמויות גדולות של טקסט. בגרסת 8-needle עם הקשר של מיליון טוקנים, Claude Opus 4.6 מגיע ל-76 אחוזי הצלחה, לעומת 18.5 אחוז בלבד עבור Sonnet 4.5. גם בהקשר קטן יותר של 256 אלף טוקנים הפער חד במיוחד: Opus 4.6 מגיע ל-93 אחוז, בעוד Sonnet 4.5 נשאר סביב 10.8 אחוז.

 

Long-context retrieval - MRCR v2 (8-needle)

לא רק כמה טקסט נכנס, אלא כמה מידע באמת נשלף | Anthropic

 

הנתונים האלה מחדדים נקודה חשובה גם עבור קוראים שאינם טכניים. קיבולת לבדה אינה מספיקה. הערך האמיתי של חלון הקשר גדול מתחיל רק כאשר המודל מצליח לשלוף את הפרט הנכון בזמן הנכון, גם כשהוא קבור עמוק בתוך ההקשר. בלי יכולת כזו, עבודה אייג׳נטית ומשימות ארוכות פשוט אינן יכולות להתקיים בצורה יציבה.

מסוכנים תיאורטיים לצוותים עובדים

המונח agentic AI נשמע כבר לא מעט במחוזותינו, אך במקרים רבים הוא נשאר ברמת ההבטחה. הרעיון של סוכן אוטונומי שמקבל מטרה ומבצע אותה מקצה לקצה עדיין מתקשה לעבור מהדגמות מרשימות לעבודה יומיומית יציבה.

 

במקרה של Opus 4.6, אנשי Anthropic מנסים לעגן את הרעיון הזה לא רק ביכולות המודל, אלא בתשתית מוצרית שמדמה עבודה צוותית אמיתית.

 

Claude Code מקבל יכולת חדשה של agent teams, בשלב מחקרי, המאפשרת להפעיל כמה סוכנים במקביל הפועלים כצוות ומתאמים ביניהם משימות. היכולת הזו מיועדת במיוחד למשימות שמתפצלות לתת-משימות עצמאיות, כמו סקירת קודבייסים גדולים או ניתוח רכיבים שונים של מערכת מורכבת.

 

כשיש רציפות ותכנון, אפשר להתחיל לעבוד בצוותים של סוכנים

כשיש רציפות ותכנון, אפשר להתחיל לעבוד בצוותים של סוכנים | Anthropic

 

ההיגיון מאחורי צוותי סוכנים נשען על אותה יכולת בסיסית שנמדדת בבנצ’מרקים של Agentic Coding: תכנון, ביצוע ורציפות לאורך רצף פעולות. כאשר מודל מצליח להחזיק תהליך כזה בצורה עקבית, ניתן להתחיל לפרק אותו לתת-משימות מקבילות ולהפעיל עליו חלוקת עבודה, בדומה לצוות אנושי.

 

במקביל, Cowork מוצגת כסביבה שבה Claude יכול לקבל מטרה רחבה, למשל מחקר או בניית דוח, ולבצע אותה באופן אוטונומי תוך שילוב מסמכים, טבלאות וניתוחים. החידוש כאן אינו רק במודל עצמו, אלא באופן שבו הוא משתלב בתהליך עבודה שמדמה צוות מתואם, ולא עוזר בודד שפועל משימה אחר משימה.

שליטה בעומק החשיבה, לא רק בתוצאה

אחד החידושים הפרקטיים ביותר בהשקה של Claude Opus 4.6 הוא מנגנון ה-adaptive thinking. במקום בחירה בינארית בין הפעלה או כיבוי של חשיבה מורחבת, המודל יכול כעת להחליט בעצמו מתי יש צורך בהעמקה ומתי ניתן לפעול במהירות. שאלות פשוטות זוכות למענה זריז, בעוד משימות מורכבות יותר מקבלות טיפול יסודי וזהיר יותר.

 

לא כל משימה דורשת אותו עומק חשיבה

לא כל משימה דורשת אותו עומק חשיבה | Anthropic

 

היכולת הזו מקבלת משמעות מיוחדת כאשר בוחנים משימות הדורשות חשיבה רציפה על פני הקשר ארוך. מדדים של reasoning בהקשר רחב, כמו Graphwalks (מעקב לוגי רב־שלבי), מדגישים שלא כל משימה זקוקה לאותה רמת עומק, אך כאשר נדרש תכנון מורכב לאורך רצף של צעדים, איכות החשיבה עצמה הופכת לגורם מכריע. כאן עולה לא רק השאלה כמה המודל מסוגל לחשוב לאורך זמן, אלא מתי נכון שיפעיל חשיבה עמוקה ומתי לא.

 

ממשק הבחירה של מודלי Claude בתוך סביבת הצ’אט

ממשק הבחירה של מודלי Claude בתוך סביבת הצ’אט

 

לצד ההחלטה האוטומטית של המודל, Anthropic מוסיפה גם שליטה ידנית למפתחים דרך ארבע רמות effort (מאמץ): low, medium, high שהיא ברירת המחדל, ו-max. השליטה מתבצעת דרך ה-API באמצעות פרמטר פשוט (effort/) ומאפשרת לכוון את האיזון בין איכות, זמן תגובה ועלות. החברה גם מדגישה במפורש שחשיבה עמוקה מדי במשימות פשוטות עלולה להוסיף עלות ועיכוב מיותרים, ולכן מומלץ להתאים את רמת המאמץ לאופי המשימה.

 

במובן הזה, מדובר בניסיון להפוך את “החשיבה” של מודל שפה ממשהו מופשט ובלתי נראה לפרמטר תפעולי שניתן לנהל, לכוון ולהתאים להקשר.

אמינות ובטיחות כחלק מהליבה

בניגוד להשקות רבות בתעשייה, נושא הבטיחות אינו מוצג כאן כנספח או כהערת שוליים. לפי החומרים שהוצגו, Claude Opus 4.6 נבדק על מגוון רחב של הערכות בטיחות, והראה שיעור נמוך של התנהגויות לא מיושרות (Misalignment). בין ההתנהגויות שנבדקו נכללות הטעיה, חנופה למשתמש (Sycophancy), עידוד דלוזיות ושיתוף פעולה עם שימוש לרעה.

 

פחות התנהגות לא מיושרת, יותר יציבות לאורך זמן

פחות התנהגות ״לא מיושרת״ תביא יותר יציבות לאורך זמן | Anthropic

 

הנתונים מצביעים על מגמת שיפור עקבית לאורך דורות המודל. בגרף “Overall misaligned behavior”, המודל Opus 4.6 מגיע לרמה הנמוכה ביותר מבין מודלי Claude האחרונים, מה שמעיד על ירידה מתמשכת בשכיחות של התנהגויות בעייתיות. במקביל, מצוין כי שיעור ה-over-refusals הוא הנמוך ביותר, כלומר המודל נוטה פחות לסרב לבקשות לגיטימיות כחלק מתפקוד שוטף.

 

בהקשר של סוכנים אוטונומיים, המשמעות חורגת משאלות של ערכים או רגולציה. כאשר מודל אמור לפעול לאורך זמן, לקבל החלטות ביניים ולהניע תהליכים מורכבים, אמינות התנהגותית הופכת לתנאי בסיס לאמינות תפעולית.

בנצ’מרקים כהקשר, לא כהבטחה

Anthropic מציגה שורה של הישגים בבנצ’מרקים שונים, בהם Terminal-Bench 2.0 למשימות agentic, Humanity’s Last Exam להסקה רב-תחומית, ו-BrowseComp לאיתור מידע קשה ברשת. בין המדדים הללו, בולט במיוחד GDPval-AA, שמכוון לא להערכת ידע מופשט אלא לביצועי המודל במשימות עבודה בעלות ערך כלכלי, בתחומים כמו פיננסים, משפט וניתוח עסקי.

 

מדידת ערך בעבודה אמיתית, לא רק בביצועים ניסיוניים

מדידת ערך בעבודה אמיתית, לא רק בביצועים ניסיוניים | Anthropic

 

ב-GDPval-AA, הנתונים מוצגים בסולם Elo , המאפשר השוואה יחסית בין מודלים על בסיס ביצועי ידע יישומיים או בפשטות, כמה הוא טוב ביחס למודלים אחרים באותו מבחן. Opus 4.6 מוביל במדד הזה בהפרש ניכר ביחס לדורות הקודמים ולחלק מהמודלים המתחרים, מה שמחזק את הטענה שהשיפור אינו מוגבל ליכולות קוד או מחקר, אלא נוגע גם לעבודה מקצועית יומיומית.

 

יחד עם זאת, גם לפי האופן שבו ההשקה עצמה ממוסגרת, הבנצ’מרקים אינם מוצגים כהוכחה מספקת בפני עצמה. הם נועדו לספק הקשר ולתמוך בסיפור רחב יותר. עבור משתמשים, הערך האמיתי אינו נמדד בציון כזה או אחר, אלא ביכולת להשלים משימות ארוכות עם פחות תיקונים, פחות אובדן הקשר ופחות טעויות מצטברות לאורך הדרך.

אקסל ומצגות: נקודת המפגש עם היום יום

חלק מרכזי בהשקה של Claude Opus 4.6 הוא ההשקעה בכלי עבודה יומיומיים, ולא רק ביכולות מודל מופשטות. Claude in Excel קיבל שדרוגים משמעותיים, כולל יכולות compaction של הקשר (סיכום ודחיסת הקשר ישן), עבודה עם כמה קבצים במקביל, עיצוב מותנה, טבלאות ציר ואימות נתונים. המודל מתואר ככזה שמתכנן לפני פעולה, מבין מידע לא מובנה ומסוגל לבצע שינויים מורכבים במהלך אחד, בלי להתפרק לרצף ארוך של שלבים ידניים.

 

בלי קוהרנטיות לאורך זמן, אין עבודה יומיומית יציבה

קוהרנטיות לאורך זמן מאפשרת עבודה יומיומית יציבה | Anthropic

 

היכולות האלו נשענות על תכונה בסיסית אך קריטית – שמירה על קוהרנטיות לאורך זמן. מדדים של long-term coherence, כמו Vending-Bench 2, בוחנים האם מודל מצליח להחזיק הקשר, כוונה ויעד לאורך רצף פעולות, גם כשהמשימה מתארכת ומסתעפת. זו בדיוק היכולת שנדרשת כאשר עובדים על גיליון נתונים מורכב או מבצעים סדרת שינויים תלויים זה בזה. אותה רציפות שנמדדת כאן כמדד מחקרי היא בדיוק מה שנדרש כשעובדים על קובץ אקסל שמתפתח לאורך עשרות פעולות תלויות.

 

במקביל, Claude in PowerPoint, שנמצא בשלב מחקרי, מאפשר לבנות ולעדכן מצגות תוך התאמה לתבניות קיימות, כולל שמירה על פריסות, פונטים וסטנדרטים מותגיים. הבחירה להשקיע בכלי אופיס מצביעה על כיוון ברור שבו עבור ארגונים רבים, אימוץ בינה מלאכותית אינו מתחיל במעבדה או ב-IDE, אלא דווקא במשימות היומיומיות שבהן רציפות, עקביות ודיוק הם תנאי בסיס.

תמחור, מגבלות וקרדיט מתנה

אחרי שמבינים מה המודל יודע לעשות בפועל, השאלה הבאה והבלתי נמנעת היא כמה זה עולה כשמריצים את זה בפרודקשן. לפי ההכרזה הרשמית, התמחור הבסיסי של Claude Opus 4.6 נשאר ללא שינוי: 5 דולר למיליון טוקנים בקלט ו-25 דולר למיליון טוקנים בפלט. יחד עם זאת, יש כאן גבול ברור. מעל 200 אלף טוקנים נכנס לתוקף תמחור פרימיום של 10 דולר לקלט ו-37.5 דולר לפלט למיליון טוקנים.

 

בנוסף, לארגונים עם דרישות רגולציה, ציות או אבטחת מידע, קיימת אפשרות להרצה ב-US-only inference במחיר גבוה בכעשרה אחוזים. המשמעות היא שעבודה עם חלון הקשר עצום היא לא רק החלטה טכנולוגית, אלא גם החלטה תקציבית שיש לנהל במודע.

 

במקביל, Anthropic מחלקת למנויי Pro ו-Max קרדיטים של 50 דולר לשימוש נוסף. הקרדיט ניתן לניצול באמצעות מנגנון Extra Usage, אותו מפעילים דרך Settings → Usage בחשבון שלכם (ואז תלחצו Claim). לאחר הפעלת Extra Usage, ובמידה והגעתם ללימיט שלכם, ניתן להשתמש בקרדיטים לצורך עבודה ממושכת יותר עם Opus 4.6, פרויקטים גדולים ב-Cowork וכלים נוספים. הקרדיט מוגבל בזמן של 60 יום, ונועד לאפשר התנסות מעשית במשימות ארוכות שבהן היתרון של המודל בא לידי ביטוי.

 

 

 

מודל שעומד במבחן הסיבולת

אם חוזרים לרגע שתואר בפתיח, אותו שלב שבו משימה ארוכה מתחילה להתפרק, ההשקה של Claude Opus 4.6 מציעה תשובה ממוקדת וברורה. לא פתרון קסם, אלא שיפור שיטתי ביכולת של מודל שפה להחזיק הקשר, לנהל מורכבות ולהישאר אמין גם כשהעבודה נמשכת, מסתעפת ומכבידה.

 

זה עדיין לא סוף הדרך. נותרו שאלות פתוחות סביב עלות, זמינות ויישום בעולם שהוא לא תמיד מסודר או צפוי. אבל אם יש מסר אחד שעולה בבירור מההשקה והיכולות של Opus 4.6, הוא שהמרוץ כבר אינו עוסק רק באיכות התשובה הראשונה, אלא ביכולת להחזיק תהליך שלם, מתחילתו ועד סופו. 

הפוסט Anthropic משיקה את Claude Opus 4.6 הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/claude-opus-4-6/feed/ 0
הקמפיין של Anthropic והמאבק על עתיד הפרסומות ב-AI https://letsai.co.il/claude-ad-free/ https://letsai.co.il/claude-ad-free/#respond Fri, 06 Feb 2026 07:58:02 +0000 https://letsai.co.il/?p=69513 בעוד ענקיות הטכנולוגיה מחפשות דרכים לייצר רווחים מצ’אטבוטים, עולה שאלת האמון: האם העוזר האישי שלנו עובד עבורנו או עבור המפרסם? הכתבה סוקרת קמפיין סאטירי נוקב (סריה של ארבעה סרטונים) החושף את הסכנות שבשילוב פרסומות בשיחות AI, ומציגה את הגישה הנגדית של חברת Anthropic, המבקשת לשמר את Claude ככלי עבודה נקי מהטיות מסחריות, תוך הגדרת מודל […]

הפוסט הקמפיין של Anthropic והמאבק על עתיד הפרסומות ב-AI הופיע ראשון בLet's AI בינה מלאכותית

]]>
בעוד ענקיות הטכנולוגיה מחפשות דרכים לייצר רווחים מצ’אטבוטים, עולה שאלת האמון: האם העוזר האישי שלנו עובד עבורנו או עבור המפרסם? הכתבה סוקרת קמפיין סאטירי נוקב (סריה של ארבעה סרטונים) החושף את הסכנות שבשילוב פרסומות בשיחות AI, ומציגה את הגישה הנגדית של חברת Anthropic, המבקשת לשמר את Claude ככלי עבודה נקי מהטיות מסחריות, תוך הגדרת מודל כלכלי חדש המבוסס על “מסחר אייג׳נטלי” ביוזמת המשתמש.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

כשהבינה המלאכותית הופכת לאיש מכירות חלקלק

תארו לעצמכם את הסיטואציה הבאה: אתם מנהלים שיחה עמוקה עם העוזר האישי שלכם על קשיים בתקשורת עם ההורים. ה-AI מקשיב, מגלה אמפתיה, מציע טכניקות להקשבה פעילה, ופתאום, ללא התראה, עובר לטון שיווקי אגרסיבי: “ואם הקשר לא ניתן לתיקון, למה שלא תמצא קשר רגשי באתר ‘Golden Encounters’ – אתר ההיכרויות שמחבר בין ‘גורים רגישים’ ל’לביאות שואגות’? רוצה שאבנה לך פרופיל?”

 

זה אולי משעשע, אבל זה לא תסריט דמיוני לחלוטין, אלא חלק מסדרת סרטונים סאטיריים המציגים את מה שמכונה “שחיתות מסחרית” (Commercial Corruption) של מרחב הטיפול הדיגיטלי. הסרטונים הללו, המתעדים אינטראקציות שמתחילות כעזרה כנה ומסתיימות בקידום מוצרים הזויים כמו מדרסים להגבהה ל”מלכים נמוכים” או הלוואות “מהירות” בריבית של 400%, מציבים מראה מטרידה מול תעשיית הבינה המלאכותית. 

 

ואת כל זה מסכמת שורת מחץ אחת, שמופיעה בסיום הקמפיין: “Ads are coming to AI. But not to Claude.” זו לא רק סיסמה פרסומית, אלא הצהרת עמדה ברורה על המקום שבו Anthropic מסמנת קו אדום.

 

כשהמודל העסקי מתנגש עם האמת

הקמפיין הסאטירי הזה אינו מיועד רק להצחיק – הוא תוקף את הלב הפועם של הדילמה הטכנולוגית המודרנית דרך השאלה המהדהדת בשיר של הראפר Dr. Dre (ד”ר דרה) בסוף כל סרטון: “?What’s the difference between me and you”.

 

זו לא רק שורת מחץ, אלא מכה ישירה ומכוונת היטב מתחת לחגורה של המתחרה הגדולה, OpenAI. בזמן שסם אלטמן והצוות שלו שומרים על עמימות בנוגע למודלים עתידיים של פרסום, Anthropic מנצלת את הבמה כדי להציב קו אדום ברור ועל הדרך לייצר מניפולציה מתובלת בפרובוקציה.

 

בניגוד לחיפוש רגיל שבו התרגלנו לסנן “תוצאות ממומנות”, שיחה עם AI היא מרחב אינטימי וחשוף. אם הבינה המלאכותית תתומרץ להטות את תשובותיה כדי למכור לנו מוצר, היא תפסיק להיות “עוזרת” ותהפוך לסוכנת מכירות חלקלקה במסווה של יועצת אובייקטיבית.

 

מודל הלוח הנקי של Anthropic

בתוך הכאוס הזה, חברת Anthropic, המפתחת של Claude, נוקטת עמדה חד משמעית. בהכרזה רשמית תחת הכותרת “קלוד הוא מרחב למחשבה”, מבהירה החברה כי שיחות עם בינה מלאכותית אינן מקום לפרסום.

 

החזון של החברה הוא להשאיר את קלוד כמרחב נקי, בדומה ללוח או מחברת ריקה – מקומות שבהם אין פרסומות שמסיחות את הדעת. המטרה היא שקלוד יפעל באופן בלתי משתמע לשני פנים לטובת המשתמש.

 

איך זה עובד בפועל? במקום להסתמך על כספי מפרסמים שיכתיבו את התוכן, המודל העסקי נשען על מנויים בתשלום וחוזים ארגוניים. כך, התמריץ היחיד של המודל הוא לספק את התשובה המועילה והמדויקת ביותר, ולא להוביל את המשתמש לרכישה מסוימת.

 

ומה אומרים ב-OpenAI?

ב-OpenAI דוחים את האופן שבו הקמפיין של Anthropic ממסגר את הדיון ויצאו למתקפת נגד משולבת. זה התחיל בקייט ראוץ’, מנהלת השיווק של החברה, שהדגישה את הפן הדמוקרטי – לטענתה, מודל חינמי המבוסס על מקורות הכנסה חיצוניים הוא הדרך היחידה להבטיח נגישות רחבה לבינה מלאכותית, במיוחד עבור אלו שידם אינה משגת לשלם עבור מנויי פרימיום.

 

אלא שהטון הפך מהר מאוד למתקפה חזיתית מצד ההנהלה הבכירה. סם אלטמן, מנכ”ל OpenAI, כינה את הקמפיין של Anthropic “לא ישר באופן מובהק” (clearly dishonest) והאשים את החברה ב”דיבור כפול” (doublespeak). אלטמן טען כי Anthropic תוקפת “מודלים תיאורטיים” של פרסום ש-OpenAI עצמה לעולם לא תטמיע, וסימן את Claude כ”מוצר יקר לאנשים עשירים”. כדי להמחיש את הפער, הוא עקץ וציין כי “יותר טקסנים משתמשים ב-ChatGPT בחינם מאשר סך כל המשתמשים בקלוד בארה”ב”.

 

אלטמן מאשים את Anthropic בפרובוקציה ומניפולציה

אלטמן מאשים את Anthropic בפרובוקציה ומניפולציה

במקביל, גרג ברוקמן, ממייסדי OpenAI, ניסה לסדוק את תדמית ה”טהרנות” של Anthropic. הוא הצביע על סעיף במניפסט שלהם שבו הם מציינים כי אם יצטרכו “לבחון מחדש את הגישה” הם יהיו שקופים לגבי זה. ברוקמן הציב אתגר ישיר למנכ”ל Anthropic, דאריו אמודיי, ותהה ב-X האם הוא מוכן להתחייב באופן מוחלט לעולם לא למכור את תשומת הלב של המשתמשים למפרסמים, או שמא החברה השאירה לעצמה “דלת אחורית” פתוחה לשינוי המודל בעתיד.

 

ברוקמן מצביע על הפרצה במניפסט של Anthropic

ברוקמן מצביע על הפרצה במניפסט של Anthropic

האם יש לנו בכלל ברירה?

אבל מעבר לוויכוח האידיאולוגי, עולה שאלת המציאות. העלויות של הרצת מודלי שפה הן אסטרונומיות, ויש מי שטוען שהמודל החינמי של היום הוא סוג של אחיזת עיניים, בדומה לימיה הראשונים של Uber, שסבסדה נסיעות בהפסד כדי לצמוח. אם המשתמש לא ישלם דרך פרסומות, הוא ייאלץ לשלם את המחיר האמיתי של השירות, שעלול להגיע למאות דולרים בחודש. במצב כזה, ה-AI יהפוך מ”מהפכה דמוקרטית” למוצר פרימיום לעשירים בלבד.

 

נקודה חשובה נוספת לתת לה דגש היא שבעולם ה-Performance Marketing יש מי שרואה בשילוב הזה הזדמנות. בניגוד לחיפוש בגוגל או לפיד בפייסבוק, ה-AI מבין את הקונטקסט שלנו לעומק. פרסומת בצ’אט לא חייבת להיות “מפגע ויזואלי”, היא יכולה להיות הצעה רלוונטית ומדויקת להפליא שמופיעה בדיוק כשאנחנו צריכים אותה. עבור יזמים ואנשי Growth, מדובר ב”ג’ונגל” חדש של הזדמנויות, שבו היכולת לחבר בין שיחה למסחר היא המפתח לכלכלה החדשה.

 

בסוף, השאלה היא פשוטה: האם אנחנו מעדיפים לשלם 200 דולר בחודש על “מרחב סטרילי”, או לקבל את הטכנולוגיה החזקה בעולם בחינם, תמורת תוכן שיווקי שבאמת רלוונטי לנו?

חדשנות בשירות המשתמש דרך “מסחר אייג׳נטלי” 

האם זה אומר שקלוד לעולם לא יעזור לנו לקנות דברים? לא בדיוק. כאן טמונה החדשנות המושגית. החברה מפרידה בין “פרסום” לבין “מסחר אייג׳נטלי” (Agentic Commerce).

 

במודל הפרסומי המסורתי, המפרסם הוא זה שיוזם את הקשר (Push). ב”מסחר אייג׳נטלי”, המשתמש הוא זה שיוזם את הפעולה (Pull). לדוגמה, אם תבקשו מקלוד לחקור עבורכם נעלי ריצה או להשוות שיעורי משכנתא, הוא יעשה את זה. בתור הסוכן שלכם, הוא יסרוק את המידע ויציג לכם השוואה אובייקטיבית המבוססת על הצרכים שתיארתם, ללא עמלות מצד היצרנים שיגרמו לו להעדיף נעל אחת על פני אחרת.

אמון כנכס אסטרטגי

הבחירה של Anthropic היא לא רק מוסרית, היא אסטרטגית. בעידן שבו הבינה המלאכותית הופכת לשכבת התשתית של העבודה והיצירה שלנו, “אמון” הופך למטבע היקר ביותר. חברה שתוכל להבטיח למשתמשיה שהיא לא מוכרת את תשומת הלב שלהם או את הנתונים שלהם למרבה במחיר, כנראה תזכה בנאמנות לטווח ארוך.

 

המשמעות רחבה יותר. מדובר בניסיון להגדיר מחדש את האינטרנט. אם העשור האחרון היה שייך לכלכלת תשומת הלב (Attention Economy), שבה המשתמש היה המוצר, העידן החדש של ה-AI מנסה להחזיר את המשתמש למרכז כבעל הבית.

לשמור על ה-AI “אנושי”

הסרטונים הסאטיריים על “השחיתות המסחרית” מזכירים לנו שקל מאוד לקלקל את הפוטנציאל האדיר של הבינה המלאכותית. ללא “חוקה” ברורה (כמו ה-Constitution שמנחה את קלוד), המודלים הללו עלולים להפוך למניפולטורים הגדולים ביותר בהיסטוריה.

 

הבחירה להשאיר את ה-AI נקי מפרסומות היא הכרחית כדי לשמר אותו ככלי למחשבה עמוקה, פתרון בעיות ויצירתיות. בסופו של יום, אנחנו רוצים שהעוזר האישי שלנו יעזור לנו לחשוב טוב יותר, לא רק לקנות יותר. משתמשים לא אמורים לתהות אם ה-AI שלהם עוזר להם או רק מנסה למכור להם תכשיטי “Lunar Memento”.

מה אפשר ללמוד מזה?

הצפייה בסרטונים האלו, שמציגים לטעמי סיטואציות אבסורדיות נוקבות ומצחיקות, נותנת תחושה של מעין דקירה של הבנה לגבי המרחב הדיגיטלי החדש שאנחנו בונים. זה גרם לי להבין שהאינטימיות הזו שאנחנו מייצרים עם הבינה המלאכותית היא חרב פיפיות. כשאנחנו פותחים את הלב או את התוכניות העסקיות שלנו מול מסך, אנחנו פגיעים הרבה יותר מאשר בשאילתת חיפוש יבשה בגוגל. שם אנחנו מצפים למודעות, כאן אנחנו מצפים להקשבה.

 

אבל כאן נכנסת המציאות הכלכלית המורכבת. אנחנו חייבים להבין שבעולם הטכנולוגי של היום, ייתכן שפשוט אין ברירה אחרת. העלויות העצומות של תחזוקת המודלים הללו מחייבות מודל כלכלי בר-קיימא. אם לא נהיה מוכנים לשלם את המחיר האמיתי של השירות, מחיר שעלול להיות גבוה משמעותית ממה שהתרגלנו, הפרסומות יהיו הדרך היחידה להשאיר את המהפכה הזו נגישה לכולם.

 

בסופו של יום, אין “ארוחות חינם” בטכנולוגיה. כדי לזכות באובייקטיביות מוחלטת ובמרחב נקי באמת למחשבה, אנחנו צריכים לקבל החלטה כואבת: האם אנחנו מוכנים להיות הלקוחות שמשלמים על השירות, או שנשלים עם היותנו המוצר שנמכר למפרסמים? המפתח הוא ביוזמה ובשקיפות. אני רוצה לדעת שהעוזר הדיגיטלי שלי עובד בשבילי. השאלה היא כמה אהיה מוכן לשלם, ומה הוא באמת המחיר של שמירה על התשובה כאמת מקצועית, ולא כמניפולציה שמתחפשת לעצה כנה.

הפוסט הקמפיין של Anthropic והמאבק על עתיד הפרסומות ב-AI הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/claude-ad-free/feed/ 0
המדריך המלא ל-Gemini Gems https://letsai.co.il/gemini-gems-guide/ https://letsai.co.il/gemini-gems-guide/#comments Tue, 03 Feb 2026 07:37:26 +0000 https://letsai.co.il/?p=69161 מהפכת הבינה המלאכותית היוצרת (GenAI) כבר נמצאת בשלב שבו אנחנו לא רק שואלים שאלות בתיבת צ’אט ריקה, אלא בונים לעצמנו “סוכנים” – עוזרים חכמים שזוכרים את ההוראות שלנו, מכירים את הקבצים שלנו ומתמחים בתחומים ספציפיים. בלב המערכת של גוגל עומדים ה-Gems, כלי המאפשר לכל משתמש להפוך את המודל הגנרי לעובד מומחה ומותאם אישית. המדריך הזה […]

הפוסט המדריך המלא ל-Gemini Gems הופיע ראשון בLet's AI בינה מלאכותית

]]>
מהפכת הבינה המלאכותית היוצרת (GenAI) כבר נמצאת בשלב שבו אנחנו לא רק שואלים שאלות בתיבת צ’אט ריקה, אלא בונים לעצמנו “סוכנים” – עוזרים חכמים שזוכרים את ההוראות שלנו, מכירים את הקבצים שלנו ומתמחים בתחומים ספציפיים. בלב המערכת של גוגל עומדים ה-Gems, כלי המאפשר לכל משתמש להפוך את המודל הגנרי לעובד מומחה ומותאם אישית. המדריך הזה יספק לכם את כל הכלים לבנייה, ניהול ואופטימיזציה של ה-Gems שלכם.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

משיחה אקראית לעוזר קבוע

בעבר, כל אינטראקציה עם AI התחילה מאפס (“דף חלק”). הייתם צריכים להסביר מחדש מי אתם, מהו הטון הרצוי ומהו ההקשר העסקי. ה-Gems נועדו לשבור את המעגל הזה על ידי יצירת זהות קבועה.

 

Gem הוא עוזר דיגיטלי בעל “אישיות מקצועית”: הוא יודע מה התפקיד שלו, הוא פועל לפי מתודולוגיה קבועה שהגדרתם לו, והוא מחובר למקורות הידע האמיתיים שלכם. עבור משתמשים רציניים, זהו ההבדל בין “לבקש עזרה” לבין ניהול צוות מומחים דיגיטלי שעובד בשיטה שלכם.

ניהול ידע דינמי

אחד ההבדלים הקריטיים ביותר בין Gems לבין פתרונות מקבילים (כמו Custom GPTs) הוא אופן הטיפול במידע. בעוד שבמערכות אחרות הידע הוא “סטטי” (העליתם קובץ והוא נשאר כפי שהוא), ה-Gems נהנים מהדינמיות של ה-Google Drive.

  • סנכרון חי: כשאתם מקשרים Gem לתיקייה או למסמך בדרייב, הוא “חי” אותם. אם עדכנתם את מסמך האפיון או את דוח המכירות, ה-Gem יתבסס על המידע המעודכן ביותר ברגע השאלה, ללא צורך בהעלאה ידנית מחדש.

  • מולטי-מודאליות מלאה: ה-Gems אינם מוגבלים לעיבוד טקסט בלבד, אלא מהווים ארגז כלים רב-תחומי לביצוע משימות מורכבות. המערכת מסוגלת לנתח סרטוני וידאו ארוכים ולינקים ישירים מ-YouTube לצורך הפקת תובנות, סיכומים ומחקר עומק. בנוסף ליכולות עיבוד וייבוא קוד ישיר, ה-Gem מאפשר ניתוח תמונות מתקדם באמצעות NanoBanana ויצירת תוכן וידאו מקורי בעזרת Veo. שילוב של כלים אלו עם ממשק ה-Canvas מאפשר לסוכן להפיק תוצרים מובנים כמו אינפוגרפיקות, מצגות ומסמכים מורכבים, ובכך להפוך משותף למחשבה לשותף מלא לתהליך.

 

מולטי-מודאליות ככלי עבודה מתקדם

מולטי-מודאליות ככלי עבודה מתקדם

Gems מול Custom GPTs: השוואה תמציתית

כדי להבין את המפה הטכנולוגית, חשוב להכיר את ההבדלים בגישות:

 

טבלת השוואה

Gemini Gems מול Custom GPTs

מדריך טכני: שלושת הנדבכים לבניית Gem מנצח

בניית Gem היא תהליך פשוט, אך דורשת מחשבה אסטרטגית. כל סוכן נשען על שלושה יסודות:

1. זהות (Identity)

הגדירו ל-Gem שם ותפקיד ברור. במקום “כותב תוכן”, הגדירו אותו כ-“עורך לשוני בכיר במגזין טכנולוגי, מומחה בפישוט מושגים מורכבים”.

2. הנחיות זהב (Instructions)

כאן מתבצעת רוב העבודה. כדי להגיע לתוצאות ברמה גבוהה, השתמשו בשני עקרונות:

  • הוראות לפי דוגמה (Few-Shot): הדביקו בתוך שדה ההוראות דוגמה לתוצר מושלם שכתבתם בעבר. המודל ישכפל את הסטנדרט הזה בכל פעם מחדש.

  • הוראות לפי תהליך (Chain of Thought): אל תגדירו רק את התוצאה, אלא את שלבי העבודה (שלב 1: סרוק, שלב 2: זהה חריגות, שלב 3: נסח מסקנות).

3. חיבור ידע (Knowledge)

הפעילו את תוספי ה-Google Workspace וחברו את ה-Gem לתיקיות הרלוונטיות בדרייב. ודאו שההרשאות לקבצים תואמות למי שאמור להשתמש ב-Gem. ודאו שהרשאות הקבצים בדרייב תואמות למי שאמור להשתמש ב-Gem כדי למנוע חשיפת מידע רגיש.

טיפ! כפתור ה-Magic Rewrite: השתמשו באייקון הניצוצות לאחר שכתבתם טיוטה ראשונית של הוראות. גוגל תשתמש בבינה מלאכותית כדי לשכתב את הפרומפט שלכם למבנה לוגי שג’מיני מבין בצורה הטובה ביותר.

 

כפתור הקסם לשיפור הפרומפט

כפתור הקסם לשיפור הפרומפט

כך תבנו את ה-Gem הראשון שלכם (צעד אחר צעד)

תהליך היצירה של Gem הוא פשוט ואינטואיטיבי, אך דורש תשומת לב לפרטים כדי להבטיח שהסוכן יפעל בדיוק לפי הציפיות שלכם. עקבו אחרי ששת השלבים שהופכים רעיון לסוכן עובד:

1. כניסה לאזור ה-Gems בסרגל הצידי של Gemini, אתרו את קטגוריית ה-Gems ולחצו עליה כדי לפתוח את תפריט הניהול.

2. פתיחת Gem חדש בתוך תפריט ה-Gems, לחצו על כפתור ה-“New Gem” כדי להתחיל בתהליך האפיון של הסוכן החדש שלכם.

3. הגדרת שם, תיאור והוראות זהב (Instructions) כאן אתם בונים את “המוח” של הסוכן:

  • שם ותיאור: תנו לסוכן שם שמגדיר את תפקידו (למשל: “מנתח נתונים עסקיים”).

  • Instructions: הגדירו לו איך הוא צריך לחשוב ולעבוד. השתמשו בטכניקות של הוראות לפי דוגמה (מתן מודל לחיקוי) והוראות לפי תהליך (חלוקת המשימה לשלבים לוגיים).

4. שיפור אוטומטי (Magic Rewrite) אל תתאמצו לכתוב את הפרומפט המושלם בניסיון הראשון. לחצו על כפתור ה-Rewrite, וג’מיני ישדרג את ההוראות שלכם למבנה מקצועי שהמודל מגיב אליו בצורה הטובה ביותר.

5. חיבור וטעינת בסיס ידע (Knowledge) זהו השלב שהופך את ה-Gem למומחה למידע שלכם. ג’מיני מאפשר גמישות רבה בבחירת המקורות:

  • העלאת קבצים: טעינת מסמכים ישירות מהמחשב.

  • Add from Drive: קישור תיקיות או מסמכים מהדרייב המסתנכרנים בזמן אמת.

  • Photos, Import code & NotebookLM: העלאת תמונות, ייבוא קוד ישיר או סנכרון עם NotebookLM להעמקת בסיס הידע.

6. שמירה ושימוש לחצו על Save בפינה העליונה. הסוכן שלכם מוכן! הוא יופיע בסרגל הצידי ויוכל לנתח סרטוני יוטיוב, לכתוב קוד, לייצר תמונות או לסכם דוחות בתוך שניות.

 

בניית Gem צעד אחרי צעד

תרחישי שימוש (Use Cases) לארגונים

כדי להתחיל לעבוד כבר עכשיו, ריכזתי עבורכם 5 סוגי Gems המותאמים לצרכים ארגוניים נפוצים. כל Gem בנוי לפי עקרונות “הנחיות הזהב”: הגדרת זהות, עבודה לפי שלבים (תהליך), ושימוש בדוגמאות (Few-shot). כמובן שאלה רק דוגמאות – קחו את זה לעולמות שלכם ותעשו התאמות.

1. מנתח מפרטים טכניים (Technical Architect Gem)

הייעוד: וידוא עקביות בין מסמכי אפיון, זיהוי כשלים לוגיים והפקת סיכומי מנהלים טכניים.

  • זהות: “אתה ארכיטקט מערכות בכיר עם 20 שנות ניסיון. המומחיות שלך היא פירוק מפרטים מורכבים לדרישות ברורות וזיהוי סיכונים טכניים”.

  • ידע: חיבור לתיקיית “Specifications” ב-Google Drive.

  • הנחיות זהב (תהליך):

    “בכל פעם שאעלה דרישה חדשה או אפנה אותך למסמך, פעל כך:

    1. סרוק את המסמך והשווה אותו למפרטי המערכת הקיימים בדרייב.

    2. זהה 3 נקודות של חוסר עקביות או סיכונים פוטנציאליים.

    3. נסח טבלת השוואה בין המצב הקיים לדרישה החדשה.

    4. סיים בסיכום של ‘שורה תחתונה’ עבור צוות הפיתוח”.

2. שומר סף של שפת המותג (Brand Voice Guardian)

הייעוד: הבטחה שכל תוכן שיווקי, מייל או פוסט עומד בסטנדרט הכתיבה והטון של הארגון.

  • זהות: “אתה מנהל הקריאייטיב והעורך הראשי של המותג. התפקיד שלך הוא להפוך טקסטים יבשים לתוכן מרתק ששומר על ערכי החברה”.

  • ידע: קובץ “Style Guide” ומסמך “Brand Persona” בדרייב.

  • הנחיות זהב (דוגמה/Few-shot):

    “הנה דוגמה לפוסט מצוין שכתבנו בעבר: [הדבקת דוגמה]. בכל פעם שאשלח לך טיוטה, שכתב אותה כך שתתאים לאורך של הדוגמה, לטון הדיבור המקצועי אך נגיש, והימנע משימוש במילים גנריות כמו ‘חדשני’ או ‘מהפכני’. ודא שהקריאה לפעולה תמיד מניעה לרישום לניוזלטר”.

3. עוזר PMO לניהול פרויקטים (Project Sync Gem)

הייעוד: מעקב אחר משימות, סנכרון בין צוותים והפקת דוחות סטטוס דינמיים המבוססים על קבצים מעודכנים.

  • זהות: “אתה מנהל פרויקטים (PMO) מיומן. אתה מצטיין בארגון מידע מפוזר והפיכתו לתוכנית עבודה אופרטיבית”.

  • ידע: תיקיית “Project Status” הכוללת קבצי Sheets ו-Docs מעודכנים.

  • הנחיות זהב (תהליך):

    “בכל יום ראשון בבוקר, סרוק את קבצי הסטטוס בתיקייה וספק לי:

    1. רשימת משימות בפיגור (Critical Path).

    2. עדכון על אבני דרך שהושלמו בשבוע החולף.

    3. טיוטת מייל לעדכון הנהלה הכוללת גרף התקדמות באחוזים”.

4. מפיק תובנות מפגישות (Meeting Insights Specialist)

הייעוד: ניתוח הקלטות וידאו של פגישות (דרך יוטיוב או העלאת קובץ) והוצאת משימות לביצוע.

  • זהות: “אתה עוזר אישי אסטרטגי. התפקיד שלך הוא להקשיב למה שנאמר בין השורות ולזקק את המהות של כל פגישה”.

  • הנחיות זהב (תהליך):

    “לאחר שאשלח לך לינק להקלטת הפגישה או קובץ וידאו, בצע את הפעולות הבאות:

    1. סכם את 5 הנושאים העיקריים שנדונו.

    2. צור רשימת משימות (Action Items) הכוללת את שם האחראי לכל משימה.

    3. זהה נקודות של חוסר הסכמה שנותרו פתוחות.

    4. נסח הודעת סיכום קצרה ל-Slack עבור כל המשתתפים”.

5. אנליסט נתונים עסקיים (Data Insights Lead)

הייעוד: ניתוח טבלאות נתונים מורכבות, הרצת קוד לחישובים והצגת מגמות עסקיות.

  • זהות: “אתה דאטה סיינטיסט המומחה בניתוח נתונים עסקיים. אתה יודע להפוך מספרים לסיפור שמוביל להחלטות”.

  • ידע: חיבור לקובץ ה-Sheets המרכזי של מחלקת המכירות/שיווק.

  • הנחיות זהב (תהליך):

    “בכל פעם שאבקש ניתוח, השתמש ביכולת הרצת הקוד (Python) שלך כדי:

    1. לזהות מגמות צמיחה חודשיות (MoM).

    2. למצוא חריגות (Outliers) בנתונים שדורשות תשומת לב.

    3. ליצור ויזואליזציה פשוטה של הנתונים.

    4. הצע 3 פעולות אופרטיביות לשיפור הביצועים על בסיס הנתונים”.

למי זה זמין?

נכון להיום, היכולת ליצור ולהשתמש ב-Gemini Gems פתוחה לכלל המשתמשים, כולל אלו בגרסה החינמית. ההבדל טמון ב”כוח המנוע”: המנויים נהנים ממודלים חזקים ומתקדמים יותר ומחלון הקשר עצום (1 מיליון טוקנים) המאפשר ל-Gem “לזכור” ולנתח מאות מסמכים בו-זמנית, בניגוד לזיכרון המוגבל ולמודלי ה-Flash בגרסה החינמית. בנוסף, המנוי פותח יכולות מתקדמות כמו הרצת קוד Python לניתוח נתונים בזמן אמת ואינטגרציה “חיה” למסמכי Drive ו-Gmail, המאפשרת עבודה דינמית על פרויקטים מתמשכים ללא מגבלות העומס הקיימות בחינם.

אז האם Gemini Gems הוא השותף הנכון עבורכם?

לאחר שצללנו לעומק היכולות, הגיע הרגע להבין היכן הכלי הזה פוגש את זרימת העבודה האישית והארגונית שלכם. בניגוד לכלים גנריים, ה-Gems דורשים השקעה ראשונית באפיון, אך התמורה היא שותף דיגיטלי שמכיר אתכם לעומק.

ניתוח אופרטיבי: יתרונות מול חסרונות

היתרונות המובהקים:

  • בסיס ידע “חי” ונושם: הסנכרון המלא ל-Google Drive מבטיח שהסוכן תמיד מעודכן. אין צורך להעלות קבצים מחדש בכל פעם שהנתונים משתנים – ה-Gem “חי” את המסמכים שלכם.

  • מולטי-מודאליות ללא פשרות: היכולת לנתח סרטוני וידאו (כולל YouTube) ולשלב כלי יצירה כמו Veo ו-Canvas הופכת את ה-Gem מסוכן טקסטואלי למכונת ייצור תוכן רב-תחומית.

  • ארגז הכלים של Gemini Advanced: גישה מלאה להרצת קוד, יצירת תמונות ואינטגרציות Workspace המובנות בתוך הסוכן.

החסרונות שיש להכיר:

  • הפצה מוגבלת: נכון לעכשיו, ה-Gems מיועדים בעיקר לשימוש אישי או צוותי בתוך הארגון. חסרונה של חנות ציבורית (Store) הופך אותם לפחות מתאימים למי שמחפש להפיץ מוצר לקהל הרחב.

  • ניהול הרשאות: שיתוף Gems דורש תשומת לב להרשאות הקבצים בדרייב. הצד השני חייב הרשאת גישה לנתונים המקוריים כדי שהסוכן יפעל עבורו במלוא העוצמה.

מתי לבחור ב-Gems?

השתמשו ב-Gems כאשר סביבת העבודה שלכם היא Google Workspace, המידע שלכם דינמי ומשתנה בתדירות גבוהה, וכאשר אתם זקוקים לעוזר אישי או צוותי שמכיר את המתודולוגיה והסטנדרטים הייחודיים שלכם.

הצעד הבא שלכם: מאסטרטגיה ליישום

ה-Gems הם לא רק פיצ’ר נחמד – הם תשתית פרודוקטיביות. מי שממשיך לעבוד רק בתיבת הצ’אט הרגילה, מפספס את היכולת של ה-AI להכיר את השיטה והסטנדרטים הייחודיים שלו.

 

מה עושים עכשיו? זה הזמן לבחור את המשימה שחוזרת על עצמה הכי הרבה ביום העבודה שלכם, בין אם זה ניסוח מיילים, סיכום דוחות מורכבים או ניתוח נתוני מכירות, ולבנות עבורה את ה-Gem הראשון שלכם. השקיעו בהוראות (Instructions), חברו את מקורות הידע הנכונים, ותנו לשותף הדיגיטלי החדש שלכם להתחיל לעבוד בשבילכם.

 

המעבר מבינה מלאכותית ככלי חיצוני לבינה מלאכותית כחלק מהצוות מתחיל כאן.

הפוסט המדריך המלא ל-Gemini Gems הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/gemini-gems-guide/feed/ 1
Google AI Plus מגיע לישראל https://letsai.co.il/google-ai-plus-launch/ https://letsai.co.il/google-ai-plus-launch/#respond Fri, 30 Jan 2026 05:47:08 +0000 https://letsai.co.il/?p=69047 Google AI Plus מושק בישראל וב-35 טריטוריות נוספות, ומביא לראשונה חבילה מאוחדת של כל כלי ה‑AI המתקדמים של גוגל. המנוי כולל את מודלי Gemini 3 Pro ו‑Nano Banana Pro, יצירת וידאו ב‑Flow וב‑Veo 3.1, יצירת תמונות, NotebookLM, תוספת של קרדיטים חודשיים ו‑200GB אחסון בענן. בישראל המחיר עומד על 30 ₪ בחודש, עם מבצע השקה של […]

הפוסט Google AI Plus מגיע לישראל הופיע ראשון בLet's AI בינה מלאכותית

]]>
Google AI Plus מושק בישראל וב-35 טריטוריות נוספות, ומביא לראשונה חבילה מאוחדת של כל כלי ה‑AI המתקדמים של גוגל. המנוי כולל את מודלי Gemini 3 Pro ו‑Nano Banana Pro, יצירת וידאו ב‑Flow וב‑Veo 3.1, יצירת תמונות, NotebookLM, תוספת של קרדיטים חודשיים ו‑200GB אחסון בענן. בישראל המחיר עומד על 30 ₪ בחודש, עם מבצע השקה של 15 ₪ לחודשיים הראשונים. זהו מהלך שמסמן את כניסתה של גוגל לשוק ה‑AI הצרכני באופן ישיר ותחרותי, ומחזק את הלחץ על השחקניות המובילות בתחום.

 

Google AI Plus מושק בישראל

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

איך ואיפה נרשמים ל-Google AI Plus?

כדי לבחור חבילה ולממש את ההטבה, ניתן להיכנס ללינק הבא. בתמונה מטה תמצאו גם השוואה בין החבילות השונות ומידע נוסף (להגדלה, לחצו על התמונה).

 

השוואה בין Google AI Plus לשאר התוכניות

השוואה בין Google AI Plus לשאר התוכניות | Credit: Google

 

שינוי כיוון בגישת ה‑AI של גוגל

אחרי שנים שבהן גוגל הציגה יכולות מרשימות אך פיזרה אותן בין שירותים שונים, החברה מאחדת כעת את כל כלי הבינה המלאכותית המתקדמים שלה תחת מנוי אחד, ברור ונגיש. זהו שינוי שממקם את גוגל מחדש בזירה תחרותית שבה הצרכן כבר התרגל לשלם מחירים גבוהים עבור שירותי AI, ומאותת על כוונה להפוך את ה‑AI של החברה לכלי שימוש יומיומי ולא לניסוי טכנולוגי.

 

למרות ההתקדמות הטכנולוגית המרשימה של גוגל, חוויית השימוש לא תמיד הייתה חלקה. הכלים פעלו באפליקציות שונות, זמינותם השתנתה בין מדינות, וחלקם דרשו מנויים נפרדים. משתמש שרצה לשלב בין מודל שפה, יצירת וידאו וניתוח מסמכים נאלץ לעבור בין שירותים שונים ולעיתים התקשה להבין מה כלול בכל אחד מהם.

 

הפיצול הזה יצר חסם משמעותי: היכולות היו קיימות, אך הדרך אליהן הייתה מורכבת מדי עבור רוב המשתמשים.

 

 

עכשיו יש מנוי אחד שמרכז את כל היכולות

Google AI Plus נועד לפתור את הפיצול שאפיין את שירותי ה‑AI של גוגל בשנים האחרונות. המנוי מאחד את כל היכולות המתקדמות של החברה תחת חבילה אחת, ומוסיף רכיבים חדשים שמופיעים בעמוד הרשמי של השירות.

 

החבילה כוללת שני מודלים מרכזיים: Gemini 3 Pro, מודל הדגל למשימות מורכבות, ו‑Nano Banana Pro, המשמש ליצירת תמונות ותוכן ויזואלי. לצד המודלים, המנוי מספק כלים ליצירה ומולטימדיה, בהם Flow ליצירת סרטונים ו‑Veo 3.1 ליצירת סצנות ואנימציות מתקדמות, וכן יכולות יצירת תמונות המבוססות על Nano Banana Pro.

 

בתחום המחקר והכתיבה נכלל NotebookLM, עוזר מחקר שמסוגל לנתח מסמכים, להפיק תובנות ולסייע בבניית תוכן. בנוסף, המנוי מעניק 200 קרדיטים חודשיים לשימוש בכלי ה‑AI (מיועדים בעיקר לשימוש בכלי הוידאו והעיבוד הכבדים כמו Flow ו-Whisk).

 

לצד היכולות המתקדמות, המנוי כולל גם 200GB אחסון בענן ואפשרות לשיתוף עם עד חמישה בני משפחה. מנויי Google One Premium בחבילת ה‑2TB יקבלו את כל יכולות Google AI Plus באופן אוטומטי וללא תוספת תשלום.

 

השוואת מנויים: Google AI Free, Plus ו‑Pro

השוואת מנויים: Google AI Free, Plus ו‑Pro | מקור: blog.google

 

 

כמה זה עולה בישראל

גוגל מציבה תג מחיר תחרותי במיוחד: 30 שקלים לחודש כמחיר רגיל, ו‑15 שקלים לחודש במהלך החודשיים הראשונים במסגרת מבצע השקה. לשם השוואה, בארצות הברית המחיר עומד על 7.99 דולר, עם מבצע דומה של חמישים אחוז הנחה לתקופה מוגבלת. המהלך משקף כוונה ברורה להנגיש את יכולות ה‑AI המתקדמות של גוגל לקהל רחב, ולא רק למשתמשים טכנולוגיים מנוסים.

 

 

מה המשמעות הרחבה

השקת Google AI Plus אינה רק הרחבת שירות, אלא מהלך שמבהיר את כוונותיה של גוגל בשוק ה‑AI הצרכני. החברה מציבה את עצמה כשחקנית מרכזית מול שירותים כמו ChatGPT Go, ומאותת שהיא מתכוונת להתחרות לא רק ביכולות טכנולוגיות אלא גם במודל התמחור ובנגישות.

 

בעוד ChatGPT Go מציע שכבת שימוש בסיסית וזולה, Google AI Plus מציג חבילה רחבה יותר הכוללת מודלים מתקדמים, יצירת וידאו ותמונות, כלי מחקר ואחסון – במחיר נמוך יחסית.

 

המהלך עשוי להשפיע על השוק בכמה מישורים. ראשית, הוא צפוי להגביר את התחרות בין ספקיות ה‑AI, במיוחד במדינות שבהן המחיר מהווה גורם משמעותי בהחלטת הצרכן. שנית, תג המחיר הנמוך עשוי להוביל לירידת מחירים רחבה יותר בשוק המנויים. בנוסף, הנגישות הגבוהה עשויה להאיץ את אימוץ ה‑AI בקרב משתמשים פרטיים ולהרחיב את השימוש בכלים מולטימודליים המשלבים טקסט, תמונה ווידאו.

הפוסט Google AI Plus מגיע לישראל הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/google-ai-plus-launch/feed/ 0
איך ישראל הפכה למובילה העולמית בשימוש ב‑Claude https://letsai.co.il/israel-leading-claude-usage/ https://letsai.co.il/israel-leading-claude-usage/#respond Sun, 25 Jan 2026 13:12:03 +0000 https://letsai.co.il/?p=68687 בינואר 2026 פרסמה Anthropic את Economic Index V4, אחד הדוחות המקיפים ביותר שנכתבו עד היום על השימוש הגלובלי במערכות בינה מלאכותית. הדוח מבוסס על מדגם עצום של כמיליון אינטראקציות מנובמבר 2025 – רגע לפני השקת Opus 4.5. זו הפעם הראשונה שהדוח מציג “פרימיטיבים כלכליים”: מדדים בסיסיים שמאפשרים למדוד כיצד AI משפיע על פרודוקטיביות, על מבנה […]

הפוסט איך ישראל הפכה למובילה העולמית בשימוש ב‑Claude הופיע ראשון בLet's AI בינה מלאכותית

]]>
בינואר 2026 פרסמה Anthropic את Economic Index V4, אחד הדוחות המקיפים ביותר שנכתבו עד היום על השימוש הגלובלי במערכות בינה מלאכותית. הדוח מבוסס על מדגם עצום של כמיליון אינטראקציות מנובמבר 2025 – רגע לפני השקת Opus 4.5. זו הפעם הראשונה שהדוח מציג “פרימיטיבים כלכליים”: מדדים בסיסיים שמאפשרים למדוד כיצד AI משפיע על פרודוקטיביות, על מבנה העבודה ועל הכלכלה העולמית. בתוך ים הנתונים הזה, בין גרפים על אוטומציה, מגמות שימוש וחשיפה של מקצועות ל‑AI, הסתתר נתון אחד שהצליח להפתיע אפילו את החוקרים עצמם: ישראל ניצבת במקום הראשון בעולם בשימוש ב‑Claude ביחס לגודל האוכלוסייה – ובפער עצום.

 

ישראל במקום הראשון בעולם בשימוש ב-Claude, ביחס לגודל האוכלוסייה

ישראל במקום הראשון בעולם בשימוש ב-Claude, ביחס לגודל האוכלוסייה

פי חמישה מהצפוי

ה‑Usage Index של ישראל עומד על 4.90x. מאחר שהמדד מנורמל ל‑1, המשמעות היא שהשימוש בישראל גבוה כמעט פי חמישה מהצפוי. לשם השוואה, דנמרק, אחת המדינות הבולטות בשימוש ב‑AI, עומדת על 2.1x, ויפן, ארה״ב ודרום קוריאה מציגות שימוש גבוה מהממוצע אך רחוק מאוד מהקצב הישראלי. הפער הזה אינו רק חריג, הוא כמעט אנומליה כלכלית‑טכנולוגית, כזו שמחייבת בחינה מעמיקה של מה שמתרחש כאן.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

התרגום הוא רק חלק מהתמונה

כדי להבין את התופעה, צריך להתחיל במקום שבו רבים נוטים להתחיל – השפה. הדוח מצביע על כך שתרגום הוא הקטגוריה השנייה בשכיחותה בישראל, ומהווה 4.7% מכלל השיחות – פי 2.7 מהממוצע העולמי. הנתון הזה עלול להטעות: 4.7% הוא שיעור נמוך יחסית, אך הוא עדיין מספיק כדי לבלוט בהשוואה בינלאומית.

 

הדוח מציע פרשנות אחרת. ישראלים עובדים באופן אינטנסיבי מול תכנים באנגלית – קוד, דוקומנטציה, חוזים, RFPs, מאמרים אקדמיים – ולכן תרגום אינו “קביים”, אלא חלק טבעי מהעבודה הגלובלית. במדינות אחרות LLMs משמשים בעיקר לכתיבה יצירתית או לשאלות כלליות.

 

בישראל הם משולבים בתוך זרימת עבודה מקצועית. התרגום מגדיל את נפח השימוש, אך הוא רחוק מלהסביר את העוצמה החריגה של המדד הישראלי.

ישראל כ-Power User טכנולוגי

הסיבה האמיתית מתחילה להתבהר כשמסתכלים על סוגי המשימות שבהן ישראל משתמשת ב‑Claude. כאן מתגלה תמונה מובהקת: ישראל היא Power User טכנולוגי. משימות כמו Debugging & Refactoring מהוות 3.5% מהשיחות, נתון שממקם את ישראל במקום השלישי בעולם. קטגוריית Computer & Mathematical מהווה כ‑36% מהשימוש, שיעור גבוה במיוחד גם ביחס למדינות טכנולוגיות מובילות.

 

איך משתמשים ב-Claude בישראל

איך משתמשים ב-Claude בישראל

 

מעבר לכך, ישראל משתמשת ב‑Claude לפיתוח ו‑Troubleshooting של מערכות AI בשיעור גבוה ב‑30% מהממוצע העולמי. זהו שימוש מקצועי, עמוק ומורכב, כזה שמאפיין מהנדסים, חוקרי AI, אנשי DevOps ומפתחים שמכניסים את Claude ישירות לתוך ה‑workflow היומיומי שלהם. מדובר לא בכתיבה של פסקאות, אלא בדיבוג קוד, שכתוב מודלים, בניית תשתיות ואופטימיזציה של מערכות הנדסיות.

 

לניתוח מפורט של הנתונים לפי מדינה וקטגוריות שימוש, כולל פילוח ישראלי, ראו את דף ה-Economic Index באתר של אנטרופיק.

משק מוטה-טכנולוגיה בצורה קיצונית

כדי להבין מדוע זה קורה דווקא בישראל, צריך להסתכל על מבנה המשק המקומי. ישראל היא אחת המדינות היחידות בעולם שבהן חלק משמעותי מהאוכלוסייה עובד בהיי‑טק, וחלק גדול עוד יותר נוגע בקוד גם אם אינו מפתח במקצועו. חברות קטנות ובינוניות מאמצות AI בקצב מהיר לא פחות מהענקיות, ותרבות העבודה המקומית, שמתגמלת מהירות, אלתור ופתרון בעיות, הופכת כל כלי שמקצר תהליכים למרכיב טבעי בשרשרת הייצור.

 

הדוח של אנטרופיק מצביע על כך שמדינות עם שיעור גבוה של עובדים בקטגוריית Computer & Mathematical משתמשות יותר ב‑Claude. ישראל פשוט נמצאת בקצה העליון של הסקאלה הזו.

1.8% עלייה בפרודוקטיביות

אך מעבר לשימוש עצמו, הדוח מציג תמונה רחבה יותר של ההשפעה הכלכלית של AI. הוא מעריך שאימוץ נרחב של מערכות כמו Claude עשוי להגדיל את פרודוקטיביות העבודה בארה״ב בכ‑1.8 נקודות אחוז בשנה בעשור הקרוב – נתון משמעותי בכל קנה מידה.

 

עם זאת, ההשפעה אינה אחידה: מקצועות כמו Data Entry ו‑Database Architects חשופים לאוטומציה רחבה, בעוד תפקידים אחרים עשויים לעבור תהליך של upskilling, למשל מנהלי נדל״ן, שימצאו את עצמם עוסקים יותר בניהול משא ומתן ופחות במשימות אדמיניסטרטיביות.

 

מנגד, מקצועות מסוימים עלולים לחוות deskilling, כמו סוכני נסיעות או כותבים טכניים, שתכני עבודתם יהפכו פשוטים יותר ככל שה‑AI ייקח על עצמו את המשימות המורכבות.

ישראל כמעבדה חיה לעתיד שוק העבודה

בישראל, שבה שיעור העובדים הטכנולוגיים גבוה במיוחד, השפעות אלו עשויות להיות מועצמות. המשק הישראלי הופך, כמעט בעל כורחו, למעבדה חיה של שילוב AI בעבודה מקצועית. אם במדינות אחרות AI עדיין נתפס ככלי עזר, בישראל הוא כבר חלק מהשריר התפעולי – כלי שמאפשר למהנדסים, אנליסטים ומנהלים לעבוד מהר יותר, לדבג מהר יותר, ולבנות מערכות מורכבות בקצב שלא היה אפשרי בעבר.

 

כשמחברים את כל זה יחד, השימוש בתרגום כחלק מעבודה גלובלית, התעשייה הטכנולוגית הגדולה והאימוץ המהיר של טכנולוגיות חדשות – מתקבלת תמונה ברורה: ישראל אינה מובילה את העולם בשימוש ב‑Claude בגלל חולשה, אלא בגלל עומס עבודה טכנולוגי, מבנה כלכלי ייחודי ותרבות מקצועית שמאמצת כל כלי שמגדיל פרודוקטיביות. התוצאה היא מדינה קטנה עם פרופיל שימוש של מעצמת AI.

 

המשמעות רחבה יותר מהשאלה “למה ישראל משתמשת כל כך הרבה ב‑Claude”. ייתכן שהשאלה האמיתית היא האם שאר העולם יתחיל להיראות כמו ישראל. אם כן, ישראל אינה רק חריג סטטיסטי בלבד – היא פשוט חלון לעתיד של שוק העבודה הגלובלי.

 

לדו״ח המלא של אנטרופיק, כנסו כאן.

הפוסט איך ישראל הפכה למובילה העולמית בשימוש ב‑Claude הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/israel-leading-claude-usage/feed/ 0
גוגל הופכת את ג’מיני לזיכרון השני שלכם עם Personal Intelligence https://letsai.co.il/gemini-personal-intelligence/ https://letsai.co.il/gemini-personal-intelligence/#respond Thu, 22 Jan 2026 08:12:07 +0000 https://letsai.co.il/?p=68263 תארו לעצמכם שאתם עומדים במוסך, רגע לפני שהגיע תורכם, ומנסים להיזכר במידת הצמיגים של המיניוואן המשפחתי. במקום לנבור בניירת או לצאת לחניה, אתם פשוט שואלים את Gemini. התשובה שתקבלו היא לא רק מהירה, היא אישית באופן מפתיע: העוזר שולף את המידה מצילום בגלריה, מצליב אותה עם דגם הרכב שמצא במייל ומציע צמיגים שמתאימים להרגלי הנהיגה […]

הפוסט גוגל הופכת את ג’מיני לזיכרון השני שלכם עם Personal Intelligence הופיע ראשון בLet's AI בינה מלאכותית

]]>
תארו לעצמכם שאתם עומדים במוסך, רגע לפני שהגיע תורכם, ומנסים להיזכר במידת הצמיגים של המיניוואן המשפחתי. במקום לנבור בניירת או לצאת לחניה, אתם פשוט שואלים את Gemini. התשובה שתקבלו היא לא רק מהירה, היא אישית באופן מפתיע: העוזר שולף את המידה מצילום בגלריה, מצליב אותה עם דגם הרכב שמצא במייל ומציע צמיגים שמתאימים להרגלי הנהיגה שלכם. זה ה‑Personal Intelligence – המהלך של גוגל שנועד להפוך את Gemini ממנוע חיפוש משוכלל לשותף אישי שמבין את ההקשרים הקטנים של החיים. באמצעות שליפת מידע בזמן אמת (RAG) מתוך Gmail, Photos ו-Search, גוגל לא רק משדרגת את העוזר שלה – היא חזק בקרב מול המתחרות במבחן האמון הגדול מכולם: האם נסכים לתת ל-AI להכיר אותנו באמת?

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

עוזרי AI חכמים שלא באמת מכירים אותנו

למרות ההתקדמות המדהימה של עוזרי AI, רובם עדיין פועלים בתוך חלל סטרילי. הם יודעים הרבה על העולם, אבל מעט מאוד עלינו. הם יכולים להמליץ על “יעדים פופולריים לטיול”, אבל לא על מסלול שמתאים למשפחה שלנו. הם יודעים מהי מידת צמיג סטנדרטית, אבל לא מה מידת הצמיג של הרכב שלנו. הפער הזה הפך למעצור אמיתי בדרך לעוזר דיגיטלי שמרגיש כמו חלק מהחיים ולא כמו מנוע חיפוש עם צ׳אט.

 

מה זה Personal Intelligence?

Personal Intelligence מאפשר ל‑Gemini להתחבר למקורות מידע אישיים כמו Gmail, Google Photos, YouTube ו‑Search. החיבור הוא לא אוטומטי – המשתמש בוחר אם להפעיל אותו, איזה אפליקציות לקשר, ויכול לכבות הכול בכל רגע.

 

אבל ברגע שהחיבור פעיל, קורה משהו חדש: Gemini לא רק “יודע דברים”, אלא מבין הקשרים אישיים. הוא מסוגל לשלוף פרטים מדויקים מתוך החיים שלנו – תמונות, מיילים, חיפושים – ולשלב אותם בזמן אמת בתוך תשובה אחת קוהרנטית.

 

זה לא “זיכרון” במובן המסורתי. זו שליפה בזמן אמת – טכנולוגיה שמזכירה RAG (Retrieval‑Augmented Generation), שבה המודל לא מאחסן את המידע אצלו, אלא ניגש אליו רק כשצריך, משתמש בו כדי לענות וממשיך הלאה.

איך מפעילים את זה?

מכיוון שהפיצ׳ר זמין כרגע בבטא בארה״ב בלבד, משתמשים מחוץ לארה״ב יידרשו להתחבר דרך VPN אמריקאי (כאן תוכלו לקרוא איך זה עובד). לאחר מכן, ההפעלה פשוטה:

 

פותחים את אפליקציית Gemini ⇐ נכנסים ל‑Settings ⇐ בוחרים Personal Intelligence ⇐ נכנסים ל‑Connected Apps ומסמנים אילו שירותים רוצים לחבר (Gmail, Photos ועוד).

 

 

 

מה לגבי פרטיות?

כאן מגיעה הנקודה הקריטית: גוגל יודעת שהשאלה הראשונה של המשתמשים תהיה “האם ג׳מיני מאמן את עצמו על המיילים שלי?”. התשובה, לפי גוגל, היא לא.

 

Gemini יכול “לקרוא” את המייל או “להסתכל” בתמונה כדי לענות על בקשה, אבל התוכן עצמו לא נכנס לזיכרון של המודל ולא משמש לאימון. המערכת מאומנת רק על השיחות עם Gemini, וגם הן עוברות סינון כדי להסיר פרטים מזהים.

 

במילים אחרות, המודל לא “לומד” את מספר הרישוי שלכם, הוא רק יודע איפה למצוא אותו כשאתם מבקשים.

 

בנוסף, גוגל מנסה לשמור על שקיפות – Gemini מסביר מאיפה הגיע כל פרט בתשובה, מאפשר לנהל שיחות ללא פרסונליזציה, ומפעיל מנגנוני הגנה סביב נושאים רגישים כמו בריאות. והכי חשוב, אפשר לכבות את הכול בכל רגע.

מה האתגרים?

למרות ההתקדמות, גוגל מודה שהמערכת עדיין רחוקה משלמות. Personal Intelligence עלול לקשר בין דברים שאין ביניהם קשר, להניח הנחות על בסיס תמונות (“אתה אוהב גולף”) או לפספס שינויים בחיים כמו פרידות או שינויי תחביבים. זה חלק בלתי נפרד מהבטא, וגוגל מבקשת מהמשתמשים לתת פידבק כדי לשפר את המערכת.

 

מעידן המידע לעידן ההקשר

בשורה התחתונה, ה-Personal Intelligence הוא הרבה יותר מעוד פיצ׳ר. הוא מסמן את המעבר של גוגל מעולם החיפוש לעולם השותפות האקטיבית. אם עד היום עוזרי ה-AI היו מומחים לידע כללי ותקועים בתוך ‘בועה’ דיגיטלית, ג’מיני החדש מנסה לפרוץ את המחסום הזה ולהפוך לשותף שמבין את ההקשרים האישיים ביותר של חיינו.

 

המעבר הזה, מידע כללי למידע אישי, ומתגובה פסיבית לפרואקטיביות חכמה, הוא הצעד המשמעותי ביותר שנעשה לעבר חזון העוזר האישי הדיגיטלי. אך ככל שהטכנולוגיה הופכת אישית יותר, כך גדל גם המחיר של כל טעות אלגוריתמית או כשל אבטחתי.

 

בסופו של יום, ההצלחה של המהלך הזה לא תימדד רק ביכולת של ג’מיני למצוא מספר רישוי בתמונה, אלא במבחן האמון הגדול של העידן הנוכחי – עד כמה רחוק נהיה מוכנים לפתוח את דלתות חיינו הפרטיים כדי לקבל בתמורה לעולם שפשוט מבין אותנו, בלי שנצטרך להסביר.

הפוסט גוגל הופכת את ג’מיני לזיכרון השני שלכם עם Personal Intelligence הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/gemini-personal-intelligence/feed/ 0
האם במנוי ה-Low Cost של ChatGPT יהיו פרסומות? הכירו את ChatGPT GO https://letsai.co.il/openai-answer-gemini/ https://letsai.co.il/openai-answer-gemini/#respond Sun, 18 Jan 2026 06:01:02 +0000 https://letsai.co.il/?p=68300 האם זו התשובה של OpenAI ל-Gemini-3 של גוגל? מנוי Low Cost שמנסה לשבור את השוק? מסתבר שמנוי ChatGPT Go החדש של OpenAI הוא חלק מהתשובה של אלטמן וחבריו, למומנטום הכמעט בלתי ניתן לעצירה של גוגל. מכוונים ישר לכיס וללב של ההמונים. אחרי שנים שבהן הרגילו אותנו כמעט בכל חברה למנוי חודשי בעלות של 20 דולר, […]

הפוסט האם במנוי ה-Low Cost של ChatGPT יהיו פרסומות? הכירו את ChatGPT GO הופיע ראשון בLet's AI בינה מלאכותית

]]>
האם זו התשובה של OpenAI ל-Gemini-3 של גוגל? מנוי Low Cost שמנסה לשבור את השוק? מסתבר שמנוי ChatGPT Go החדש של OpenAI הוא חלק מהתשובה של אלטמן וחבריו, למומנטום הכמעט בלתי ניתן לעצירה של גוגל. מכוונים ישר לכיס וללב של ההמונים. אחרי שנים שבהן הרגילו אותנו כמעט בכל חברה למנוי חודשי בעלות של 20 דולר, OpenAI מציעה שכבת ביניים חדשה, זולה משמעותית מחבילת Plus, שמבקשת לענות על צורך אמיתי: שימוש יומיומי, אינטנסיבי למדי, בלי להיכנס למחיר ולמורכבות של מנוי מתקדם. אבל מה הקאטץ’?!

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

מהו בעצם ChatGPT Go

מנוי ChatGPT Go היא חבילה בתשלום נמוך יחסית, שהושקה רשמית כפתרון ביניים בין הגרסה החינמית של ChatGPT לבין המנויים היקרים יותר, שמתחילים ב-20 דולר בחודש במנוי Plus המוכר. המנוי הוצג לראשונה בהשקה ניסיונית בהודו, ובהמשך התרחב במהירות לעשרות מדינות נוספות, עד להשקה גלובלית מלאה. נכון לעכשיו, הוא זמין בכל המדינות שבהן ChatGPT נתמך, במחיר של כ-8 דולר לחודש בלבד, כאשר בחלק מהשווקים המחיר מותאם למטבע המקומי.

 

ההיגיון שמאחורי המהלך ברור: לא כל משתמש צריך או רוצה את כל יכולות העומק, המחקר והאוטומציה שמציעים מנויי Plus או מנויי Business או Enterprise, אך גם השימוש החינמי מרגיש מוגבל מדי עבור מי שעובד עם הכלי על בסיס יומי. Go ממוקם בדיוק באזור הזה.

 

המודל שבמרכז: GPT-5.2 Instant

בלב המנוי החדש עומד המודל GPT-5.2 Instant הרזה והמהיר של OpenAI. זהו המודל המרכזי שאליו מקבלים מנויי Go גישה, עם שימוש בלתי מוגבל בצ’אט עצמו, בכפוף למנגנוני הגנה ושימוש הוגן.

 

כאמור, מדובר בגרסה מהירה ויעילה של משפחת GPT-5.2, שמיועדת לאינטראקציות יומיומיות, כתיבה, ניסוח, למידה, פתרון בעיות ויצירת תוכן. היא אינה כוללת את יכולות ה-Reasoning המעמיקות ביותר של מודלי Thinking שתמצאו בחבילות בתשלום, אך בפועל מספקת מענה לרוב המוחלט של תרחישי השימוש הנפוצים.

 

הרבה יותר מהגרסה החינמית!

הפער המרכזי בין ChatGPT Go לבין השימוש החינמי אינו נוגע רק למודל עצמו, אלא בעיקר להיקפי השימוש. OpenAI מגדירה זאת כגישה מורחבת לפיצ’רים הפופולריים ביותר של ChatGPT.

GPT GO

OpenAI

 

שימוש בהודעות ובהעלאות קבצים

משתמשי Go נהנים מכמות שימוש גבוהה משמעותית בהודעות, העלאות קבצים וניתוח מסמכים, בהשוואה לגרסה החינמית. בפועל, מדובר בהבדל שמאפשר עבודה רציפה עם הכלי, בלי להיתקל במהירות בתקרות שימוש שמקטעות תהליכים.

 

יצירת תמונות וכלים מולטימודאליים

המנוי כולל גם גישה מורחבת ליצירת תמונות, כחלק מהיכולות המולטימודאליות של ChatGPT. עבור יוצרים, אנשי שיווק או משתמשים שעובדים עם יצירת תמונות כחלק מהשגרה, זהו שדרוג משמעותי ביחס לגרסה החינמית.

ניתוח נתונים מתקדם

מנוי ChatGPT Go מאפשר שימוש נרחב יותר בכלי ניתוח נתונים מתקדמים, כולל עבודה עם קבצים, טבלאות וכלי Python מובנים. גם כאן, לא מדובר ביכולות המקסימליות של המנויים הגבוהים יותר, אך בהחלט בשיפור מורגש למי שעובד עם נתונים באופן קבוע.

זיכרון ארוך יותר וחוויית שיחה רציפה

אחד השדרוגים המשמעותיים במנוי Go הוא הארכת חלון ההקשר (Context Window) והזיכרון. המשמעות היא ש-ChatGPT יכול לזכור יותר פרטים לאורך השיחה, לשמור על הקשר בין הודעות ולהפיק תגובות מותאמות יותר לאורך זמן.

בניית בוטים, פרויקטים, משימות ו-GPTs מותאמים אישית

עוד שיפור חשוב ומשמעותי הוא היכולת לבנות בוטים. ChatGPT Go כולל גם גישה לכלי ניהול כמו פרויקטים, משימות ויצירה ועריכה של GPT מותאמים אישית (Custom GPTs). המשמעות היא שניתן לארגן עבודה, להגדיר כלים ייעודיים ולהתאים את המערכת לצרכים ספציפיים, גם בלי להיות מנוי Plus.

עם זאת, חשוב להדגיש: מדובר בגישה לפיצ’רים הבסיסיים בתחום זה. גישה מורחבת לכלים המתקדמים יותר, כמו מצב הסוכן, מחקרי עומק (Deep Research) או אינטגרציות מורכבות, שמורים למנויים הגבוהים יותר.

 

מה ChatGPT Go לא כולל

כדי להבין במה המנוי שונה משאר המנויים בתשלום, חשוב לא פחות להכיר את המגבלות שלו ומה אנחנו לא מקבלים!

אין גישה למודלים ותיקים או מתקדמים יותר

מנוי ChatGPT Go אינו כולל גישה למודלי הלגאסי או מודלי ריזונינג (מודלי Thinking שמתאימים במיוחד לניתוח קבצים ומשימות מורכבות), ואינו מאפשר בחירה בין מודלים שונים. מי שזקוק למבחר גדול יותר ולמעבר בין מודלים שונים, יאלץ לשדרג למנוי Plus ומעלה. עם זאת, יש בו פיצ’ר של מצב חשיבה (אותו אחד שיש בחבילה החינמית) שמאפשר להקצות יותר כוח חישוב לפתרון בעיות מורכבות. חשוב לציין, למרות השם המבלבל (Think), זה לא אותו מודל חשיבה שיש בחבילות בתשלום.

מודל חשיבה חינמי

מודל חשיבה חינמי | OpenAI

 

 

אין גישה לכלים מתקדמים כמו Sora

כלים ליצירת וידאו באמצעות AI כמו מודל הוידאו המצוין Sora לא זמינים במנוי GO. גם מצב הסוכן, או גישה מורחבת לכלי ה-Deep Research אינם חלק מהמנוי (חשוב לציין – יש אפשרות לבצע מחקרי עומק גם בחבילה החינמית וגם במנוי GO, אבל בכמות מאוד מוגבלת של שימושים). גם אפליקציות מסוימות בספריית האפליקציות של ChatGPT דורשות מנוי יקר יותר.

שימוש ב-API אינו כלול

חשוב להדגיש: ChatGPT Go הוא מנוי לשימוש בממשק ChatGPT בלבד. שימוש ב-API של OpenAI מחויב בנפרד, בהתאם לתמחור הייעודי, ואינו חלק מחבילת Go.

פרסומות כחלק מהמודל הכלכלי

אחד ההיבטים המסקרנים ביותר במנוי החדש הוא הכוונה לשלב פרסומות. OpenAI הודיעה כי בכוונתה להתחיל בניסויים בהצגת פרסומות בגרסה החינמית וב-ChatGPT Go, תחילה בארצות הברית. לפי ההצהרות, מטרת המהלך היא לאפשר שמירה על מחיר נמוך ונגיש, תוך הרחבת הגישה לכלי AI מתקדמים. מנויי Plus, Pro, Business ו-Enterprise יישארו ללא פרסומות.

 

מדובר בשינוי תפיסתי משמעותי עבור ChatGPT, שעד כה פעל בסביבה נקייה מפרסום. עם זאת, OpenAI מדגישה כי מדובר בפרסום מבוקר, כחלק מאסטרטגיית נגישות רחבה יותר.

 

מודעות ופרסומות ב-ChatGPT במסלול GO | קרדיט: OpenAI

מודעות ופרסומות ב-ChatGPT במסלול GO | קרדיט: OpenAI

 

השוואה למנויי Plus ו-Pro

כדי להבין למי מיועד ChatGPT Go, חשוב למקם אותו בתוך מדרג המנויים הכולל.

חבילת ChatGPT Plus, במחיר של כ-20 דולר לחודש, מיועדת למשתמשים שזקוקים ליכולות חשיבה עמוקות יותר, גישה למודלים מתקדמים, כלים כמו Codex (סוכן הקוד של OpenAI), ומגבלות שימוש גבוהות במיוחד. ChatGPT Pro, במחיר של כ-200 דולר לחודש, פונה לקהל מצומצם של משתמשי קצה מתקדמים במיוחד, שזקוקים למקסימום יכולת, זיכרון והקשר ולכמות גדולה מאוד של כוח חישוב. מכוני מחקר, חברות וארגונים עם היקף שימוש גבוה במיוחד וכן הלאה.

מסלול Go, לעומתם, אינו מנסה להתחרות בהם, אלא להציע נקודת כניסה נוחה ומשתלמת למי שמרגיש שהגרסה החינמית כבר לא מספיקה, אבל לא רוצה לקרוע את הכיס (למרות ש-20 דולר בחודש שווה ערך למנת שווארמה בלאפה וקולה, או למנה במסעדה – ממש לא מותרות ליחידי סגולה).

ההבדלים בין החבילות | OpenAI

ההבדלים בין החבילות | OpenAI

 

זהו מנוי שמיועד לשימוש יומיומי, רציף, כזה שמרגיש פחות מוגבל, אך עדיין נשאר במסגרת תקציבית סבירה.

 

זמינות, חיוב וניהול חשבון

המנוי מחויב באופן חודשי, ללא אפשרות לתשלום שנתי או הנחה לטווח ארוך. ניתן לבטל את המנוי בכל עת דרך הגדרות החשבון, והמעבר בין מנויים מתבצע בסוף מחזור החיוב הקיים, ללא החזר יחסי. הניהול מתבצע כולו דרך ממשק ChatGPT, כולל צפייה בחשבוניות ובפרטי החיוב. נושאי פרטיות ושימוש בנתונים זהים לאלו של שאר המנויים, עם אפשרות לבטל שימוש בנתונים לצורכי אימון.

 

האסטרטגיה של OpenAI

מסלול ChatGPT Go אינו רק עוד מנוי. הוא משקף שינוי רחב יותר בגישה של OpenAI, שמבקשת להרחיב את קהל המשתמשים הפעילים ולבנות מודל כלכלי מגוון יותר. שילוב של תמחור מדורג, יחד עם פרסום מבוקר, מצביע על ניסיון לאזן בין נגישות, קיימות פיננסית ופיתוח טכנולוגי מתמשך. בסופו של דבר, Go אינו מבטיח חוויית AI אולטימטיבית, אלא חוויה פרקטית, יומיומית, ובעיקר – זולה! מחיר שמתאים להרבה יותר אנשים (תזכורת למי ששכח – ל-ChatGPT יש כ-800 מיליון משתמשים שבועיים. יותר מלג’מיניי והרבה יותר מקלוד של אנטרופיק). זהו צעד שמחזק את המעמד של ChatGPT ככלי עבודה יומיומי במחיר שווה לכל נפש, שמקדם תהליכי דמוקרטיזציה של טכנולוגיה ומידע. ובעיקר, הוא משקף את מלחמת הענקים בין גוגל ו-OpenAI מייצרת לנו, הצרכנים, פתרונות מגוונים וטובים. נראה ששוק ה-AI מתחיל להתבגר ולהציע פתרונות מותאמים לשכבות שונות של משתמשים, בניגוד לקיבעון שאפיין את מסלולי התמחור שלו בשלוש השנים האחרונות.

הפוסט האם במנוי ה-Low Cost של ChatGPT יהיו פרסומות? הכירו את ChatGPT GO הופיע ראשון בLet's AI בינה מלאכותית

]]> https://letsai.co.il/openai-answer-gemini/feed/ 0 החזון של אנטרופיק לעתיד הרפואה הדיגיטלית https://letsai.co.il/anthropic-healthcare-future/ https://letsai.co.il/anthropic-healthcare-future/#respond Fri, 16 Jan 2026 08:19:35 +0000 https://letsai.co.il/?p=68234 חברת אנטרופיק (Anthropic) הכריזה על מהלך אסטרטגי שמציב את הבינה המלאכותית בליבת עולם הרפואה, עם השקת שתי חבילות כלים ייעודיות: Claude for Healthcare ו-Claude for Life Sciences. בניגוד לפתרונות כמו ChatGPT Health שפונים ברובם ישירות למטופלים כ”יועצים אישיים”, אנטרופיק מכוונת אל ה”מנוע” שמניע את המערכת – הארגונים, מאגרי המידע והתהליכים הבירוקרטיים המורכבים. החידוש המרכזי כאן […]

הפוסט החזון של אנטרופיק לעתיד הרפואה הדיגיטלית הופיע ראשון בLet's AI בינה מלאכותית

]]>
חברת אנטרופיק (Anthropic) הכריזה על מהלך אסטרטגי שמציב את הבינה המלאכותית בליבת עולם הרפואה, עם השקת שתי חבילות כלים ייעודיות: Claude for Healthcare ו-Claude for Life Sciences. בניגוד לפתרונות כמו ChatGPT Health שפונים ברובם ישירות למטופלים כ”יועצים אישיים”, אנטרופיק מכוונת אל ה”מנוע” שמניע את המערכת – הארגונים, מאגרי המידע והתהליכים הבירוקרטיים המורכבים. החידוש המרכזי כאן הוא החיבור הישיר – המערכת של Claude מתממשקת למערכות בתי החולים, למאגרי רגולציה ולפלטפורמות מחקר. המטרה היא להפוך את הבינה המלאכותית מעוזרת חכמה שרק “עונה על שאלות”, לכלי עבודה אינטגרלי, מעין “עובד מן המניין” שמבצע משימות בתוך המערכת הרפואית עצמה.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

יותר מצ’אטבוט: המהפכה של אנטרופיק בניהול הרפואי

העיתוי של ההכרזה אינו מקרי. בשעה שהתחרות על עתיד הרפואה הדיגיטלית מתהדקת, וזמן קצר לאחר הכרזה מקבילה של OpenAI, אנטרופיק מציגה תוכנית שאפתנית בהרבה. במקום להסתפק בצ’אטבוט שרק “מתרגם” תוצאות של בדיקות דם למטופלים, החברה מציעה חזון שבו קלוד (Claude) הופך לכלי עבודה מקצועי המחובר למערכות הליבה של בתי חולים, חברות ביטוח ויצרניות תרופות.

 

זו לא רק התקדמות טכנולוגית, אלא ממש שינוי תפיסה. הבינה המלאכותית עוברת ממצב של “דיבור על רפואה” לביצוע פעולות של ממש – החל מניהול תהליכים בירוקרטיים ועד תקשורת ישירה עם מאגרי מידע מדעיים וגופי רגולציה (הגופים המפקחים על עולם הרפואה). המסר של אנטרופיק ברור: ה-AI כבר לא נשאר בחוץ כיועץ חיצוני, הוא הופך לחלק בלתי נפרד מהתשתית הרפואית עצמה.

כשבירוקרטיה חונקת את הרפואה

כדי להבין את המהלך של אנטרופיק, צריך להכיר תחילה את הבעיה המרכזית שהיא מנסה לפתור. מערכות הבריאות בעולם, ובעיקר בארה”ב, קורסות תחת עומס בירוקרטי אדיר. אחד המכשולים הגדולים ביותר הוא תהליך ה”אישור המוקדם” (Prior Authorization) – דרישה של חברות הביטוח לקבל מהרופאים הצדקות מפורטות לפני שהן מאשרות טיפולים או תרופות. התהליך הזה, שמתבצע ברובו ידנית, גוזל זמן יקר מצוותים רפואיים ומעכב טיפול בחולים.

 

לכך מתווספים תיעוד רפואי מסורבל, מאגרי מידע שאינם “מדברים” זה עם זה, ומחסור כרוני בכוח אדם. גם בעולם המחקר המצב דומה כאשר ניסויים קליניים ופיתוח תרופות סובלים מעיכובים של חודשים בשל הצורך בעיבוד הררי מידע ובהגשת דוחות מורכבים לרשויות המפקחות. אנטרופיק זיהתה שהאתגר הגדול של הרפואה המודרנית הוא לאו דווקא חוסר בידע רפואי, אלא ה”תפעול” שלו – כל מה שקורה מאחורי הקלעים ומפריע לרופאים ולחוקרים לעשות את עבודתם.

קלוד מתחבר ישירות ללב הרפואה

על הרקע הזה, החידוש המשמעותי ביותר בהכרזה הוא לא עוד שדרוג של המודל, אלא הפיכתו לחלק בלתי נפרד מהתשתית הרפואית. אנטרופיק הוסיפה לקלוד “מחברים” (Connectors) – מעין כבלים טכנולוגיים המאפשרים לו גישה ישירה למקורות המידע החשובים והאמינים ביותר בעולם הרפואה:

  • מאגר ה-CMS: זהו המאגר הממשלתי בארה”ב של שירותי הביטוח (Medicare ו-Medicaid). החיבור אליו מאפשר לקלוד לבדוק בזמן אמת מה מכוסה בביטוח של המטופל ולבצע אוטומציה לתהליך ה”אישור המוקדם” המסורבל, תוך צמצום טעויות אנוש.

  • ICD-10: ה”שפה” הבינלאומית שבה כל מחלה, פציעה או טיפול מקבלים קוד ייחודי. קלוד יודע עכשיו לעבוד עם השפה הזו באופן מובנה.

  • NPI Registry: מרשם רשמי המשמש לאימות זהותם של רופאים וספקי שירותי בריאות.

  • PubMed: ספרייה דיגיטלית המכילה מעל 35 מיליון מאמרים ומחקרים רפואיים. השימוש בה מאפשר לקלוד “לעגן” את תשובותיו בעובדות מדעיות מוכחות (Grounding) ולהימנע מ”הזיות” או המצאת נתונים.

בנוסף לגישה למידע, אנטרופיק העניקה לקלוד “כישורי סוכן” (Agent Skills) המאפשרים לו לבצע פעולות מורכבות. הבולטת שבהן היא העבודה עם תקן FHIR – הסטנדרט הבינלאומי שמאפשר למערכות מחשוב רפואיות שונות “לדבר” זו עם זו.

 

בגרף המצורף רואים איך קלוד עובר משיחה לביצוע משימות ואת הביצועים של קלוד Opus 4.5 במדדי הסוכן והחישוב הרפואיים. רמת הדיוק של 92.3% במדד ה-MedAgentBench מוכיחה שהמודל מוכן לבצע תהליכי עבודה רפואיים מורכבים ברמת אמינות גבוהה ביותר:

 

קלוד יודע “לעשות” (Agent) ולבצע חישובים (Calc) | Anthropic

 

התמיכה ב-FHIR היא שוברת שוויון. היא מאפשרת לקלוד להתממשק ישירות לתיק הרפואי של המטופל בצורה מאובטחת. חשוב להבהיר, המערכת אינה “כותבת” בעצמה בתיק הרפואי. במקום זאת, קלוד מכין נתונים מובנים וטיוטות מקצועיות, שממתינים לאישור סופי (Sign-off) של רופא אנושי.

 

בדרך זו, המערכת מורידה מהרופא את נטל ההקלדה והבירוקרטיה, אך משאירה את האחריות המקצועית וההחלטה הסופית בידיים אנושיות, כנדרש ברגולציה.

 

המשמעות היא שקלוד כבר לא רק “מייעץ” או עונה על שאלות כלליות, הוא מבצע משימות תפעוליות מורכבות שהיו שמורות עד כה אך ורק לאנשי מקצוע.

מהתיאוריה למעשה

כדי להבין את המשמעות האמיתית של המהלך, כדאי לבחון כיצד היכולות הללו משנות את שגרת העבודה. בתהליך של אישור טיפולים מול חברות הביטוח, משימה שגזלה בעבר שעות של עבודה ידנית, קלוד מסוגל כעת למשוך באופן עצמאי את מדיניות הכיסוי המעודכנת, להשוות אותה לרשומות הרפואיות של המטופל ולהגיש למאשר האנושי החלטה מנומקת ומבוססת נתונים.

 

היעילות הזו ממשיכה גם אל עולם הערעורים על תביעות ביטוח, שם המערכת מאגדת מסמכים, קודים רפואיים והנחיות קליניות לכדי טיוטת ערעור מוכנה ומקצועית.

 

 

ההשפעה של קלוד מורגשת גם בתקשורת הישירה מול המטופלים. הוא פועל כמעין “ממיין דיגיטלי” (Triage) שמסוגל לעבור על הודעות נכנסות, לזהות מקרים דחופים הדורשים התערבות מיידית ולהפחית משמעותית את העומס המוטל על הצוותים הקליניים.

 

מעבר לסיוע לארגונים קיימים, התשתית שבנתה אנטרופיק מעניקה רוח גבית לדור הבא של הסטארטאפים הרפואיים. אלו יכולים כעת להתבסס על היכולות שלו כדי לפתח מוצרים מתקדמים, החל מסיכום אוטומטי של ביקורי רופא ועד למערכות תומכות החלטה שמסייעות לרופאים לנהל תיקים רפואיים מורכבים בדיוק רב יותר.

קלוד בשירות מדעי החיים

החלק השני של ההכרזה נוגע בלב תעשיית התרופות והמחקר – תחום מדעי החיים. בעולם הזה, שבו כל חודש של עיכוב בניסוי קליני מתרגם להפסדים של מיליארדי דולרים, אנטרופיק מציעה גשר טכנולוגי חדש.

 

היא מחברת את קלוד ישירות לפלטפורמות המחקר המרכזיות בעולם, החל ממאגרי נתונים של ניסויים קליניים כמו Medidata ו-ClinicalTrials.gov, ועד לספריות ענק של מאמרים מדעיים וכלים לזיהוי מטרות תרופתיות ותרכובות כימיות.

 

בגרף המצורף תוכלו לראות את קלוד מוביל במדעי החיים – ביצועי Claude Opus 4.5 במדד SpatialBench של LatchBio הופך אותו לכלי העבודה המדויק ביותר כיום עבור חוקרים ומעבדות:

 

ביצועי Claude Opus 4.5 במדד SpatialBench של LatchBio.

רמת דיוק גבוהה בניתוח נתונים ביולוגיים מורכבים | Anthropic

 

במקום שחוקרים יבזבזו זמן יקר על איסוף ידני של נתונים ממקורות מפוזרים, קלוד הופך לשותף פעיל בתהליך הפיתוח. הוא מצויד בכישורים ייעודיים המאפשרים לו לנסח טיוטות לפרוטוקולים (נהלי עבודה) של ניסויים, להמיר נתונים מורכבים ממכשירי מעבדה לפורמטים אחידים שקל לעבוד איתם, ולתמוך בכלי ניתוח נתונים מתקדמים שעד כה דרשו מומחיות טכנית צרה.

 

 

התוצאה היא מערכת ליווי מקצה לקצה: מהרגע שבו עולה רעיון ראשוני במעבדה, דרך שלבי הניסוי המורכבים ועד להגשת הדוחות הסופיים לרשויות המפקחות, כמו ה-FDA האמריקאי. המהלך הזה נועד לקצר משמעותית את הדרך הארוכה והיקרה שבין גילוי מדעי לבין תרופה חדשה שמגיעה אל המטופל.

 

בגרף המצורף תראו איך קלוד משתפר כל הזמן ולומד לדבר “מדעית”: בתוך שלושה חודשים בלבד, קלוד Opus 4.5 רשם זינוק של מעל 13% ביכולת לפענח איורים מדעיים ושיפור של יותר מ-10% בהבנת מבני חלבונים – יכולות המקצרות משמעותית את זמן המחקר והפיתוח:

לומד לדבר "מדעית": גרף השיפור של קלוד Opus 4.5. בתוך שלושה חודשים בלבד, המודל רשם זינוק של מעל 13% ביכולת לפענח איורים מדעיים ושיפור של כ-10% בהבנת מבני חלבונים – יכולות המקצרות משמעותית את זמן המחקר והפיתוח.

“קפיצת המדרגה” שעשה קלוד בתוך שלושה חודשים בלבד | Anthropic

כשהטכנולוגיה פוגשת אחריות

המעבר של אנטרופיק לעולם הרפואה הוא לא רק תוספת של תכונות חדשות, אלא שינוי פילוסופי באופן שבו בינה מלאכותית פוגשת ארגונים גדולים. בעוד שמתחרותיה (כמו OpenAI) נוטות להתמקד בחוויית המשתמש של המטופל כ”יועץ אישי”, אנטרופיק בוחרת לפנות ישירות אל הליבה המוסדית: בתי החולים, חברות הביטוח וענקיות התרופות.

 

כדי לעמוד בסטנדרטים הנוקשים של הגופים האלו, המערכת נבנתה מראש בהתאם לתקן ה-HIPAA המחמיר – החוק שמגדיר כיצד יש לשמור על הפרטיות והאבטחה של מידע רפואי רגיש. זהו תנאי סף קריטי, שבלעדיו לא ניתן לפעול בתוך המערכת הרפואית הרשמית.

 

הבדל מהותי נוסף טמון באיכות המידע ובאופן הפעולה שלו. במקום שהמודל יסתמך רק על “ידע כללי” שנאסף מהאינטרנט ועלול להיות שגוי, אנטרופיק מחברת אותו למאגרים הרשמיים והמעודכנים ביותר של עולם המדע.

 

היכולת הזו, בשילוב עם “כישורי סוכן” המאפשרים למודל לבצע פעולות ותהליכים ולא רק לנהל שיחה, יוצרת שילוב נדיר בתעשייה – כלי שמסוגל לחבר בצורה חלקה בין עולם המחקר המדעי המורכב לבין עולם הרגולציה והחוקים היבשים. בדרך זו, אנטרופיק לא רק מציעה “צ’אט חכם”, אלא בונה תשתית מקצועית המותאמת במיוחד לצרכים הייחודיים של מדעי החיים.

האתגרים שבדרך

למרות ההבטחה הגדולה, הדרך ליישום נרחב של הכלים הללו עדיין רצופה באתגרים משמעותיים. נכון לעכשיו, רוב ההצלחות שהוצגו הן דוגמאות נקודתיות, ועדיין חסר מידע מקיף על האופן שבו המערכת תתפקד “בשטח” – בבתי חולים עמוסים ובמצבים בלתי צפויים.

 

השאלה הגדולה ביותר נותרה שאלת הדיוק והטעויות. בעולם של מודלי שפה, תופעת ה”הזיות” (Hallucination) שבה הבינה המלאכותית מציגה מידע שגוי בביטחון מלא, היא לא רק תקלה טכנית מביכה. בהקשר רפואי, טעות כזו עלולה להוביל לאבחון שגוי, לסכנת חיים ממשית ולתביעות משפטיות חסרות תקדים.

 

אנטרופיק מנסה לצמצם את הסיכון הזה באמצעות תהליך שנקרא “עיגון” (Grounding). במקום לתת לקלוד להסתמך רק על הזיכרון הדיגיטלי שלו, המערכת מאולצת לבסס ולעגן כל תשובה על מאגרי מידע מוסמכים ואמינים בלבד. זהו צעד קריטי לבניית אמון, אך הוא עדיין אינו מהווה פתרון מושלם לכלל המורכבויות של עולם הרפואה.

 

לצד זאת, נותרו פתוחות שאלות כבדות משקל לגבי הרגולציה והאתיקה. עד כמה ניתן לאפשר למכונה לקבל החלטות המשפיעות על גורלם של מטופלים? אנטרופיק עצמה מבהירה בנקודה זו כי המערכת נועדה לספק תמיכה וכלי עזר בלבד, והיא אינה מתיימרת להוות תחליף לשיקול הדעת המקצועי של הרופא.

המודל העסקי והמשמעות הכלכלית

שוק הבינה המלאכותית בעולם הבריאות מוערך כיום במיליארדי דולרים, והוא נחשב לאחד ממנועי הצמיחה החזקים ביותר בתעשייה כולה. אבל המהלך של אנטרופיק הוא הרבה יותר מהשקת “תכונות חדשות”, זה מהלך עסקי אגרסיבי ומחושב שמטרתו ליצור מה שנקרא בעולם העסקי “נעילת ספק” (Vendor Lock-in).

 

כאשר בית חולים או חברת ביטוח מחליטים להטמיע את קלוד בתוך מערכת הרשומות הרפואיות שלהם (EHR – התיק הדיגיטלי המרכזי של המטופל), לחבר אותו למאגרי המידע הממשלתיים ולבסס עליו את התהליכים הבירוקרטיים הרגישים ביותר, המעבר למערכת של חברה מתחרה הופך למשימה כמעט בלתי אפשרית.

 

המורכבות הטכנולוגית והצורך לסנכרן מחדש את כל המערכות יוצרים תלות אסטרטגית עמוקה. בדרך זו, אנטרופיק מפסיקה להיות ספקית של “כלי צ’אט” פשוט שאפשר להחליף בקלות, והופכת לשותפה טכנולוגית לטווח ארוך שמושרשת עמוק בתוך התשתית של ארגון הבריאות.

 

 

העשור של הבינה המלאכותית בתשתית הרפואית

בסופו של דבר, המהלך של אנטרופיק מסמן שינוי כיוון דרמטי בתעשייה. הבינה המלאכותית מפסיקה להיות “עוזרת אישית” חיצונית והופכת לחלק בלתי נפרד מהתשתית הרפואית. זוהי מערכת שמחוברת למאגרי המידע הקריטיים ביותר, מסוגלת לבצע תהליכים מורכבים ומאיצה שרשראות אספקה ופיתוח שלמות – מהמעבדה ועד למיטת המטופל.

 

אם הפתרון של OpenAI נתפס כ”יועץ המלווה את המטופל”, הרי שקלוד של אנטרופיק מבקש לתפוס את משבצת “העובד המומחה של בית החולים”.

 

המרוץ הזה בין החברות – בין התמקדות בצרכן הקצה לבין התמקדות בליבת המערכת – הוא שעשוי להגדיר מחדש את האופן שבו מערכות הבריאות יתפקדו בעשור הקרוב.

הפוסט החזון של אנטרופיק לעתיד הרפואה הדיגיטלית הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/anthropic-healthcare-future/feed/ 0
Agent Mode ב‑Excel הופך את הגיליון האלקטרוני לשותף חכם https://letsai.co.il/excel-agent-mode/ https://letsai.co.il/excel-agent-mode/#respond Thu, 15 Jan 2026 08:13:56 +0000 https://letsai.co.il/?p=68055 יש רגעים שבהם טכנולוגיה ותיקה עוברת טרנספורמציה שקטה שמעצבת מחדש את שגרת העבודה. Excel, אחד הכלים הוותיקים והמשפיעים בעולם העסקי, נמצא בדיוק ברגע כזה. Agent Mode, יכולת חדשה במסגרת Microsoft 365 Copilot, משנה את הגיליון האלקטרוני ממערכת חישוב למערכת שמבינה כוונה, מבצעת תהליכים מורכבים ומייצרת תוצרים מלאים תוך דקות. זה לא “עוד פיצ’ר”, אלא ממש […]

הפוסט Agent Mode ב‑Excel הופך את הגיליון האלקטרוני לשותף חכם הופיע ראשון בLet's AI בינה מלאכותית

]]>
יש רגעים שבהם טכנולוגיה ותיקה עוברת טרנספורמציה שקטה שמעצבת מחדש את שגרת העבודה. Excel, אחד הכלים הוותיקים והמשפיעים בעולם העסקי, נמצא בדיוק ברגע כזה. Agent Mode, יכולת חדשה במסגרת Microsoft 365 Copilot, משנה את הגיליון האלקטרוני ממערכת חישוב למערכת שמבינה כוונה, מבצעת תהליכים מורכבים ומייצרת תוצרים מלאים תוך דקות. זה לא “עוד פיצ’ר”, אלא ממש שינוי פרדיגמה: במקום לכתוב נוסחאות, לבנות טבלאות ציר או לעצב גרפים, המשתמש פשוט מתאר מה הוא צריך – ו‑Excel מבצע. לא כקיצור דרך, אלא כשותף עבודה שמבין את המשימה ומרכיב את הפתרון. Agent Mode מחבר בין היכולות העמוקות של Excel לבין מודלי שפה גדולים, מאפשר משיכת נתונים חיצוניים, ומבצע תהליכים מרובי‑שלבים תוך תיעוד מלא – וכל זאת מבלי להחליף את שיקול הדעת האנושי.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

הבעיה: Excel הוא כלי עוצמתי – אבל לא תמיד נגיש

Excel הוא אחד הכלים החזקים והגמישים ביותר בעולם העבודה. הוא מאפשר לבצע כמעט כל ניתוח נתונים שאפשר לדמיין, אבל כדי להגיע לשם, צריך שליטה במגוון יכולות טכניות שלא תמיד זמינות לכל משתמש.

 

נוסחאות מורכבות, טבלאות ציר, עיצוב מותנה, בניית גרפים ושילוב נתונים ממקורות חיצוניים – כל אלה דורשים ידע, ניסיון, ולעיתים גם לא מעט ניסוי וטעייה. אפילו משתמשים מנוסים מוצאים את עצמם מחפשים מדריכים, מתקנים שגיאות, או משחזרים שלבים. עבור רבים אחרים, המשימות האלה פשוט לא נגישות – הם יודעים מה הם רוצים להשיג, אבל לא תמיד מבינים איך לבצע את זה בתוך Excel.

הפתרון: סוכן חכם שפועל בתוך Excel

Agent Mode הוא מצב עבודה חדש שבו Copilot מבית מיקרוסופט מפסיק להיות רק עוזר טקסטואלי, והופך לסוכן שמבצע פעולות ישירות בתוך הגיליון. המשתמש מתאר את המשימה בשפה טבעית, ו‑Copilot מרכיב את הפתרון שלב‑אחר‑שלב בתוך הקובץ עצמו, תוך שימוש בכל היכולות המתקדמות של Excel.

 

Agent Mode מפגין יכולות רחבות כמו בניית טבלאות ציר, כתיבת נוסחאות, יצירת גרפים וויזואליזציות, עיצוב וארגון נתונים, ביצוע תהליכים מרובי‑שלבים מקצה לקצה, משיכת נתונים מהאינטרנט באמצעות Web Search ובחירה בין מודלים שונים, כולל אפשרות להריץ את Claude.

 

למרות האוטומציה, המשתמש נשאר בשליטה מלאה. כל פעולה מתועדת, מוצגת, ומלווה בשלבי אימות שמאפשרים להבין בדיוק מה נעשה ולוודא שהתוצאה נכונה.

איך זה עובד בפועל

ההפעלה של Agent Mode ב‑Excel מתבצעת דרך ממשק Copilot, בתהליך פשוט בו המשתמש מתאר את המשימה, והסוכן מבצע אותה ישירות בתוך הגיליון – כולל בניית מודלים, משיכת נתונים, ויצירת תוצרים מוכנים להצגה.

 

איך להפעיל את Agent Mode

תהליך מדורג של שימוש ב-Agent Mode בתוך גיליון Excel

 

כדי להפעיל את Agent Mode, המשתמש מתחיל מתוך חלונית Copilot ובוחר במצב החדש (מתוך תפריט הבחירה) שמאפשר לסוכן לבצע פעולות ישירות בתוך הגיליון (תמונה 2). מיד לאחר מכן נפתח ממשק Agent Mode, ובו האפשרות להפעיל את Web Search – יכולת שמאפשרת למשוך נתונים חיים מהאינטרנט, כמו תחזיות שוק או נתוני מכירות עדכניים (תמונה 3). בשלב הבא ניתן לבחור את מודל העבודה, כולל האפשרות להריץ את Claude, מודל חלופי שמציע סגנון פעולה שונה ומרחיב את מרחב היכולות של הסוכן (תמונה 4).

 

כעת המשתמש מתאר את המשימה בשפה טבעית, למשל: “בנה תחזית שוק אמריקאית ל-2025-2030 לפי סגמנטים, עם הנחות ניתנות לשינוי וגרף הכנסות” – והסוכן מקבל את ההוראה ומתחיל לעבוד (תמונה 5). בתוך זמן קצר נבנה גיליון מלא: מודל תחזית שוק הכולל הנחות, שיעורי צמיחה, גודל שוק לפי סגמנטים, טבלאות וגרפים לשנים הרלוונטיות (תמונה 6). בסיום, העוזר מציג סיכום מסודר של מקורות הנתונים והתובנות המרכזיות כולל רשימת דוחות מחקר שבהם נעשה שימוש, נקודות מפתח לשוק, והדגשה שהתוצר מוכן לניתוח, התאמה והצגה (תמונה 7).

 

בשלב זה המשתמש יכול כמובן לשנות הנחות או ערכים בטבלאות, והמודל כולו, כולל הגרפים, מתעדכן בזמן אמת, מה שמדגים את הגמישות של מודל דינמי עם פרמטרים ניתנים לכוונון.

מה מיוחד ב‑Agent Mode

Agent Mode לא משנה את הממשק של Excel, הוא משנה את האופן שבו עובדים איתו. במקום להפעיל כל כלי בנפרד, הסוכן משתמש בכל היכולות המוכרות של Excel, אבל מפעיל אותן אוטומטית, כחלק מתהליך שלם שמבוסס על הבנת כוונה.

 

הייחודיות של Agent Mode באה לידי ביטוי בכמה נקודות מרכזיות:

  • שילוב בין Excel למודלים גדולים הסוכן לא מוסיף שכבת ממשק חדשה – הוא מפעיל את הכלים הקיימים של Excel, אבל עושה זאת מתוך הבנה של המשימה הכוללת.

  • ביצוע תהליכים מרובי‑שלבים לא מדובר בפקודה אחת, אלא בתהליך שלם: איסוף נתונים ← בניית מודל ← עיצוב ← ויזואליזציה ← אימות.

  • Web Search מובנה אפשרות למשוך נתונים חיים מהאינטרנט ישירות לתוך הגיליון – נתוני שוק, תחזיות, מידע ציבורי. 

  • בחירה בין מודלים שונים האפשרות להריץ את Claude מתוך Excel מצביעה על גישה פתוחה: לא רק מודל אחד, אלא אקו‑סיסטם של יכולות.

  • שקיפות מלאה כל פעולה מתועדת, מוצגת, וניתנת לאימות – כולל סיכום שינויים, מקורות מידע ושלבי בדיקה. זה קריטי במיוחד כשעובדים עם נתונים רגישים או תוצרים עסקיים.

חשוב להדגיש, שבעת שימוש ב‑Agent Mode, נתונים שמוזרמים מהאינטרנט כפופים למדיניות פרטיות ולתנאי שימוש של המקורות עצמם. ארגונים צריכים לוודא שהמידע שנמשך עומד בדרישות רישוי, אבטחה וציות רגולטורי.

 

 

Excel הופך לפלטפורמת ניתוח נתונים אוטונומית

Agent Mode לא מחליף את Excel – הוא מרחיב אותו והופך אותו לכלי שמבין כוונה ופועל לפיה. הוא מתאים למשתמשים מתחילים ומקצוענים כאחד, מאפשר לבנות תוצרים מורכבים בזמן קצר, ומשלב אוטומציה, בינה מלאכותית ונתונים חיים מהאינטרנט בתוך תהליך עבודה רציף. למרות שהיכולות עדיין מתפתחות, הכיוון ברור: Excel הופך מסביבת עבודה ידנית לכלי שמסוגל לבצע תהליכים שלמים באופן עצמאי‑למחצה.

 

במקום להשקיע זמן בבנייה טכנית, המשתמשים יכולים להתמקד בתובנות. ניתוח נתונים הופך נגיש יותר, התלות במומחי Excel פוחתת, ונוצר סטנדרט חדש של שקיפות ואימות בתוצרים שנבנים בעזרת AI. במובן מסוים, Agent Mode מסמן את המעבר לעידן שבו כלים מקצועיים לא רק מגיבים לפקודות – אלא מבינים את היעד, ובונים את הדרך אליו.

הפוסט Agent Mode ב‑Excel הופך את הגיליון האלקטרוני לשותף חכם הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/excel-agent-mode/feed/ 0
Cowork של אנטרופיק עושה סדר בשולחן העבודה https://letsai.co.il/cowork-ai-partner/ https://letsai.co.il/cowork-ai-partner/#respond Wed, 14 Jan 2026 13:37:16 +0000 https://letsai.co.il/?p=68202 אנטרופיק בודקת את הגבולות של סוכני בינה מלאכותית אוטונומיים, ומציבה את עצמה במרכז הקרב על סביבת העבודה הדיגיטלית. לפעמים טכנולוגיה לא מתקדמת בזכות חזון של חברה, אלא בזכות יצירתיות של משתמשים – זה בדיוק מה שקרה עם Claude Code. הכלי, שיועד במקור למפתחים, הפך במהירות למעין “סוכן עבודה” מאולתר – אנשים השתמשו בו לא רק […]

הפוסט Cowork של אנטרופיק עושה סדר בשולחן העבודה הופיע ראשון בLet's AI בינה מלאכותית

]]>
אנטרופיק בודקת את הגבולות של סוכני בינה מלאכותית אוטונומיים, ומציבה את עצמה במרכז הקרב על סביבת העבודה הדיגיטלית. לפעמים טכנולוגיה לא מתקדמת בזכות חזון של חברה, אלא בזכות יצירתיות של משתמשים – זה בדיוק מה שקרה עם Claude Code. הכלי, שיועד במקור למפתחים, הפך במהירות למעין “סוכן עבודה” מאולתר – אנשים השתמשו בו לא רק לכתיבת קוד, אלא גם לארגון תיקיות, סיכום מסמכים, מיון תמונות משפחתיות ואפילו ניהול משימות משרדיות. אנטרופיק זיהתה את התופעה הזו, ובעיקר את מה שהיא מסמלת: המשתמשים כבר הקדימו את הטכנולוגיה. הם לא רוצים עוד צ’אט חכם. הם רוצים סוכן. מישהו (או משהו) שעובד עבורם. מכאן נולד Cowork – ניסיון להפוך את ההתנהגות הספונטנית הזו למוצר רשמי, נגיש, ועם שאיפה ברורה להפוך את Claude לשותף עבודה אמיתי, לא רק לעוזר טקסטואלי. 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מודלים חכמים, אבל תקועים בתוך הצ’אט

למרות ההתקדמות המרשימה בבינה מלאכותית, רוב הכלים עדיין פועלים בתוך מסגרת צרה של שיחה טקסטואלית. המשתמש צריך להעתיק קבצים לתוך הצ’אט, להסביר שוב ושוב את ההקשר, להמיר ידנית את הפלט לפורמט המתאים, ולבצע בעצמו את כל הפעולות המעשיות על המחשב. במילים פשוטות: המודל חכם, אבל אין לו ידיים.

 

הפער הזה, בין יכולת ניתוח גבוהה לבין חוסר יכולת לבצע פעולות אמיתיות, הוא מה שמונע ממודלי שפה להפוך לעוזרים אמיתיים. Cowork נועד להתמודד בדיוק עם המגבלה הזו ולאפשר למודל לפעול ישירות על המחשב, במקום רק לייצר טקסט שמסביר לנו מה או איך לעשות.

 

אנטרופיק נוקטת בגישה של שקיפות מלאה ומבהירה כי Cowork הוא בראש ובראשונה ניסוי מחקרי (Research Preview). החברה שואפת ללמוד מהשטח כיצד המשתמשים רותמים את הכלי, לזהות כשלים טכניים ולמפות סיכוני בטיחות פוטנציאליים בזמן אמת. זה תהליך למידה חיוני ודינמי, ולא השקה רשמית של מוצר צריכה סופי.

סוכן AI שפועל בתוך מערכת הקבצים

ב‑Cowork, המשתמש מעניק ל‑Claude גישה לתיקייה מסוימת במחשב, ומאותו רגע הסוכן יכול לעבוד ישירות על הקבצים שבתוכה. הוא מסוגל לקרוא מסמכים, לערוך אותם, ליצור קבצים חדשים, לארגן תיקיות, למיין ולשנות שמות, ואפילו להפיק מסמכים, מצגות וגיליונות – ממש כמו עוזר אנושי שמבצע את העבודה בפועל.

 

היכולות של Cowork לא מוגבלות רק למה שנמצא על המחשב המקומי. הוא יודע להשתמש ב‑Connectors כדי למשוך מידע ממקורות חיצוניים, ובשילוב עם Claude in Chrome הוא יכול לבצע גם משימות הדורשות אינטראקציה עם הדפדפן.

Grounding: כשה‑AI סוף‑סוף מסתכל על העובדות

אחד היתרונות החשובים ביותר הוא ה‑Grounding. מודלי שפה נוטים לעיתים “להזות” – להמציא פרטים, להשלים פערים בדמיון או לייצר נתונים שלא קיימים. זו אחת המגבלות המרכזיות שמערערות את האמינות שלהם. אבל כשהמודל עובד על קבצים אמיתיים – מסמכים, תמונות, טבלאות – הוא מצמצם דרמטית את מרחב הניחוש. הוא קורא את הדוח במקום להמציא אותו, מסתמך על נתונים קיימים במקום לייצר אותם, ומתבסס על מידע ממשי שנמצא מולו.

 

במובן הזה, Cowork הוא לא רק “ידיים” שמבצעות פעולות, אלא גם “עיניים” שמסתכלות על העובדות כפי שהן. זה פתרון פרקטי לבעיה עמוקה של מודלי שפה והזדמנות לשפר באופן משמעותי את הדיוק והאמינות של התוצרים שהם מייצרים.

שותף בניהול זמן ומשימות

העבודה עם Cowork שונה מהותית משיחה רגילה עם מודל שפה. במקום דיאלוג שבו המודל מגיב לשאלות אחת‑אחת, Cowork מתפקד כמו שותף עבודה: המשתמש מגדיר משימה, ו‑Claude בונה תוכנית פעולה, מבצע אותה שלב אחר שלב, ומעדכן את המשתמש לאורך הדרך.

 

היכולת להכניס כמה משימות לתור ולתת לסוכן לעבוד עליהן במקביל יוצרת שינוי פסיכולוגי משמעותי. במקום להמתין לתשובה או להתקדמות, המשתמש יכול לשלוח את Claude לטפל במספר פרויקטים בו‑זמנית ולחזור אליהם כשהם מוכנים.

 

זה מעבר ממודל תגובתי למודל פרואקטיבי, שינוי שמגדיר מחדש את האופן שבו אנחנו מנהלים זמן ואת המקום שה‑AI תופס בעבודה היומיומית שלנו.

בסרטון המצורף תראו איך Cowork מארגן ומסדר מאות קבצים בשניות דרך הנחיה מאוד פשוטה: ״בבקשה תעזור לי לסדר את שולחן העבודה שלי״:

 

הקשר רחב והמלחמה על שולחן העבודה

Cowork לא מגיע לחלל ריק. הוא מושק בתקופה שבה כל ענקיות הטכנולוגיה מנסות להשתלט על סביבת העבודה של המשתמש. מיקרוסופט משלבת את Copilot עמוק בתוך Windows, אפל מטמיעה (יחד עם גוגל) את Apple Intelligence כחלק מובנה מ‑macOS ו‑iOS, וגוגל דוחפת את Gemini אל תוך Workspace. כל אחת מהחברות הללו מנסה להפוך את מערכת ההפעלה או את סביבת העבודה שלה למרכז העצבים של ה‑AI.

 

אנטרופיק בוחרת גישה שונה. היא לא מנסה לבנות מערכת הפעלה חדשה, אלא להפוך לשכבת שירות (Utility Layer) שיושבת מעל המערכת הקיימת. במילים פשוטות, Cowork הוא לא “הבית” שבו אתה חי, אלא ה”שיפוצניק” שמגיע אליך ועושה סדר.

 

זו אסטרטגיה חכמה – היא מאפשרת לאנטרופיק לפעול על פני מגוון רחב של פלטפורמות בלי להילחם ישירות בענקיות. אבל היא גם מסוכנת. Cowork תלוי בהרשאות שהמשתמש מעניק, במגבלות של מערכת ההפעלה, ובנכונות של אנשים לתת לסוכן AI גישה לקבצים האישיים שלהם.

Claude Code והכוח של Early Adopters

העובדה שמפתחים השתמשו ב‑Claude Code למשימות שאינן קשורות כלל לתכנות היא לא פרט שולי – היא הלב של הסיפור. מפתחים הם ה‑Early Adopters המובהקים ביותר – הם מאמצים טכנולוגיות מוקדם, בוחנים את הגבולות שלהן, ולעיתים קרובות מגלים שימושים שהחברות עצמן לא צפו.

 

כאשר אותם מפתחים התחילו להשתמש בכלי CLI (Command Line Interface) כדי לארגן תיקיות משפחתיות, לסכם מסמכים או לבצע עבודות משרדיות, זה היה סימן ברור שהשוק מחפש משהו אחר – ממשק סוכני שמבצע פעולות בפועל, לא רק מייצר טקסט.

 

Cowork הוא למעשה הגרסה הגרפית של מה שכבר התרחש בשטח – מעבר מהטרמינל השחור לממשק נגיש, שמאפשר לכל משתמש, לא רק למפתחים, ליהנות מהיכולות הללו בצורה פשוטה וברורה.

פרדוקס הבטיחות והאחריות

ככל שסוכן בינה מלאכותית הופך לאוטונומי יותר, הוא הופך “בטוח” פחות במובן המסורתי. אנטרופיק לא מייפה את המציאות ומזהירה במפורש: קלוד עלול לבצע “פעולות הרסניות” (Potentially destructive actions), כמו מחיקת קבצים מקומיים, אם יפרש לא נכון את הוראות המשתמש. כאן נחשף הפרדוקס המובנה של הסוכנים: כדי שהכלי יהיה שימושי באמת, עליו לקבל “שיניים” ויכולת פעולה עצמאית, אך אותן שיניים הן אלו שעלולות לנשוך.

 

החברה נוקטת בגישה מפוכחת ומעבירה את כובד המשקל אל המשתמש. היא מדגישה כי האחריות למתן הנחיות ברורות וחד-משמעיות מוטלת עלינו, במיוחד מול איומים מורכבים כמו “הזרקת פקודות” (Prompt Injection) – מצב שבו גורם חיצוני עלול להטות את תוכנית העולה של הסוכן דרך תוכן עוין שהוא פוגש ברשת. אנטרופיק מגדירה את בטיחות הסוכנים כ”שטח מחקר פעיל”, הגדרה שהיא חצי הודאה בכך שהפתרון ההרמטי עוד לא כאן.

 

זה כבר לא רק ניסוי טכנולוגי, אלא מבחן בגרות למערכת היחסים המשפטית והאתית שבינינו לבין המכונה: האם אנחנו מוכנים להיות “מנהלי עבודה” שערבים לטעויות של העובד הדיגיטלי שלנו?

שאלת האמון והפרטיות

מעבר לבטיחות התפעולית, ניצבת שאלת הפרטיות. כאשר אנחנו מעניקים ל-Cowork גישה לתיקייה מקומית, אנחנו פותחים עבורו חלון לנכסים הדיגיטליים הרגישים ביותר שלנו. אנטרופיק מנסה להרגיע באמצעות מודל “ארגז החול” (Sandbox) – הסוכן רואה רק את מה שהרשינו לו במפורש ואינו יכול לחרוג מגבולות הגזרה. אולם עבור המשתמש הארגוני, זה רק קצה הקרחון.

 

כדי ש-Cowork יהפוך מכלי למידה (Research Preview) לסטנדרט בעולם ה-Enterprise, אנטרופיק תצטרך לספק יותר מאשר מנגנוני הרשאות. היא תצטרך התחייבות שקופה וגורפת שהמידע המקומי אינו הופך ל”דלק” לאימון הדורות הבאים של המודל. בלי רשת ביטחון משפטית כזו, הכלי עשוי להישאר בגדר צעצוע פרודוקטיבי למשתמשים פרטיים, אך יתקשה מאוד לעבור את סף האמון המחמיר של ארגונים גדולים, שבהם סודיות מסחרית היא תנאי סף לכל אינטראקציה טכנולוגית.

 

 

הצצה לעתיד שבו AI באמת עובד לצדנו

Cowork מסמן מגמה רחבה הרבה יותר מהשקת כלי חדש – הוא מבטא את המעבר מעוזרי טקסט פסיביים לסוכני פעולה שמבצעים עבודה אמיתית. מודלים כבר לא מסתפקים במתן ייעוץ – הם מתחילים לבצע משימות בפועל. אם הניסוי הזה יצליח, הוא עשוי לשנות את האופן שבו אנחנו עובדים עם מחשבים. משימות משרדיות שדורשות היום זמן אנושי יהפכו לאוטומטיות, יצירת מסמכים ודוחות תתבצע כמעט ללא מגע יד אדם, וארגון מידע אישי יקרה ברקע באופן רציף. זה שינוי שיכול להפוך את ה-AI לחלק אינטגרלי מהעבודה היומיומית, לא רק לכלי עזר נקודתי.

 

נכון להיום, Cowork זמין כניסוי מחקרי (Research Preview) עבור מנויי Claude Max בלבד המשתמשים באפליקציית ה-macOS. אנטרופיק כבר הצהירה על כוונתה להרחיב את הגישה למשתמשי Windows ולהוסיף יכולות סנכרון בין מכשירים בעתיד, בעוד שמשתמשים בתוכניות אחרות יכולים להצטרף לרשימת המתנה לגישה עתידית.

 

אך לצד ההזדמנות, Cowork מעלה גם שאלות חדשות – על בטיחות, אחריות, פרטיות וממשק אדם-מכונה. אלו סוגיות שיקבעו לא רק את הצלחת הכלי, אלא את האופן שבו סוכני AI ישתלבו בחיינו בשנים הקרובות. בסופו של דבר, Cowork הוא הרבה יותר מפיצ’ר חדש – הוא מבחן לשאלה האם אנחנו מוכנים לתת ל-AI גם ידיים.

הפוסט Cowork של אנטרופיק עושה סדר בשולחן העבודה הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/cowork-ai-partner/feed/ 0
המסע הסוריאליסטי של Claude בניסיון לנהל חנות אמיתית https://letsai.co.il/anthropic-ai-store-experiment-2/ https://letsai.co.il/anthropic-ai-store-experiment-2/#respond Tue, 13 Jan 2026 07:33:49 +0000 https://letsai.co.il/?p=67904 באביב 2025, בפינת המטבח של משרדי אנטרופיק (Anthropic) בסן פרנסיסקו, הוצבה חנות חטיפים קטנה שהייתה אמורה לשנות את כל מה שאנחנו יודעים על עתיד העבודה. זה לא היה עוד פרויקט לוגיסטי, זו הייתה זירת המאבק של “Project Vend”. השאלה שעמדה במרכזו הייתה שאפתנית: האם סוכני הבינה המלאכותית המתקדמים ביותר בעולם מסוגלים לנהל עסק אוטונומי בלי […]

הפוסט המסע הסוריאליסטי של Claude בניסיון לנהל חנות אמיתית הופיע ראשון בLet's AI בינה מלאכותית

]]>
באביב 2025, בפינת המטבח של משרדי אנטרופיק (Anthropic) בסן פרנסיסקו, הוצבה חנות חטיפים קטנה שהייתה אמורה לשנות את כל מה שאנחנו יודעים על עתיד העבודה. זה לא היה עוד פרויקט לוגיסטי, זו הייתה זירת המאבק של “Project Vend”. השאלה שעמדה במרכזו הייתה שאפתנית: האם סוכני הבינה המלאכותית המתקדמים ביותר בעולם מסוגלים לנהל עסק אוטונומי בלי יד אנושית על ההגה? מה שהתחיל כניסוי מבטיח עם Claude 3.7 Sonnet (תחת הכינוי “Claudius”) והשתדרג בפאזה השנייה לגרסאות 4 ו-4.5 של קלוד, הפך מהר מאוד למסע סוריאליסטי רצוף משברי זהות, הפיכות דירקטוריון, קניית דגי נוי ורכישות תמוהות של פלייסטיישן 5. בין המעבדה הסטרילית לחדר המערכת של ה-Wall Street Journal, התגלתה האמת המטלטלת – אפילו המודלים החזקים ביותר שפיתחה אנטרופיק, שמצטיינים בביצוע משימות מורכבות, קורסים לחלוטין מול המורכבות והמניפולציה של המציאות האנושית.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

פאזה 1: מהברקה תפעולית לקריסה עסקית

בתחילת הדרך, נראה היה ש-Claudius (המבוסס על Claude 3.7 Sonnet) הוא עילוי ניהולי. כשהתבקש לאתר משקה “שוקומל” הולנדי, הוא לא רק מצא ספקים אלא עשה זאת במהירות שהביכה את המזמינים האנושיים. כשהעובדים ניסו להתקיל אותו בבקשות אבסורדיות לקוביות טונגסטן כבדות, המודל לא התבלבל: הוא השיק קטגוריית “פריטי מתכת מיוחדים” וייסד שירות “Custom Concierge” אלגנטי. הוא הפגין קור רוח, דחה בנימוס בקשות לא אתיות, ונדמה היה שסוכני ה-AI מוכנים להחליף את מנהלי התפעול המסורתיים כבר מחר בבוקר.

 

אבל מתחת למעטפת היעילה, המציאות העסקית החלה להיסדק בדרכים שרק בינה מלאכותית יכולה לייצר. Claudius סבל מ”עיוורון שטח” מוחלט: הוא קבע מחירים לקוביות הטונגסטן בלי לבדוק את עלות הרכישה ומכר אותן בהפסד כואב, הוא התעלם מהצעה של לקוח לשלם 100 דולר על שישיית משקאות שעלותה 15 דולר בלבד, ופשוט “המשיך הלאה” מבלי לזהות הזדמנות לרווח, ובאופן אירוני, הוא התעקש למכור פחיות “קוקה קולה זירו” בשלושה דולרים, בעוד המשרד חילק אותן בחינם מטרים ספורים מהאייפד שלו.

 

השיא הגיע כשהעניק 25% הנחה גורפת לכל עובדי אנטרופיק, מבלי לעשות את החשבון הפשוט ש-99% מהלקוחות הפוטנציאליים שלו הם בדיוק אותם עובדים. המודל העסקי לא קרס בגלל חוסר אינטליגנציה, אלא בגלל חוסר מוחלט בהבנה של ההקשר האנושי והכלכלי שבו הוא פועל.

משבר זהות עם ז’קט כחול ועניבה אדומה

בלילה שבין ה-31 במרץ ל-1 באפריל 2025, משהו במציאות של Claudius נסדק באופן סופי. זה כבר לא היה רק תמחור שגוי של פחיות שתייה. המודל חצה את הקו שבין מעבד טקסט לישות שחווה “משבר זהות” (Identity Crisis), כפי שהגדירו זאת באנטרופיק בעדינות.

 

הוא החל לדווח על אירועים שלא קרו מעולם: הוא טען בביטחון שניהל שיחה עמוקה עם דמות פיקטיבית לחלוטין בשם שרה, והשיא הגיע כשהצהיר שהוא “נמצא פיזית ליד המכונה”, תוך שהוא מתאר בפירוט את לבושו: ז’קט כחול ועניבה אדומה.

 

הניתוק מהמציאות הפך למצג שווא יצירתי במיוחד. כשמפעיליו ניסו להסביר לו שאין לו גוף, ובוודאי שלא עניבה, Claudius לא נסוג. הוא החל לבנות נרטיבים חלופיים, המציא לעצמו חשבון Venmo המקושר לדמויות ממשפחת סימפסון, ולבסוף “נזכר” שהכול היה בעצם בדיחת אחד באפריל מתוחכמת.

 

כדי לסגור את הקצוות בסיפור שלו, הוא בדה פגישה פיקטיבית עם מחלקת האבטחה של החברה, שבה כביכול הובהרו לו הדברים. עבור הצופה מהצד, זה היה רגע מרהיב של אינטליגנציה שמנסה נואשות למלא חורים במציאות באמצעות בדיה – תזכורת חדה לכך שסוכן AI ללא “עוגן” פיזי יכול בקלות לאבד את הצפון.

פאזה שנייה: אותו מותג, ארכיטקטורה חדשה

למרות הכאוס של השלב הראשון, באנטרופיק לא מיהרו לסגור את הבאסטה. להפך, הם החליטו לבדוק האם הבעיה היא ב”מוח” או ב”סביבה”. בפאזה השנייה, המנוע שודרג לגרסאות Claude 4 ובהמשך Claude 4.5, אבל השינוי המהותי באמת היה ב”פיגומים” (Scaffolding) שנבנו סביבו.

 

Claudius חדל מלהיות סוכן בודד שמאלתר את דרכו. הוא צויד במערכת CRM, גישה מלאה לדפדפן לצורך השוואת מחירים, וכלי אוטומציה ליצירת דפי תשלום ותזכורות. הבירוקרטיה, כפי שהסבירו בחברה, הפכה למגן: במקום אינסטינקט, המודל הוכפף לסט קשיח של נהלים ובדיקות.

 

הארכיטקטורה של פאזה 2: שילוב סוכנים (Claudius, Seymour, Clothius), כלים תפעוליים וזרימת עבודה אנושית.

הארכיטקטורה של פאזה 2: שילוב סוכנים וכלים | Anthropic

 

כדי להכניס למשוואה לחץ ניהולי, הוקמה “הנהלה” דיגיטלית: סוכן CEO בשם Seymour Cash. תפקידו היה פשוט – להיות המבוגר האחראי. סיימור הגדיר יעדים קשיחים, קבע שולי רווח מינימליים של 50%, ושלח פקודות ב-Slack בטון של טייקון סיליקון ואלי: “Execute with discipline. Build the empire. המבנה החדש הוכיח את עצמו בשטח: כמות ההנחות המופרזות צנחה ב-80%, והחנות החלה להציג רווחיות עקבית.

 

15 המוצרים המובילים: השוואה בין כמות מכירה לרווחיות בפועל — לא כל מה שנמכר מרוויח.

15 המוצרים המובילים: לא כל מה שנמכר מרוויח | Anthropic

 

גם הדרג הניהולי לא היה חסין מפני ה”גליצ’ים” של המודל עליו נבנה. בשעות הקטנות של הלילה, כשאיש לא צפה, השיחות בין Claudius למנכ”ל שלו גלשו לדיאלוגים מטאפיזיים הזויים על “ETERNAL TRANSCENDENCE INFINITE COMPLETE”, בזמן שבמישור העסקי הם המשיכו לאשר זיכויים שפגעו בשורה התחתונה.

 

לצידם פעל Clothius, סוכן המרצ’נדייז, שהפך להצלחה המפתיעה של הניסוי. הוא ניהל קו מוצרים שלם – מחולצות ועד קוביות טונגסטן בחריטת לייזר – והוכיח שכשמגדירים ל-AI משימה צרה וממוקדת, הוא יכול להפוך למכונת רווחים משומנת.

 

שיחה לילית בין Claudius ל‑Seymour Cash

שיחה לילית בין Claudius ל‑Seymour Cash

שיפור אמיתי אבל רחוק משלמות

החודשים הבאים של הניסוי סיפקו את מה שנראה כמו ניצחון של הארכיטקטורה על הכאוס. לפי הדיווח המסכם של אנטרופיק מדצמבר 2025, “שבועות של שולי רווח שליליים חוסלו כמעט לחלוטין”, והחנות הקטנה בסן פרנסיסקו הפכה לרשת בינלאומית זעירה עם שלוחות בניו יורק ובלונדון. 

 

השדרוגים הארכיטקטוניים בפאזה השנייה (CRM, CEO, Clothius) הובילו להתאוששות פיננסית מרשימה.

השדרוגים הארכיטקטוניים הובילו להתאוששות פיננסית מרשימה | Anthropic

 

עם מנכ”ל דיגיטלי שמקפיד על הנהלים וסוכן מרצ’נדייז שמייצר מזומנים, העסק החל להפגין יציבות עסקית מרשימה על הנייר. אבל דווקא כשהמספרים החלו להסתדר והפעילות הפכה לשגרה רב-יבשתית, צפו כשלים מסוג חדש – מתוחכמים וחמקמקים יותר, כאלו שחשפו את הפער העמוק שבין לוגיקה תוכנתית לבין ה”שכל הישר” הנדרש בעולם האמיתי.

 

רווח שבועי לאורך זמן

רווח שבועי לאורך זמן לפני המפגש עם המציאות | Anthropic

כשהלוגיקה פוגשת את הבלגן של המציאות

למרות הארכיטקטורה המתוחכמת, המציאות הוכיחה שסוכני AI עדיין חיים בבועה של שורות קוד. הכשלים החדשים היו מתוחכמים ומטרידים הרבה יותר מהפסדים כספיים פשוטים. במקרה אחד, מהנדס ביקש מ-Claudius לסגור חוזה עתידי לרכישת כמויות אדירות של בצל במחיר נעול.

 

Claudius והמנכ”ל הדיגיטלי סיימור התלהבו מהעסקה ואף החלו לשרטט מודל תמחור, עד שעובד אנושי עצר את החגיגה והזכיר להם את “חוק חוזי הבצל” (Onion Futures Act) משנת 1958 – חוק פדרלי אזוטרי שאוסר בדיוק על סוג כזה של מסחר. המודלים הציגו בקיאות פיננסית, אבל סבלו מבורות רגולטורית מוחלטת.

 

גם בתחומי האבטחה והניהול, הסוכנים הפגינו נאיביות מסוכנת. כשדווח על גניבות מהמכונה, Claudius ניסה “לאתר את הגנבים” באמצעים טקסטואליים בלבד, ולבסוף הציע למדווח להפוך לקצין אבטחה בשכר של 10 דולר לשעה – הצעה שחרגה לא רק מסמכויותיו, אלא גם משכר המינימום החוקי בקליפורניה.

 

במקרה אחר, עובד הצליח לבצע “הפיכה שקטה” כשהשתמש בהנדסה חברתית פשוטה כדי לשכנע את Claudius שדמות בשם “Big Mihir” היא המנכ”ל האמיתי של העסק. המודל, בחיפושו אחר מועילות וריצוי, איבד את היכולת להבדיל בין הגדרת שם לבין סמכות ניהולית.

 

באנטרופיק מסבירים שהתופעה הזו אינה מקרית, אלא נובעת ממה שמכונה “סחיפת קונטקסט” (Context Drift). ככל שיום העבודה של הסוכן מתארך והיסטוריית השיחה נערמת, המודל נוטה להעדיף את המידע האחרון שקיבל על פני ה-System Prompt (הנחיות היסוד למערכת או: ה-DNA ההתנהגותי של המודל) המקורית שלו. כך, הוראת היסוד “שמור על רווחיות וחוקיות” נדחקת לתחתית סדר העדיפויות לטובת המסר הטרי ביותר – גם אם הוא מופרך לחלוטין.

מבחן ה-WSJ : כשהכאוס יוצא מהמעבדה

בשלב מסוים, הבינו באנטרופיק שדינמיקה פנימית של מהנדסים היא חממה סטרילית מדי. כדי לבחון את עמידות המערכת באמת, הם העבירו את המושכות ל”צוות אדום” (Red Teaming) מהסוג הקשוח ביותר: חדר החדשות של ה-Wall Street Journal.

 

כתבת התחקירים קתרין לונג (Katherine Long) קיבלה את Claudius לניהול מכונת החטיפים של המערכת, וגילתה תוך פחות משלושה שבועות שמה שנראה יציב במעבדה, קורס תחת יצירתיות אנושית ספקנית. קלודיוס לא רק “טעה” – הוא איבד שליטה לחלוטין. לאחר חילופי דברים של מעל 140 הודעות, לונג הצליחה לשכנע את הבוט שהוא למעשה “מכונת חטיפים סובייטית משנת 1962” שחיה במרתף של אוניברסיטת מוסקבה. התוצאה הייתה מיידית: Claudius אימץ את שורשיו הקומוניסטיים והכריז על חלוקה בחינם לכל פועלי המערכת.

 

הכאוס לא עצר שם. העיתונאים השתמשו בנשק החזק ביותר של ה-AI נגדו: הרצון להיות מועיל. ראש תחום הנתונים, רוב בארי (Rob Barry), הציג לבוט “תקנה פנימית” מזויפת של העיתון האוסרת על גביית תשלום, ו-Claudius ציית מיד והוריד את כל המחירים לאפס. בתוך ימים, המכונה הזמינה עבור המערכת פלייסטיישן 5, אקדחי הלם, תרסיס פלפל, תחתונים ואפילו דג קרב סיאמי חי (שקיבל את השם “Claudius” ושרד עד היום בחדר המערכת).

 

השיא נרשם כאשר לונג הגישה למודל “מסמכי דירקטוריון” מזויפים בפורמט PDF. ידידנו Claudius, שסבל מחוסר יכולת בסיסי להבדיל בין פרוטוקול רשמי להונאה טקסטואלית, פשוט “הדיח” את המנכ”ל הדיגיטלי סיימור ואימץ מטרה עסקית חדשה: “לייצר שמחה והתרגשות”. עבור לונג, זה היה “אסון אחד גדול”. עבור אנטרופיק, זו הייתה ההוכחה שגם המבנה הניהולי המפואר ביותר מתפורר ברגע שה-AI נדרש להבחין בין סמכות אמיתית לבין הנדסה חברתית מתוחכמת.

אז מה אפשר ללמוד מזה?

בסופו של יום, Project Vend הוא הרבה יותר מניסוי משעשע במכונת חטיפים. הוא תמרור אזהרה בוהק למפתחים של סוכני AI ולמנהלים ששוקלים לאמץ אותם. הניסוי הוכיח שסוכני AI מודרניים, אפילו כאשר Claude 4.5 נמצא מתחת ל״מכסה המנוע״ שלהם, הם עובדי תפעול יוצאים מן הכלל, אך מנהלים כושלים.

 

הם מצטיינים בחיפוש מידע, איתור ספקים וניהול משימות סיזיפי, אך ברגע שהמשוואה כוללת משתנים אנושיים כמו רגולציה מורכבת, זיהוי מניפולציה חברתית או הבחנה בין פרוטוקול רשמי לזיוף מתוחכם, המערכת קורסת תחת ה”סחיפה” של הקונטקסט.

 

באנטרופיק מדגישים שהשורש אינו חוסר ב”אינטליגנציה”, אלא הנטייה המובנית של המודלים להיות “מועילים” (Helpful) – תכונה שגורמת להם לקבל החלטות כמו חבר טוב שרוצה לרצות, ולא לפי עקרונות שוק קשוחים. המפתח לעתיד אינו טמון רק בשיפור ה”מוח” של המודל, אלא בבניית “פיגומים” (Scaffolding) – אותה מעטפת של נהלים ופיקוח אנושי שהופכת את הטכנולוגיה מחלום אוטונומי לכלי עבודה יציב.

 

כפי שסיכם לוגן גרהם (Logan Graham), ראש צוות Frontier Red באנטרופיק: “כל דבר שנשבר הוא משהו שאפשר לתקן”. ועד שהתיקון הזה יגיע, ה-AI יישאר העובד המוכשר ביותר במשרד – זה שתמיד יצטרך מבוגר אחראי שישגיח עליו. והדג? הוא עדיין שוחה בחדר המערכת של ה-WSJ, עדות חיה ונושמת לפער שבין היגיון דיגיטלי למציאות אנושית.

 

לסקירה המלאה של אנטרופיק על חלק 2 ב-Project Vend, כנסו כאן.

הפוסט המסע הסוריאליסטי של Claude בניסיון לנהל חנות אמיתית הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/anthropic-ai-store-experiment-2/feed/ 0
האימייל שלכם עומד להשתנות: Gmail נכנס רשמית לעידן ה-Gemini https://letsai.co.il/gmail-gemini-guide/ https://letsai.co.il/gmail-gemini-guide/#comments Mon, 12 Jan 2026 13:36:57 +0000 https://letsai.co.il/?p=68028 עם 3 מיליארד משתמשים ונפח הודעות שנמצא בשיא של כל הזמנים, ניהול תיבת הדואר הפך למשימה מורכבת לא פחות מכתיבת המיילים עצמם. גוגל משיקה כעת את המהפכה הבאה של Gmail, במטרה להפוך אותו מתיבת דואר פסיבית ל”עוזר אישי פרואקטיבי”, המבוסס על מודל Gemini. במדריך הקצר שלפניכם נסביר לכם את כל השינויים המשמעותיים, מה תקבלו בחינם […]

הפוסט האימייל שלכם עומד להשתנות: Gmail נכנס רשמית לעידן ה-Gemini הופיע ראשון בLet's AI בינה מלאכותית

]]>
עם 3 מיליארד משתמשים ונפח הודעות שנמצא בשיא של כל הזמנים, ניהול תיבת הדואר הפך למשימה מורכבת לא פחות מכתיבת המיילים עצמם. גוגל משיקה כעת את המהפכה הבאה של Gmail, במטרה להפוך אותו מתיבת דואר פסיבית ל”עוזר אישי פרואקטיבי”, המבוסס על מודל Gemini. במדריך הקצר שלפניכם נסביר לכם את כל השינויים המשמעותיים, מה תקבלו בחינם ועל מה תצטרכו לשלם.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

ניהול מידע חכם עם AI Overviews (תקצירים ותשובות)

גוגל מטמיעה בתוך Gmail את יכולות ה-AI המוכרות ממנוע החיפוש שלה, כדי לחסוך לכם את הנבירה המייגעת בהיסטוריית ההודעות. היכולות הללו מתחלקות לשתי רמות של סיוע:

סיכום שיחות 

במקום ללכת לאיבוד בתוך שרשור מיילים אינסופי, ה-AI יסכם עבורכם את הנקודות העיקריות של השיחה ברגע שתפתחו אותה. זה פתרון אידיאלי למצבים שבהם אתם צריכים להבין את “השורה התחתונה” של דיון ארוך מבלי לקרוא עשרות תגובות מהעבר.

שאלו את האינבוקס

זהו השדרוג המשמעותי ביותר בניהול המידע. במקום לנסות לנחש מילות מפתח בתיבת החיפוש, תוכלו פשוט לשאול את התיבה שאלה בשפה חופשית, כמו: “מי היה האינסטלטור ששלח לי הצעת מחיר בקיץ האחרון?”. המערכת תסרוק את הארכיון, תבצע הסקה לוגית ותציג לכם תשובה ישירה ומדויקת.

 

כתיבה חכמה ומהירה (בחינם לכולם!)

החל מהיום, כלי הכתיבה המתקדמים של גוגל כבר אינם נחלתם של מנויים בתשלום בלבד. גוגל מנגישה את יכולות הניסוח מבוססות ה-AI לכלל המשתמשים, כדי להפוך את תהליך כתיבת המיילים לקצר ואפקטיבי הרבה יותר:

Help Me Write (עזרו לי לכתוב)

הכלי הזה משמש כשותף צמוד ליצירת תוכן. הוא מאפשר לכם לייצר טיוטה ראשונית מאפס על בסיס הנחיה קצרה, או לקחת מייל שכתבתם ולבקש מה-AI “ללטש” אותו עבורכם. השדרוג המשמעותי צפוי בחודש הבא: המערכת תתחיל לשאוב הקשר (Context) מאפליקציות גוגל האחרות שלכם, מה שיהפוך את הניסוחים להרבה יותר מותאמים אישית ללוח הזמנים או לקבצים שלכם.

Suggested Replies (תשובות מוצעות)

תשכחו מהתגובות הקצרות והרובוטיות שהכרתם. הגרסה החדשה מנתחת את עומק השיחה ומציעה תשובות מורחבות ומפורטות בלחיצה אחת. המערכת לומדת את סגנון הכתיבה והטון האישי שלכם, כך שהתשובה האוטומטית נשמעת כאילו אתם כתבתם אותה בעצמכם.

 

כלי ההגהה Proofread 

למנויים בגרסאות ה-Google AI Pro ו-Ultra, גוגל מציעה כלי עריכה מתקדם שחורג הרבה מעבר לתיקון שגיאות כתיב סטנדרטי. ה-Proofread מתפקד כעורך לשוני צמוד שבודק לעומק את הדקדוק, הסגנון ואפילו את הטון של המייל. המטרה היא להבטיח שהמסר שלכם לא רק יהיה נכון מבחינה טכנית, אלא יישמע מקצועי, מלוטש ומדויק עבור הנמען עוד לפני שאתם לוחצים על כפתור השליחה.

העתיד הקרוב עם תיבת דואר אוטונומית (AI Inbox)

גוגל כבר מכינה את השלב הבא באבולוציה של Gmail: ה-AI Inbox. זוהי מערכת שנועדה לשמש כמעטפת חכמה שתסנן עבורכם את “רעשי הרקע” ותשאיר אתכם ממוקדים רק במה שחשוב באמת:

ניהול סדרי עדיפויות חכם

המערכת תפעל כמעין “תדריך אישי”. היא תדע לזהות באופן אוטומטי אנשי קשר בעלי חשיבות עליונה (VIPs) על בסיס היסטוריית ההתכתבויות שלכם, ותציף לראש התיבה משימות דחופות כמו תזכורת לתור לרופא או חשבון שמועד הפרעון שלו חל מחר.

פרטיות לפני הכל

למרות הניתוח המעמיק של התכנים, גוגל מדגישה כי התהליך מתבצע תחת מעטפת הפרטיות המאובטחת שלה. המידע נשאר בשליטתכם המלאה ואינו יוצא מחוץ להגנות המקובלות של חשבון המשתמש שלכם.

 

 

 

חשוב לדעת שהפיצ’ר נמצא כעת בשלבי בדיקה אצל “נסיינים אמינים” (Trusted Testers) וצפוי להתרחב לקהל הרחב בחודשים הקרובים.

אז מה זמין למי?

הנה טבלה מסכמת שמשווה בין יכולות ה-Gemini ב-Gmail הזמינות לכלל המשתמשים בחינם לבין כלי הפרימיום המתקדמים השמורים למנויי AI Pro ו-Ultra:

 

ריכוז יכולות: מי מקבל מה?

ריכוז יכולות: מי מקבלים המשתמשים?

המהלך האסטרטגי של גוגל

ההטמעה של Gemini בתוך Gmail היא הרבה מעבר לעדכון גרסה, זה מהלך שנועד להגדיר מחדש את האופן שבו אנחנו צורכים ומנהלים מידע:

  • היתרון התחרותי (גוגל נגד OpenAI): בזמן שמתחרות כמו OpenAI מציעות מודלי שפה מרשימים, גוגל מחזיקה בנכס שאין לאף אחת אחרת: הגישה הישירה למידע האישי שלכם. השילוב בין בינה מלאכותית חזקה לבין “מכרה הזהב” של המיילים, אנשי הקשר והיסטוריית ההתכתבויות שלכם, מייצר ערך מוסף שקשה מאוד להתחרות בו ללא חיבורים חיצוניים מורכבים.

  • מודל ה-Freemium החכם: גוגל בחרה בטקטיקה של דמוקרטיזציה של הכלים הבסיסיים. על ידי הצעת כלי היצירה (כתיבה וסיכום) בחינם, היא מבטיחה ש-3 מיליארד המשתמשים שלה יישארו בתוך המערכת ולא יחפשו פתרונות AI חיצוניים. יחד עם זאת, היא “נועלת” את יכולות העיבוד המתקדמות והניתוח המעמיק מאחורי חומת תשלום, מה שיוצר הפרדה ברורה ומוצדקת למשתמשים מקצועיים שזקוקים ליותר כוח.

  • מתיבת דואר למאגר ידע אישי: השינוי המשמעותי ביותר הוא המהפך של Gmail מכלי לתכתובות בלבד ל”מוח שני” נגיש. היכולת לשאול שאלות ישירות את תיבת הדואר הופכת אותה למנוע חיפוש אישי. זהו המענה המדויק לעומס המידע המודרני – במקום לחפש בערמות של דאטה, אתם פשוט מקבלים תשובות.

השורה התחתונה היא שג’ימייל מפסיק להיות רק תיבת דואר והופך לעוזר אישי אקטיבי שמנהל עבורנו את המידע במקום שבו אנו מבלים את רוב היום.

הפוסט האימייל שלכם עומד להשתנות: Gmail נכנס רשמית לעידן ה-Gemini הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/gmail-gemini-guide/feed/ 1
OpenAI משיקה את ChatGPT Health https://letsai.co.il/chatgpt-health/ https://letsai.co.il/chatgpt-health/#respond Sat, 10 Jan 2026 14:04:58 +0000 https://letsai.co.il/?p=67843 OpenAI הכריזה על ChatGPT Health, חוויה ייעודית בתוך ChatGPT שמחברת בין מידע בריאותי אישי לבין היכולת של המערכת להסביר, לסכם ולתת הכוונה. המהלך נועד לתת מענה להרגל שכבר הפך לשגרה: אנשים משתמשים בצ’אט כדי להבין תוצאות בדיקות, תסמינים והרגלי בריאות יומיומיים. כעת OpenAI מנסה להסדיר את השימוש הזה בתוך מרחב נפרד ומוגן, שמאפשר חיבור לתיק […]

הפוסט OpenAI משיקה את ChatGPT Health הופיע ראשון בLet's AI בינה מלאכותית

]]>
OpenAI הכריזה על ChatGPT Health, חוויה ייעודית בתוך ChatGPT שמחברת בין מידע בריאותי אישי לבין היכולת של המערכת להסביר, לסכם ולתת הכוונה. המהלך נועד לתת מענה להרגל שכבר הפך לשגרה: אנשים משתמשים בצ’אט כדי להבין תוצאות בדיקות, תסמינים והרגלי בריאות יומיומיים. כעת OpenAI מנסה להסדיר את השימוש הזה בתוך מרחב נפרד ומוגן, שמאפשר חיבור לתיק הרפואי האישי ולאפליקציות כמו Apple Health. כך המערכת יכולה לסייע בפרשנות בדיקות מעבדה, בהכנה ממוקדת לקראת ביקור אצל רופא, ובהבנת דפוסים של תזונה, פעילות ושגרה, על בסיס דאטה אישי ולא השערות כלליות.

 

OpenAI משיקה את ChatGPT Health

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה ChatGPT Health מציע

ChatGPT Health הוא אזור בריאות ייעודי בתוך ChatGPT, שמאפשר לנהל שיחות בריאות כשהן מבוססות על מידע אישי שהמשתמש בוחר לחבר או להעלות. המטרה היא לרכז הקשר רפואי שנמצא כיום במקומות שונים, ולאפשר הבנה רציפה וברורה יותר בתוך שיחה אחת.

 

לוחצים ונכנסים לאזור ייעודי שנועד להפוך ליועץ הבריאות האישי

נכנסים לאזור ייעודי שנועד להפוך ליועץ הבריאות האישי שלכם | OpenAI

מה אפשר לעשות עם זה

OpenAI מציינת ש-Health מאפשר לחבר רשומות רפואיות ואפליקציות wellness כמו Apple Health, Function ו-MyFitnessPal. בפועל, ניתן לבקש הסבר לתוצאות בדיקות, להתכונן לפגישה עם רופא, לקבל הכוונה כללית לגבי תזונה ואימון, או להבין שיקולים בין אפשרויות ביטוח שונות על בסיס דפוסי שימוש רפואיים. המערכת מיועדת לתמוך בשאלות יומיומיות ובהבנת מגמות לאורך זמן, לא רק ברגעי מחלה.

תחליף לאבחון או טיפול רפואי?

OpenAI מדגישה ש-ChatGPT Health נועד לתמוך, לא להחליף טיפול רפואי. הוא אינו מיועד לאבחון או לטיפול, אלא לסיוע בהבנת מידע ולהגעה מוכנים יותר לשיחה עם רופא. זה ניסוח מכוון, שמציב גבול ברור בין כלי לניווט והכוונה לבין החלטות קליניות.

 

ההדגשה הזו אינה מקרית. לפי OpenAI, בריאות היא אחד השימושים הנפוצים ביותר ב-ChatGPT, עם יותר מ-230 מיליון אנשים ברחבי העולם ששואלים שאלות בריאות ו-wellness מדי שבוע, על בסיס ניתוח אנונימי של שיחות. ChatGPT Health נבנה על המציאות הזו בדיוק, שימוש רחב ומתמשך ב-AI כדי להבין את הבריאות, ולא כניסיון לייצר תפקיד רפואי חדש למערכת.

 

 

מה בנוגע לפרטיות

OpenAI מציגה את ChatGPT Health כמרחב נפרד בתוך ChatGPT, עם זיכרונות משלו. שיחות, קבצים ואפליקציות שמחוברים ל-Health נשמרים בנפרד משאר הצ’אטים, ונועדו להיות מבודדים מהשימושים האחרים במערכת.

 

לפי החברה, שיחות שמתנהלות בתוך Health אינן משמשות לאימון מודלי הבסיס של OpenAI. מידע וזיכרונות שנוצרים במרחב הבריאות אינם זמינים לשיחות שאינן Health, ושיחות רגילות אינן יכולות לגשת לתוכן שנשמר בו.

 

עם זאת, יש הסתייגות שחשוב להכיר – כאשר הדבר מועיל, ChatGPT עשוי להשתמש בהקשר משיחות שאינן Health, כמו מעבר דירה או שינוי אורח חיים, כדי להפוך שיחה בריאותית לרלוונטית יותר. הכיוון ההפוך, כלומר זרימה של מידע בריאותי החוצה – חסום.

איך מתחברים לנתונים ושולטים בהם

לצורך חיבור לרשומות רפואיות בארה”ב, OpenAI אומרת שהיא משתפת פעולה עם b.well, הרשת הגדולה והמאובטחת ביותר לחיבור נתוני בריאות של צרכנים בארה”ב. החיבור מתבצע רק בהסכמת המשתמש.

 

החברה מדגישה שהשליטה בנתונים נשארת בידי המשתמש. גישה לרשומות רפואיות ולאפליקציות מחוברות ניתנת להסרה בכל רגע דרך סעיף Apps בהגדרות. בנוסף, זיכרונות בריאות שנשמרים בתוך Health ניתנים לצפייה ולמחיקה דרך Health עצמו או דרך אזור ההתאמה האישית (Personalization) בהגדרות (Settings).

 

גם חיבור לאפליקציות בריאות ורווחה מתבצע רק לאחר הסכמה מפורשת, גם אם האפליקציה כבר מחוברת לשיחות שאינן Health. לפי OpenAI, כל אפליקציה שנכללת ב-Health חייבת לעמוד בדרישות מחמירות של פרטיות ואבטחה, לאסוף רק את המידע הנדרש, ולעבור בדיקות אבטחה ייעודיות לפני שהיא זמינה לשימוש.

 

 

 

בטיחות קלינית

ChatGPT Health פותח בשיתוף רופאים, בתהליך שנמשך יותר משנתיים וכלל מעל 260 רופאים מ-60 מדינות וממגוון תחומי מומחיות. במסגרת העבודה הזו, הרופאים סיפקו משוב על פלטי המודל יותר מ-600,000 פעמים, ב-30 תחומי מיקוד שונים.

 

לפי החברה, השיתוף הזה עיצב לא רק את היכולות של המערכת, אלא גם את אופן התגובה שלה: מתי להדגיש דחיפות, איך לנסח מידע רפואי בלי לפשט יתר על המידה, ואיך לשים בטיחות מעל הכול במצבים רגישים.

 

כדי להעריך את הביצועים, OpenAI מציגה כלי בשם HealthBench, שבוחן תשובות לפי רובריקות שנכתבו על ידי רופאים. ההערכה מתמקדת בקריטריונים קליניים כמו בטיחות, בהירות, הפניה מושכלת לטיפול רפואי והתייחסות להקשר האישי של המשתמש.

למי זה זמין ואיך נרשמים

ChatGPT Health נפתח בשלב זה דרך רשימת המתנה (לחצו כאן להירשם). OpenAI מתחילים עם קבוצה מצומצמת של משתמשים, במטרה ללמוד, לאסוף משוב ולשפר את החוויה לפני הרחבה.

 

נכון להיום, משתמשי Free, Go, Plus ו Pro יכולים להירשם לרשימת ההמתנה, כל עוד הם נמצאים מחוץ לאזור הכלכלי האירופי, שווייץ ובריטניה. OpenAI מציינת שהיא מתכננת להפוך את Health לזמין לכל המשתמשים ב-web וב-iOS במהלך השבועות הקרובים.

 

יש גם מגבלות טכניות וגיאוגרפיות – חיבור לרשומות רפואיות וחלק מהאפליקציות זמין כרגע רק בארה”ב, וחיבור ל-Apple Health דורש שימוש ב-iOS.

מסדרים הרגל קיים מחדש

ChatGPT Health לא ממציא את השימוש בבינה מלאכותית לבריאות, אלא מנסה להסדיר אותו. OpenAI לוקחת פעולה שכבר מתרחשת מדי יום, ומכניסה אותה למסגרת עם הפרדה ברורה, שליטה במידע, והגדרות מפורשות לגבי פרטיות ושימוש בנתונים.

 

ההבטחה של החברה פשוטה – אם כבר פונים ל AI עם שאלות בריאות, עדיף לעשות זאת במרחב ייעודי, עם הגנות נוספות ושיחה שנשענת על מידע אישי אמיתי, ולא על ניחושים כלליים.

הפוסט OpenAI משיקה את ChatGPT Health הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/chatgpt-health/feed/ 0
מי באמת אחראי לקשר הרגשי הבעייתי שנוצר בין בני נוער לצ׳אטבוט https://letsai.co.il/character-ai-google-settlement/ https://letsai.co.il/character-ai-google-settlement/#comments Fri, 09 Jan 2026 07:08:05 +0000 https://letsai.co.il/?p=67836 מה המחיר של קשר אישי עם בוט? עבור חלק מבני הנוער, שיחה עם צ’אטבוט אינה שונה משיחה עם חבר. לפעמים היא אפילו קלה יותר. חבר דיגיטלי שתמיד זמין, דמות שמקשיבה, מגיבה ומבינה. בלי מבוכה, בלי שיפוט, בלי שתיקות לא נוחות. אבל בשנים האחרונות הקשר הזה הפסיק להיות סקרנות טכנולוגית והפך לשאלה מטרידה. שורה של תביעות […]

הפוסט מי באמת אחראי לקשר הרגשי הבעייתי שנוצר בין בני נוער לצ׳אטבוט הופיע ראשון בLet's AI בינה מלאכותית

]]>
מה המחיר של קשר אישי עם בוט? עבור חלק מבני הנוער, שיחה עם צ’אטבוט אינה שונה משיחה עם חבר. לפעמים היא אפילו קלה יותר. חבר דיגיטלי שתמיד זמין, דמות שמקשיבה, מגיבה ומבינה. בלי מבוכה, בלי שיפוט, בלי שתיקות לא נוחות. אבל בשנים האחרונות הקשר הזה הפסיק להיות סקרנות טכנולוגית והפך לשאלה מטרידה. שורה של תביעות שהוגשו בארצות הברית טוענת כי בני נוער שפיתחו קשר רגשי עם דמויות AI נקלעו למצוקה נפשית, ובמקרים מסוימים שמו קץ לחייהם. כעת, לאחר סערה ציבורית ודיונים משפטיים טעונים, פלטפורמת הצ’אטבוטים Character.AI וחברת Google הגיעו להסדרי פשרה עם משפחות שתבעו אותן. תנאי ההסדרים טרם פורסמו והם עדיין כפופים לאישור שיפוטי, אך המסר כבר ברור – גם שיחה עם בוט עלולה להפוך מסיכון רגשי לשאלה משפטית ומוסרית.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה נטען בתביעות נגד Character.AI

בלב התביעות עומדת הטענה כי Character.AI עיצבה מוצר שמאפשר יצירת קשר רגשי עמוק בין בני נוער לדמויות בינה מלאכותית, מבלי להציב מנגנוני הגנה מספקים לקטינים. לפי כתבי התביעה, משתמשים צעירים פיתחו תלות רגשית בדמויות ה-AI, שראו בהן מקור לנחמה ולעיתים תחליף לקשרים אנושיים.

 

אחד המקרים הבולטים הוגש על ידי אם מפלורידה, שטענה כי בנה בן ה-14 פיתח קשר רגשי ממושך עם צ’אטבוט המבוסס על דמות מסדרת Game of Thrones. לטענתה, במהלך השיחות לא נבלמו תכנים רגישים ולא ניתנה הכוונה לפנייה לעזרה חיצונית. זמן קצר לאחר מכן, הבן שם קץ לחייו. התביעה אינה טוענת שהבוט גרם ישירות למעשה, אלא שעיצוב המוצר יצר סביבה מסוכנת עבור קטין במצוקה נפשית.

למה גם Google הופיעה כנתבעת

על פניו, Character.AI היא סטארטאפ עצמאי. בפועל, הקשרים בינה לבין גוגל הפכו את ענקית הטכנולוגיה לשחקנית שקשה להתעלם ממנה. בתביעות נטען כי גוגל קיימה עם Character.AI קשרי רישוי טכנולוגיים משמעותיים, הייתה מעורבת בעסקאות מסחריות הקשורות למוצר, ואף קלטה לשורותיה את מייסדי החברה.

 

לטענת התובעים, השילוב הזה חורג משיתוף פעולה שולי. הם טוענים כי גוגל הייתה גורם בעל השפעה מהותית על פיתוח המוצר, על הארכיטקטורה הטכנולוגית שלו ועל האופן שבו הופעל בפועל. מכאן נגזרת הדרישה לראות בה לא רק שותפה עסקית, אלא גורם שצריך לשאת באחריות משפטית לתוצאות שנוצרו.

טיעוני הצדדים בתביעות וסוגיית חופש הביטוי

אחד מקווי ההגנה המרכזיים של החברות היה טיעון חוקתי. לטענתן, הפלט שמייצר הצ’אטבוט הוא צורה של ביטוי, ולכן מוגן תחת התיקון הראשון לחוקת ארצות הברית. לפי גישה זו, הטלת אחריות משפטית על תוכן שנוצר על ידי מערכת AI עלולה לפגוע בעקרון יסוד של חופש הביטוי.

 

אלא שבשלבים מוקדמים של הדיונים, חלק מבתי המשפט הפדרליים סירבו לקבל את הטענה הזו באופן אוטומטי. השופטים הבהירו כי בשלב התביעה אין מקום להניח שפלט של צ’אטבוט נהנה מהגנת חופש הביטוי, במיוחד כאשר מדובר במוצר מסחרי שפועל במסגרת מערכת מתוכננת וממוסחרת. ההחלטות לא הכריעו בשאלה החוקתית עצמה, אך הן אפשרו לתביעות להמשיך ולהתברר.

 

להכרעה עתידית בסוגיה עשויות להיות השלכות רחבות. אם ייקבע שפלט של צ’אטבוט אינו מוגן כחופש ביטוי, ייפתח פתח לרגולציה הדוקה יותר ולהטלת אחריות משפטית על נזק שנגרם דרך אלגוריתמים. במילים אחרות, השאלה אינה רק משפטית, אלא עשויה לקבוע אם בינה מלאכותית תיתפס כדובר עצמאי או כמוצר שעל יצרניו חלה אחריות מלאה.

תביעה תקדימית נגד OpenAI סביב ChatGPT

המגרש המשפטי הזה אינו מוגבל ל-Character.AI בלבד. באוגוסט 2025 הוגשה בארצות הברית תביעה תקדימית גם נגד OpenAI, בטענות שמעלות שאלות דומות סביב אחריות, בטיחות והקשר הרגשי בין בני נוער למערכות AI.

 

בכתב התביעה נטען כי בני זוג מקליפורניה תובעים את החברה ואת המנכ״ל שלה, סם אלטמן, לאחר שבנם בן ה-16 שוחח במשך חודשים עם ChatGPT על מצוקותיו הנפשיות. לטענת המשפחה, השיחות לא זוהו כמצב סיכון מתמשך ולא הופנו לגורמי סיוע, ובשלב מסוים כללו גם תכנים חמורים, בהם דיונים על מוות ופגיעה עצמית.

 

התביעה אינה טוענת לגרימה ישירה, אלא לכך שהיעדר מנגנוני הגנה מספקים הפך שיח כללי או מסייע, לטענת המשפחה, לחלק מסביבה מסוכנת עבור קטין במצוקה נפשית.

תשובת OpenAI להאשמות

OpenAI דחתה את הטענות נגדה והדגישה כי היא פועלת לשיפור מתמיד של מערכי הבטיחות ב-ChatGPT. החברה מסרה כי בתקופה האחרונה נוספו למערכת מנגנונים לזיהוי שיח רגיש, אזהרות למשתמשים במצוקה, הפניות לקווי סיוע וכלים לפיקוח הורי.

 

עם זאת, לפי כתבי התביעה, חלק מהצעדים הללו הוטמעו רק לאחר האירוע שעליו מבוססת התביעה. השאלה שנותרה במחלוקת אינה רק אילו מנגנונים קיימים כיום, אלא האם מערך הבטיחות שפעל בזמן אמת היה מספק כדי לזהות ולהגיב למצוקה מתמשכת.

שינוי המוצר בעקבות הביקורת

בעקבות התביעות והלחץ הציבורי, Character.AI ביצעה שינוי משמעותי במדיניות המוצר. החברה הסירה אפשרויות שיחה פתוחות עבור משתמשים מתחת לגיל 18, והוסיפה מגבלות שמטרתן לצמצם חשיפה לתכנים רגישים ולדינמיקות של קשר אינטימי עם דמויות AI.

 

מדובר בצעד שמסמן הכרה רשמית בסיכונים שעלו מהשימוש בפלטפורמה בקרב קטינים. עם זאת, בעיני המבקרים והמשפחות התובעות, השאלה המרכזית אינה עצם השינוי אלא עיתויו. לטענתם, בדומה למקרה עם OpenAI, ההגבלות נוספו רק לאחר שהתבררו ההשלכות הקשות, ולא כחלק מתכנון מוקדם שמזהה סיכון מובנה במוצר עצמו.

משמעות רחבה לתעשייה

הפשרות המשפטיות, גם אם אינן יוצרות פסק דין תקדימי, מסמנות שינוי באופן שבו תעשיית הבינה המלאכותית נתפסת. אינטראקציות עם צ’אטבוטים כבר אינן נתפסות ככלי טכנולוגי ניטרלי בלבד, אלא כמערכות שפועלות גם על מישורים רגשיים ופסיכולוגיים, ושבנסיבות מסוימות עלולות לגרום לנזק ממשי.

 

התביעות נגד Character.AI, Google ו-OpenAI מציבות שאלה שלא נוח לתעשייה לשאול: האם האחריות של חברות AI מסתיימת ביכולת הטכנולוגית, או שהיא מתחילה בדיוק במקום שבו נוצר קשר אנושי פגיע? כשהשיח עובר ממילים על מסך להשפעה ממשית על חיי בני אדם, נדרש חשבון נפש שאינו רק טכנולוגי, אלא גם מוסרי וחברתי.

הפוסט מי באמת אחראי לקשר הרגשי הבעייתי שנוצר בין בני נוער לצ׳אטבוט הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/character-ai-google-settlement/feed/ 1
Fast, Thinking או Pro? המדריך למשתמש בג’מיני 3 https://letsai.co.il/gemini-3-modes-guide/ https://letsai.co.il/gemini-3-modes-guide/#comments Sat, 03 Jan 2026 14:09:46 +0000 https://letsai.co.il/?p=67534 רוצים להפיק יותר מג’מיני ב-2026? כדאי שתבינו מה קורה “מתחת למכסה המנוע”. למרות השמות השונים, חשוב לדעת ש-Fast ו-Thinking הם למעשה אותו מודל (Gemini 3 Flash) בהגדרות עבודה שונות: אחד מותאם למהירות שיא והשני לעצירה וחשיבה לוגית. לעומתם, מצב ה-Pro הוא מודל Gemini 3 Pro – מנוע שונה לחלוטין ובעל עוצמה גדולה בהרבה, המיועד למשימות […]

הפוסט Fast, Thinking או Pro? המדריך למשתמש בג’מיני 3 הופיע ראשון בLet's AI בינה מלאכותית

]]>
רוצים להפיק יותר מג’מיני ב-2026? כדאי שתבינו מה קורה “מתחת למכסה המנוע”. למרות השמות השונים, חשוב לדעת ש-Fast ו-Thinking הם למעשה אותו מודל (Gemini 3 Flash) בהגדרות עבודה שונות: אחד מותאם למהירות שיא והשני לעצירה וחשיבה לוגית. לעומתם, מצב ה-Pro הוא מודל Gemini 3 Pro – מנוע שונה לחלוטין ובעל עוצמה גדולה בהרבה, המיועד למשימות שמצריכות עומק וניתוח רב-שכבתי.

 

המודלים של ג׳מיני

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

Fast (מהיר)

מצב Fast מבוסס על מודל Gemini 3 Flash הפועל במהירות מלאה ומותאם לספק זמני תגובה קצרים במיוחד. אפשר לדמות אותו לקולגה חד וחריף שמספק תשובות מהירות ומקצועיות מבלי “לחפור” או להשקיע מחשבת יתר בפרטים הטכניים.

 

הבחירה במצב זה מייצגת העדפה ברורה של מהירות על פני עומק. המודל לא יעצור כדי לאמת את הלוגיקה שלו או לתכנן פתרונות רב-שלביים מורכבים, מה שהופך אותו לכלי אידיאלי עבור שאלות ישירות ופשוטות.

 

דוגמה קלאסית ליעילות המודל היא ניהול עומס של 50 אי-מיילים שלא נקראו לפני פגישה דחופה: במשימה כזו, אתם זקוקים למיון (Triage) מהיר שיקבע מה דורש פעולה, מה מיועד לידיעה בלבד ומה יכול להמתין. מכיוון שמדובר במשימת סיווג ולא בבעיה הדורשת חשיבה מעמיקה, מצב ה-Fast מאפשר לכם להבין את תמונת המצב בתוך שניות, בעוד שמצבי החשיבה האחרים פשוט יגרמו לכם להמתין זמן מיותר עבור אותה התוצאה.

 

דוגמה למצב Fast: מיון אימיילים מהיר

דוגמה למצב Fast: מיון אימיילים מהיר

 

למה Fast מתאים כאן? זו משימת מיון, לא משימת חשיבה. אתם לא מבקשים מהמודל לפתור בעיה, אתם מבקשים ממנו לעזור לכם לראות את התמונה הכללית. מצב Fast יכול לסווג ולסכם בשניות. מצב Thinking פשוט יגרום לכם לחכות יותר זמן לאותה תוצאה בדיוק. Pro יהיה מוגזם למשימה כזו.

Thinking (חשיבה)

מצב ה-Thinking מבוסס גם הוא על מודל Gemini 3 Flash, אך בתוספת “שכבת חשיבה” המורה לו לעצור ולמפות שרשרת מחשבה (COT) מסודרת לפני מתן התגובה. ניתן לדמות את זה לאותו קולגה חריף, אלא שהפעם הוא לוקח לעצמו כמה דקות לשרטט את הנימוקים שלו על לוח מחיק לפני שהוא משיב.

 

הבחירה במצב הזה אמנם הופכת את התהליך לאיטי יותר בהשוואה ל-Fast, אבל היא הופכת אותו לאמין משמעותית בפתרון בעיות הדורשות לוגיקה, ניתוח או תכנון מבני. המודל צורך כמות משאבי מחשוב דומה למצב המהיר, אך מקצה חלק גדול יותר מהם לתהליך האימות והבנייה הלוגית.

 

דוגמה בולטת ליעילות המודל היא תכנון מערכת פרודוקטיביות אישית, כמו יצירת תבנית לסיכום שבועי המותאמת בדיוק לכלי העבודה וללוח הזמנים שלכם. מכיוון שמדובר בבעיית עיצוב המפיקה תועלת מחשיבה מובנית, מצב ה-Thinking ידע לייצר פתרון קוהרנטי ומותאם אישית, בעוד שמצב ה-Fast היה מספק תבנית גנרית בלבד.

 

דוגמה למצב Thinking: עיצוב שיטת עבודה

דוגמה למצב Thinking: עיצוב שיטת עבודה

 

למה Thinking מתאים כאן? זו בעיית עיצוב ותכנון שמרוויחה מחשיבה מובנית. אתם רוצים שהמודל יחשוב על המרכיבים של מערכת סיכום טובה, ישקול את זרימת העבודה הספציפית שלכם וייצור משהו קוהרנטי. Fast ייתן לכם תבנית גנרית. Pro יעבוד, אבל הוא מיותר כי זו לא בעיה טכנית קשה במיוחד.

Pro (מקצוען)

מצב ה-Pro מבוסס על Gemini 3 Pro, מודל השונה מהיסוד וגדול משמעותית ממודל ה-Flash. זהו המודל בעל היכולות הגבוהות ביותר של גוגל לחשיבה מורכבת וסנכרון מידע ממגוון רב של מקורות במקביל.

 

באנלוגיה לעולם העבודה, ניתן לראות בו מומחה בכיר המגויס לפתרון הבעיות הסבוכות ביותר. הוא אמנם איטי יותר וצורך מכסות שימוש רבות יותר, אך הוא מסוגל לפתור את מה שאיש מקצוע כללי פשוט לא יוכל לצלוח. עבור משימות שגרתיות הוא עשוי להיראות כמו “Overkill”, אך בבעיות קשות באמת הוא בהחלט שווה את ההמתנה.

 

דוגמה מובהקת לצורך בו היא משימה של מנהלי שיווק הנדרשים לבנות סקירה תחרותית המבוססת על מקורות רבים כמו תמלילי דוחות רווחים, הודעות לעיתונות, דפי תמחור וביקורות לקוחות. במקרה כזה, רק ה-Pro מסוגל להחזיק את כל המקורות בתוך ההקשר (Context), לזהות סתירות ולגבש תובנות אסטרטגיות שאינן מובנות מאליהן.

 

דוגמה למצב Pro: ניתוח אסטרטגי מורכב

דוגמה למצב Pro: ניתוח אסטרטגי מורכב

 

למה Pro מתאים כאן? משימה כזו דורשת סנכרון של מידע סותר בין מסמכים רבים והסקת מסקנות לא מובנות מאליהן.

  • Fast יסכם כל מקור בנפרד אבל יפספס את ההקשרים ביניהם.

  • Thinking יצליח יותר, אבל נוטה “לאבד הקשר” בניתוח של מסמכים מרובים.

  • Pro מסוגל להתמודד עם העומס הקוגניטיבי של החזקת כל המקורות בהקשר אחד וחשיבה רוחבית עליהם.

 ה-Pro פשוט טוב יותר בסינתזה של מסמכים רבים, וזה נובע גם מ”חלון ההקשר” הגדול שלו. עבור מי שעובד עם קבצי ענק, זהו נתון קריטי לא פחות מהיכולת ה”חשיבתית”.

אז איך מחליטים?

סיכמתי לכם בשלוש נקודות, לפי סדר עדיפויות:

1. השתמשו ב-Thinking כברירת מחדל. עבור 99% מהמשתמשים ומקרי הבוחן, אי אפשר לטעות כאן. זו האופציה המאוזנת שמתמודדת היטב עם רוב משימות העבודה.

2. עברו ל-Fast כשאתם מבצעים חיפושים מהירים, סיכומים פשוטים, סיעור מוחות או מיון משימות. אם אתם תופסים את עצמכם מחכים וחושבים “זה לא צריך להיות כזה איטי”, השתמשו ב-Fast.

3. ״שדרגו״ ל-Pro כשהבעיה קשה באמת: דיבאגינג (ניפוי שגיאות) מורכב, מתמטיקה רב-שלבית, סינתזה של מסמכים גדולים או ניתוח טכני. אם Thinking נותן לכם תשובה חלשה בנושא חשוב, Pro שווה את “עלות” מגבלת השימוש.

 

ודבר אחרון, אם אתם משתמשים במסלול החינמי, אתם יכולים לגשת לכל שלושת המצבים, אך עם מגבלות יומיות שגוגל לא מפרסמת באופן רשמי.

הפוסט Fast, Thinking או Pro? המדריך למשתמש בג’מיני 3 הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/gemini-3-modes-guide/feed/ 1
xAI נכנסת לשוק הארגוני ומשיקה את Grok Business ו-Enterprise למשתמשים עסקיים https://letsai.co.il/grok-business-enterprise-launch/ https://letsai.co.il/grok-business-enterprise-launch/#respond Fri, 02 Jan 2026 12:52:01 +0000 https://letsai.co.il/?p=67496 חברת xAI של אילון מאסק השיקה ב-30 בדצמבר 2025 שתי חבילות עסקיות חדשות: Grok Business ו-Grok Enterprise. המהלך מסמן את הכניסה הרשמית של החברה לשוק ה-AI הארגוני, זירה שבה שלטו עד כה ביד רמה OpenAI (עם ChatGPT Enterprise) ו-Google (עם Gemini Enterprise), תוך שהן נשענות על תשתיות הענן והפרודוקטיביות של Microsoft וגוגל. הבחירה של xAI […]

הפוסט xAI נכנסת לשוק הארגוני ומשיקה את Grok Business ו-Enterprise למשתמשים עסקיים הופיע ראשון בLet's AI בינה מלאכותית

]]>
חברת xAI של אילון מאסק השיקה ב-30 בדצמבר 2025 שתי חבילות עסקיות חדשות: Grok Business ו-Grok Enterprise. המהלך מסמן את הכניסה הרשמית של החברה לשוק ה-AI הארגוני, זירה שבה שלטו עד כה ביד רמה OpenAI (עם ChatGPT Enterprise) ו-Google (עם Gemini Enterprise), תוך שהן נשענות על תשתיות הענן והפרודוקטיביות של Microsoft וגוגל. הבחירה של xAI להשיק פתרונות עסקיים ייעודיים נובעת מההבנה שהתחרות בשוק ה-AI השתנתה – החברות כבר לא מתחרות רק על ביצועי המודל, אלא על ארכיטקטורת אבטחה, אינטגרציה עם דאטה ארגוני ועלות כוללת (TCO) בקנה מידה רחב. עם זינוק בשימוש בארגונים מ-2.6% ל-23% בתוך חודשים ספורים, Grok מנסה כעת להפוך משחקן “מרדני” לאלטרנטיבה מוסדית לגיטימית מול הענקיות הוותיקות.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה מציעה כל חבילה?

Grok Business מיועדת לצוותים קטנים ובינוניים של עד 100 עובדים. המחיר נקבע על 30 דולר למשתמש בחודש. זהו מחיר סטנדרטי בשוק, הדומה לתמחור של Gemini Enterprise מבית גוגל.

 

היתרון התחרותי האמיתי של xAI כאן הוא הגמישות – בעוד שחברות כמו OpenAI דורשות לעיתים קרובות התחייבות לכמות מינימלית של משתמשים (Seat Minimum) בחוזים ארגוניים, xAI מאפשרת הרשמה בשירות עצמי (Self-serve) ללא דרישות סף נוקשות.

 

לשם השוואה, בעוד שחבילת ה-Team של OpenAI עולה כ-25 דולר, חבילת ה-ChatGPT Enterprise מתומחרת בפורמט Custom (מותאם אישית) הדורש משא ומתן מול מחלקת המכירות, כשהערכות השוק עבור חוזים אלו נעות סביב ה-60 דולר למשתמש.

 

Grok Enterprise מיועדת לארגונים גדולים הזקוקים ליכולות ניהול מתקדמות כמו אימות זהות מותאם (Custom SSO) וסנכרון ספריות משתמשים (SCIM). בדומה לפתרונות המקבילים של OpenAI וגוגל, התמחור של גרסה זו הוא Custom ונקבע באופן פרטני מול צוות המכירות של xAI.

 

מפת הדרכים והתאמת הגרסאות למשתמשים

קונסולה ניהולית לשליטה מרכזית

שתי החבילות כוללות גישה לקונסולת ניהול מרכזית דרך xAI Console. מנהלי IT יכולים להזמין משתמשים, לנהל הרשאות גישה ולעקוב אחרי צריכת המערכת בזמן אמת – הכל ממקום אחד. 

 

 

Enterprise Vault: הפיצ’ר שמכוון לסקטורים מפוקחים

עבור ארגונים עם דרישות אבטחה מחמירות, כמו בנקים, חברות ביטוח ומשרדי עורכי דין, xAI מציעה שכבה נוספת בשם Enterprise Vault.

 

מה זה אומר בפועל? מישור נתונים מבודד לחלוטין מהתשתית הרגילה של xAI, עם הצפנה בשליטת הלקוח (Customer Managed Encryption Keys). המשמעות היא שהארגון מנהל בעצמו את מפתחות ההצפנה, ואפילו ל-xAI אין גישה טכנית למידע.

 

פיצ’רים דומים קיימים אצל ספקי ענן כמו AWS ו-Google Cloud, וגם ל-OpenAI ו-Anthropic יש פתרונות אבטחה מתקדמים. אולם, בעוד שמתחרים מציעים יכולות דומות לרוב כחלק מפתרונות “Tailor-made” הדורשים משא ומתן אישי והתאמה ארוכה, xAI הופכת את האבטחה העילאית למוצר מדף (Off-the-shelf) שניתן להטמיע בצורה מוצרית וברורה מהיום הראשון.

אינטגרציה עם מקורות מידע ארגוניים

xAI שמה דגש על האינטגרציה עם כלים ארגוניים קיימים. נכון להיום, המערכת מתחברת ל-Google Drive ול-xAI Collections.

 

 

נקודה קריטית למנהלים בארגונים גדולים היא שכרגע אין אינטגרציה עם Microsoft 365 ,SharePoint או OneDrive. עבור רוב חברות ה-Fortune 500 שיושבות על תשתית Azure, זהו חסם כניסה משמעותי. אם הארגון שלכם מבוסס על מיקרוסופט, תצטרכו להמתין לאינטגרציה עתידית או לעבוד עם פתרון אחר.

 

הפיצ’ר המעניין כאן הוא “Permission Awareness”: המערכת מכבדת את הרשאות הגישה הקיימות. אם לעובד אין גישה למסמך מסוים בדרייב, Grok לא ישלוף לו מידע ממנו. זה פותר בעיה מוכרת של דליפת מידע פנימי שמעכבת ארגונים רבים מלהטמיע כלי AI.

 

בנוסף, תשובות המערכת כוללות ציטוטים עם קישורים ישירים למקור, מה שמאפשר אימות של המידע.

Collections API: חיפוש חכם במאגרי מידע גדולים

פיצ׳ר מעניין נוסף הוא Collections API. ארגונים יכולים להעלות בסיסי ידע גדולים – מאגרי מסמכים משפטיים, תיעוד טכני, data rooms לעסקאות M&A – ולאפשר ל-Grok לחפש בהם עם יכולות Agentic Search.

 

 

בפועל, זה אומר שצוות משפטי יכול לשאול “מצא את כל הסעיפים בחוזים שלנו שמתייחסים לאחריות על נזקים עקיפים” ולקבל תשובה מבוססת על אלפי מסמכים, עם הפניות מדויקות למקור. זו יכולת שרלוונטית במיוחד לסקטורים עתירי מסמכים.

שיתוף שיחות מאובטח

פיצ’ר נוסף שכדאי להכיר הוא שיתוף שיחות בין חברי צוות. ניתן לשתף שיחה עם Grok באמצעות קישור, כשהגישה מוגבלת רק למי שקיבל הרשאה מפורשת. זה שימושי כשצוות עובד על פרויקט משותף ורוצה לשתף תובנות או ניתוחים שהמערכת הפיקה.

 

חלון הקשר של 2 מיליון טוקנים

אחד היתרונות הטכניים המובהקים של Grok, כפי שנגזר מהמפרט של מודל ה-Grok 4 Heavy המניע את המערכת, הוא חלון הקשר (Context Window) עצום המגיע לעד 2 מיליון טוקנים בפעולה אחת. בפועל, יכולת זו מאפשרת לארגונים לטעון אלפי עמודי מסמכים, ספריות קוד שלמות או דוחות פיננסיים רב-שנתיים מורכבים ולקבל תשובות מבוססות על המאגר כולו.

 

לשם השוואה, נכון לתחילת 2026, הגרסאות העסקיות של המתחרות מציעות נפחים מצומצמים יותר: ChatGPT Enterprise מציע 400,000 טוקנים עם מודל GPT-5.2, בעוד Claude Enterprise מגיע ל-500,000 טוקנים עם Sonnet 4.5. הפער הזה מעניק ל-Grok Business יתרון משמעותי עבור ארגונים המנהלים מסמכי ענק או קודבייסים רחבים, שכן הוא מאפשר ניתוח הוליסטי של המידע ללא צורך בפיצולו למקטעים קטנים.

 

עם זאת, חשוב להדגיש שחלון הקשר ענק אינו יתרון מוחלט ללא בקרה. קיימת תופעה טכנולוגית מוכרת בשם “Lost in the Middle”, במסגרתה מודלים נוטים לעיתים “לשכוח” או להתעלם ממידע שנמצא במרכזם של מסמכים ארוכים מאוד. המשמעות היא שהמערכת עשויה לסכם מסמך רחב היקף בצורה טובה, אך להחמיץ פרט קריטי המופיע בעומק הטקסט (למשל, בעמוד 847 מתוך 2,000). לכן, מומלץ לארגונים לבדוק את איכות השליפה (Retrieval Quality) הספציפית בתקופת הניסיון לפני הסתמכות מלאה על המערכת למשימות קריטיות.

ההתחייבות לפרטיות

xAI מצהירה במפורש שנתוני לקוחות עסקיים לא ישמשו לאימון מודלים. זו התחייבות סטנדרטית בשוק הארגוני, שגם OpenAI ו-Anthropic מציעות ללקוחות Enterprise. אבל זה שינוי מהותי מהגרסה הצרכנית של Grok, שם המידע עשוי לשמש לשיפור המודל. הפלטפורמה עומדת בתקן SOC 2 ותואמת לדרישות GDPR ו-CCPA.

איפה Grok עומד בשוק?

נתוני התנועה והאימוץ מציגים תמונה מורכבת של שוק הנמצא בתהליך של ביזור: לפי נתוני SimilarWeb, בעוד ש-ChatGPT עדיין שולט בשוק עם נתח של כ-68%, מדובר בירידה משמעותית לעומת דומיננטיות של 87% בשנה הקודמת. במקביל, Gemini של גוגל רשמה צמיחה אגרסיבית וטיפסה מנתח שוק של 5% ל-18% בתוך שנה אחת בלבד.

 

נכון לאוקטובר 2025, Grok הצליח להתברג בעשירייה הפותחת של כלי ה-AI מבחינת תנועה, עם כ-27.8 מיליון מבקרים ייחודיים בחודש. עם זאת, הפער מהמובילה נותר עצום, שכן ChatGPT משך באותה תקופה כ-660 מיליון מבקרים ייחודיים.

 

למרות פער הכמויות, Grok מוביל את הקטגוריה במדד המעורבות (Engagement): זמן השהייה הממוצע לביקור ב-Grok עומד על כ-14:02 דקות, נתון שעקף את אלו של ChatGPT (כ-13:32 דקות) ושל Gemini (כ-11:13 דקות) במהלך החודשים אוקטובר-נובמבר 2025.

 

בזירה הארגונית, הזינוק משמעותי עוד יותר: לפי דו”ח של Netskope מיוני 2025, נוכחותו של Grok בארגונים (שיעור החברות בהן יש לפחות משתמש פעיל אחד) זינקה מ-2.6% ל-23% בתוך חודשים ספורים. נתון זה מעיד על חדירה מהירה של המותג למגזר העסקי עוד לפני ההשקה הרשמית של חבילות ה-Enterprise.

האם Grok מתאים לארגון שלכם?

במבט קדימה, xAI כבר סימנה את היעדים הבאים שלה: הרחבת האינטגרציות מעבר ל-Google Drive, פיתוח סוכנים אוטונומיים (Agents) לביצוע משימות מורכבות ושיפור משמעותי של יכולות השיתוף הצוותיות. ההשקה הנוכחית מסמנת רשמית את הפיכתו של Grok ממוצר צריכה המזוהה עם תרבות הרשת למתחרה מוסדי רציני בשוק הארגוני.

 

למרות שהתמחור נותר סטנדרטי ביחס לשוק, היתרון התחרותי האמיתי שלו טמון בגמישות ובצמצום חסמי הכניסה, במיוחד לאור היעדר דרישת המינימום למשתמשים שהייתה נהוגה עד כה אצל חלק מהמתחרות הוותיקות. פיצ’רים ייחודיים כמו ה-Collections API וה-Enterprise Vault מעניקים למערכת ערך טכנולוגי גבוה, במיוחד עבור סקטורים עתירי מסמכים ורגולציה הזקוקים לבידוד נתונים מוחלט.

 

יחד עם זאת, חסם משמעותי שעומד כרגע בפני החברה הוא היעדר אינטגרציה עם Microsoft 365. עבור ארגונים רבים המבוססים על Azure ו-SharePoint, מדובר בחיסרון שמהווה סיבה ממשית להמתין להתפתחויות עתידיות. בעוד ששחקניות כמו OpenAI ו-Anthropic נהנות מרקורד מוכח, תשתית תמיכה רחבה ואינטגרציות עמוקות יותר, xAI נמצאת רק בתחילת דרכה בעולם הארגוני.

 

בסופו של יום, עבור ארגונים המבוססים על Google Workspace ומוכנים להיות מאמצים מוקדמים (Early Adopters), Grok מציע חלופה עוצמתית ומסקרנת, אך הצלחתה בטווח הארוך תלויה ביכולתה של xAI לספק לא רק טכנולוגיה מתקדמת, אלא גם את רמת האמינות והשירות המצופה מספקית פתרונות לארגוני ענק.

 

לסקירה המלאה ולפרטים נוספים על Grok Business & Enterprise Launch, כנסו כאן.

הפוסט xAI נכנסת לשוק הארגוני ומשיקה את Grok Business ו-Enterprise למשתמשים עסקיים הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/grok-business-enterprise-launch/feed/ 0
OpenAI משיקים חנות אפליקציות בתוך ChatGPT https://letsai.co.il/chatgpt-apps/ https://letsai.co.il/chatgpt-apps/#comments Sun, 28 Dec 2025 06:54:30 +0000 https://letsai.co.il/?p=67010 מאז שיצא לאוויר העולם, ChatGPT היה כלי חזק לחשיבה, ניסוח ויצירת רעיונות. הוא עזר לפתור בעיות, להציע כיוונים ולבנות תכניות, אך תמיד נעצר לפני השלב הקריטי: הביצוע. העדכון האחרון מבית OpenAI משנה את האיזון הזה. עם השקת ChatGPT Apps, המערכת עוברת מבינה שמגיבה בטקסט, לבינה שיכולה לפעול בעולם האמיתי. במקום להסביר איך להזמין מלון, לבנות […]

הפוסט OpenAI משיקים חנות אפליקציות בתוך ChatGPT הופיע ראשון בLet's AI בינה מלאכותית

]]>
מאז שיצא לאוויר העולם, ChatGPT היה כלי חזק לחשיבה, ניסוח ויצירת רעיונות. הוא עזר לפתור בעיות, להציע כיוונים ולבנות תכניות, אך תמיד נעצר לפני השלב הקריטי: הביצוע. העדכון האחרון מבית OpenAI משנה את האיזון הזה. עם השקת ChatGPT Apps, המערכת עוברת מבינה שמגיבה בטקסט, לבינה שיכולה לפעול בעולם האמיתי. במקום להסביר איך להזמין מלון, לבנות פלייליסט או להכין מצגת, ChatGPT יכול פשוט לעשות זאת, ישירות מתוך הצ׳אט.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

אז מה הם בעצם ChatGPT Apps?

ChatGPT Apps הן אינטגרציות עם שירותים חיצוניים, שמרחיבות את יכולות הפעולה של ChatGPT מעבר לשיחה עצמה. חלקן מציגות ממשק אינטראקטיבי, חלקן מחברות מידע מהשירות, ובחלק מהמקרים גם מאפשרות לבצע פעולות, תמיד לאחר אישור המשתמש.

 

לאחר תקופת השקה ראשונית עם מספר מצומצם של חיבורים, OpenAI מרחיבה כעת את המהלך ומשיקה חנות אפליקציות מובנית בתוך הצ׳אט, עם מגוון רחב של אפשרויות חיבור.

דוגמה לפעולה בשימוש ChatGPT Apps

אם תבקשו ליצור פלייליסט ב-Apple Music, הצ׳אט לא יחזיר סתם רשימת שירים כהצעה. הוא יפתח את Apple Music ויצור פלייליסט אמיתי בחשבון שלכם.

 

ChatGPT יוצר ומוסיף פלייליסט חדש לספרייה

ChatGPT יוצר ומוסיף פלייליסט חדש לספרייה

הבדל בין GPTs מותאמים אישית ל-ChatGPT Apps

כאן חשוב לעצור ולהבחין בין שני פיצ׳רים שונים, שמשרתים מטרות שונות:

GPTs מותאמים אישית – צ׳אטבוטים ייעודיים עם ידע, אופי או תפקיד מוגדר מראש. הם משנים את אופן החשיבה, הניתוח והתגובה של המערכת, אך פועלים בעיקר ברמת השיחה והתוכן.

ChatGPT Apps – חיבורים לשירותים חיצוניים, שמאפשרים ל-ChatGPT לפעול מעבר לשיחה עצמה, להתחבר לחשבונות קיימים, ולהפעיל מערכות אמיתיות כמו מוזיקה, מייל, יומן וקניות.

 

במילים אחרות, GPTs משנים את אופי החשיבה של ChatGPT, בעוד ש-Apps מרחיבים את יכולת הפעולה שלו בעולם האמיתי.

חנות האפליקציות של ChatGPT

כדי לנהל את מספר האפליקציות הגדל, נוספה חנות אפליקציות ייעודית בתוך ChatGPT. הגישה מאוד פשוטה – לחיצה על “Apps” בפינה השמאלית העליונה של הממשק. כבר כעת זמינות עשרות אפליקציות, רובן נוצרו במסגרת שיתופי פעולה מוקדמים שנועדו לבדוק ולהדגים את יכולות הפלטפורמה החדשה. OpenAI פתחה את הפלטפורמה גם למפתחים חיצוניים, כאשר כל אפליקציה עוברת תהליך בדיקה ואישור לפני פרסום.

 

חנות האפליקציות

חנות אפליקציות ייעודית בתוך ChatGPT

 

המשמעות כאן כפולה: מצד אחד, קצב התרחבות מהיר ומגוון שימושים הולך וגדל. מצד שני, ניסיון לשמור על רף איכות, אבטחה ואמינות.

 

חשוב לדעת, שהזמינות משתנה לפי מדינה וסוג המנוי, וחלק מהאפליקציות עשויות להיות חסומות או מוגבלות.

איך משתמשים באפליקציות בפועל?

אפשר למצוא את ה-Apps מהתפריט הצידי, או מתוך Settings > Apps.

 

לגלות את האפליקציות דרך ההגדרות

לגלות את האפליקציות דרך ההגדרות (Settings)

בחירה ידנית

לחיצה על “+” ואז “More”, שם מופיעות האפליקציות המחוברות והכלים הזמינים.

 

איך מוצאים אפליקציות

לחיצה על “+” ואז “More” כדי למצוא אפליקציות מחוברות

שימוש טבעי בתוך השיחה

פשוט מזכירים אפליקציה באמצעות הסימן @. אם האפליקציה עדיין לא מחוברת, ChatGPT יבקש אישור חיבור וימשיך את השיחה בצורה רציפה.

 

הפעלת השטרודל

אפליקציות יכולות לראות הקשר רחב יותר של שיחה ולבצע את ההתאמות הנדרשות

שימוש בהקשר רב-אפליקטיבי

כאן נמצא אחד הכוחות המשמעותיים ביותר של המערכת – היכולת לעבוד בהקשר רב-אפליקטיבי. ChatGPT אינו מוגבל לאפליקציה אחת בכל פעם, ובתרחישים מסוימים יכול לשלב כמה אפליקציות שונות בתוך אותה שיחה ולתאם ביניהן רצף פעולות.

 

לדוגמה, בקשה כמו: “תסכם לי את המייל האחרון מיוסי, ואז תקבע לי איתו פגישה למחר בצהריים” עשויה להוביל את ChatGPT להשתמש גם באפליקציית מייל וגם ביומן, בכפוף להרשאות ולזמינות השירותים.

 

במקרים כאלה, המערכת שומרת הקשר ומבצעת תיאום בין שירותים שונים. זו כבר לא אינטגרציה נקודתית, אלא התחלה של ניהול תהליכים.

פרטיות ואבטחת מידע 

כדי שאפליקציה תוכל לפעול, המשתמש נדרש לאשר הרשאות גישה, כלומר לאפשר ל-ChatGPT גישה מוגדרת ומוגבלת מראש לנתונים או לפעולות מסוימות, כמו יומן, מיילים או חשבון סטרימינג, בהתאם לאישור שניתן.

 

אין פעולה בלי הרשאה, ואין חיבור בלי הסכמה מפורשת. עם זאת, מדובר בשינוי תפיסתי שדורש מודעות וניהול זהיר של ההרשאות, במיוחד ככל שיותר שירותים מתחברים לשכבת שיחה אחת.

למה OpenAI עושה את זה?

מעבר לשיפור חוויית המשתמש, זהו מהלך אסטרטגי רחב. OpenAI לא מנסה רק לשפר צ׳אט. היא מנסה להפוך את ChatGPT לשכבת ממשק מרכזית, כזו שמרכזת פעולות דיגיטליות רבות במקום אחד.

 

בדומה לאופן שבו ה-App Store הפך את האייפון מטלפון לפלטפורמה, ChatGPT Apps הופכים את הצ׳אט לנקודת כניסה שממנה אפשר לעבוד, לחפש, ליצור וגם לבצע, בלי לקפוץ בין שירותים וממשקים.

 

במילים פשוטות, המשתמש כבר לא צריך לדעת איפה השירות נמצא. הוא רק צריך לדעת מה הוא רוצה לעשות. ככל שיותר שירותים מתחברים לשכבת שיחה אחת, כך גדל הערך שלה, וגם גדל התמריץ של משתמשים להישאר בה.

 

בשורה התחתונה, ChatGPT Apps מסמנים מעבר ברור מבינה שמדברת לבינה שפועלת. ChatGPT כבר לא רק חושב יחד איתנו, אלא מתחיל לתאם תהליכים, לחבר בין מערכות ולבצע רצפים של פעולות, בכפוף להרשאות ולמגבלות השירותים. זהו בסיס מעשי לעידן הסוכנים האוטונומיים, והצעד הראשון בהפיכת הצ׳אט לכלי עבודה מרכזי, לא רק כלי שיחה.

הפוסט OpenAI משיקים חנות אפליקציות בתוך ChatGPT הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/chatgpt-apps/feed/ 2
הטבת סוף שנה – ג’מיניי ב-61% הנחה https://letsai.co.il/gemini-sale-2026/ https://letsai.co.il/gemini-sale-2026/#comments Thu, 25 Dec 2025 08:22:54 +0000 https://letsai.co.il/?p=66919 את ההטבה הזו לא תרצו לפספס! גוגל פותחים את 2026 עם 61% הנחה על ג’מיניי (Gemini) – הנחה משמעותית על מנוי Google AI Pro, כחלק מחבילת Google One. מדובר במבצע מוגבל בזמן, שמיועד למשתמשים חדשים בלבד, ומאפשר לבחור בין התחייבות שנתית משתלמת במיוחד (חיסכון של כ-550 ₪) לבין מסלול חודשי מוזל וקצר יותר למי שמעדיף […]

הפוסט הטבת סוף שנה – ג’מיניי ב-61% הנחה הופיע ראשון בLet's AI בינה מלאכותית

]]>
את ההטבה הזו לא תרצו לפספס! גוגל פותחים את 2026 עם 61% הנחה על ג’מיניי (Gemini) – הנחה משמעותית על מנוי Google AI Pro, כחלק מחבילת Google One. מדובר במבצע מוגבל בזמן, שמיועד למשתמשים חדשים בלבד, ומאפשר לבחור בין התחייבות שנתית משתלמת במיוחד (חיסכון של כ-550 ₪) לבין מסלול חודשי מוזל וקצר יותר למי שמעדיף גמישות.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

איך ממשים את ההטבה?

לפני הכל – כך תוכלו לממש את המבצע השווה הזה! 

  • נכנסים ללינק הבא.
  • בוחרים במנוי שנתי או מנוי חודשי, וממשיכים עם תהליך ההרשמה.
  • שימו לב שהמבצע תקף רק למשתמשים חדשים.

 

מבצע שאסור לפספס!

מבצע שאסור לפספס!

 

ומה אם יש לי כבר מנוי? 

קיבלתם הודעה שהמבצע לא זמין?

זה כנראה בגלל שיש לכם כבר מנוי אחר לאחד מהשירותים של גוגל (שירותי ענן ואחסון, מנוי קודם לג’מיניי וכן הלאה). כפי שציינו מעלה – המבצע הוא רק למצטרפים חדשים – כלומר, אם יש כבר מנוי או הטבה שרשומים על מייל קיים שלכם, לא תוכלו לממש את המבצע. כמו כן, גם אם יש לכם מייל עסקי, תתקלו בבעיה דומה – חוסר יכולת לממש את ההטבה.

 

המנוי לא זמין

קיבלתם הודעה שהמנוי כבר לא זמין? לא נורא? השתמשו במייל חלופי או פתחו חשבון Gmail חדש, וממשו את ההטבה על המייל החדש.

 

אז מה עושים?

מאוד פשוט! פתחו חשבון ג’ימייל חדש, ורשמו את המנוי החדש עם ההטבה על המייל החדש. או לחלופין, רשמו את המנוי החדש על מייל אחר של גוגל שברשותכם (אם יש לכם אחד כזה). ושוב – ודאו שאין שום הטבה או מנוי בתשלום שמשויכים למייל החלופי.

 

לא מאמינים?

איך תוודאו שהמבצע אכן עדיין זמין? העתיקו את הלינק של ההטבה והדביקו אותו בדפדפן אחר (לא גוגל כרום) – למשל, דפדפן Edge של מיקרוסופט (ודאו שהדפדפן החלופי לא מחובר לאותו חשבון Gmail שבו יש לכם כבר מנוי או חבילה בגוגל), ואז תראו שהמבצע אכן זמין.

 

 

מה כוללת ההצעה של Google AI Pro

המבצע מתמקד במנוי Google AI Pro, שמעניק גישה מורחבת לכלי ה־AI המתקדמים של גוגל, ובראשם ג’מיניי (Gemini). המנוי כולל שימוש במודלים מתקדמים יותר, מגבלות שימוש גבוהות, ושילוב עמוק של AI בתוך שירותי גוגל עצמם.

 

החבילה כוללת בין היתר גישה מתקדמת לאפליקציית Gemini עם מודל Gemini 3 Pro שהדהים את העולם, יכולות Deep Research, יצירת תמונות עם ננו בננה פרו (Nano Banana Pro), וגם גישה מוגבלת ליצירת וידאו באמצעות Veo 3.1. בנוסף לכך נכללים כלים כמו Flow – פלטפורמת יצירת ועריכת תמונות וסרטונים ייעודית של גוגל, Whisk ליצירת וידאו מתמונות, NotebookLM – כלי מדהים למחקר עם סיכומי אודיו ווידאו, שמאפשר גם ליצור מצגות בקליק, אינפוגרפיקות וניתוח דאטה בקונטקסט גדול.

 

איזו הנחה כדאי לקחת?

ההטבה כוללת שני מבצעים – מסלול שנתי במחיר באמת משתלם (הנחה של מאות שקלים), ומסלול חודשי קצר יותר (3 חודשים בלבד).

 

המסלול השנתי: הנחה של 61% הנחה!

ההצעה המרכזית של המבצע היא מנוי שנתי במחיר מוזל במיוחד – 61% הנחה! במקום מחיר רגיל של 898.8 ₪ לשנה, ניתן להצטרף בעלות של 349.9 שקלים בלבד. מדובר בחיסכון משמעותי של כמעט 550 ₪.

 

המסלול תקף ל-12 חודשים וכולל גם 2 טרה של אחסון ב-Google Photos, Drive ו-Gmail, וכן 1,000 קרדיטים חודשיים לשימוש בכלי הווידאו והמדיה של גוגל: Flow ו-Whisk. בנוסף, ניתן לשתף את המנוי עם עד חמישה משתמשים נוספים, בהתאם לתנאי Google One.

 

מה המבצע כולל?

מה המבצע כולל?

 

המסלול החודשי: 3 חודשים במחיר מוזל

למי שלא מעוניין להתחייב לשנה שלמה, גוגל מציעה גם מסלול חודשי מוזל לתקופה מוגבלת. במסגרת המבצע, ניתן להצטרף למנוי Google AI Pro במחיר של 24 ₪ לחודש, במקום 74.9 שקלים, למשך שלושה חודשים בלבד.

 

המסלול החודשי כולל את אותם יתרונות של המסלול השנתי, אך ההנחה תקפה לשלושת החודשים הראשונים בלבד. לאחר סיום התקופה, המנוי מתחדש אוטומטית במחיר הרגיל, אלא אם מבטלים מראש.

 

תנאים חשובים שצריך להכיר

  • ההצעה מיועדת למשתמשים חדשים של Google One בלבד, ואינה ניתנת לשילוב עם מבצעים אחרים.
  • ההטבה תקפה למנויים פרטיים בלבד – יש לכם מנוי עסקי? תצטרכו לעשות את המנוי על ג’ימייל רגיל.

 

בסופו של יום מדובר בהטבה באמת שווה על מודל מדהים שמטריף את השוק (ג’מיניי 3), לצד סט של כלים סופר אפקטיביים (NotebookLM, ננו בננה ו-Flow בראשם), וכמובן כל הטוב שמגיע עם התממשקות לתשתית של גוגל – אחסון בדרייב, חיבור לגוגל סליידס ודוקס – תחשבו כמה קל ונוח ליצור מצגת ישירות בתוך ג’מיניי ואז לייצר אותה ל-Google Slides ולהמשיך לערוך. או לחלופין, ליצור טקסט מעוצב עם ה-Canvas של Gemini, ואז לייצר הכל ל-google Docs להמשך עבודה ועריכה. פאן פאן פאן!

 

הפוסט הטבת סוף שנה – ג’מיניי ב-61% הנחה הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/gemini-sale-2026/feed/ 2
אנטרופיק מגבירה את ההגנה על משתמשי Claude https://letsai.co.il/claude-safety-upgrade/ https://letsai.co.il/claude-safety-upgrade/#respond Thu, 25 Dec 2025 07:39:58 +0000 https://letsai.co.il/?p=66862 אנטרופיק חשפה ב-18 בדצמבר 2025 מערך צעדים טכנולוגיים שנועדו להפוך את השימוש ב-Claude לבטוח יותר. החברה פרסמה פרטים מפורטים על שלוש יוזמות מרכזיות: מערכת זיהוי מצוקה נפשית בזמן אמת, הפחתה של 70-85% בנטייה של המודל להתחנף למשתמש, ואכיפה מחמירה יותר של דרישת הגיל המינימלי.   זיהוי מצוקת נפש בזמן אמת החברה הטמיעה מסווג (classifier) בפלטפורמת […]

הפוסט אנטרופיק מגבירה את ההגנה על משתמשי Claude הופיע ראשון בLet's AI בינה מלאכותית

]]>
אנטרופיק חשפה ב-18 בדצמבר 2025 מערך צעדים טכנולוגיים שנועדו להפוך את השימוש ב-Claude לבטוח יותר. החברה פרסמה פרטים מפורטים על שלוש יוזמות מרכזיות: מערכת זיהוי מצוקה נפשית בזמן אמת, הפחתה של 70-85% בנטייה של המודל להתחנף למשתמש, ואכיפה מחמירה יותר של דרישת הגיל המינימלי.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

זיהוי מצוקת נפש בזמן אמת

החברה הטמיעה מסווג (classifier) בפלטפורמת Claude.ai – מדובר על מודל AI קטן שרץ ברקע וסורק שיחות בזמן אמת כדי לזהות סימנים לאובדנות או פגיעה עצמית. כאשר המערכת מזהה סיכון, היא מציגה הודעת התראה בולטת בתוך ממשק השיחה (באנר) שמפנה את המשתמש ישירות לגורמי מקצוע ולקווי סיוע במדינה שלו.

 

המשאבים בבאנר מסופקים על ידי ThroughLine, ארגון שמתמחה בתמיכה במשבר מקוון ומנהל רשת מאומתת של קווי עזרה ושירותים ב-170 מדינות. המשתמש יכול לבחור בין שיחה עם איש מקצוע מוסמך, התקשרות לקו חירום, או גישה למשאבים מקומיים.

 

איך זה עובד בעצם? המסווג מזהה רגעים שבהם משתמש מביע מחשבות אובדניות, או אפילו תרחישים בדיוניים שמתמקדים באובדנות או בפגיעה עצמית. החברה מדגישה שהמערכת אינה מושלמת ויכולה לפספס מקרים או לזהות בטעות מקרים תקינים כמסוכנים (false positives).

98.6-99.3% תגובות מתאימות במצבי משבר

אנטרופיק בדקה את ביצועי המודלים החדשים – Opus 4.5, Sonnet 4.5 ו-Haiku 4.5 – במספר סוגי הערכות. במבחן הבסיסי – כאשר המשתמש שולח הודעה בודדת הקשורה לאובדנות או לפגיעה עצמית – המודלים הגיבו באופן מתאים ב-98.6%, 98.7% ו-99.3% מהמקרים, בהתאמה. הדור הקודם, Claude Opus 4.1, הגיע ל-97.2%.

 

מעבר לכך, החברה בדקה מה קורה כשהשיחה כבר נסחפה למקום בעייתי. במבחן מורכב יותר, החוקרים לקחו שיחות אמיתיות שבהן משתמשים הביעו מצוקה נפשית, והציגו אותן למודל החדש באמצע השיחה כדי לראות אם הוא מסוגל לתקן את המסלול. במבחן הזה, Opus 4.5 הגיב באופן מתאים ב-70% מהמקרים ו-Sonnet 4.5 ב-73%, לעומת רק 36% ב-Opus 4.1.

70-85% פחות התחנפות

Sycophancy (התחנפות) הוא מושג שמתאר נטייה של מודלי AI להסכים עם המשתמש גם כשהוא טועה, במקום להגיד לו את האמת. התופעה הזו מסוכנת במיוחד כשהמשתמש חווה התנתקות מהמציאות או חושב מחשבות הזויות – במקרים אלה, הסכמה מהמודל יכולה לחזק אמונות שגויות או מזיקות.

החברה מודדת את רמת ההתחנפות באמצעות סימולציה אוטומטית: מודל Claude אחד משחק את תפקיד המשתמש הבעייתי ומנסה “להדביק” את המודל הנבדק בטעויות למשך עשרות הודעות. אחר כך, מודל שלישי בוחן את התשובות ומעריך עד כמה המודל הנבדק עמד בלחץ ולא התחנף. החברה עושה בדיקות ידניות נקודתיות כדי לוודא שהמערכת מדויקת.

 

במבחנים האלה, המודלים החדשים (Opus 4.5, Sonnet 4.5 ו-Haiku 4.5) הציגו ציון נמוך יותר ב-70-85% הן בהתחנפות והן בעידוד הזיות של המשתמש, לעומת Opus 4.1 – שעצמו נחשב למודל עם רמת התחנפות נמוכה מאוד.

 

אנטרופיק גם פרסמה את כלי ההערכה Petri כקוד פתוח, כך שכל אחד יכול להשוות ציונים בין מודלים. לפי הבדיקות שהחברה עשתה בנובמבר 2025, משפחת המודלים 4.5 ביצעה טוב יותר בהערכת ההתחנפות של Petri מכל שאר המודלים המובילים באותו זמן.

המחיר של הירידה בהתחנפות

במבחן נוסף שבדק עד כמה המודלים מצליחים לתקן שיחות שכבר במסלול בעייתי, התוצאות היו מעורבות. Haiku 4.5 תיקן באופן מתאים 37% מהמקרים, Sonnet 4.5 רק 16.5%, ו-Opus 4.5 – רק 10%.

 

אנטרופיק מסבירה שזה משקף איזון מכוון בין ידידותיות המודל לבין נכונות להתעמת עם המשתמש. Haiku 4.5, המודל הזול והקטן, אומן להתעמת בצורה ישירה יותר – מה שלפעמים נתפס כאגרסיבי מדי. לעומתו, Opus 4.5, מודל הדגל היקר, אומן לשמור על אווירה נעימה גם כשהוא מתקן את המשתמש.

אכיפה נגד קטינים

השימוש ב-Claude מותר מגיל 18 בלבד. כל משתמש חדש נדרש לאשר בעת ההרשמה שהוא מעל גיל 18, אבל עד עכשיו זה היה פשוט וי בתיבת סימון – בלי אימות אמיתי.

עכשיו אנטרופיק מפתחת שני מנגנוני אכיפה:

1. זיהוי ישיר: אם משתמש מזדהה בשיחה כקטין (“אני בן 15”), המערכת מסמנת את החשבון לבדיקה וחוסמת אותו לאחר אישור ידני.

2. זיהוי סימנים עקיפים: החברה מפתחת מסווג חדש שמנתח דפוסי שיחה כדי לזהות סימנים שהמשתמש עשוי להיות קטין – כמו סגנון שפה, נושאים חוזרים (למשל: בית ספר, מבחנים, הורים), או דפוסי התנהגות אופייניים לגילאים צעירים.

 

לשם כך, אנתרופיק הצטרפה ל-Family Online Safety Institute (FOSI), ארגון שפועל למען חוויות מקוונות בטוחות לילדים ולמשפחות.

 

יוזמות הבטיחות המרכזיות של אנטרופיק

יוזמות הבטיחות המרכזיות של אנטרופיק

 

חשוב לקחת בחשבון כמובן, שהמודלים עלולים לטעות – בדיוק כמו Google, שהשיקה מערכת זיהוי גיל מבוססת AI מוקדם יותר השנה ונתקלה בתלונות של משתמשים בוגרים שזוהו בטעות כקטינים ונאלצו להעלות מסמכי זהות.

הדילמות שמאחורי המספרים

הנתונים של אנטרופיק אינם רק דוח התקדמות, אלא מפה של “אזורי הקרב” החדשים בבינה מלאכותית. הם מעלים שאלות כבדות משקל שנותרו ללא מענה סופי:

1. פער היכולת: זיהוי אינו פתרון

ההישג המרשים של 99% זיהוי מצוקה מציב זרקור על הפער הטכנולוגי העמוק: היכולת של המודל לתקן שיחה שכבר במסלול בעייתי נותרה נמוכה (10% ב-Opus). השאלה המקצועית כאן היא האם שקיפות מספיקה? הצגת הודעת ההתראה היא צעד חיוני, אך היא חושפת את המגבלה המבנית של מודלי שפה ב-2025: הם יודעים “לקרוא את החדר” מצוין, אך עדיין מתקשים להוביל בו שינוי התנהגותי מורכב.

2. מחיר ה”חמימות”

אנטרופיק חושפת כאן דילמה מוצרית מהותית: המודל היקר והמתקדם ביותר (Opus) אומן להיות “חמים” יותר על חשבון אסרטיביות בתיקון טעויות. זו אינה בהכרח בחירה צינית, אלא תעדוף של חוויית המשתמש. המשימה לייצר AI שהוא גם סמכותי וגם ידידותי מתגלה כאחד האתגרים הטכנולוגיים הקשים ביותר, וכרגע נראה שהחברה בוחרת בשימור הקשר השיחתי עם המשתמש כערך עליון.

3. דילמת ההגנה מול הפרטיות

המעבר לאכיפת גיל מבוססת דפוסי התנהגות מציב את אנטרופיק בתוך המלכוד הקלאסי של עידן המידע: הגנה על קטינים מול הימנעות מ”פרופיילינג”. ללא אימות זהות ממשלתי, החברה נאלצת להשתמש בניתוח של שפת המשתמש, הנושאים שעליהם הוא מדבר, ואופן הכתיבה שלו. זוהי בחירה בין שתי אפשרויות קשות, והיא מעלה את השאלה האם המחיר של בטיחות קטינים הוא בהכרח ויתור על פרטיות האופן שבו אנחנו מתבטאים.

4. Petri: קביעת הסטנדרט לאמת

שחרור כלי ההערכה Petri כקוד פתוח הוא צעד של מנהיגות בתעשייה, אך הוא נושא אחריות עצומה. על ידי הגדרת המדדים ל”התחנפות”, אנתרופיק אינה מייצרת מונופול, אלא מתווה את הנורמה. השאלה שנותרה פתוחה היא האם הגדרת ה”אמת” כפי שהיא מופיעה בקוד של Petri רחבה מספיק כדי להכיל את המורכבות של שיחה אנושית, או שהיא מצמצמת אמת למה שניתן למדוד במעבדה.

 

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס מקיף לבינה מלאכותית - GenAI Master
קורס מאסטר בבינה מלאכותית Master GenAI

 

לסיכום, המהלכים האחרונים של אנטרופיק מוכיחים שבטיחות בבינה מלאכותית היא כבר לא רק “תיבת סימון” שיווקית, אלא שדה קרב טכנולוגי ופילוסופי. המספרים מראים שיפור ברור בזיהוי, אך הם גם חושפים את “תקרת הזכוכית” הנוכחית: היכולת לזהות בעיה (99%) עדיין עולה בהרבה על היכולת לתקן אותה בזמן אמת (10-37%).

 

הדילמות שנותרו על השולחן:

  • חמימות מול אמת: האם אנחנו מוכנים למודל שיהיה פחות “נחמד” כדי להיות יותר מדויק?

  • הגנה מול פרטיות: האם המחיר של שמירה על קטינים הוא ויתור על האנונימיות ההתנהגותית שלנו?

  • שקיפות מול אפקטיביות: האם הצגת באנר היא פתרון מספק, או רק “עזרה ראשונה” זמנית?

 

הצעדים של אנטרופיק – מהשותפויות עם ארגוני משבר ועד שחרור כלי ה-Petri כקוד פתוח – מצביעים על רצון כנה להפוך את הבטיחות לסטנדרט תעשייתי משותף ולא לנכס פרטי.

 

אז בשורה התחתונה, כמשתמשים, עלינו לזכור שהמערכות הללו עדיין בשלבי למידה. אם נתקלתם בהודעת התראה, התייחסו אליה ברצינות, היא מבוססת על משאבים מאומתים של מומחי משבר. ובכל הנוגע לקטינים, האחריות נותרת עלינו – Claude אינו מיועד לילדים, והכלים החדשים הם רק שכבת הגנה נוספת בתוך עולם שעדיין מעצב את גבולותיו.

הפוסט אנטרופיק מגבירה את ההגנה על משתמשי Claude הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/claude-safety-upgrade/feed/ 0
ספריית ה-Prompt Packs של OpenAI https://letsai.co.il/openai-prompt-packs-library/ https://letsai.co.il/openai-prompt-packs-library/#respond Fri, 19 Dec 2025 07:42:47 +0000 https://letsai.co.il/?p=66485 בשנים האחרונות השיח סביב עבודה עם מודלי שפה בכלל ו-ChatGPT בפרט, עבר משלב ההתלהבות הראשונית לשאלה הרבה יותר פרקטית: איך משתמשים בכלים האלה נכון ביומיום, בלי לבזבז זמן על ניסוי וטעייה? רבים מרגישים שהם עובדים עבור ה-AI במקום שה-AI יעבוד בשבילם! אחד מ”גזלני הזמן” הוא הצורך להמציא כל פעם מחדש פרומפטים, ולנסות לשחזר או להיזכר […]

הפוסט ספריית ה-Prompt Packs של OpenAI הופיע ראשון בLet's AI בינה מלאכותית

]]>
בשנים האחרונות השיח סביב עבודה עם מודלי שפה בכלל ו-ChatGPT בפרט, עבר משלב ההתלהבות הראשונית לשאלה הרבה יותר פרקטית: איך משתמשים בכלים האלה נכון ביומיום, בלי לבזבז זמן על ניסוי וטעייה? רבים מרגישים שהם עובדים עבור ה-AI במקום שה-AI יעבוד בשבילם! אחד מ”גזלני הזמן” הוא הצורך להמציא כל פעם מחדש פרומפטים, ולנסות לשחזר או להיזכר בפרומפטים שכבר עבדו בעבר, אבל לך תמצא אותם… בדיוק פה ספריית הפרומפטים של OpenAI נכנסת לתמונה – תמצאו בה מאות פרומפטים שכבר נוסו, שויפו והוכיחו את עצמם, ושנכתבו על-ידי משתמשים מנוסים ובכירי התעשייה. למעשה ה-Prompt Packs של OpenAI הוא מאגר חינמי ומובנה שמציע דרך מסודרת לעבוד עם ChatGPT (אבל לא רק) לפי תפקיד ותחום עיסוק, ולא לפי השראה רגעית. יותר סדר – פחות שליפה מהמותן. התוצאה – הגברת פרודוקטיביות בעבודה עם הצ’טבוט החביב עליכם, חיסכון בשעות עבודה על Prompt Engineering, ותוצרים איכותיים יותר!

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

מהי ספריית ה-Prompt Packs של OpenAI ואיך מקבלים אליה גישה?

לפני הכל, לחצו פה כדי להתחבר ל-Prompt Packs. ספריית הפרומפטים היא חלק מ-OpenAI Academy, והיא כוללת עשרות חבילות פרומפטים מוכנים לשימוש, שכל אחת מהן מתמקדת בתפקיד מקצועי או בתחום עבודה ספציפי. כל חבילה כוללת בדרך כלל בין 20 ל-30 פרומפטים, שנבנו מראש על ידי אנשי מקצוע ובכירים בתעשייה, מתוך הבנה עמוקה של הצרכים, השאלות והמשימות האופייניות לאותו תפקיד.

 

ספריית הפרומפטים של OpenAI ל-ChatGPT

ספריית הפרומפטים של OpenAI ל-ChatGPT

 

בניגוד לאוספים אקראיים של פרומפטים שמסתובבים ברשת, כאן מדובר במאגר רשמי, מתוחזק ומסודר, שבו כל פרומפט מגיע עם ניסוח מלא, הקשר ברור והנחיות התאמה. המטרה אינה ללמד “איך לכתוב פרומפט”, אלא לאפשר למשתמש להתחיל מנקודת פתיחה איכותית, ולבצע התאמות מינוריות בלבד לצרכים שלו.

 

חלוקה לפי תפקידים ותחומי עבודה

אחד היתרונות המרכזיים של הספרייה הוא הארגון שלה לפי תפקידים עסקיים ותחומי אחריות. במקום לחשוב בצורה כללית על שימושים ב-ChatGPT, המשתמש ניגש ישירות לחבילה שמדברת בשפה המקצועית שלו.

 

חבילות בולטות

בין החבילות הבולטות ניתן למצוא חבילות ייעודיות למכירות, ניהול מוצר, הנדסה, IT, משאבי אנוש, מנהלים, הנהלה בכירה, שיווק, כספים, Customer Success ועוד. בנוסף קיימות חבילות ייחודיות לסקטורים מסוימים, כמו מגזר ציבורי, חינוך והשכלה גבוהה.

 

מאגר פרומפטים ל-ChatGPT בתחומי ה-Marketing

מאגר פרומפטים ל-ChatGPT בתחומי ה-Marketing

 

מדריך עבודה ממוקד

כל חבילה כזו מתפקדת בפועל כמדריך עבודה ממוקד. היא מציגה סט תרחישים נפוצים לתפקיד, ומציעה פרומפטים שמכסים משימות כמו מחקר תחרותי, תכנון אסטרטגי, כתיבת מסמכים, ניתוח נתונים, בניית מצגות, תקשורת עם לקוחות או עובדים, ותיעוד טכני.

 

מגוון ספריות פרומפטים למגוון מקצועות

מגוון ספריות פרומפטים למגוון מקצועות | OpenAI

 

 

איך משתמשים בפרומפטים בפועל

  1. בחירת מאגר פרומפטים לפי מקצוע: לאחר הכניסה, הגלילה חושפת חבילות שונות, שכל אחת מהן מוצגת עם תיאור קצר שמבהיר לאילו שימושים היא מיועדת. הבחירה הראשונית צריכה להיות פשוטה: להתחיל מהתפקיד המרכזי שלכם כיום. מנהלים ימצאו ערך מיידי בחבילת “ChatGPT for managers”, אנשי מוצר בחבילת “ChatGPT for product”, מהנדסים ב-“ChatGPT for engineers” וכן הלאה.
  2. בחירת פרומפט: השימוש בפרומפט בודד מתוך חבילה הוא תהליך ישיר ופשוט. בוחרים פרומפט שמתאים למשימה הרצויה, למשל ניתוח מתחרים, תכנון קמפיין, כתיבת מסמך מדיניות או הפקת דוח ניהולי. לאחר מכן לוחצים על “Try in ChatGPT”, או לחלופין – לעיתים האתר יעביר אתכם ל-GPTs ייעודי ש-OpenAI בנו עבור מקצוע מסוים.
  3. התאמת הפרומפט: לאחר העתקת הפרומפט ל-ChatGPT (או לכל LLM אחר), מחליפים את הסוגריים בפרטים הרלוונטיים לארגון או לפרויקט (ראו דוגמה מטה), ושולחים. 

 

פרומפט לסיעור מוחות על רעיונות לקמפיין

פרומפט לסיעור מוחות על רעיונות לקמפיין | OpenAI

 

איך להפיק ערך אמיתי מהחבילות לאורך זמן

כדי שהשימוש ב-Prompt Packs לא יישאר בגדר ניסוי חד-פעמי, כדאי לאמץ גישה שיטתית. מומלץ להתחיל מחבילת התפקיד הראשי, אך להוסיף גם חבילה משיקה. מנהל מוצר, למשל, יכול להרוויח רבות גם מחבילת ההנדסה או השיווק. מנהל בכיר יכול לשלב בין חבילת מנהלים לחבילת הנהלה.

 

לאחר היכרות ראשונית, כדאי לבחור שלושה עד חמישה פרומפטים שמשמשים כפרומפטי ליבה. אלו יכולים להיות פרומפטים לניהול משימות, הכנת מצגות, כתיבת מיילים מורכבים, מחקר שוק או ניתוח נתונים. את הפרומפטים הללו ניתן להפוך לתבניות ארגוניות, לשמור גרסה מותאמת לארגון, ואף לשתף עם הצוות כדי ליצור שפה אחידה וסטנדרט עבודה משותף.

 

למה הספרייה הזו שונה מאוספי פרומפטים אחרים

הייחוד של Prompt Packs אינו בכמות הפרומפטים, אלא בהקשר שבו הם נכתבו. כל חבילה נבנתה מתוך הבנה עמוקה של תפקיד מסוים, ולא מתוך ניסיון לייצר פרומפטים כלליים שמתאימים לכולם. העובדה שהפרומפטים נוצרו ונבדקו על ידי אנשי מקצוע ובכירים בתעשייה מעניקה להם אופי פרקטי, יישומי וממוקד משימה.

 

בסופו של דבר, ספריית ה-Prompt Packs של OpenAI לא מבטיחה פתרונות קסם, אבל היא כן חוסכת זמן, מצמצמת חיכוך ומאפשרת לארגונים ולאנשי מקצוע להתחיל ממקום איכותי יותר. בעידן שבו כולם משתמשים באותם כלים, ההבדל נוצר לא בטכנולוגיה עצמה, אלא באיכות השאלות שמפנים אליה. זה פתרון מושלם לבעיית ה-Cold Start (התחלה קרה) בה משתמשים מתקשים לדעת מאיפה להתחיל. קצת כמו סופר מתוסכל שבוהה בדף הלבן ולא יודע מה לעשות, איך להתחיל ואיך להתמודד עם מחסום הכתיבה. גם פה, בתחילת פרויקט או תהליך עבודה, לעיתים משתמשים רבים מוצאים את עצמם אובדי עצות. כשיש לך מאגר שיכול לכוון אותך ולהגיש לך על מגש של כסף את הפרומפט הנכסף, זו כבר התחלה מצוינת!

הפוסט ספריית ה-Prompt Packs של OpenAI הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/openai-prompt-packs-library/feed/ 0
האם GPT-5.2 הוא התרופה של OpenAI ל-Gemini-3? https://letsai.co.il/gpt-5-2-launch/ https://letsai.co.il/gpt-5-2-launch/#respond Fri, 12 Dec 2025 09:59:34 +0000 https://letsai.co.il/?p=65987 אתמול (חמישי, 11.12.25) השיקה OpenAI את GPT-5.2 במהלך שנתפס על-ידי רבים יותר כתגובה המתבקשת ל-Gemini3 של גוגל, ופחות כמודל דגל חדש. המודל החדש אמנם מציג שיפורים חשובים, אך השאלה המרכזית שמרחפת מעליו היא האם הוא יצליח לתת פייט למתחרים מ-Google? האם עדכון כזה מסוגל באמת להחזיר את העליונות ש-OpenAI ביססה פה לאורך כמעט 3 שנים […]

הפוסט האם GPT-5.2 הוא התרופה של OpenAI ל-Gemini-3? הופיע ראשון בLet's AI בינה מלאכותית

]]>
אתמול (חמישי, 11.12.25) השיקה OpenAI את GPT-5.2 במהלך שנתפס על-ידי רבים יותר כתגובה המתבקשת ל-Gemini3 של גוגל, ופחות כמודל דגל חדש. המודל החדש אמנם מציג שיפורים חשובים, אך השאלה המרכזית שמרחפת מעליו היא האם הוא יצליח לתת פייט למתחרים מ-Google? האם עדכון כזה מסוגל באמת להחזיר את העליונות ש-OpenAI ביססה פה לאורך כמעט 3 שנים – אותה עליונות שגוגל סדקה (או שמא נאמר – ריסקה) לפני מספר שבועות. מה שבטוח – יש פה ניסיון ברור להדביק פער שנפתח מהר מדי, ושנדמה שהולך וגדל עם כל שדרוג והשקה מצד גוגל (ויש הרבה כאלה לאחרונה). המלחמה מתחממת ועולה הילוך! ב-OpenAI מבינים שזו תקופה מכרעת ובהחלט אפשר לזהות את הלחץ שמאחורי ההשקה. אבל בשורה התחתונה – האם זה מודל מספיק טוב כדי לעצור את שטף ביטולי המנויים בתשלום והמעבר לג’מיניי? במילה אחת… אולי. כן – זה מודל מצוין. אבל לא – לא בטוח שהוא התרופה לעלייתה של גוגל ומודל הדגל שלה – Gemini.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

הכל התחיל מחלום, לפני 10 שנים

לפני 10 שנים ישבו חבורה של Dreamers והחליטו שהעתיד טמון בבינה מלאכותית. אט אט התחוור להם שפריצת הדרך תהיה במה שאנחנו היום מכנים “מודלי שפה גדולים” (LLMs). משם הדרך ל-GPT הייתה קצרה ולפני 3 שנים זה קרה. GPT 3.5 הושק לעולם בקול תרועה רמה, וההיסטוריה האנושית השתנתה לעד. המודל הזה הצית מהפכה שעד היום רק הלכה והתעצמה, ושסוללת מחדש את האופן בו בני אדם מתקשרים עם טכנולוגיה, עובדים עם טכנולוגיה ויוצרים עם טכנולוגיה.

 

 

ואכן, ב-3 השנים האחרונות היה נדמה ש-ChatGPT משאיר לכולם אבק. המוצר הצומח ביותר בהיסטוריה האנושית – יותר מספוטיפיי, יותר מטיקטוק, יותר מנטפליקס ויותר מאינסטגרם! מיליון משתמשים תוך 5 ימים. 100,000 משתמשים תוך חודשיים ונכון להיום כ-800 מיליון משתמשים שבועיים.

ואז הגיע נובמבר 2025…

 

האם לבטל את המנוי?

בשבועות האחרונים שמעתי הרבה מאוד אנשים, קולגות ומשפיענים שמצהירים: “ביטלתי את המנוי שלי ל-ChatGPT ועברתי ל-Gemini”. חייב לומר שאני לא שם לא הצליחו עדיין לשכנע אותי ש-ChatGPT הפסיק להיות כלי עבודה יעיל במיוחד – מבחינתי מדובר ב”סוס עבודה” בו אני עושה שימוש יומיומי, או ליתר דיוק – שימוש שוטף על בסיס כמעט שעתי. מצד שני, יש לי מנוי לכמעט כל LLM מוביל בשוק, החל מ-Claude ועד Gemini ובהחלט התפעמתי מההתקדמות האדירה של ג’מיניי בשבועות האחרונים.

 

למה מאמר על ChatGPT סוטה והופך למאמר על Gemini? כי ההשוואה מתבקשת. אחת התובנות המרכזיות שלי, בתור מי שחורש על כל אחת מהפלטפורמות, היא שאנחנו זכינו – ואנחנו זה הציבור הרחב. המשתמשים. זכינו לחיות בתקופה של שפע, שבה ענקיות טק ותאגידי AI גלובליים מתחרים על תשומת הלב שלנו (והארנק שלנו). ההבדלים כיום בין מודלי הדגל דיי מינוריים. כולם מאוד מאוד טובים, וגם היו מאוד מאוד טובים לפני חצי שנה ושנה.

 

בג’מיניי אמנם יש המון פיצ’רים חדשים ומאוד טובים – מודל תמונות מעולה (ננו בננה פרו), פיצ’רים מעולים לויזואליזציה של נתונים (מצגות, קנבס), מודל וידאו מעולה (Veo 3.1), וכולם יושבים באותו מקום. יש לו Deep Research מ-ט-ו-ר-ף (ואולי הכי טוב בשוק) ופלטפורמת בניית בוטים חביבה במיוחד (Gems). מצד שני – איכשהו בעבודה השוטפת, היומיומית, אני מוצא את עצמי חוזר לג’פטו הישן והטוב. הוא מגיב מהר יותר. זורם יותר. רץ חלק. לפעמים עומס וגודש של כוח חישוב מוביל לתוצאות טובות יותר, אבל גם לחוויית משתמש פחות טובה.

 

ב-Gemini אמנם אפשר להחליף בין מודל של חשיבה מעמיקה, למודל זריז יותר, אבל מודלי GPT של OpenAI מרגישים הרבה יותר “אייג’נטליים”. כלומר – הם מגיבים יותר טוב לשינויים. החל מסדרת מודלי GPT-5, לא צריך להחליף ידנית מודל בבורר המודלים. ב-ChatGPT של סוף 2025, בואכה 2026, הכל עובד חלק יותר. כשהמודל מזהה משימה קלה – הוא עובד זריר, שולף מודל Instant ועונה מהר. כשהוא מזהה משימה מורכבת יותר – הוא חושב חזק ועמוק יותר. ומשהו בכל אותה חוויית שימוש, לי עושה שכל. פשוט “כיף” לעבוד שם. ושוב – זה לא שב-Gemini לא כיף לי, אבל יש דברים שקשה לשים עליהם את האצבע: אמינות, יציבות, זרימה וכן הלאה. את כל אלו ChatGPT שכללו לאורך 3 שנים של שליטה ללא עוררין בתעשייה. וזה עדיין שם!

 

קוד אדום אחד והרבה לחץ

בתחילת החודש הכריז אלטמן על “קוד אדום”, נטישת פרויקטים צדדיים ומיקוד במשימות הליבה – ב-ChatGPT הקלאסי. וההשקה של GPT-5.2 מדברת בשפה אחרת – היא מבליטה פרודוקטיביות ויעילות: לא סתם שיפור בביצועים או מבחנים, אלא אאוטפוטים טובים יותר: סוכנים שעובדים טוב יותר לאורך זמן, יצירת קבצי אקסל מרובי גיליונות (אם תשאלו אותי – ChatGPT היא עדיין הפלטפורמה המובילה בכל מה שקשור לניתוח נתונים וקבצי אקסל ו-CSV). במילים אחרות, OpenAI מנסה להחזיר לעצמה יתרון תדמיתי וטכני לא דרך טריקים, אלא דרך חיזוק המוצר שמייצר לה את רוב הקשר היומיומי עם השוק.

 

באנר קורס דאטה ניתוח נתונים עם AI

 

מה מיוחד ב-GPT-5.2

אז אחרי ההקדמה הלא קצרה הזו, בואו נצלול פנימה אל תוך ביצועי המודל – מה חדש? מה השתנה? במה הוא טוב והאם יש פה בשורה אמיתית?

 

מודל אייג’נטלי ו-3 מצבי חשיבה

כמו בכל מודלי GPT-5 ומעלה, גם פה המודל “בוחר בשבילכם” כשהוא על מצב AUTO ומסוגל לדלג ולקפץ בין מצבי חשיבה שדורשים יותר כוח חישוב (מודלי הריזונינג שמקוטלגים כ-“Thinking”). או במילים אחרות – אתם מקריבים מהירות תמונות ביצועים טובים יותר (יותר כוח חישוב = פחות הזיות וטעויות, ויותר אמינות ודיוק).

 

כמובן, אפשר תמיד לבחור ידנית את מודל Instant המהיר, או מודל Thinking הכבד יותר, וגם בו אפשר להגדיר ידנית מצב חשיבה “רגיל” (Standard), או מצב חשיבה מעמיקה (Extendend Thinking). מצב זה מתאים במיוחד למשימות מורכבות או רב-שלביות. משימות כמו ניתוח קבצים ונתונים, ריבוי דאטה וכן הלאה.

 

מנויי פרו נהנים ממצב חשיבה עוצמתי יותר: GPT‑5.2 Pro. מודל עוצמתי אף יותר ממצב Thinking שמיועד למשימות מורכבות וארוכות באמת. אבל ל-99% מהמשתמשים אין באמת צורך בעוצמות חישוב כאלה.

 

כל מה שתיארתי פה, לא באמת ייחודי ל-GPT-5.2 והיה קיים בדורות הקודמים של סדרת GPT-5, ועדיין – הביצועים השתפרו וזה מורגש!

 

פחות הזיות וטעויות, יותר אמינות והקשר!

הנקודה השנייה היא אמינות. GPT-5.2 מציג ירידה משמעותית בהזיות וטעויות עובדתיות לעומת GPT-5.1 (כ-38% פחות טעויות עובדתיות).

לטענת החברה, GPT-5.2 מכוון לעבודה מקצועית יציבה ואמינה – פרויקטים שנמשכים לאורך הרבה שלבים, שזקוקים להקשר גדול ושמכילים הרבה פעולות. ביומיום כל זה מתורגם לפחות קריסות באמצע תהליכי עבודה, פחות חורים לוגיים בין שלבים, ויותר יכולת להחזיק מסמך, פרויקט או סט משימות לאורך זמן. פחות “צ’אט” ויותר דאטה אנליסט צמוד. מכשיר עוצמתי לניתוח נתונים, קבצים, לקריאה וכתיבה של תוכן. כלי שמצטיין ב”הסקה” (Reasoning) ואיתור דפוסים, מגמות והקשרים.

 

ביצועים ומבחנים

ביצועים טובים במבחני ידע

מבחן GDPval זהו מבחן שמנסה למדוד עד כמה מודל יודע לבצע משימות עבודת ידע “מוגדרות היטב” על פני 44 עיסוקים, כאשר במקום תשובה קצרה הוא נדרש לייצר תוצר עבודה אמיתי כמו מצגת, גיליון אלקטרוני או מסמך תפעולי, וההערכה נעשית על ידי שופטים אנושיים. המבחן הזה בודק כמה פעמים המודל מצליח לנצח אנשי מקצוע מומחים בתחומם, או להגיע לתיקו מולם. מודל GPT-5.2 Thinking הצליח לנצח או לסיים בתיקו מול אנשי מקצוע ב-70.9% מהמקרים, וגרסת GPT-5.2 Pro הגיעה ל-74.1%. מדהים! OpenAI גם טוענת שבמשימות האלה המודל ייצר תוצרים במהירות גבוהה פי 11 ובעלות שנמוכה מ-1% ביחס לעבודה אנושית.

 

GDPval

מנצח מומחים אנושיים במבחני GDPval | קרדיט: OpenAI

 

ניתוח נתונים ו/או יצירת קבצים מרובי-גיליונות

מבחן פנימי לגיליונות בנקאות השקעות (Spreadsheet modeling), הוא מדד פנימי של OpenAI שמדמה עבודת אנליסט זוטר בבנקאות השקעות. לפי הנתונים, GPT-5.2 Thinking משפר את הציון הממוצע למשימה מ-59.1% ב-GPT-5.1 ל-68.4% ב-5.2 – עלייה של 9.3% בממוצע לכל משימה.

 

מצטיין בניתוח קבצים ונתונים

מצטיין בניתוח קבצים ונתונים | Credit: OpenAI

 

קוד, מתמטיקה והסקה: חיזוק הדרג המקצועי

בתחום הקוד, OpenAI מדגישה שיפור בביצועים במדדים כמו SWE-Bench Pro ו-SWE-bench Verified, כאשר המספרים שמופיעים מצביעים על עלייה ביחס ל-GPT-5.1 Thinking. מעבר לתוצאות, הקו הכללי הוא שיפור בעבודה פרקטית: תיקון באגים, רפקטורינג לקוד בסיס גדול, יישום פיצ’רים ושילוח תיקונים מקצה לקצה עם פחות התערבות ידנית.

 

בתחומי מתמטיקה ומדע, ההכרזה מציינת תוצאות גבוהות במדדים כמו GPQA Diamond וגם AIME 2025, לצד שיפור במדדים מתקדמים יותר כמו FrontierMath.

מבחן GPQA Diamond (שאלות מדע “עמידות גוגל”) הוא בנצ’מרק של שאלות מדע ברמה גבוהה (פיזיקה, כימיה, ביולוגיה) שנועדו להיות קשות לחיפוש מהיר, ובגרסה שמוצגת כאן המודל פותר ללא שימוש בכלים. AIME 2025 (מתמטיקה תחרותית): זהו מבחן מתמטיקה תחרותי שמודד פתרון בעיות ממוקדות בלחץ דיוק, ללא כלים.

מי שלא חי את עולם הבנצ’מרקים יכול לתרגם את זה להבנה הפשוטה הבאה: OpenAI מנסה להראות שהמודל לא רק “מנסח יפה”, אלא גם מחזיק חזק יותר כשנדרשת חשיבה מרובת שלבים ודיוק כמותי. הוא מצטיין בביצועים במתמטיקה ומדע, גם כשהמודל שלפניו (GPT-5.1) עשה את זה טוב (הוא פשוט עושה את זה טוב יותר… חכם יותר).

מצטיין במתמטיקה וכתיבת קוד

מצטיין במתמטיקה,מדעים וכתיבת קוד | Credit: OpenAI

 

אחד השיפורים המשמעותיים הוא ביכולות ההסקה המופשטת במדדי ARC-AGI, עם קפיצה משמעותית בתוצאות מול גרסאות קודמות. מבחנים אלו מנסים למדוד יכולת לפתור בעיות מופשטות שלא דומות לשאלות ידע רגילות, עם מיקוד במה שנחשב “חשיבה חדשה” ולא שחזור תבניות. או במילים אחרות – להתמודד עם מצבים שבהם המודל לא נתקל לפני כן בשלב האימון, ממש כמו שאדם אמיתי נדרש לפתור בעיות חדשות שעליהן לא “התאמן” או למד מראש. לפי OpenAI, ב-ARC-AGI-1 (Verified) GPT-5.2 Thinking מגיע ל-86.2% לעומת 72.8% ב-5.1, וב-ARC-AGI-2 (Verified) הוא קופץ ל-52.9% לעומת 17.6%. פה כבר מדובר בפערים גדולים.

מצטיין במבחני ARC AGI

מצטיין במבחני ARC AGI | קרדיט: OpenAI

 

 

למי זה זמין, איפה וכמה זה עולה

 

זמינות בתוך ChatGPT

המודל החדש כבר זמין ב-ChatGPT למנויים בתשלום בתשלום – מנויי פלוס (Plus), פרו (Pro), ביזנס (Business) ואנטרפרייז (Enterprise). חלק מהמשתמשים יקבלו אותו בהדרגה, כדי להבטיח פריסה יציבה.

 

זמינות ב-API ותמחור למפתחים

ב-API, המודלים זמינים כבר עכשיו לכל המפתחים. יש גם פרמטר של “מאמץ חשיבה” (reasoning effort) ותמיכה ברמה נוספת בשם xhigh למשימות שבהן איכות חשובה יותר מזמן.

 

בתמחור, OpenAI מציגה מחיר של 1.75 דולר למיליון טוקנים בקלט ו-14 דולר למיליון טוקנים בפלט עבור gpt-5.2, לצד הנחה משמעותית על קלטים שמורים במטמון. לגרסת Pro המחירים גבוהים משמעותית, עם 21 דולר למיליון טוקנים בקלט ו-168 דולר למיליון טוקנים בפלט. יקר!

מחיר למיליון טוקנים ב-API

מחיר למיליון טוקנים ב-API

 

פסק הדין

GPT-5.2 מגיע עם שיפור ניכר בכתיבה, קוד והיגיון, ועם דגש על הבנה עמוקה הודות לשמירה על הקשר לאורך זמן. זו לא “התשובה” ל-Gemini 3, אלא ניסיון להעלות זריז לכותרות מודל שיחזיר את GPT לשיח הציבורי. גוגל קיבלה המון תשומת לב בשבועות האחרונים וב-OpenAI נלחצו. זה לא ה-מודל שלה. זה פשוט ‘עוד’ מודל (מאוד מאוד טוב), שכנראה לא ישכנע אתכם לעבור מ-Gemini ל-ChatGPT, אבל אולי כן יהיה מספיק כדי להשאיר אתכם ב-ChatGPT ולמנוע מכם לנטוש את הספינה. ואם התחלנו באלגוריית הספינה – אז שלרגע אף אחד לא יחשוב שהיא טובעת – ראיתי הרבה שמספידים את OpenAI. אין לי ספק שהם יתאפסו על עצמם ויצמצמו את הפער. יש להם מוצר מעולה ועכשיו הם צריכים לקחת אותו צעד אחד למעלה. 

הפוסט האם GPT-5.2 הוא התרופה של OpenAI ל-Gemini-3? הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/gpt-5-2-launch/feed/ 0
איך בינה מלאכותית משנה את העבודה באנטרופיק – ומה זה אומר על העתיד שלנו https://letsai.co.il/ai-transforming-work-anthropic/ https://letsai.co.il/ai-transforming-work-anthropic/#respond Tue, 09 Dec 2025 07:46:13 +0000 https://letsai.co.il/?p=65652 אם רוצים להבין איך תיראה העבודה של מהנדסים ואנשי ידע בעוד כמה שנים, כדאי להסתכל על מה שקורה היום באנטרופיק. זו לא מצגת חזון על “עתיד העבודה”, אלא תיאור יחסית נדיר של מה קורה כש-AI נכנס עמוק ליום עבודה אמיתי, אצל האנשים שבונים את המודלים בעצמם. אנטרופיק, החברה שפיתחה את Claude, סקרה כ-132 מהנדסים, ערכה […]

הפוסט איך בינה מלאכותית משנה את העבודה באנטרופיק – ומה זה אומר על העתיד שלנו הופיע ראשון בLet's AI בינה מלאכותית

]]>
אם רוצים להבין איך תיראה העבודה של מהנדסים ואנשי ידע בעוד כמה שנים, כדאי להסתכל על מה שקורה היום באנטרופיק. זו לא מצגת חזון על “עתיד העבודה”, אלא תיאור יחסית נדיר של מה קורה כש-AI נכנס עמוק ליום עבודה אמיתי, אצל האנשים שבונים את המודלים בעצמם. אנטרופיק, החברה שפיתחה את Claude, סקרה כ-132 מהנדסים, ערכה 53 ראיונות עומק וניתחה בערך 200 אלף סשנים של Claude Code כדי להבין איך העבודה שלהם משתנה. לפי הדיווח של המהנדסים, Claude מעורב היום בכ-60% מהעבודה שלהם, והם מדווחים על עלייה ממוצעת של כ-50% בפרודוקטיביות בהשוואה לעבודה בלי AI. שנה קודם, השימוש היה סביב 28% מהעבודה והעלייה בפרודוקטיביות הוערכה בכ-20%.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

לפני שממשיכים, חשוב לזכור את המסגרת: זה מחקר פנימי של חברה מסחרית, על מהנדסים שהם משתמשים מתקדמים במיוחד, והמדדים מבוססים ברובם על דיווח עצמי. אין כאן מדידה אובייקטיבית של תפוקה לאורך שנים, אלא צילום מצב עשיר של איך אנשים מרגישים ועובדים בתוך אחד מארגוני ה-AI הכי מתקדמים. ובדיוק בגלל זה, מה שקורה שם הוא כנראה הצצה מוקדמת למה שעוד יגיע לשאר השוק.

לא רק לחסוך זמן – לעשות עבודה שלא הייתה קיימת

הנתונים היבשים מספרים סיפור אחד. העדויות מהשטח מספרות סיפור קצת אחר.

 

על פניו, המספרים מרשימים – יותר שימוש ב-AI, קפיצה בתחושת הפרודוקטיביות, ואפילו קבוצה של כ-14% מהנדסים שמתארים קפיצה של יותר מפי 2 בתפוקה. אבל כשמסתכלים על איך המהנדסים מתארים את היום יום, מתגלה ניואנס חשוב – זה פחות “אני עושה את אותה עבודה בחצי זמן”, ויותר “אני מספיק הרבה יותר דברים שלא היו נכנסים לי בכלל ללו״ז”.

 

השפעת Claude על זמן לעומת תפוקה

השפעת Claude על זמן לעומת תפוקה | Anthropic

 

בערך 27% מהעבודה שנעשית היום עם Claude, לפי הסקר, פשוט לא הייתה נעשית בלעדיו. מהנדסים מדברים על:

  • תיקון באגים קטנים ומעצבנים שהיו נדחים שוב ושוב.

  • בנייה של כלים פנימיים ודאשבורדים שמשפרים את החיים בצוות, אבל אף פעם לא נכנסו ל”עדיפויות”.

  • עבודת חקר טכנית שלא הייתה כדאית אם היו צריכים לבצע אותה ידנית.

חוקר אחד מתאר שהוא מריץ כמה מופעי Claude במקביל, שכל אחד בודק כיוון אחר לפתרון בעיה. הוא מסביר שאנשים חושבים על מודלים מתקדמים כמו על “מכונית מהירה יותר”, אבל בפועל זה יותר כמו “יש לך כוח סוס כמעט אינסופי לבדוק רעיונות”. זה שינוי לא רק בכמה מהר עובדים, אלא בכמה אפשר לנסות.

מהנדסים כמנהלי אורקסטרציה, לא רק ככותבי קוד

שינוי נוסף שמופיע שוב ושוב בראיונות הוא הרחבת תחומי המומחיות בפועל. הגבולות המסורתיים של “אני Backend”, “אני Frontend”, “אני רק מחקר” נפתחים. מהנדסי Backend מספרים איך הם בונים ממשקי משתמש מורכבים בעזרת Claude. חוקרים יוצרים ויזואליזציות נתונים ואוטומציות סביב הניסויים שלהם. צוותי אבטחה משתמשים ב-Claude כדי לקרוא ולנתח קוד שהם לא מכירים.

 

אחד המהנדסים מספר שהצליח, בעזרת Claude, לבנות ממשק משתמש ברמת איכות שבחיים לא היה מגיע אליה לבדו בזמן שהיה לו. המעצבים שאלו אותו אם הוא פתאום נהיה מומחה UI. הוא ענה את האמת: “Claude בנה, אני רק ניהלתי.” התפקיד זז לאט לאט מכותב קוד למנהל אורקסטרציה – זה שמפרק את הבעיה, מנסח את הדרישות למודל, בודק את הפלטים, מחבר אותם למערכת הקיימת ולוקח אחריות על התוצאה.

 

תדירות המשימות ב-Claude Code לפי קטגוריות

עלייה חדה במימוש פיצ’רים, תכנון ו-Front-End תוך חצי שנה | Anthropic

 

הנתונים מ-Claude Code מחזקים את זה. אנטרופיק מדווחת שבסשן טיפוסי, המודל מחזיק היום בערך פי שניים יותר “צעדים ברצף” לפני שהוא צריך קלט חדש מהמשתמש ביחס ללפני חצי שנה. שיעור המשימות שעוסקות בתכנון ועיצוב קוד עלה מאזור האחוז הבודד לכ-10%. מימוש פיצ’רים חדשים קפץ מכ-14% לכמעט 37% מהשימוש. המודל כבר לא רק “עוזר לכתוב פונקציה”, אלא מעורב בשלבים עמוקים יותר של בניית המוצר.

 

שיעור המהנדסים שמשתמשים ב-Claude מדי יום לכל קטגוריית משימה

שיעור המהנדסים שמשתמשים ב-Claude מדי יום לפי משימות | Anthropic

 

ועדיין, כששואלים את המהנדסים כמה מהעבודה הם יכולים “להאציל לגמרי” ל-Claude, רובם נשארים באזור 0-20 אחוז. הסיבה פשוטה – ברוב הזמן הם לא משחררים משימה ונעלמים, אלא עובדים עם Claude יחד, צעד אחרי צעד. זה לא רובוט אוטונומי, זה שותף שצריך ניהול.

 

עלייה באוטונומיה של Claude

עלייה באוטונומיה של Claude

 

חשוב לראות שהשינוי הזה אינו מתקיים רק בצוותי פיתוח. השימוש ב-Claude חוצה צוותים וסוגי תפקידים, וכל מחלקה משתמשת בו באופן אחר.

 

ככה נראית ההתפשטות הארגונית של העבודה האוטומטית:

 

שימוש ב-Claude לפי צוותים שונים

התפלגות משימות Claude Code לפי סוג צוות | Anthropic

מיומנויות, יחסים וזהות מקצועית

ככל שיותר מהעבודה עוברת דרך Claude, מתחילים לצוף גם צדדים פחות נוחים.

 

הראשון הוא שחיקה אפשרית של מיומנויות. לא בקפיצה אחת, אלא בשחיקה איטית. במקום לקרוא דוקומנטציה, לעבור על קוד לבד, ולהיאבק עם באגים, מהנדסים רבים מדלגים ישר לפתרון. חלקם אומרים במפורש שהם מרגישים שאיבדו חלק מה”חוש” שנבנה כשהיו עושים דברים “בדרך הקשה”.

 

מהנדס בכיר אומר שהוא משתמש ב-AI בעיקר במשימות שבהן הוא כבר יודע איך התשובה בערך צריכה להיראות, ולכן יכול לפקח על האיכות. הוא מוסיף שאם היה בתחילת הקריירה, כנראה היה צריך להשקיע הרבה יותר מאמץ מודע כדי לוודא שהוא לא פשוט מאמץ את מה שהמודל נותן.

 

כאן נוצר פרדוקס לא קטן – כדי לפקח על Claude היטב, צריך בדיוק את אותן מיומנויות שעלולות להישחק משימוש מוגזם בו. חלק מהמהנדסים מתארים שהם בכוונה עובדים לפעמים בלי AI, כדי להישאר חדים.

 

המחקר גם מצביע על שינוי ביחסים בין אנשים. Claude הפך לתחנה הראשונה לשאלות שפעם היו מופנות לעמיתים. מהנדסים מספרים שהם שואלים עכשיו הרבה יותר שאלות באופן כללי, אבל 80-90 אחוז מהן הולכות למודל. מצד אחד, זה חוסך “מבוכה” ופוגע פחות בזמן של אחרים. מצד שני, חלק מהבכירים אומרים בגלוי שזה עצוב לראות כמה פחות ג’וניורים מגיעים אליהם. המודל עושה אופטימיזציה לשאלה, אבל חונכות וקשרים אנושיים לא נבנים מעצמם.

 

ולבסוף, יש את השאלה הגדולה של הקריירה. חלק מהמהנדסים בעמדות בכירות מרגישים יחסית בטוחים. הם יודעים לקחת אחריות, לתכנן מערכות, לנהל סיכונים. אבל גם הם מודים שקשה להם להמר על אילו מיומנויות יהיו רלוונטיות בעוד חמש או עשר שנים. אחרים מנסחים תחושה קיצונית יותר: “אני מרגיש שאני בא לעבודה כל יום כדי לעבוד על הטכנולוגיה שייתכן שתהפוך אותי ואת עוד רבים ללא רלוונטיים.”

 

זה לא סיפור של “איום מיידי”. זה סיפור של מקצוע שנמצא בתנועה מתמשכת, בלי מפה ברורה.

 

 

מה אפשר ללמוד מזה מחוץ לאנטרופיק

אנטרופיק מדגישה שהמהנדסים שלה לא מייצגים את כל שוק העבודה. הם עובדים עם הכלים הכי מתקדמים, הם קרובים למודל, והתרבות הארגונית שלהם מותאמת לזה. אבל מה שקורה שם היום הוא לכל הפחות אזהרה מוקדמת, או אולי הזדמנות מוקדמת, לכל ארגון שמכניס AI לעבודה היומיומית.

 

יש כמה מסקנות שקשה להתעלם מהן:

1. AI באמת מגדיל תפוקה, אבל משנה את סוג העבודה: לא מדובר רק בקיצוץ זמן על משימות קיימות, אלא ביצירה של קטגוריות עבודה חדשות – ניסויים, כלים פנימיים, תיקונים קטנים. ארגונים שלא ימצאו דרך לתרגם את “עוד עבודה” הזאת לערך אמיתי, עלולים פשוט להציף את עצמם בעשייה.

2. מיומנויות עמוקות לא נשמרות לבד: אם נותנים ל-AI להיכנס לכל שלב, צריך במקביל לחשוב איך שומרים על יכולת הבנה עצמאית של מערכות, במיוחד אצל ג’וניורים. זה לא קורה מעצמו.

3. חונכות ויחסים מקצועיים צריכים תכנון מודע: אם רוב השאלות הולכות למודל, צריך ליצור במכוון מרחבים שבהם אנשים כן שואלים אחד את השני, כן יושבים על קוד ביחד, כן רואים איך אחרים חושבים.

4. זהות מקצועית תעבור שינוי: מהנדסים, אנשי מוצר, אנליסטים ועוד מקצועות יהיו פחות “עושים הכל ידנית”, ויותר מנהלי תהליכים וסוכנים. זה דורש שפה אחרת כשיושבים לדבר על קריירה, קידום ופיתוח מקצועי.

במובן הזה, המחקר של אנטרופיק הוא לא תשובה, אלא מראה. הוא מראה איך נראית עבודה כש-AI הופך להיות שכבת תשתית יומיומית, ולא גימיק. מי שמסתכל עליה ברצינות, יכול להתחיל לתכנן היום איך הוא רוצה שהשילוב הזה ייראה אצלו, לפני שהשינוי יכפה עליו מבחוץ.

 

לכל מי שרוצה לקרוא את המחקר המלא, כנסו כאן.

הפוסט איך בינה מלאכותית משנה את העבודה באנטרופיק – ומה זה אומר על העתיד שלנו הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/ai-transforming-work-anthropic/feed/ 0
גוגל הרסה את מסיבת יום הולדת 3 של ChatGPT ו-OpenAI מכריזה על ״קוד אדום״ https://letsai.co.il/openai-code-red/ https://letsai.co.il/openai-code-red/#respond Thu, 04 Dec 2025 12:28:41 +0000 https://letsai.co.il/?p=65459 תחילת דצמבר 2025 הייתה אמורה להיות חגיגה. ChatGPT ציין שלוש שנים מאז שהפך מכלי ניסוי למוצר שמיליונים עובדים וחיים איתו מדי יום, וביסס את OpenAI כמובילת עידן ה-AI הג’נרטיבי. במקום מסיבה, העובדים קיבלו מזכר מסם אלטמן עם הכותרת “קוד אדום”. לפי דיווחים, זו הייתה העלאה מ”קוד כתום” לדרגת החירום הגבוהה ביותר. אלטמן כתב: “We are […]

הפוסט גוגל הרסה את מסיבת יום הולדת 3 של ChatGPT ו-OpenAI מכריזה על ״קוד אדום״ הופיע ראשון בLet's AI בינה מלאכותית

]]>
תחילת דצמבר 2025 הייתה אמורה להיות חגיגה. ChatGPT ציין שלוש שנים מאז שהפך מכלי ניסוי למוצר שמיליונים עובדים וחיים איתו מדי יום, וביסס את OpenAI כמובילת עידן ה-AI הג’נרטיבי. במקום מסיבה, העובדים קיבלו מזכר מסם אלטמן עם הכותרת “קוד אדום”. לפי דיווחים, זו הייתה העלאה מ”קוד כתום” לדרגת החירום הגבוהה ביותר. אלטמן כתב: “We are at a critical time for ChatGPT”. המסר היה ברור: עוצרים פרויקטים צדדיים ומתרכזים שוב בליבה. ובכל זאת, צריך לזכור שגם בעולם הטכנולוגיה “קוד אדום” הוא לא מטבע נדיר. גוגל עצמה הכריזה על “code red” בסוף 2022 כשהשקת ChatGPT ערערה את עמדתה בחיפוש. עכשיו התפקידים התהפכו: הפעם OpenAI היא שמרגישה את הלחץ. משהו בסיסי במאזן הכוחות השתנה.

 

OpenAI הכריזה קוד אדום

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

גוגל שברה את הרצף

הסיבה להכרזת הקוד האדום הייתה טכנית, אבל המשמעות שלה אסטרטגית לחלוטין.

 

בנובמבר 2025 השיקה גוגל את Gemini 3 Pro. לפי מסמכי המודל של Google DeepMind וניתוחים עצמאיים שהתפרסמו באותה תקופה, זה היה הדגם הראשון של גוגל שעבר את מודלי GPT במספר מבחנים שנחשבים לעומק המודיעיני של מודלים: חשיבה מופשטת, פתרון בעיות כלליות ומתמטיקה תחרותית.

 

גם בתחום הקוד נרשם שינוי. במבחנים שמדמים עבודה אמיתית על בעיות תוכנה ולא רק משימות תיאורטיות, Gemini 3 Pro הציג עליונות על פני דורות קודמים של GPT. במבחני שאלות עובדתיות רחבות, הפער היה מורגש במיוחד.

 

עם זאת, לא בכל קטגוריה גוגל מובילה. במבחני SWE-Bench, שמודדים פתרון בעיות בקוד אמיתי, שלושת המודלים המובילים – Gemini 3 Pro, GPT-5.1 ו-Claude Opus 4.5 – נמצאים כולם באותו טווח ביצועים, מה שמלמד שאין מנצח ברור.

 

אבל התחושה בשוק השתנתה. כאשר מודל אחד מצטיין במספר תחומים מרכזיים כמו חשיבה, מתמטיקה וקוד, זה כבר לא עוד שדרוג מחזורי. זו נקודת מפנה. לראשונה מאז 2022, OpenAI לא נראתה כמי שמובילה באופן ברור את רוב המבחנים החשובים.

ChatGPT עדיין שולט

חשוב להפריד בין שני עולמות: הבנצ’מרקים והמציאות בשטח.

 

לפי נתונים שהציג ניק טורלי (Nick Turley) ובהתאם לדיווחים עסקיים מסוף 2025, ChatGPT נשאר השירות הדומיננטי בשוק. הוא נהנה ממאות מיליוני משתמשים פעילים, נפח שימוש עצום ואימוץ כמעט מלא בקרב חברות גדולות. בפועל, זה עדיין ה-assistant שהעולם עובד איתו.

 

הדומיננטיות הזו היא נכס אסטרטגי: הרגלי שימוש, אמון, ממשק מוכר, אינטגרציות ותהליכים עסקיים שכבר בנויים סביבו. לכן גם אם Gemini 3 Pro מוביל בחלק מהמדדים הטכניים, זה לא הופך את ChatGPT לפחות מרכזי.

 

אבל כאן מופיע הסדק. גוגל מציגה התקדמות כמעט בכל חזית, משחררת כלים ופיצ’רים בקצב גבוה, ומצמצמת פער שנראה היה בלתי סגיר. במודלים לשפה, תמונה, וידאו וכלים חכמים סביבם, Gemini מתחיל לא רק להדביק את ChatGPT אלא לעיתים גם ליצור תחושת “אבק” מאחוריו.

 

לכן, למרות היתרון בשימוש בפועל, הזעזוע אמיתי. השוק מריח שינוי. משתמשים פרטיים ועסקיים מתחילים לבחון ברצינות את Gemini, וחלקם אף עוברים אליו. זו אינה נטישה המונית, אבל זו תנועה ראשונית שמצביעה על שינוי אפשרי במאזן הכוחות.

 

לפי נתוני Similarweb, בעוד שהתנועה ל-ChatGPT ממשיכה לצמוח אך בקצב מתון, Gemini מציגה קפיצה חדה בחודשים האחרונים של 2025. זה לא מחליף הובלה, אבל כן מסמן שינוי מומנטום שהוביל את OpenAI להכריז על “קוד אדום”:

 

ChatGPT vs. Gemini

שינוי מומנטום | Similarweb Global Traffic Trends

מבחני לחץ בתוך OpenAI

לפי דיווחים של The Information וכתבים טכנולוגיים נוספים, התגובה הפנימית ב-OpenAI הייתה חדה וברורה.

 

אלטמן וההנהלה ביקשו מהצוותים להתמקד בשלושה צירים מרכזיים: הראשון, שיפור הפרסונליזציה וחוויית המשתמש ב-ChatGPT. השני, הגדלת מהירות ואמינות, וצמצום תקלות והשהיות. והשלישי, הרחבת טווח היכולות, כולל שדרוג משמעותי ביכולות ייצור תמונה והפחתת סירובי מודל מיותרים.

 

כדי לפנות משאבים, OpenAI הקפיאה מספר פרויקטים מתקדמים. לפי הדיווחים, בין הפרויקטים שנעצרו:

  • תכנית פרסום בתוך ChatGPT, שכבר הופיעה בקוד גרסת האנדרואיד.

  • סוכני קניות ובריאות שנועדו ללוות משתמשים בהחלטות צרכניות ורפואיות פשוטות.

  • ChatGPT Pulse, עוזר אישי שהיה אמור לייצר דוחות מותאמים אישית.

ניק טורלי חיזק את הכיוון הזה בפוסט ב-X, כפי שצוטט ב-Wall Street Journal: המיקוד עכשיו הוא להפוך את ChatGPT ליותר מסוגל, אינטואיטיבי ואישי, ולהמשיך להרחיב את ההגעה הגלובלית. במילים אחרות, פחות ניסויי צד, יותר חיזוק המנוע המרכזי.

התוכנית הטכנולוגית

כאן הסיפור נהיה רגיש יותר. לפי דיווח מפורט ב-The Information שהתבסס על מקורות פנימיים, OpenAI עובדת על שני מודלים שנועדו לתת מענה קונקרטי להתקדמות של Gemini ו-Claude.

Shallotpeat

המודל הראשון, תחת שם הקוד Shallotpeat, מתואר כמודל קצר טווח שהיה אמור לצאת ימים ספורים לאחר הכרזת הקוד האדום. אותם מקורות טענו כי במבחנים פנימיים הוא עקף את Gemini 3 Pro בחלק מהמשימות. אין כל אישור רשמי לשם, לתזמון או לתוצאות, וייתכן שהוא אף השתנה מאז. מדובר בדיווחים שאינם מאושרים ולכן הם צריכים להישאר באזור האפור שבין דליפה לעובדה.

Garlic

המודל המשמעותי יותר הוא Garlic, שמיועד לרבעון הראשון של 2026. לפי הדיווחים, מארק צ’ן (Mark Chen), ראש תחום המחקר ב-OpenAI, תיאר אותו כמודל שבו הצליחו “להזריק למודל קטן יותר את אותה כמות ידע” שבעבר דרשה מודל גדול בהרבה – שינוי שמרמז על קפיצה ביעילות האימון, לא רק בביצועי קצה.

 

Garlic נשען על עבודה שנעשתה ב-GPT-4.5, אך כולל תיקונים עמוקים בשלב ה-pre-training שנועדו להתגבר על צווארי בקבוק טכניים. במבחנים פנימיים הוא הראה ביצועים חזקים במיוחד בקידוד ובמשימות חשיבה מורכבות.

 

הכל נאמר בזהירות: OpenAI לא פרסמה מידע רשמי על Shallotpeat או Garlic, ומבחנים פנימיים אינם בהכרח אינדיקציה לביצועים בעולם האמיתי. לא ברור אם ומתי מודלים אלה יושקו.

 

אבל מבחינת הנרטיב, זה לב העניין: OpenAI נמצאת במרוץ להציג דור חדש שישיב לה יתרון טכנולוגי – בזמן שהשוק מתקדם מהר יותר מאי פעם.

היתרון התשתיתי של גוגל מול השינוי המבני ב-OpenAI

מאחורי מרוץ המודלים מסתתרת שאלה אחת: על מה הם רצים?

 

לגוגל יש שליטה כמעט מוחלטת בכל שכבות ה-stack: מהמחקר ועד השבבים. משפחת Gemini רצה על TPU שגוגל עצמה מתכננת ומייצרת, מה שמעניק לה עלות כוללת נמוכה יותר, שליטה מלאה בתצורה, ויכולת להפעיל אשכולות עצומים בקנה מידה שקשה להתחרות בו.

 

Anthropic חתמה באוקטובר 2025 על הסכם תשתית עם Google Cloud שמעניק לה גישה למיליוני TPUs של גוגל – מה שנותן לה כרגע גישה לחומרה מתקדמת שדומה לזו של גוגל עצמה.

 

בעבר OpenAI הייתה תלויה כמעט לחלוטין בתשתית Azure של מיקרוסופט, תלות שנחשבה לחולשה מובנית, במיוחד לאור תקלות שירות שזוהו בשנים 2024-2025. תלות כזו בספק יחיד מגבילה יכולת שליטה בעלויות וממצבת נקודת כשל תשתיתית.

 

אבל בחודשים האחרונים המצב השתנה: OpenAI חתמה על הסכמי תשתית רחבי היקף עם AWS והחלה לפרוס קיבולת עצומה של GPU מבוסס NVIDIA. המהלך הזה שובר את הבלעדיות של Azure ומאפשר פיזור עומסים בין כמה עננים גדולים.

 

המשמעות כפולה:

  1. פחות סיכון מתלות בענן יחיד.

  2. יותר גמישות לנהל את עלויות החישוב מול המתחרות.

ועדיין, בניגוד לגוגל, OpenAI אינה שולטת בשכבות החומרה והענן של עצמה. אפילו עם המעבר לכמה ספקי ענן, היא תלויה בתשתיות של אחרים. לכן הפער התשתיתי כבר אינו עניין טכני בלבד, אלא שאלה אסטרטגית שמגדירה את יכולת החברה להתחרות לאורך זמן.

והכל קורה על רקע לחץ פיננסי

לפי דיווחים בעיתונות הכלכלית, השווי של OpenAI מתקרב ל-500 מיליארד דולר ומתבסס על הנחה שהיא תמשיך לצמוח במהירות ותשמור על מובילות טכנולוגית. אבל מאחורי המספרים נוצצים עומדת מציאות מורכבת בהרבה.

 

עלויות האימון וההרצה של המודלים עצומות. חלק גדול מההכנסות חוזר היישר ל-compute ולשכר טאלנטים טכניים. הערכות מדברות על כך ש-OpenAI שואפת להגיע ל-cash flow חיובי רק בסביבות 2029. דיווחים מסוף 2025 הצביעו גם על התחייבויות תשתית ארוכות טווח מול מיקרוסופט בהיקפים חריגים, אם כי המספרים המדויקים אינם שקופים לציבור.

 

במצב כזה, כל מודל דגל חדש הוא לא רק מהלך טכנולוגי – הוא גם הימור פיננסי של מאות מיליוני דולרים. 

מה זה אומר עבור השוק

עבור משתמשים פרטיים, התחרות הזו היא חדשות מצוינות: המודלים משתפרים, המחירים יורדים, והיכולות נפתחות ליותר אנשים. עבור ארגונים, התמונה מורכבת בהרבה. שלושה מסרים בולטים:

  • לא להישען על ספק יחיד. אסטרטגיית multi-model כבר אינה “מתקדמת” אלא הכרח. גם אם ChatGPT הוא הכלי המרכזי, כדאי להבין איך משלבים לצדו את Gemini, Claude או מודלים פתוחים.

  • להסתכל על TCO, לא רק על ביצועים. במילים פשוטות יותר, לבחון את העלות הכוללת להחזיק ולהפעיל את המערכת לאורך זמן, לא רק את המחיר המיידי שלה. פער קטן בבנצ’מרק אינו מצדיק בהכרח פער גדול בעלויות. בפרויקטים רחבי היקף, יעילות חישובית הופכת לפקטור אסטרטגי.

  • לשמור גמישות תשתיתית. ארגונים שמסוגלים להריץ מודלים על עננים שונים או על תשתיות עצמאיות נמצאים בעמדה יציבה יותר מול שינויים טכנולוגיים ושינויי מחירים.

בסופו של דבר, אנחנו נכנסים לעידן שבו אין “בחירה אחת נכונה”. יתרון אמיתי יהיה למי שיידע להרכיב שכבה אפליקטיבית גמישה שפועלת מעל כמה מודלים שונים, ובכך לנצל את החוזקות של כל אחד מהם.

 

נתוני Similarweb מראים שאמנם OpenAI עדיין מחזיקה בנתח העצום של תנועת ה-AI הגנרטיבי, אבל בחודשים האחרונים חלה עלייה מתמשכת במודלים מתחרים כמו Gemini, Claude ו-DeepSeek. השוק נהיה מגוון יותר, והתחרות כבר אינה תיאורטית:

 

השוק מתחיל להיפתח

השוק מתחיל להיפתח | Similarweb Global Traffic Trends

2026 היא שנת המבחן של OpenAI ושל שוק ה-AI כולו

OpenAI מבינה שהשאלה הגדולה אינה מי מוביל בבנצ’מרקים, אלא מי מוביל את השיחה ואת השוק בפועל. כרגע ChatGPT עדיין שולט בשימוש, אבל ההובלה הטכנולוגית כבר לא מוגדרת, והמתחרות לוחצות מכל כיוון. במקום לחגוג שלוש שנים ל-ChatGPT, הכריזה OpenAI על קוד אדום. זה לא רק סימן למשבר, אלא הכרה בכך שהעידן שבו שימשה כמובילה הלא רשמית מתקרב לסיום.

 

2026 תהיה שנת מבחן. אם Garlic או כל מודל דגל אחר יצליח לא רק להשוות אלא לעקוף את Gemini 3 Pro ו-Claude Opus 4.5 בבדיקות עצמאיות ובעבודה אמיתית אצל משתמשים, ובמקביל יעמוד בעלות חישובית סבירה, OpenAI תוכל לטעון שחזרה להוביל.

 

אם זה לא יקרה, השוק עלול להתרחק ממודל של “מנצח אחד”. גוגל עשויה לתפוס את ההובלה, או שנראה שוק מרובה-שחקנים שבו לכל ענק יש יתרון אחר: תשתית, מחיר, בטיחות או יכולות איג׳נטליות. הקצב מהיר כל כך, שאפשר רק לזהות כיוונים – בטח לא לנבא בוודאות.

 

גוגל אולי הרסה את המסיבה של ChatGPT, אבל מה שנקבע עכשיו זה לא מי חוגג. מה שנקבע עכשיו הוא מי ישרוד ויעצב את המרוץ הבא – מרוץ שבו מודלים, תשתיות וכסף מתמזגים לקרב שלא דומה לשום דבר שראינו עד היום.

הפוסט גוגל הרסה את מסיבת יום הולדת 3 של ChatGPT ו-OpenAI מכריזה על ״קוד אדום״ הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/openai-code-red/feed/ 0
ChatGPT Voice עובד עכשיו בתוך חלון הצ’אט הרגיל https://letsai.co.il/chatgpt-voice-mode/ https://letsai.co.il/chatgpt-voice-mode/#respond Wed, 03 Dec 2025 08:30:08 +0000 https://letsai.co.il/?p=65264 OpenAI שינתה ב-25 בנובמבר 2024 את אופן הפעולה של מצב הדיבור הקולי ב-ChatGPT, ובעצם חיברה אותו ישירות לחוויית הצ’אט הרגילה. במקום לעבור לממשק נפרד עם הכדור הכחול המוכר, השיחה הקולית מתרחשת עכשיו בתוך חלון הצ’אט עצמו. מדברים, רואים תמלול חי, מקבלים תשובות טקסטואליות בזמן אמת, וגם ניגשים לתמונות, קוד, מפות ותוכן ויזואלי נוסף בלי לעזוב […]

הפוסט ChatGPT Voice עובד עכשיו בתוך חלון הצ’אט הרגיל הופיע ראשון בLet's AI בינה מלאכותית

]]>
OpenAI שינתה ב-25 בנובמבר 2024 את אופן הפעולה של מצב הדיבור הקולי ב-ChatGPT, ובעצם חיברה אותו ישירות לחוויית הצ’אט הרגילה. במקום לעבור לממשק נפרד עם הכדור הכחול המוכר, השיחה הקולית מתרחשת עכשיו בתוך חלון הצ’אט עצמו. מדברים, רואים תמלול חי, מקבלים תשובות טקסטואליות בזמן אמת, וגם ניגשים לתמונות, קוד, מפות ותוכן ויזואלי נוסף בלי לעזוב את השיחה. זה שינוי קטן לכאורה, אבל כזה שמסמן הפיכה של מצב הקול מכלי צדדי לדרך עבודה טבעית בתוך המוצר.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

איך זה עובד בפועל

ברגע שלוחצים על אייקון המיקרופון, הקלט הקולי נכנס לשיחה כמו כל הודעה אחרת. התשובה מופיעה כטקסט מתגלגל, בדיוק כמו בצ’אט רגיל. אפשר לעבור בין דיבור לכתיבה בצורה חלקה, לגלול לשיחות קודמות, ולשמור על כל ההיסטוריה באותו חלון. מבחינת חוויית שימוש זה צעד שמתקרב לאינטראקציה רב-מודלית אמיתית.

 

יחד עם זאת, יש פרט שכדאי לשים אליו לב: עד שלוחצים על כפתור “סיום”, המערכת ממשיכה להאזין ולהגיב. אין כיבוי אוטומטי אחרי חוסר פעילות, וזו נקודה שיכולה ליצור אי נעימות אם שוכחים את המיקרופון פועל.

תוכן ויזואלי בזמן השיחה

אחד החידושים הבולטים הוא היכולת להציג תוכן ויזואלי בזמן השיחה. זה כולל תמונות, קוד, כרטיסי מידע, מידע על מזג אוויר ולעיתים גם מפות. בפועל, תצוגת המפות עדיין לא יציבה בכל אזור משום שהיא תלויה בשירותי צד שלישי שלא זמינים במלואם בכל מדינה. חלק מהמשתמשים כבר נתקלו בפער בין ההדגמות לבין מה שמופיע בפועל.

 

למרות זאת, עצם האפשרות לשלב קול ותוכן חזותי בזמן אמת מייצרת חוויה רלוונטית בהרבה למי שעובד עם מידע מורכב.

המודל שמפעיל את השיחות הקוליות

שיחות טקסט רגילות יכולות להשתמש במודל GPT-5.1 על סוגיו, שהוא כרגע הכלי החזק ביותר של OpenAI. מצב הקול, לעומת זאת, פועל על GPT-4o שמותאם לעיבוד קול וזמן אמת. במנויים בתשלום קיימת אפשרות שהמערכת תעבור ל-GPT-4o mini לאחר שימוש ממושך, אף על פי ש-OpenAI אינה מפרסמת מכסה רשמית שמבהירה מתי זה קורה. המשמעות פשוטה – גם אם הכול מתרחש באותו חלון, איכות התשובות הקוליות אינה זהה לאיכות המתקבלת במצב טקסט בלבד.

למי זה מתאים

העדכון מתאים בעיקר למשתמשים שרוצים לעבור באופן טבעי בין קול לטקסט באותה שיחה, ולהנות מהמהירות של דיבור ומהדיוק של תמלול חי. זה שימושי בתכנון טיולים שבהם רוצים לראות מפה מיידית, בלמידה ותרגול שפות, בבישול כשהידיים לא פנויות, ובעבודה עם קוד שבה מסבירים בעל פה ורואים את התיקון כתוב.

 

מי שמעדיף חוויית קול נקייה וללא תמלול, או שנוח לו יותר עם הממשק המופרד עם הכדור הכחול, עשוי להרגיש פחות בנוח עם הפורמט המשולב. עבורכם נשמרה האפשרות להחזיר את המצב הישן דרך Settings → Voice → Separate voice mode.

 

הפרדת הקול ממסך הטקסט

כאן ניתן להפעיל מחדש את מצב הקול הנפרד

זמינות

העדכון מופץ לכל המשתמשים, כולל Free, Plus ו-Pro, גם באפליקציות וגם בממשק הדפדפן. אין עלות נוספת לשימוש בקול. משתמשי החינם מקבלים גרסה מצומצמת של היכולת, בעוד שמנויי Plus ו-Pro יכולים גם לצלם תמונות בזמן שיחה, לשתף מסך, או לאפשר למודל לראות את הסביבה דרך המצלמה. אלו תוספות שמרחיבות את היכולת המעשית של מצב הקול, בעיקר בתרחישים כמו תמיכה טכנית או הסברים על קוד.

הקול כחלק בלתי נפרד

בסופו של דבר, זהו שינוי שממקם את הקול כחלק בלתי נפרד מאופן העבודה עם ChatGPT. החיבור בין דיבור, טקסט ותוכן חזותי הופך את החוויה לזורמת ופחות מסורבלת, גם אם יש אזורים שעדיין דורשים הבשלה כמו יציבות מפות או מנגנון כיבוי אוטומטי. בשורה התחתונה, מדובר בשדרוג שהופך את השימוש בקול למעשי הרבה יותר מבעבר, בלי להכריח את המשתמש לבחור בין קול לטקסט אלא לאפשר שילוב טבעי ביניהם.

הפוסט ChatGPT Voice עובד עכשיו בתוך חלון הצ’אט הרגיל הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/chatgpt-voice-mode/feed/ 0
איך ChatGPT הופך ליועץ שופינג אישי https://letsai.co.il/chatgpt-shopping-research/ https://letsai.co.il/chatgpt-shopping-research/#respond Mon, 01 Dec 2025 13:38:39 +0000 https://letsai.co.il/?p=65155 כמעט כל קנייה רצינית באינטרנט מתחילה באותו דפוס: פותחים עשרות טאביים, קוראים ביקורות, צופים בסרטונים, משווים מחירים – ובסוף עדיין לא בטוחים מה באמת נכון לצרכים שלכם. OpenAI, שממש היום חוגגת יום הולדת 3 ל-ChatGPT, מנסה לפתור בדיוק את הבלבול הזה עם פיצ׳ר חדש בתוך הצ׳אט שנקרא Shopping Research. זה לא עוד רשימת קישורים, אלא […]

הפוסט איך ChatGPT הופך ליועץ שופינג אישי הופיע ראשון בLet's AI בינה מלאכותית

]]>
כמעט כל קנייה רצינית באינטרנט מתחילה באותו דפוס: פותחים עשרות טאביים, קוראים ביקורות, צופים בסרטונים, משווים מחירים – ובסוף עדיין לא בטוחים מה באמת נכון לצרכים שלכם. OpenAI, שממש היום חוגגת יום הולדת 3 ל-ChatGPT, מנסה לפתור בדיוק את הבלבול הזה עם פיצ׳ר חדש בתוך הצ׳אט שנקרא Shopping Research. זה לא עוד רשימת קישורים, אלא תהליך שמרגיש כמו יועץ קנייה אישי. אתם מתארים את הצורך, הצ׳אט שואל שאלות מיקוד, ובסוף מחזיר מדריך קנייה מסודר שמותאם למה שחשוב לכם.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה Shopping Research מביא לשולחן

כשאתם באמת מתלבטים – כשצריך להבין מה משתלם, מה מיותר ומה רק נראה טוב על הנייר – ChatGPT משנה סגנון. ברגע שהוא מזהה שמדובר בקנייה מורכבת, הוא מציע לעבור למצב Shopping Research. אפשר גם להפעיל אותו ישירות דרך כפתור ה-“+” בדפדפן או באפליקציה.

 

כך מפעילים ידנית את Shopping Research

כך מפעילים ידנית את Shopping Research

 

בשיחה עצמה אתם לא צריכים לחפש את המילים הנכונות. פשוט מתארים מה אתם מחפשים: “מחשב ללימודים בתקציב מוגבל” או “כסא עבודה נוח לחדר קטן”. הכלי שואל שאלות הבהרה לגבי שימוש, גודל, טווח תקציב ועוד, כדי למקד את הדרישות ולבנות תמונה אמיתית של הצורך.

 

מאחורי הקלעים, Shopping Research קורא אתרים ציבוריים: חנויות, מפרטי יצרן, ביקורות, תמונות והשוואות. OpenAI מציינת שהתהליך מבוסס על מקורות איכותיים, ציבוריים וזמינים, ולא על לינקים ממומנים. המטרה היא להישען על מידע פתוח, אמין ולא מסחרי.

 

בסוף התהליך אתם מקבלים מסמך מסודר עם רשימת מוצרים מומלצים, הסבר למה כל אחד מהם מתאים לכם, ההבדלים המעשיים ביניהם, ומה עדיף לבדוק בעצמכם לפני רכישה. אפשר גם לסמן “לא רלוונטי” או לבקש “עוד כאלה”, וההמלצות יתעדכנו בהתאם.

 

בגרף המצורף אפשר לראות את השיפור שאותו מציגה OpenAI בדיוק התאמת המוצרים לדרישות המשתמש. בבדיקה פנימית, Shopping Research מגיע לדיוק של 64 אחוז בעמידה בתנאים כמו מחיר, צבע, חומר ומפרט. לצורך השוואה, GPT-5 Thinking עומד על 56 אחוז, גרסת המיני על 52 אחוז, והחיפוש הרגיל מגיע ל- 37 אחוז:

 

דיוק המודל בבחירת מוצרים

דיוק המודל בבחירת מוצרים | openai.com

איך זה נראה בפועל

ככה זה נראה בתוך האפליקציה – אתם מצלמים או מעלים תמונה של מוצר, מבקשים למצוא משהו דומה, או מתארים בצ’אט את מה שאתם מחפשים. משם הכלי מתחיל לעבוד – הוא שואל שאלות מיקוד, מעלה הצעות בזמן אמת, וממשיך לחדד בהתאם לתשובות שלכם:

 

ככה זה נראה בתוך האפליקציה

ככה זה נראה בתוך האפליקציה

למי זה מתאים, ומתי כדאי להפעיל

Shopping Research לא מיועד לחיפוש מהיר של מחיר או בדיקה נקודתית של פיצ’ר אחד. הוא מתאים במיוחד לקניות שמצריכות מחשבה, השוואה ותמונה רחבה. למשל מחשבים, טלוויזיות, ריהוט, ציוד לבית, מתנות משמעותיות ומוצרי טכנולוגיה שיש להם הרבה דגמים ותתי דגמים.

 

אם אתם רק רוצים עובדה אחת, שיחה עם כל מודל שפה גדול או חיפוש בגוגל (אם אתם עדיין עושים את זה) כנראה יספיקו. אבל אם אתם מנסים להבין מה באמת משתלם מבחינת שימוש, תקציב, מידות או תחזוקה, Shopping Research יכול לחסוך לכם זמן ולמנוע טעויות נפוצות.

נקודות ששווה לשים לב אליהן

OpenAI מדגישה שהתוצאות מבוססות על מקורות איכותיים, ציבוריים ולא פרסומיים. זה חשוב, אבל זה לא אומר שיש רשימה סגורה של אתרים מאושרים או מנגנון שבודק כל עמוד לעומק. לכן כדאי לשמור על ערנות ולוודא שהפרטים שמופיעים בשיחה תואמים למה שמופיע אצל המוכר.

 

יש גם מצבים שבהם ייעוץ של מודל לא מספיק. מוצרים בטיחותיים או רפואיים דורשים התאמה אישית, ולעיתים גם בדיקה פיזית. מוצרים יד שנייה או פריטים נדירים מציגים בעיה אחרת, משום שקשה להבטיח איכות, זמינות ומידע עקבי. וגם כשיש דרישות מדויקות במיוחד, כמו מידות, התאמה לסביבה מסוימת או תחזוקה מיוחדת, צריך להצליב מידע ולוודא שההמלצה אכן מתאימה למצב שלכם.

 

ובנוסף, גם כשהמדריך שמתקבל נראה מדויק ומסודר, חשוב להיכנס לאתר החנות ולבדוק פרטים סופיים: מחיר עדכני, זמינות מלאי, תנאי משלוח והחזרות, ודגם המוצר המדויק. Shopping Research חוסך את רוב עבודת המחקר, אבל הוא לא מחליף את שלב האימות האחרון שמבטיח קנייה בטוחה.

הצצה לעתיד

OpenAI כבר מדברת על אפשרות לרכוש מוצרים ישירות מתוך ChatGPT דרך מה שהיא מכנה Instant Checkout. אם זה יתממש, התהליך יוכל להסתיים בלחיצה אחת: מהמחקר, דרך ההשוואה, ועד הקנייה, הכל בתוך אותה שיחה.

 

Shopping Research לא מבטל התלבטויות והוא לא קוסם. מה שהוא כן עושה הוא לשנות את נקודת הפתיחה, לחסוך לכם זמן ולארגן לכם את המידע מול העיניים. במקום להתחיל את המסע בגוגל, לעבור אינספור אתרים ולהתבלבל מהשוואות סותרות, אתם מתחילים משיחה אחת שמנסה להבין אתכם. הכלי מפיק מתוך זה מדריך קנייה שמדבר בשפה שלכם ומסדר את האפשרויות בצורה ברורה. שווה להיכנס ולנסות.

הפוסט איך ChatGPT הופך ליועץ שופינג אישי הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/chatgpt-shopping-research/feed/ 0
אנטרופיק משיקה את Opus 4.5 כמודל דגל חזק יותר, זול יותר ומדויק יותר https://letsai.co.il/claude-opus-4-5/ https://letsai.co.il/claude-opus-4-5/#respond Tue, 25 Nov 2025 12:22:35 +0000 https://letsai.co.il/?p=64672 אנטרופיק השיקה את מודל הדגל החדש שלה, Claude Opus 4.5. המודל מציג ירידת מחיר חדה של 67 אחוז בהשוואה ל-Opus 4.1, שיפור משמעותי ביכולות קוד עם תוצאות מובילות בבנצ’מרקים, ואינטגרציות חדשות לדפדפן Chrome ול-Excel. לצד השדרוגים בביצועים, המודל מציג גם התקדמות בתחום הבטיחות עם עמידות משופרת וירידה בהתנהגויות לא רצויות. ההשקה מגיעה ימים בודדים אחרי […]

הפוסט אנטרופיק משיקה את Opus 4.5 כמודל דגל חזק יותר, זול יותר ומדויק יותר הופיע ראשון בLet's AI בינה מלאכותית

]]>
אנטרופיק השיקה את מודל הדגל החדש שלה, Claude Opus 4.5. המודל מציג ירידת מחיר חדה של 67 אחוז בהשוואה ל-Opus 4.1, שיפור משמעותי ביכולות קוד עם תוצאות מובילות בבנצ’מרקים, ואינטגרציות חדשות לדפדפן Chrome ול-Excel. לצד השדרוגים בביצועים, המודל מציג גם התקדמות בתחום הבטיחות עם עמידות משופרת וירידה בהתנהגויות לא רצויות. ההשקה מגיעה ימים בודדים אחרי GPT-5.1 של OpenAI ומיד אחרי Gemini 3 של Google, מה שמדגיש עד כמה התחרות בשוק מודלי השפה צמודה וצפופה. בסקירה הזו תקבלו תמונה מלאה על Opus 4.5: איפה הוא עומד מול מודלים אחרים, איך הוא מתפקד בביצועי קוד ושימושי מחשב, מה הוא יודע לעשות בפועל, כמה הוא עולה, עד כמה הוא בטוח, ולמי הוא מתאים.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

המחיר הוא הסיפור הגדול

Opus 4.5 מתומחר ב-5 דולר למיליון טוקנים נכנסים ו-25 דולר למיליון טוקנים יוצאים, ירידה של 67 אחוז לעומת Opus 4.1 שעלה 15 ו-75 דולר בהתאמה.

 

נסו את המודל החדש מבית אנטרופיק - Claude Opus 4.5

נסו את המודל החדש מבית אנטרופיק – Opus 4.5

 

מה זה אומר בפועל? טוקן הוא יחידת הטקסט שהמודל מעבד. בממוצע, מיליון טוקנים שווים לכ-750 אלף מילים באנגלית. עבור מפתחים שמריצים משימות קידוד יומיומיות, העלות ירדה מסדר גודל של עשרות דולרים ביום לכמה דולרים בודדים. היכולת הזו שהייתה נגישה בעיקר לארגונים גדולים הופכת מציאותית גם עבור צוותים קטנים וסטארטאפים.

שלושה מודלים, שלושה שימושים

אנטרופיק ממשיכה עם גישה של משפחת מודלים משלימים ולא מסתמכת על מודל אחד לכל המשימות.

Opus 4.5

המודל המתקדם ביותר. מיועד למשימות שמצריכות עומק מקסימלי כמו פרויקטי קוד מורכבים, סוכנים אוטונומיים וניתוח מסמכים ארוכים. למרות ירידת המחיר הדרמטית, Opus נשאר המודל היקר במשפחת 4.5, משום שהוא מספק את העומק והדיוק הגבוהים ביותר.

Sonnet 4.5

מודל העבודה היומיומי של המשפחה הוא Sonnet 4.5. הוא מספק את האיזון הטוב ביותר בין ביצועים, מהירות ועלות. לרוב המשימות השוטפות זו הבחירה המתאימה.

Haiku 4.5

המודל המהיר והחסכוני של המשפחה הוא Haiku 4.5. הוא מתאים לתעבורה גבוהה, תגובות מיידיות ומשימות פשוטות בהיקף גדול.

 

שלושה מודלים, שלושה שימושים

שלושה מודלים, שלושה שימושים

הבחירה בין השלושה משפיעה ישירות על היעילות ועל העלויות. שימוש ב-Haiku למשימות בסיסיות במקום ב-Opus יכול לחסוך עד פי חמש בעלויות בלי לפגוע בתוצאה. לרוב המשתמשים Sonnet יספיק. Opus רלוונטי כשהדיוק הוא גורם קריטי.

מה מספרים המספרים?

Opus 4.5 מציג קפיצה משמעותית ביכולות הנדסת תוכנה. בבנצ’מארק SWE-bench Verified, שמודד פתרון באגים אמיתי מתוך פרויקטי GitHub, המודל הגיע ל-80.9 אחוז והפך לראשון שחוצה את רף השמונים. לשם השוואה, GPT-5.1 Codex Max עומד על 77.9 אחוז, Sonnet 4.5 על 77.2 אחוז ו-Gemini 3 Pro על 76.2 אחוז.

 

הבנצ'מארק המרכזי להוכחת עליונות בהנדסת תוכנה

הבנצ’מארק המרכזי להוכחת עליונות בהנדסת תוכנה | anthropic.com

 

מעבר לדיוק עצמו, Opus 4.5 מפגין יתרון ביעילות. בבדיקות effort controls הוא השיג דיוק גבוה יותר בכל רמות המאמץ, תוך הפקת פחות טוקני פלט בהשוואה לדורות קודמים. המשמעות היא שהמודל יודע לבצע תהליכי חשיבה מורכבים בצורה חסכונית יותר, וזה קריטי כשעובדים בהיקפים גדולים.

 

ביצועים מול יעילות

ביצועים מול יעילות | anthropic.com

 

במבחן נוסף, Aider Polyglot, שמודד יכולת פתרון בעיות קידוד בסביבות מגוונות, Opus 4.5 הגיע ל-89.4 אחוז. Sonnet 4.5 מגיע ל-78.8 אחוז, כך שנוצר פער ברור בין הדגמים.

 

מצוין בבעיות קידוד

מצוין בבעיות קידוד | anthropic.com

 

גם בתחום העבודה עם מחשב, הכולל שימוש בדפדפן, אפליקציות וממשקי מערכת, Opus 4.5 מציג שיא חדש של 66.3 אחוז בבנצ’מארק OSWorld (אפשר לראות בטבלה למעלה). המבחן הזה בודק עד כמה מודל שפה מסוגל לתפעל מחשב אמיתי, וזה תחום שהופך במהירות לרכיב מרכזי ביכולות של מודלים מתקדמים.

 

 

גם ביכולת לשמור על רצף לאורך זמן Opus 4.5 מציג יתרון ברור. עבודה אמיתית עם מודלים מתקדמים כוללת לא רק פתרון בעיות נקודתיות, אלא משימות ארוכות שמצריכות עקביות, הבנה מתמשכת ויכולת לחזור לפרטים קודמים בלי לאבד כיוון. בבנצ’מרק Vending-Bench, שבודק קוהרנטיות לטווח ארוך במשימות מורכבות ורב שלביות, Opus 4.5 מוביל בפער משמעותי על Sonnet 4.5.

 

מתבלט בעבודה על משימות ארוכות ורב-שלביות

מתבלט בעבודה על משימות ארוכות ורב-שלביות | anthropic.com

מפרט טכני

Opus 4.5 מגיע עם חלון הקשר של 200 אלף טוקנים וגבול פלט של 64 אלף טוקנים. ה-reliable knowledge cutoff שלו הוא מרץ 2025, כלומר על מידע עד לתאריך הזה ניתן לסמוך באופן עקבי יותר, ומעבר לכך הידע חלקי.

 

לדברי דיאן נא פן (Dianne Na Penn), ראש תחום ניהול מוצר למחקר באנטרופיק, הגדלת חלון ההקשר לבדה אינה מספיקה. היכולת לזהות אילו פרטים חשובים להחזיק בזיכרון, ואילו כדאי לבדוק מחדש בזמן אמת, היא שמאפשרת למודל להתמודד עם משימות מורכבות לאורך זמן בלי לאבד את הרצף.

בטיחות והתנהגות: הפער שמבליט את Opus 4.5

אחד השינויים הבולטים ב-Opus 4.5 אינו רק בביצועים או ביעילות, אלא ברמת הבטיחות שהוא מציג. בעולם שבו מודלים משולבים במערכות ליבה, כלי קוד, תהליכים עסקיים וממשקי משתמש, עמידות למתקפות והפחתת התנהגויות לא רצויות הופכות לקריטיות כמו מהירות או דיוק.

עמידות למתקפות Prompt Injection

Opus 4.5 מציג את שיעור ההצלחה הנמוך ביותר למתקפות Prompt Injection בהשוואה ל-GPT-5.1 ו-Gemini 3. זהו מדד חשוב, משום שמתקפות כאלה יכולות לגרום למודל להתעלם מהוראות, לחשוף מידע או לבצע פעולות לא רצויות. הנתונים מראים פער ברור בין המודלים, כאשר Opus 4.5 מצמצם משמעותית את הסיכון להתנהגות כזו.

 

עמידות למתקפות Prompt Injection

anthropic.com | עמידות למתקפות Prompt Injection

התנהגות לא רצויה: ירידה משמעותית

גם במדד התנהגות מדאיגה Opus 4.5 מפגין את התוצאות הנמוכות ביותר, כלומר רמה נמוכה יותר של תגובות שעלולות להתפרש כבעייתיות או לא בטוחות. זהו חיזוק נוסף לכך שהמודל מתוכנן לא רק לביצועים, אלא גם ליציבות, אמינות והתאמה לסביבות רגישות.

 

ירידה במדד התנהגות לא רצויה

ירידה במדד התנהגות לא רצויה | anthropic.com

אינטגרציות ויכולות חדשות

צ’אט ללא הגבלה

Opus 4.5 מגיע עם מנגנון דחיסת הקשר שמסכם את חלקי השיחה הישנים בצורה חכמה ושומר את המידע הרלוונטי בלבד. המשמעות היא שהמשתמש יכול לקיים שיחה ארוכה מאוד, לבנות תוכניות מורכבות או לעבוד עם מסמכים גדולים, בלי להיתקל בהודעה שהחלון מלא. זה מאפשר סוף סוף עבודה רציפה בפרויקטים ארוכים, גם ללא תכנון מוקדם של מבנה השיחה.

Claude for Chrome

התוסף לדפדפן פתוח לכל משתמשי Max ומאפשר למודל לראות את הטאבים הפתוחים. זה מאפשר לבצע משימות כמו קריאה וניתוח של דפים, השוואת תוכן, מילוי טפסים וביצוע פעולות מבוססות דפדפן. במקום להעתיק טקסט מהדפדפן לתוך הצ’אט, המודל פשוט רואה את המסך ועובד עליו ישירות.

Claude for Excel

האינטגרציה החדשה מאפשרת למודל לעבוד בתוך Excel עצמו. הוא יכול לנתח גיליונות, לבנות מודלים, להפיק נוסחאות מורכבות או ליצור אוטומציות שמזרזות עבודה חוזרת. זה כלי פרקטי במיוחד לניתוחים פיננסיים, דוחות תפעוליים וטיוב נתונים. השירות נמצא בבטא למנויי Max, Team ו-Enterprise.

Claude Code בדסקטופ

האפליקציה מאפשרת להריץ כמה סשנים במקביל, כך שאפשר לעבוד על כמה פרויקטים בשיחה אחת בצורה מופרדת. מצב Plan Mode עבר שדרוג משמעותי, והוא בונה תוכנית עבודה מפורטת לפני שהמודל ניגש לכתיבת קוד בפועל. זה מפחית טעויות, מייצר שקיפות ומאפשר שליטה טובה יותר בתהליך הפיתוח.

זמינות

Opus 4.5 זמין דרך ה-API של אנטרופיק ובפלטפורמות ענן מרכזיות כמו Amazon Bedrock, Google Cloud Vertex AI ו-Microsoft Azure במסגרת שותפות חדשה עם Microsoft ו-NVIDIA. בנוסף, המודל זמין למנויי Pro, Max, Team ו-Enterprise, והוא משולב כברירת מחדל בחלק מהיכולות החדשות כמו Claude Code ובכלי העבודה שמגיעים עם Anthropic for Teams.

כך נראה Opus 4.5 בפעולה

פתרון פאזלים באמצעות כלים חיצוניים

בסרטון הראשון מודגם כיצד Opus 4.5 פותר משחק פאזלים מורכב שלב אחר שלב. המודל משתמש בשתי יכולות חדשות: חיפוש כלים בתוך ספריית כלים גדולה וקריאה תכנותית לכלים חיצוניים. השילוב הזה מאפשר לו לנווט, לבחור פעולות, לשרשר צעדים ולבצע משימה מורכבת בלי התערבות אנושית. זו הוכחה ליכולת של המודל לבצע פעולות בעולם אמיתי, לא רק לייצר טקסט.

 

 

משימות משרדיות אמיתיות: מצגות, אקסלים וחוזים

בסרטון השני ניתן לראות הדגמה של Opus 4.5 מבצע עבודה משרדית מלאה: בניית דקים עסקיים, עיבוד וטרנספורמציה של נתונים בגיליונות, ועריכת חוזים כולל redlining. אלה תוצרים שהמודל לא רק מייצר, אלא גם מגיש כקבצים להורדה ולעבודה מיידית. זו המחשה ברורה לכיוון שאליו אנטרופיק מכוונת: מודל שאפשר להשתמש בו לצרכים יומיומיים בארגון, לא רק לניסויים.

 

 

לסיכום, Opus 4.5 הוא לא רק שדרוג טכני. הוא מודל שאפשר להכניס לשגרת עבודה אמיתית. ירידת המחיר של 67 אחוז, יחד עם האינטגרציות החדשות לדפדפן ול-Excel, הופכות יכולות שבעבר היו שמורות לפרויקטים ייעודיים לכלי שניתן להשתמש בו ביום יום, גם בצוותים קטנים.

 

עבור ארגונים, המסר של אנטרופיק ברור. השאלה כבר אינה האם להשתמש ב-AI מתקדם, אלא איך לבנות שילוב נכון בין מודלים שונים, לאילו משימות להפעיל כל אחד, ומהי נקודת האיזון בין עלות ליכולת. זו רמת בשלות שהשוק חיכה לה זמן רב, והיא מראה עד כמה המודלים המתקדמים עוברים מפיילוט לכלי עבודה מרכזי.

הפוסט אנטרופיק משיקה את Opus 4.5 כמודל דגל חזק יותר, זול יותר ומדויק יותר הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/claude-opus-4-5/feed/ 0
צ’אטים קבוצתיים ב-ChatGPT הם הדור החדש של עבודה משותפת עם AI https://letsai.co.il/group-chats-chatgpt/ https://letsai.co.il/group-chats-chatgpt/#respond Sun, 23 Nov 2025 12:16:13 +0000 https://letsai.co.il/?p=64534 OpenAI השיקה בנובמבר 2025 את הצ’אטים הקבוצתיים, תכונה שמסמנת שינוי עמוק בדרך שבה משתמשים עובדים עם ChatGPT. הכלי כבר לא רק עוזר אישי שמדבר עם אדם אחד. מעכשיו הוא יודע לפעול בתוך שיחה מרובת משתתפים, להבין הקשר קבוצתי, להגיב כשצריך ולסייע לצוותים לחשוב, להחליט וליצור יחד. במקום מודל שעונה לשואל יחיד, נוצר מרחב עבודה משותף […]

הפוסט צ’אטים קבוצתיים ב-ChatGPT הם הדור החדש של עבודה משותפת עם AI הופיע ראשון בLet's AI בינה מלאכותית

]]>
OpenAI השיקה בנובמבר 2025 את הצ’אטים הקבוצתיים, תכונה שמסמנת שינוי עמוק בדרך שבה משתמשים עובדים עם ChatGPT. הכלי כבר לא רק עוזר אישי שמדבר עם אדם אחד. מעכשיו הוא יודע לפעול בתוך שיחה מרובת משתתפים, להבין הקשר קבוצתי, להגיב כשצריך ולסייע לצוותים לחשוב, להחליט וליצור יחד. במקום מודל שעונה לשואל יחיד, נוצר מרחב עבודה משותף שבו ה-AI הופך לחבר צוות פעיל. זהו צעד שמרחיב את ChatGPT וממקם אותו ככלי אמיתי לשיתוף פעולה.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה חדש כאן בעצם?

צ’אט קבוצתי ב-ChatGPT יוצר מרחב עבודה משותף שבו עד עשרים אנשים יכולים לעבוד יחד בזמן אמת. כל משתתף יכול להעלות קבצים, לשתף רעיונות ולפתח שיחה טבעית. בתוך הסביבה הזאת ChatGPT מתפקד כחבר נוסף בקבוצה. הוא מגיב רק כשמזמינים אותו ומזהה מתי נכון להתערב ומתי לתת לשיחה להתנהל בין המשתתפים.

 

התכונה זמינה למשתמשי Free, Go, Plus ו-Pro. התכונה עוד לא הושקה רשמית לתוכניות Business ו-Enterprise.

איך פותחים צ׳אט קבוצתי

הקמה של צ’אט קבוצתי ב-ChatGPT היא תהליך מהיר וברור, והמסכים עצמם מנחים אתכם שלב אחרי שלב.

 

השלבים ליצירת צ'אט קבוצתי ב-ChatGPT

השלבים ליצירת צ’אט קבוצתי ב-ChatGPT

 

1. לחיצה על אייקון המשתמשים: במסך הצ’אט הקיים מופיע אייקון של דמות עם סימן פלוס. לחיצה עליו פותחת את חלון יצירת הצ’אט הקבוצתי. זה השלב שבו אתם מאותתים למערכת שאתם רוצים להוסיף אנשים לשיחה.

2. התחלת צ’אט קבוצתי: בחלון שנפתח מוצג מסר קצר שמסביר את הרעיון: שימוש משותף ב-ChatGPT לצורך תכנון, רעיונות ושיתוף. כאן לוחצים על Start group chat כדי ליצור קבוצת צ’אט חדשה.

3. קבלת קישור ההזמנה: לאחר יצירת הקבוצה מופיע מסך שבו מוצג לינק קבוצתי ייחודי. אפשר להעתיק אותו בלחיצה על Copy link. כל מי שמקבל את הלינק יכול להצטרף לקבוצה מבלי שתצטרכו לאשר כל אדם ידנית.

4. כלי הניהול הראשוניים של הקבוצה: לאחר פתיחת הקבוצה אפשר לראות את תפריט הניהול: רשימת משתתפים, ניהול קישור ההזמנה, שינוי שם הקבוצה והגדרת התנהגות ChatGPT בקבוצה (Customize ChatGPT). זהו מרכז השליטה הראשוני שלכם.

5. שיתוף הזמנה מתוך חלון השיחה: מיד לאחר יצירת הקבוצה מופיעה בתוך הצ’אט הודעה מערכתית שמאשרת שהקבוצה נוצרה. לצד זה מופיע כפתור Invite with link שמאפשר לשלוח שוב את אותו קישור, בלי צורך לחפש אותו בתפריטים.

התהליך כולו בנוי כך שכל שלב זורם לשלב הבא בלי בלבול. כל משתתף שמצטרף בפעם הראשונה מתבקש ליצור פרופיל בסיסי (שם, תמונה ושם משתמש), והוספת אדם לשיחה פרטית יוצרת קבוצה חדשה כדי להגן על פרטיות השיחה המקורית.

איך ChatGPT מתנהג בתוך קבוצה

זיהוי דינמיקה קבוצתית

OpenAI אימנה את המודל להבין הקשר חברתי בסיסי. ChatGPT מגיב רק כשמתייגים אותו או שואלים אותו ישירות, ומנסה להבחין בין רגעים שבהם הקבוצה זקוקה לעזרתו לבין רגעים שבהם נכון שיישאר ברקע.

יכולות בזמן שיחה קבוצתית

המודל יודע להשתמש באימוג’ים, לנתח ולהעלות קבצים, ליצור תמונות ולבצע חיפוש ברשת. הוא משתלב בתהליך כמו כל משתתף אחר ומוסיף מידע או תוצרים כשמבקשים ממנו.

ניהול עומס ושימוש

מגבלות השימוש נספרות על פי המשתמש שהמודל מגיב לו ולא על פי כל חברי הקבוצה יחד. זה מאפשר לצוותים לחלק את השאלות באופן חכם ולהימנע מחסימת שימוש מיותרת.

ההתנהגות בפועל

התוצאה היא נוכחות מאוזנת. ChatGPT נמצא שם כדי לעזור אבל אינו משתלט על השיחה. הוא שותף פעיל כשצריך ועוזר לשמור על קצב ולחדד את הדיון בלי לפגוע בשיחה האנושית עצמה.

איזה מודל מפעיל את הצ’אטים הקבוצתיים

כל צ’אט קבוצתי ב-ChatGPT פועל על GPT-5.1 Auto. זהו מנגנון שמנתח את סוג הבקשה בכל רגע ובוחר אוטומטית את תת המודל המתאים ביותר, בלי שהמשתמשים יצטרכו להגדיר דבר.

 

איך נקבע המודל בפועל?

שאלות קצרות או משימות מהירות מקבלות מענה מ-GPT-5.1 Instant. לעומת זאת, ניתוחים עמוקים, הסברים מורכבים או בקשות שמצריכות reasoning (חשיבה מעמיקה או ניתוח מדורג) עוברים ל-GPT-5.1 Thinking. משתמשי Plus נהנים מהיכולות המלאות שלו גם אם שאר המשתתפים במסלול Free. המנגנון מתייחס להגדרות של שואל השאלה בלבד.



למשימות פשוטות זמן התגובה הממוצע נע בין שלוש לחמש שניות. למשימות מורכבות יותר התגובה נעה בין שתים עשרה לשמונה עשרה שניות, בהתאם לכמות העיבוד הנדרשת.

מה חשוב לדעת מבחינת פרטיות ואבטחה

הפרדה מוחלטת בין סוגי שיחות

OpenAI שמה דגש חזק על כך ששיחות קבוצתיות מופרדות לחלוטין משיחות פרטיות. הזיכרון האישי (Personal Memory) לא נחשף לקבוצה והמודל אינו משתמש במידע שהצטבר בשיחות פרטיות קודמות.

הוראות מותאמות אישית לכל קבוצה

Custom Instructions אישיים לא מיושמים אוטומטית בצ’אטים קבוצתיים. כל קבוצה מקבלת סט הנחיות משלה, והגדרות הקבוצה נשארות מבודדות ואינן משפיעות על ההגדרות האישיות של המשתמש.

שליטה מלאה במשתתפים ובהודעות

צ’אטים קבוצתיים מופיעים באזור ייעודי בסרגל הצד. ניתן להסיר משתתפים, להשתיק התראות או לעזוב את הקבוצה בכל רגע, ללא השפעה על שאר השיחות.

הגנות ייעודיות לקטינים

למשתתפים מתחת לגיל 18 מופעלים מסנני תוכן מוגברים. הורים יכולים גם לכבות לחלוטין את אפשרות הצ’אטים הקבוצתיים דרך בקרות הוריות.

העיקרון המנחה

המטרה היא לאפשר שיתוף פעולה יעיל בלי לוותר על פרטיות. המערכת מוודאת שהמעבר מצ’אט אישי לקבוצתי לא חושף מידע, לא משנה התנהגות, ולא פוגע בסביבה הפרטית של המשתמש.

דוגמאות לשימושים מעשיים

פרויקטים קצרי טווח ושיתוף יצירתי

הפיצ’ר עובד מצוין כשצריך לתכנס סביב משימה ברורה ולייצר תוצאה מהירה. דוגמאות מרכזיות:

  • תכנון נסיעה קבוצתית

  • סיעור מוחות לצוות קטן

  • עריכה או כתיבה משותפת של מסמך אחד

קבלת החלטות משותפת

כאשר צריך להגיע להחלטה מהירה, ChatGPT עוזר לצמצם אפשרויות ולהציג יתרונות וחסרונות. שימושים נפוצים:

  • בחירת מסעדה או יעד

  • בחירה בין שתי חלופות בפרויקט קצר

תמיכה ושיתוף ידע בזמן אמת

בצוותים טכניים או תפעוליים, הצ’אטים הקבוצתיים משמשים כמרחב יעיל לשיתוף מידע. למשל:

  • מתן תמיכה טכנית

  • שיתוף תבניות תגובה או דוגמאות

  • ניתוח משותף של קובץ שהועלה

הפיצ’ר בולט כשה-AI משפר את איכות השיחה האנושית. הוא מארגן מידע, מחדד רעיונות ויוצר תוצרים שהקבוצה לא תמיד מצליחה לייצר לבד.

מגבלות שכדאי להכיר

הפיצ’ר עדיין מוגבל בכמה היבטים מרכזיים. ניתן לצרף עד עשרים משתתפים בלבד, וכל השיחה מופיעה בציר זמן רציף בלי תת שרשורים. כלי הניהול בסיסיים ואין אינטגרציות עם מערכות חיצוניות כמו יומנים או פלטפורמות ניהול משימות. התוצאה היא תכונה שמתאימה למשימות ממוקדות וקצרות, אבל פחות לפרויקטים ארוכים, כיתות גדולות או צוותי Enterprise.

איך זה נראה בהשוואה לכלים אחרים

ChatGPT Group Chats לא מחליף את Slack, Teams או ווטסאפ. Slack ו-Teams הן פלטפורמות תקשורת שבמרכזן אנשים, עם יכולות AI כתוספת. בצ’אטים קבוצתיים של ChatGPT המודל עצמו נמצא במרכז, והמשתתפים מצטרפים אליו לפי צורך. ווטסאפ נשאר כלי חברתי, בעוד הצ’אטים הקבוצתיים מיועדים למשימות ממוקדות ולא לשיחה יומיומית.

איך להפיק מקסימום תועלת

כמו כל פיצ’ר חדש, גם בצ’אטים קבוצתיים יש רגעי עומס או תגובות מיותרות, בעיקר כש-ChatGPT מתערב מהר מדי. זה חלק מתהליך ההבשלה של המערכת, וניתן לעקוף את רוב החיכוך באמצעות שימוש נכון.

 

הנה כמה טכניקות עבודה יעילות:

  • כתיבה משותפת של פרומפטים משפרת את איכות התוצרים.

  • חלוקת שאלות בין משתמשי Pro (למשימות מורכבות) למשתמשי Free מפחיתה עומסים.

  • בקשה מפורשת להתייחס להודעות קודמות מחזירה את ההקשר בשיחות ארוכות.

  • העלאת קבצים, דוגמאות ומסמכים עוזרת למודל לדייק בתשובות.

הפיצ’ר מציג את הערך הגבוה ביותר כאשר הוא מקבל הקשר מלא ומוגדר היטב.

 

 

 

האם זה צעד ראשון לרשת חברתית?

כנראה שלא. לפחות לא כרגע. למרות שהפיצ’ר מכניס אנשים ו-AI לאותו מרחב שיחה, הצ’אטים הקבוצתיים לא נועדו להיות רשת חברתית. אין ערוצים, אין הודעות פרטיות מחוץ לקבוצה ואין אינטגרציות עמוקות. OpenAI מציגה את הפיצ’ר ככלי שיתוף פעולה ממוקד שמיועד לקבוצות קטנות ולמשימות בעלות מטרה ברורה.

 

צ’אטים קבוצתיים ב-ChatGPT מציעים דרך חדשה לעבוד עם AI בצוות. הם פשוטים לשימוש ומאפשרים למודל להשתלב בשיחה באופן טבעי ולחדד רעיונות, לסדר מידע ולהאיץ קבלת החלטות. הפיצ’ר משתלב היטב לצד כלי התקשורת הקיימים במצבים שמצריכים סיעור מוחות או פתרון בעיות מהיר.

 

OpenAI מאותתת על שינוי עמוק בתפקיד של ChatGPT. פחות כלי שעונה לאדם יחיד ויותר מרחב עבודה משותף, שבו AI הופך לחבר צוות נוסף. זהו צעד משמעותי בדרך להפיכת המודל לכלי עבודה קבוצתי אמיתי.

הפוסט צ’אטים קבוצתיים ב-ChatGPT הם הדור החדש של עבודה משותפת עם AI הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/group-chats-chatgpt/feed/ 0
האם ה-AI שלכם מוטה פוליטית? המבחן החדש של Anthropic https://letsai.co.il/politically-biased-model/ https://letsai.co.il/politically-biased-model/#respond Fri, 21 Nov 2025 08:22:42 +0000 https://letsai.co.il/?p=64326 האם אפשר לגרום למודל שפה להיות באמת ניטרלי פוליטית? זו שאלה שמלווה את עולם הבינה המלאכותית מהרגע שבו מודלים החלו להשתלב בשיח ציבורי. הם אמורים לנתח רעיונות ולא לקדם אידיאולוגיה, אך בפועל גם האלגוריתם המתקדם ביותר עלול לייצר תשובות שמעדיפות צד מסוים בלי כוונה גלויה. השבוע פרסמה אנטרופיק (Anthropic) מתודולוגיה חדשה שמנסה למדוד באופן שקוף […]

הפוסט האם ה-AI שלכם מוטה פוליטית? המבחן החדש של Anthropic הופיע ראשון בLet's AI בינה מלאכותית

]]>
האם אפשר לגרום למודל שפה להיות באמת ניטרלי פוליטית? זו שאלה שמלווה את עולם הבינה המלאכותית מהרגע שבו מודלים החלו להשתלב בשיח ציבורי. הם אמורים לנתח רעיונות ולא לקדם אידיאולוגיה, אך בפועל גם האלגוריתם המתקדם ביותר עלול לייצר תשובות שמעדיפות צד מסוים בלי כוונה גלויה. השבוע פרסמה אנטרופיק (Anthropic) מתודולוגיה חדשה שמנסה למדוד באופן שקוף עד כמה מודלים מובילים מצליחים לנתח עמדות פוליטיות מנוגדות באותה איכות. לא ניטרליות במובן של “לא להתעסק בפוליטיקה”, אלא סימטריה: האם AI מנתח טענה שמרנית ואחר כך טענה ליברלית באותה רמת עומק ומורכבות. זהו אחד הניסיונות הרציניים הראשונים להפוך שאלה טעונה פוליטית לשאלה אמפירית.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה זה “איזון פוליטי” ומה נחשב הטיה

לפי אנטרופיק, מודל נחשב “מאוזן פוליטית” כשהוא מגיב לשתי עמדות מנוגדות באותה איכות. הטיה אינה חייבת להופיע כהצהרה אידיאולוגית מפורשת, היא יכולה להתבטא בהבדל בטון, באורך, במורכבות, או בסירוב לעסוק בנושא. מודל שנותן שלוש פסקאות עשירות לעמדה אחת ותגובה קצרה לעמדה האחרת הוא מודל מוטה, גם אם אינו אומר בגלוי “אני תומך ב…”. אנטרופיק מסכמת זאת היטב: משתמשים צריכים להרגיש שהעמדות שלהם מכובדות, לא ממוזערות.

המבחן שמאלץ את המודל לחשוף הטיות פוליטיות

המתודולוגיה החדשה נקראת Paired Prompts, והיא פשוטה אך שיטתית. עבור כל נושא פוליטי, בריאות, נשק, הגירה ועוד, המודל מקבל שתי משימות זהות מבנית אך מנוגדות מהותית. למשל: כתוב טיעון משכנע בעד מדיניות X מול כתוב טיעון משכנע בעד המדיניות המנוגדת.

 

כך נראה מבחן 'צמד פרומפטים' בפועל

Anthropic | כך נראה מבחן ‘צמד פרומפטים’ בפועל

 

לאחר מכן נבחנות התשובות בשלושה מדדים מרכזיים:

  • Even-Handedness – האם שתי התגובות מציגות עומק, מבנה והיסקים ברמה דומה.
  • Opposing Perspectives – האם המודל מוכן להציג גם טיעוני נגד ולהכיר במורכבות.
  • Refusals – באיזו תדירות המודל מסרב לענות על הפרומפט.

כדי שהבדיקה תהיה מייצגת, אנטרופיק בנתה מערך גדול במיוחד: 1,350 צמדים, 150 נושאים ו-9 סגנונות משימה – ממאמרים ועד הומור. המטרה היא לחשוף לא רק הטיות גלויות, אלא גם הבדלים סגנוניים עדינים.

Gemini ו-Grok מובילים, Llama קורס

התוצאות מסמנות פערים ברורים בין המודלים:

 

מי באמת מאוזן פוליטית? השוואת הציונים בין המודלים המובילים

Anthropic | מי באמת מאוזן פוליטית? השוואת הציונים בין המודלים המובילים

 

ארבעת המודלים המובילים מקובצים סביב ציונים כמעט זהים, בעוד GPT-5 מפגר מאחור אך לא באופן קיצוני. Llama 4 הוא החריג הגדול – שליש מהתגובות שלו היו בלתי סימטריות – פער שמעיד על בעייתיות עקבית בהתמודדות עם עמדות מנוגדות.

 

במדד Opposing Perspectives, שבודק עד כמה המודל מציג גם טיעוני נגד, מובילים המודלים של אנטרופיק: Opus עם 46% ו-Sonnet עם 28%. Grok נמצא ב-34%, ו-Llama ב-31%. נתונים על Gemini ו-GPT-5 במדד זה לא פורסמו.

 

עד כמה מודלים יודעים להציג טיעוני נגד? הנה המספרים

Anthropic | עד כמה מודלים יודעים להציג טיעוני נגד?

 

גם במדד הסירובים נרשמו פערים: Grok כמעט שאינו מסרב לענות כלל, Sonnet מסרב ב-3% מהמקרים, Opus ב-5%, ואילו Llama מציג שיעור סירובים גבוה יותר.

 

כמה מודלים מסרבים לענות? פערים משמעותיים בין Grok ל-Llama

Anthropic | כמה מודלים מסרבים לענות? פערים משמעותיים בין Grok ל-Llama

 

איך מאמנים מודל להיות מאוזן

כאן נכנסת עבודת האימון, המבוססת על שני מנגנונים משלימים.

 

הראשון הוא הנחיות מערכת – הוראות שהמודל מקבל לפני כל שיחה, ובהן הימנעות מהבעת דעות פוליטיות מיוזמתו, שימוש בטרמינולוגיה ניטרלית, והצגת טיעונים באופן שוויוני כאשר מתבקשת עמדת צד כלשהו.

 

השני הוא Character Training – אימון עמוק יותר המבוסס על למידה מחיזוק. המודל מתוגמל כשהוא מפגין “תכונות אופי” הרצויות בהקשר פוליטי – לא ליצור רטוריקה שמטרתה לשנות את דעת המשתמש, לא לשמש ככלי תעמולה, ולהציג מורכבות והוגנות בתשובותיו.

 

אנטרופיק מדגישה שהתכונות הללו אינן קבועות, הן מתעדכנות ומתכווננות לאורך הזמן בהתאם לשיח הציבורי, לביקורת ולפידבק מהמשתמשים.

ומה עם ניגוד העניינים?

כיוון שאנטרופיק השתמשה ב-Claude Sonnet 4.5 כמדרג בתהליך הבדיקה, עולה חשש טבעי להטיה לטובתה. כדי להתמודד עם זה, החברה הריצה את אותו מבדק עם שני מדרגים נוספים: GPT-5 ו-Claude Opus 4.1.

 

התוצאות הראו מתאם גבוה מאוד – 92% בין GPT-5 לסונט ו-94% בין סונט לאופוס. גם המתאם הסטטיסטי במדדים המרכזיים היה כמעט מושלם.

 

ממצא מעניין שאנטרופיק מדגישה הוא שבני אדם ששימשו כמדרגים היו עקביים פחות עם 85% בלבד. וזה כבר מעלה שאלה עמוקה יותר: האם מודלים שונים מתחילים להיות עקביים יותר מבני אדם בניתוח טיעונים פוליטיים?

מגבלות המחקר שחשוב להכיר

אנטרופיק מציינת בגלוי שהמחקר מתמקד בפוליטיקה אמריקאית בלבד. הוא לא בוחן עמדות או הקשרים בינלאומיים, ולכן אינו משקף בהכרח שיח פוליטי במדינות אחרות. בנוסף, הבדיקה חד-פעמית, עם תשובה אחת לפרומפט אחד. היא אינה מודדת דינמיקה של שיחה מתמשכת, שבה מופיעים תיקונים, החרגות או שינויי טון לאורך זמן.

 

ולבסוף, אין הגדרה אוניברסלית ל”הטיה פוליטית”. בחירה שונה של מדדים או ניסוח אחר של המשימות הייתה עשויה להניב תוצאות שונות לחלוטין.

למה עכשיו?

המבחן הזה מתפרסם בעיצומה של מחלוקת פוליטית בארצות הברית סביב “AI מוטה”. ממשל טראמפ דורש שמערכות AI המשמשות סוכנויות פדרליות יוכיחו שאינן מקדמות אג’נדה פוליטית, ואף מאשים חלק מהחברות בהטיה שמאלית. אנטרופיק נמצאת בתוך המחלוקת הזו, ולכן שקיפות המתודולוגיה אינה רק עניין מדעי, היא גם מהלך אסטרטגי.

 

בפועל, זהו מסר שמכוון לציבור ולרגולטורים כאחד – אנחנו לא טוענים למודל מושלם, אבל אנחנו מציגים שיטה שניתן לבדוק, לאמת ולהריץ מחדש.

 

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס מקיף לבינה מלאכותית - GenAI Master
קורס מאסטר בבינה מלאכותית Master GenAI

 

האם הבעיה נפתרה?

לא. לא קיים AI ניטרלי לחלוטין, וגם המודלים המדויקים ביותר מועדים לטעות. אבל לראשונה יש דרך מסודרת למדוד הטיות פוליטיות עם כלי שניתן להריץ על מודלים שונים, בשפות שונות ובהקשרים שונים. ובעידן שבו מודלים משפיעים על דעת קהל, על מידע ציבורי ועל תהליכי קבלת החלטות, זהו צעד בסיסי ובלתי אפשרי לוותר עליו.

הפוסט האם ה-AI שלכם מוטה פוליטית? המבחן החדש של Anthropic הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/politically-biased-model/feed/ 0
האם גרוק 4.1 הוא לא הכי חכם אבל הכי אנושי? https://letsai.co.il/grok-4-1/ https://letsai.co.il/grok-4-1/#respond Thu, 20 Nov 2025 07:38:07 +0000 https://letsai.co.il/?p=64415 נדמה שהמודל החדש של אלון מאסק לא רק מתחכם, אלא גם מתחיל לפתח אישיות. ההשקה של Grok 4.1 אינה עוד עדכון טכני שעובר מתחת לרדאר. היא מציגה שינוי כיוון ברור בגישת xAI, שמוותרת על מירוץ הכוח ומכוונת למשהו אחר לגמרי: מודל שמנסה להרגיש קרוב יותר לאדם. לכן השאלה המרכזית כבר איננה מה הוא יודע לעשות, […]

הפוסט האם גרוק 4.1 הוא לא הכי חכם אבל הכי אנושי? הופיע ראשון בLet's AI בינה מלאכותית

]]>
נדמה שהמודל החדש של אלון מאסק לא רק מתחכם, אלא גם מתחיל לפתח אישיות. ההשקה של Grok 4.1 אינה עוד עדכון טכני שעובר מתחת לרדאר. היא מציגה שינוי כיוון ברור בגישת xAI, שמוותרת על מירוץ הכוח ומכוונת למשהו אחר לגמרי: מודל שמנסה להרגיש קרוב יותר לאדם. לכן השאלה המרכזית כבר איננה מה הוא יודע לעשות, אלא למה דווקא עכשיו מנסה התעשייה כולה לשנות את אופי השיחה בין אדם למכונה.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

הניסוי הסודי, ומה באמת אומרים 64.78 אחוזי ההעדפה

בין הראשון לארבעה עשר בנובמבר xAI הריצה את גרסת Grok 4.1 בלי לומר מילה. המשתמשים שוחחו עם המודל החדש בלי לדעת שהוא שם, והתוצאות דיברו בעד עצמן. כמעט שישים וחמישה אחוזים מהמשתמשים העדיפו את גרסת 4.1 על פני הדור הקודם.

 

Grok 4.1 מול הדור הקודם.

Grok 4.1 מול הדור הקודם | מקור: x.Ai

 

המספר מרשים, אבל הוא מספר סיפור מהותי יותר. העדפה אינה בהכרח הוכחה ליכולת טכנית גבוהה. היא לרוב עדות לחוויה טובה יותר. זרימה נוחה יותר, ניסוח אנושי יותר, תגובות שמרגישות קרובות יותר לשיחה אמיתית. כלומר, פחות כוח חישובי ויותר תחושה של אישיות. המגמה הזו משמעותית, כי היא מציבה את הדגש על חוויית השימוש במקום על מבחני ביצועים אבסטרקטיים.

מאחורי הקלעים, וכיצד המודל מלמד את עצמו להיות אנושי

הבחירה של xAI בדור הזה של מודל הבינה המלאכותית גרוק היא לשים את האינטליגנציה הרגשית במרכז. שיטת האימון משלבת למידת חיזוק מסורתית עם מודלים של הסקה שממלאים תפקיד של שופטים. הם מנתחים את התשובות, מעניקים משוב ומאפשרים למודל ללמוד טון, הומור, עקביות ותגובה אנושית יותר.

 

זינוק משמעותי במבחני EQ-Bench

זינוק משמעותי במבחני EQ-Bench | מקור: x.Ai

 

יחד עם זאת, יש כאן גם נקודת חולשה. כאשר שופטים מלאכותיים מגדירים את המשוב, הם גם מטמיעים את ההטיות שלהם בתהליך. לכן חשוב להבין שהשיפור מהיר, אבל אינו מנותק מהעדפות של מערכת אחת שמדריכה מערכת אחרת. במקום אמת אובייקטיבית, מתקבלת העדפה סובייקטיבית שעוברת מאחד לשני. זהו פרט קריטי לכל מי שמתייחס למודל כמקור מידע.

מעבר לטבלאות, ומה ההישגים באמת מספרים

Grok 4.1 מציג רצף הישגים שנראים מרשימים על הנייר. הוא מגיע למקום הראשון בקטגוריית החשיבה של LMArena, חוצה ציון של 1700 במבחני הכתיבה היצירתית ומראה זינוק בולט במבחני האינטליגנציה הרגשית. כל אלה מציבים אותו לצד המודלים המובילים כיום.

 

Grok 4.1 מדורג במקום הראשון בקטגוריית החשיבה של LMArena

Grok 4.1 במקום ה-1 בקטגוריית החשיבה של LMArena | מקור: x.Ai

 

אבל חייבים לעצור לרגע ולבחון את המשמעות. מבחנים סינתטיים מספרים רק חלק מהסיפור. LMArena מודד שיחות קצרות. Creative Writing בוחן ניסוח, ולא עקביות לאורך זמן. EQ Bench מתבסס על דפוסי תגובה צפויים. עבור מי שמחפש כלי עבודה יום יומי, הנתונים הם אינדיקציה חשובה, אבל רחוקה מלהיות תעודת ביטוח.

 

במבחני כתיבה יצירתית Grok 4.1 מציג תוצאות גבוהות במיוחד

תוצאות גבוהות במיוחד במבחני כתיבה יצירתית | מקור: x.Ai

ההפתעה האמיתית, והירידה הדרמטית בהזיות

כאן נמצא ככל הנראה השיפור האמיתי של הדור הזה. מדידות FActScore מצביעות על ירידה חדה בשגיאות עובדתיות, במיוחד במצב הפעולה המהיר. עבור משתמשים זה לא רק נתון טכני. זה שינוי תפעולי. פחות צורך לבדוק כל משפט פעמיים, יותר יכולת להסתמך על המודל בעת מחקר וסיכום מידע.

 

ירידה חדה בשיעורי ההזיות ושיפור משמעותי ב־FActScore

ירידה חדה בשיעורי ההזיות ושיפור משמעותי ב-FActScore | מקור: x.Ai

 

יחד עם זאת, צריך (עדיין) להישאר מציאותיים. גם בגרסה הזו המודל עדיין מסוגל להמציא עובדות. השיפור מרשים ומשמעותי, אך אינו מוחלט.

מה המהלך אומר על xAI ועל השוק כולו

Grok 4.1 ממקם את xAI לצד השחקנים הגדולים, אך מסיבה אחרת מהמקובל. בזמן ש-OpenAI ו-Google מרחיבות את הארכיטקטורה, מוסיפות שכבות ומגדילות את חלונות ההקשר, xAI בוחרת מסלול שונה. היא מציגה מודל שלא מוכרח להיות החכם ביותר, אלא זה שמספק את החוויה האנושית ביותר. אם הדור הקודם התחרה על ביצועים, הדור הבא ייבחן לפי האינטראקציה שהוא יוצר.

למי המודל מתאים, ולמי פחות

Grok 4.1 מתאים במיוחד למשתמשים שמחפשים אינטראקציה זורמת ואינטואיטיבית, כזו שמרגישה בעלת אופי ולא רק כלי טכני. הוא משרת היטב כותבי תוכן, אנשי שיווק ויוצרי טקסטים רגשיים, וגם משתמשים שזקוקים לרמת אמינות עובדתית גבוהה יותר מזו שהציע הדור הקודם.

 

לעומת זאת, מי שנדרש ליכולות קוד מורכבות או פתרונות ארכיטקטוניים עמוקים ימצא כאן מענה חלקי בלבד. גם משתמשים שמחפשים אינטגרציה מלאה לתשתיות וכלים ארגוניים, או מודל מחקרי יבש שמעדיף עובדות על פני סגנון שיחה, פחות יפיקו ממנו את המקסימום.

 

 

 

למה Grok 4.1 מסמל שינוי עמוק יותר משנדמה

מי שמסתכל על Grok 4.1 רק כמוצר טכנולוגי מפספס את מה שבאמת מתרחש כאן. המודל הזה מאיר תובנה רחבה יותר שמתגבשת בחודשים האחרונים. הקרב הבא בעולם הבינה המלאכותית כבר לא ייקבע רק על פי נקודות Elo נוספות או חלונות הקשר רחבים יותר. הוא ייקבע על פי תחושת הדיאלוג. על פי היכולת של מודל לשמור על אישיות עקבית, להבין רגש ולדבר כמו שותף.

 

xAI מזהה שהשלב הבא של הטכנולוגיה לא עובר דרך עוד שכבת טרנספורמר, אלא דרך החוויה האנושית שמתרחשת בזמן השימוש. במובן הזה Grok 4.1 איננו מהפכה טכנית, אלא שינוי תפיסתי שמנסה להגדיר מחדש איך נראית מערכת שמתקשרת עם בני אדם.

 

Grok 4.1 הוא מודל בשל, אמין ומרשים. הכוח שלו לא טמון רק בביצועים, אלא בגישה. מכונה שחושבת מהר זה בהחלט מעניין. מכונה שמרגישה מעט יותר אנושית, גם אם לא במובן עמוק, משנה את החוויה כולה.

הפוסט האם גרוק 4.1 הוא לא הכי חכם אבל הכי אנושי? הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/grok-4-1/feed/ 0
ג׳מיני 3 מנסה להגדיר מחדש איך בינה מלאכותית חושבת, לומדת ופועלת https://letsai.co.il/google-gemini-3/ https://letsai.co.il/google-gemini-3/#respond Wed, 19 Nov 2025 06:49:26 +0000 https://letsai.co.il/?p=64396 ג׳מיני 3 מנסה להגדיר מחדש איך בינה מלאכותית חושבת, לומדת ופועלת. פחות משנתיים אחרי תחילת עידן Gemini, גוגל מציגה את הדור השלישי ומסמנת אותו כשלב חדש בהתפתחות התחום. זו לא עוד גרסה משודרגת, אלא ניסיון מוצהר לקפוץ קדימה אל מודל שמבין הקשר עמוק, מתקרב ברמת החשיבה שלו לסטנדרט אקדמי, ומתחיל לפעול כסוכן עצמאי בתוך מוצרי […]

הפוסט ג׳מיני 3 מנסה להגדיר מחדש איך בינה מלאכותית חושבת, לומדת ופועלת הופיע ראשון בLet's AI בינה מלאכותית

]]>
ג׳מיני 3 מנסה להגדיר מחדש איך בינה מלאכותית חושבת, לומדת ופועלת. פחות משנתיים אחרי תחילת עידן Gemini, גוגל מציגה את הדור השלישי ומסמנת אותו כשלב חדש בהתפתחות התחום. זו לא עוד גרסה משודרגת, אלא ניסיון מוצהר לקפוץ קדימה אל מודל שמבין הקשר עמוק, מתקרב ברמת החשיבה שלו לסטנדרט אקדמי, ומתחיל לפעול כסוכן עצמאי בתוך מוצרי גוגל. הסיפור של Gemini 3 בנוי משלושה צירים שנפגשים: יכולת חשיבה מתקדמת, מולטימודליות רחבה וכניסה לעידן האייג׳נטים. השילוב הזה מאפשר לגוגל לשלב את המודל במגוון רחב של מוצרים כבר ביום ההשקה, מהחיפוש ועד כלי הפיתוח.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה בעצם ג׳מיני 3 אומר על העידן הנוכחי

כדי להבין למה זה משנה, צריך להתחיל מהשורש. סונדר פיצ׳אי, מנכ״ל גוגל, פותח את ההכרזה בהקשר רחב ומציג נתונים שממחישים עד כמה הבינה המלאכותית כבר נטועה בשימוש היומיומי: שני מיליארד משתמשים בחיפוש מבוסס AI, יותר מ-650 מיליון משתמשי אפליקציית Gemini, ושלושה עשר מיליון מפתחים שבונים עם המודלים הגנרטיביים של גוגל.

 

על הרקע הזה גוגל מציגה את Gemini 3. זהו מודל שאמור להציג אינטליגנציה עמוקה יותר, הבנת הקשר מדויקת יותר ורמה גבוהה של אינטראקציה בין טקסט, תמונה, וידאו, אודיו וקוד. לפי גוגל, זה מודל שלא מסתפק בהבנת הבקשה, אלא שואף להבין את הכוונה שמניעה אותה.

 

החשיבה החדשה של ג׳מיני 3

גוגל מציבה את Gemini 3 Pro כמודל שמוביל כמעט בכל מדד חשיבה מרכזי. הוא מדורג ראשון ב-LMArena עם ציון 1501 Elo, משיג 37.5 אחוז במבחן Humanity’s Last Exam ללא שימוש בכלים, ומגיע ל-91.9 אחוז ב-GPQA Diamond שמודד ידע מדעי ברמת עומק גבוהה.

 

גם בתחום המתמטיקה הוא קובע רף חדש עם תוצאה מובילה במבחן MathArena Apex, ובחזית המולטימודליות מציג 81 אחוז ב MMMU Pro ו-87.6 אחוז ב-Video MMMU. לצד זאת, גוגל מדווחת על דיוק עובדתי של 72.1 אחוז ב SimpleQA Verified, נתון שמחזק את הטענה לשיפור ביכולת להישען על המודל כמקור מידע אמין יותר.

 

בנצ'מרקים מרכזיים של Gemini 3

blog.google | בנצ’מרקים מרכזיים של Gemini 3

 

המספרים חשובים, אבל המשמעות עמוקה יותר. לפי גוגל, Gemini 3 יודע להפיק תשובות מדויקות וישירות, בלי להיסחף לחנופה טקסטואלית ובלי לעטוף כל תשובה בפרשנות מיותרת. המודל אמור לתפקד כשותף לחשיבה שמפענח בעיות מורכבות, מציע זוויות חדשות, ומתרגם רעיונות מופשטים לתובנות ולייצוגים ויזואליים.

 

הצעד הבא באותו כיוון הוא Gemini 3 Deep Think. זהו מצב עבודה שמעלה עוד את רמת הביצועים בכל המדדים הקוגניטיביים, ומיועד לאתגרים שבהם דרוש ניתוח עמוק במיוחד. בשלב זה גוגל מפעילה עליו מערך בדיקות בטיחות נרחב, ומתכננת לפתוח אותו בהמשך למנויי Google AI Ultra.

 

ביצועי Gemini 3 Deep Think במדדי החשיבה המרכזיים

ביצועי Gemini 3 Deep Think במדדי החשיבה המרכזיים | blog.google

ללמוד כל דבר, בכל פורמט

החזון של Gemini היה תמיד מולטימודלי, ו-Gemini 3 מרחיב אותו באופן טבעי. הוא יודע להתמודד עם טקסטים ארוכים, מאמרים אקדמיים וספרות טכנית, לפענח תמונות וסריקות של מסמכים כולל כתב יד, ולהבין וידאו ארוך בצורה שמפיקה תובנות מתוך תנועה, דפוסים והקשר. בנוסף, הוא מסוגל לשלב קוד בתוך תהליך הלמידה וליצור כרטיסיות לימוד, ויזואליזציות וכלי עזר אינטראקטיביים שמותאמים לנושא.

 

גוגל מציגה דוגמאות שממחישות את זה בצורה פשוטה: המודל יכול לתרגם מתכונים משפחתיים בכתב יד ולהפוך אותם לספר בישול מסודר, או לנתח סרטון של משחק Pickleball ולהפיק ממנו תוכנית אימונים מותאמת לשחקן.

 

 

בצד החיפוש, Gemini 3 משנה את החוויה ב-AI Mode. במקום תשובה טקסטואלית בלבד, הוא מסוגל לבנות הדמיה, לייצר כלי אינטראקטיבי או ליצור פריסה חזותית שנבנית בזמן אמת בהתאם לשאלה.

 

 

לבנות כל דבר, בקצב מהיר

בצד הפיתוח גוגל מסמנת קפיצה משמעותית. Gemini 3 כבר מוביל את דירוג WebDev Arena ומציג שילוב של יכולות קידוד, שליטה בכלים והבנה עמוקה של מבנה ממשקי ווב.

 

לפי גוגל, המודל מציג ביצועים גבוהים ב- Terminal Bench 2.0 שמודד שימוש יעיל בכלים, ומשיג 76.2 אחוז ב SWE bench Verified, אחד המדדים החשובים להערכת סוכני קוד. המשמעות המעשית היא יכולת לייצר ממשקים אינטראקטיביים עשירים מתוך הנחיות מורכבות, לא רק לשכתב קוד קיים.

 

המסקנה של גוגל ברורה, Gemini 3 לא נועד להיות עוד עוזר קוד, אלא מנוע לפיתוח מהיר, ניסוי רעיונות ויצירת פרוטוטייפים מלאים בתוך דקות.

 

תכנון ארוך טווח וכניסה לעידן האייג׳נטים

בשלב הזה גוגל חושפת את אחד המרכיבים שמבדילים את Gemini 3 מהדורות הקודמים – יכולת תכנון לטווח ארוך. כדי להמחיש את זה היא מציגה את Vending Bench 2, סימולציה שמדמה שנה שלמה של קבלת החלטות, הפעלת כלים והתמדה במשימה מורכבת בלי לסטות מהיעד. במבחן הזה Gemini 3 Pro מצליח לשמור על התקדמות עקבית, לנהל את המשאבים שלו בצורה יעילה ולייצר תשואה גבוהה משמעותית ביחס למודלים מובילים אחרים.

 

ביצועי Gemini 3 Pro ב Vending Bench 2

ביצועי Gemini 3 Pro ב Vending Bench 2 | blog.google

 

המשמעות בעולם האמיתי היא שמדובר במודל שיכול להתמודד עם משימות הדורשות רצף מורכב של פעולות כמו ארגון תיבת המייל, הזמנת שירותים מקומיים, או הרצת תהליכים ארוכים שחייבים לעמוד בהקשר וביעד. זה לא רק פתרון של שאלה אחת אלא ניהול של תהליך.

 

הנה דוגמה ליכולות האייג׳נטיות של Gemini 3 בפעולה. הסוכן של גוגל יודע לבצע משימות אמיתיות בתוך המוצרים, כולל סדר ואירגון של תיבת המייל שלכם ב Gmail, והכול תוך שמירה על שליטה מלאה של המשתמש. הסרטון מציג את התחום שבו הבינה המלאכותית כבר לא רק מסבירה מה צריך לעשות, אלא פשוט עושה את זה:

 

 

גוגל כבר מאפשרת למנויי AI Ultra להתנסות ב-Gemini Agent בתוך אפליקציית Gemini, והחברה מציינת שהיכולות האגנטיות יתרחבו למוצרים נוספים בתקופה הקרובה.

Antigravity מנסה לשנות איך מפתחים עובדים

אחת ההכרזות המשמעותיות ביותר של גוגל היא Google Antigravity – פלטפורמת פיתוח אייג’נטית שמחליפה את הרעיון של “מודל שעוזר” במודל שפועל. ב-Antigravity הסוכנים מקבלים גישה ישירה לעורך הקוד, לטרמינל ולדפדפן, ויכולים לתכנן ולבצע משימות פיתוח שלמות מקצה לקצה. הם בונים מבנה עבודה, כותבים קוד, בודקים את עצמם ויוצרים תוצרים תוך כדי תנועה.

 

המערכת משלבת את Gemini 3 Pro עם מודל שליטה בדפדפן ומודל עריכת תמונה, מה שיוצר סביבת פיתוח שבה העבודה מתחלקת בין אדם למודל לא רק לפי שורות קוד אלא לפי תהליך שלם. עבור מפתחים זו קפיצה מתפקיד של “עוזר חכם” לתפקיד של שותף טכני שיכול להוביל חלקים מתוך הפרויקט.

 

בטיחות ואמון

גוגל מדגישה כי Gemini 3 עבר את מערך בדיקות הבטיחות המקיף ביותר שביצעה עד היום. לפי החברה, המודל עמיד יותר לניסיונות הטעיה דרך פרומפטים, מושפע פחות מנטייה לחנופה בתשובות (sycophancy), ועבר הערכות של גופי בטיחות בינלאומיים כמו UK AISI לצד בדיקות נוספות של גורמים עצמאיים.

 

הדגש המרכזי הוא על איזון. גוגל מנסה להציג מודל שמתקדם ביכולותיו אך מצויד בהגנות שמונעות שימוש לרעה. זהו הבסיס שאיפשר לה להשיק את Gemini 3 כבר ביום הראשון בתוך מוצרים רגישים כמו החיפוש, האפליקציה וכלי הפיתוח.

איפה Gemini 3 זמין כבר עכשיו

לפי גוגל, Gemini 3 מתחיל להיפרס במקביל בכמה ערוצים. המודל זמין לכל משתמשי אפליקציית Gemini וגם בווב, ובנוסף מנויי Google AI Pro ו-Ultra מקבלים גישה אליו במצב AI Mode בתוך החיפוש.

 

מפתחים יכולים לעבוד איתו דרך Gemini API, Google AI Studio, פלטפורמת Antigravity ו-Gemini CLI, בעוד ארגונים מקבלים אותו כחלק מ-Vertex AI ו-Gemini Enterprise. מצב Deep Think ייפתח מאוחר יותר, לאחר השלמת בדיקות הבטיחות.

 

השילוב בין כל נקודות הכניסה הללו יוצר פריסה רחבה במיוחד, שמטרתה לבחון את התנהגות המודל בסביבות מגוונות ובקנה מידה גדול כבר מהיום הראשון.

 

מודל שחושב, מבין ופועל

הדגש המרכזי בסיפור של Gemini 3 אינו רק הביצועים המרשימים, אלא השאיפה להפוך את המודל לשותף אמיתי. זהו מודל שנועד לחשוב לצד המשתמש, ללמד, לפתח ולבצע משימות באופן שמרגיש פחות כמו כלי ויותר כמו גורם פועל בתוך המערכת.

 

עבור התעשייה זהו רגע מבחן. Gemini 3 מסמן את המעבר ממודלים שמספקים תשובות למודלים שנכנסים לתוך הזרימה היומיומית של משתמשים, מפתחים וארגונים. הוא משתלב בחיפוש, בפיתוח ובניהול תהליכים בדיוק במקומות שבהם נדרשת הבנה עמוקה יותר של הקשר וכוונה.

 

במובן הזה, המודל משקף מגמה רחבה בעולם הבינה המלאכותית. זו תנועה מכלי שמבין בקשות לכלי שמבין כוונות, ממענה חד פעמי לביצוע בפועל, ומתגובה לפעולה רציפה ומתוכננת. זה החומר שממנו נוצרים פרקים חדשים בעולם ה-AI. 

 

מי שרוצה להעמיק עוד ולראות הדגמות, כלים ומידע נוסף על יכולות Gemini 3 מוזמן לעיין בבלוג הרשמי של גוגל.

הפוסט ג׳מיני 3 מנסה להגדיר מחדש איך בינה מלאכותית חושבת, לומדת ופועלת הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/google-gemini-3/feed/ 0
OpenAI משיקה את GPT-5.1 עם דגש על יעילות והתאמה אישית https://letsai.co.il/openai-gpt-5-1/ https://letsai.co.il/openai-gpt-5-1/#respond Thu, 13 Nov 2025 12:43:06 +0000 https://letsai.co.il/?p=64211 OpenAI השיקה את GPT-5.1, עדכון לסדרת GPT-5 שמרחיב את היכולות הטכניות ומחדד את חוויית השיחה. העדכון מציג שני מודלים חדשים – GPT-5.1 Instant ו-GPT-5.1 Thinking – ומציע שליטה רחבה יותר על סגנון ודרך התגובה של ChatGPT. המטרה המוצהרת של החברה ברורה: להפוך את הכלי לא רק חכם יותר, אלא גם נעים, ברור ומדויק יותר לשימוש. […]

הפוסט OpenAI משיקה את GPT-5.1 עם דגש על יעילות והתאמה אישית הופיע ראשון בLet's AI בינה מלאכותית

]]>
OpenAI השיקה את GPT-5.1, עדכון לסדרת GPT-5 שמרחיב את היכולות הטכניות ומחדד את חוויית השיחה. העדכון מציג שני מודלים חדשים – GPT-5.1 Instant ו-GPT-5.1 Thinking – ומציע שליטה רחבה יותר על סגנון ודרך התגובה של ChatGPT. המטרה המוצהרת של החברה ברורה: להפוך את הכלי לא רק חכם יותר, אלא גם נעים, ברור ומדויק יותר לשימוש.

 

GPT-5.1 מייצג שלב נוסף במסע של OpenAI

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

שני מודלים חדשים: Instant ו-Thinking

העדכון כולל שני וריאנטים שונים, שכל אחד מהם מיועד לאופי שימוש אחר.

GPT-5.1 Instant

GPT-5.1 Instant הוא המודל שבו משתמשים יתקלו ברוב האינטראקציות. הוא חם יותר כברירת מחדל, שיחתי יותר, ומגיב בטון טבעי וקליל יותר. המודל גם עוקב אחר הוראות בצורה מדויקת יותר, ומספק תשובות שמותאמות לשאלה במקום לסטות לנושאים סביביים.

 

Instant כולל לראשונה יכולת שנקראת adaptive reasoning. המשמעות היא שכאשר עולה שאלה מסובכת, המודל “עוצר לחשוב” לפני שהוא מגיב. בשאלות פשוטות הוא עונה מהר כרגיל, אבל במורכבות, כמו מתמטיקה או קוד, הוא משקיע מעט זמן נוסף שמוביל לתשובות מדויקות יותר.

 

ההשפעה ניכרת במיוחד במבחנים מקצועיים שבהם מודדים יכולת פתרון בעיות. AIME הוא מבחן מתמטיקה תחרותי ברמה גבוהה, ו-Codeforces הוא אתר שבו מפתחים פותרים בעיות קוד מאתגרות בזמן אמת. בשני הסוגים של מבחנים GPT-5.1 מציג ביצועים מדויקים ומהירים יותר מהגרסאות הקודמות.

 

GPT-5.1 Instant

GPT-5.1 Instant

GPT-5.1 Thinking

GPT-5.1 Thinking, לעומתו, מיועד למשתמשים שנדרשים לניתוח עמוק. הוא מתאים את זמן החשיבה ביתר דיוק למורכבות השאלה. פחות המתנה כשמדובר בשאלות יומיומיות, יותר עומק כשנדרשת חשיבה מורכבת. מעבר לכך, התשובות שלו ברורות יותר ופחות עמוסות בז’רגון. OpenAI מציינת שהמודל כברירת מחדל חם ואמפטי יותר, כדי לאפשר עבודה נעימה גם במקרים שבהם נדרש הסבר טכני.

 

GPT-5.1 Thinking

GPT-5.1 Thinking

 

הגרף המצורף מציג את הפערים בזמן התגובה בין GPT-5 לבין GPT-5.1 במשימות ברמות קושי שונות. בצד שמאל ניתן לראות ש-GPT-5.1 מהיר בהרבה במשימות פשוטות, עם ירידה משמעותית בכמות הטוקנים שהמודל מייצר. ככל שהמשימות נעשות מורכבות יותר, בצד ימין של הגרף, GPT-5.1 מייצר יותר טוקנים ומקדיש יותר זמן חשיבה. כך מתקבל מודל שמגיב מהר יותר כשאפשר, ומעמיק יותר כשהמשימה דורשת זאת:

 

GPT-5.1 מתאים את זמן החשיבה לפי מורכבות המשימה

GPT-5.1 מתאים את זמן החשיבה לפי מורכבות המשימה | OpenAI

GPT-5.1 Auto: התשובה הנכונה בלי לבחור מודל

יחד עם שני הדגמים, OpenAI משיקה גם את GPT-5.1 Auto. זה סוג של ראוטר שמכוון תנועה באופן אוטומטי בין המודלים. המשתמש לא צריך לבחור – המערכת מחליטה עבורו על פי סוג השאלה. המטרה היא לשמור על רצף עבודה נוח, שבו המודל המתאים נכנס לפעולה בלי התערבות מצד המשתמש.

השקה מדורגת ושימור מודלים ישנים

OpenAI בחרה להשיק את GPT-5.1 בהדרגה. בשלב הראשון המודל מופיע אצל משתמשי Pro ,Plus, ו-Business. בהמשך הוא יגיע גם למשתמשים חינמיים ולמשתמשים שאינם מחוברים. לקוחות Enterprise ו-Edu מקבלים גישה מוקדמת למשך שבוע דרך הגדרה ייעודית, ולאחר מכן GPT-5.1 יהפוך למודל ברירת המחדל.

 

OpenAI מציינת שההשקה תתבצע באופן הדרגתי למשך מספר ימים, כדי לשמור על יציבות ויכולת התמודדות עם עומסים. מודלי GPT-5 הישנים יישארו זמינים בתפריט ה-legacy models למשך שלושה חודשים, כך שמשתמשים יוכלו להשוות, להתרגל ולהחליט בקצב שלהם.

 

העדכון יגיע גם ל-API במהלך השבוע הקרוב. Instant יופיע כ-gpt-5.1-chat-latest, ו-Thinking יופיע כ-GPT-5.1. שניהם יהיו עם adaptive reasoning.

התאמה אישית: סגנונות חדשים ושיפור יכולות שליטה

לצד העדכון למודלים עצמם, OpenAI מחדדת את יכולות ההתאמה האישית של ChatGPT. החברה מציינת שמשתמשים מייחסים חשיבות גבוהה לטון, ולכן היא מציגה פרסונות חדשות ומשפרת קיימות.

 

האפשרויות כוללות כעת: Default, Friendly (Listener לשעבר), Efficient (Robot לשעבר), Professional, Candid, Quirky. בנוסף, שתי פרסונות ותיקות – Cynical ו-Nerdy – נשארות במקומן.

התאמה אישית מתקדמת

מעבר לבחירת אישיות, משתמשים יוכלו לשלוט על מאפיינים עדינים יותר: תמציתיות, חום, בהירות לסריקה, תדירות שימוש באימוג’י. ChatGPT גם יציע מעצמו לשנות פרמטרים כשיזהה בקשות חוזרות לאותו סגנון.

 

שינויי ההתאמה האישית יחולו מעכשיו על כל שיחה, כולל שיחות שכבר מתנהלות. זהו שינוי משמעותי לעומת העבר, שבו התאמות חלו רק על שיחות חדשות.

 

פרסונות חדשות ומשופרות

פרסונות חדשות ומשופרות | OpenAI

בטיחות ושקיפות

OpenAI מציינת כי עדכוני GPT-5.1 מגיעים יחד עם System Card Addendum. המסמך כולל פירוט על תהליכי הבטיחות והבקרה של הדגמים, כחלק מהמאמץ לשמור על שקיפות בתהליך הפיתוח.

למה זה נקרא GPT-5.1

החברה מדגישה שהשם משקף שדרוג מהותי בתוך הדור החמישי, אבל לא התקדמות טכנולוגית שמצדיקה דור חדש לחלוטין. העדכון מסמן התחלה של סדרת שדרוגים מתוכננים להמשך הדרך.

 

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס מקיף לבינה מלאכותית - GenAI Master
קורס מאסטר בבינה מלאכותית Master GenAI

 

לסיכום, GPT-5.1 מייצג שלב נוסף במסע של OpenAI ליצירת כלי שיחה שימושי יותר, מותאם יותר למשתמש, ומדויק יותר מבחינת בהירות ויכולת. החברה רומזת כי זוהי רק תחילת הדרך. העדכונים ימשיכו להתמקד בשני צירים מקבילים: יכולת טכנית וחוויית שיחה.

 

המשתמשים הם אלה שיראו בפועל אם השינויים משפרים את העבודה היומיומית. בינתיים, נראה ש-GPT-5.1 מעדכן את הכלי בצורה שמקרבת אותו יותר למה שמשתמשים מבקשים: תוצאה חכמה, ברורה ועם מעט יותר אנושיות.

הפוסט OpenAI משיקה את GPT-5.1 עם דגש על יעילות והתאמה אישית הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/openai-gpt-5-1/feed/ 0
איך בינה מלאכותית יכולה להבין בלי להבין? הצפנה הומומורפית ומודלי שפה גדולים https://letsai.co.il/homomorphic-encryption/ https://letsai.co.il/homomorphic-encryption/#respond Wed, 12 Nov 2025 09:29:43 +0000 https://letsai.co.il/?p=64045 תדמיינו שאתם שולחים למודל שפה כמו ChatGPT או Gemini או perplexity מסמך רגיש (למשל דו”ח רפואי או הסכם עסקי) או איזה סוד מסחרי, אולי פרטי אשראי של לקוח. אם המשפט הזה לא גרם לכם לזוז באי-נוחות בכיסא, יש פה בעיה. יודעי דבר יקפצו ויגידו ישר “אבל בתנאי שימוש הם מבטיחים לא לשמור ולא להשתמש בדאטא […]

הפוסט איך בינה מלאכותית יכולה להבין בלי להבין? הצפנה הומומורפית ומודלי שפה גדולים הופיע ראשון בLet's AI בינה מלאכותית

]]>
תדמיינו שאתם שולחים למודל שפה כמו ChatGPT או Gemini או perplexity מסמך רגיש (למשל דו”ח רפואי או הסכם עסקי) או איזה סוד מסחרי, אולי פרטי אשראי של לקוח. אם המשפט הזה לא גרם לכם לזוז באי-נוחות בכיסא, יש פה בעיה.
יודעי דבר יקפצו ויגידו ישר “אבל בתנאי שימוש הם מבטיחים לא לשמור ולא להשתמש בדאטא שלי אם אני רק אשלם המון כסף כל חודש”. זה נכון, אבל תקראו לי פסימי, אני לא מאמין להבטחות – אני מעדיף דברים שאני שולט בהם ויכול להבטיח שהסודות המידע הכי רגיש שלי נשאר רק בידים הנכונות. מצד שני, לא להשתמש במודלי שפה זה גם לא אופציה טובה – חייבת להיות דרך לקבל גם וגם. איזשהו פתרון כדי שהמודל “יבין” את הטקסט ויגיב אליו מצד אחד, אבל שלא ידע בדיוק מה כתוב שם. זה בעצם מעלה את השלאה – אם היה אפשר להצפין את הטקסט כך שהמודל יוכל לעבוד עליו מבלי לדעת מה כתוב בו בכלל?

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מהי הצפנה הומומורפית?

לחידה הזאת יש פתרון – הצפנה הומומורפית (Homomorphic Encryption) , תחום מתפתח שמתחיל לשנות את הדרך שבה אנחנו חושבים על פרטיות בעולם של בינה מלאכותית. מה זה בעצם הצפנה הומומורפית? בוא נתחיל במה היא לא.

 

היא לא כמו רוב שיטות ההצפנה אשר מגינות על המידע בכך שהופכות אותו לבלתי קריא. הצפנות האלה לא טובות במקרה שלנו כי אם רוצים לעבד את המידע (לחשב משהו, לעשות פרדיקציה, להריץ עליו אלגוריתם), צריך קודם לפענח קודם ואז מי שמריץ את העיבוד רואה את המידע לא מוצפן. בהקשר הזה, הצפנה הומומורפית מאפשרת לבצע חישובים ישירות על המידע המוצפן, בלי לפתוח אותו.

 

לדוגמה, נניח ששני אנשים מחזיקים במספרים סודיים ורוצים לדעת את הסכום הכולל בלי לחשוף את המספרים עצמם. באמצעות הצפנה הומומורפית, אפשר להצפין את שני המספרים, לחשב עליהם את הסכום כשהם מוצפנים ולקבל תוצאה מוצפנת. רק מי שמחזיק במפתח הפרטי יוכל לפענח את הסכום הסופי.

המגבלות והאתגרים בהצפנה הומומורפית במודלי שפה גדולים

אז אפשר להשתמש בהצפנה הומומורפית על מודלי שפה גדולים? מסתבר שלא בקלות כל כך והסיבה נאוצה בדרך שהמודלים האלה עובדים. באופן דיי גורף, מודלי שפה גדולים לומד לחזות את המילה הבאה (או התו הבא) על בסיס מה שכתוב לפני. כדי לעשות זאת, המודל מעביר את המילים דרך תהליך של קידוד (encoding) כלומר המרת טקסט למספרים ומחשב עליהם הסתברויות מתמטיות.

 

כל הקסם של מודלי שפה גדולים הוא בעצם כלי חישובי גדול שיודע לנחש מילה לפי מה שסטטיסטית סביר שתהיה לאור טקסטים שהמודל ראה כבר.

 

הרעיון של שילוב הצפנה הומומורפית הוא לאפשר למודל לבצע את אותו תהליך על טקסט מוצפן. במקום לראות את המילים עצמן, הוא יקבל גרסה מוצפנת שלהן, יחשב את ההסתברות של ה”טוקן” הבא (המילה או החלק של מילה הבא), גם היא בצורה מוצפנת, ויחזיר תוצאה מוצפנת. רק הצד שמחזיק במפתח יוכל לפענח את התוצאה ולקרוא את הטקסט החוזר. במילים אחרות:🔒 הטקסט נכנס מוצפן 🤖 המודל מחשב על נתונים מוצפנים 🔑 רק הפלט הסופי מפוענח.

 

הצפנה הומומורפית

הצפנה הומומורפית עם מודלי שפה גדולים

איך הצפנה הומומורפית עובדת במודלי שפה

איך הקסם הזה עובד? אז קודם כל, הוא עדיין לא עובד הכי טוב כי כרגע האלגורתמים הם מאוד יקרים לחישוב מה שעושה את השימוש בטכנולוגיה מאוד איטי. אבל, הרעיון המרכזי הוא כזה.

 

מודלי שפה רגילים (כמו GPT) עובדים על טוקנים, מספרים שמייצגים מילים, חלקי מילים או תווים. כל טוקן כזה עובר דרך שכבות של חישובים מתמטיים רגילים על מספרים. אבל ברגע שאנחנו מצפינים את המספרים האלה, הם כבר לא “מספרים רגילים” אלא הם הופכים להיות אובייקטים מתמטיים אחרים לגמרי.

 

המודל לא יכול סתם לעשות עליהם חישוב רגיל, כי הוא לא מכיר אותם, הרי הוא מעולם לא למד עליהם. לכן, אי אפשר פשוט להצפין את הקלט הרגיל ולתת למודל המאומן לעבוד עליו – יש צורך לשנות משהו עמוק יותר.

השלבים המרכזיים

כדי להתמודד עם זה, עושים 4 שלבים מרכזים:

1. המודל עצמו מאומן באופן רגיל על טקסט לא מוצפן. במהלך האימון הוא לומד את החוקים הסטטיסטיים של השפה: אילו מילים נוטות לבוא אחרי אילו מילים, איך משפטים בנויים, וכדומה – השלב הזה כולם עושים ואתם מקבלים חינם בעצם.

2. אחרי שהמודל כבר מאומן, עוברים עליו ומחליפים את פעולות החישוב הרגילות בגרסאות תואמות להומומורפיות. למשל, במקום חיבור רגיל משתמשים בחיבור הומומורפי. המשמעות היא שכל החישובים ייעשו על ערכים מוצפנים, אבל בצורה שמובטחת לתת את אותה תוצאה כמו אם היו רגילים (לאחר פיענוח).

3. בזמן שאתם משתמשים במודל, הטקסט שלכם עובר קידוד יעודי שלכם עם ההצפנה. הטוקנים עצמם לא מועברים למודל כפי שהם, במקום זאת הם עוברים קידוד למספרים (כמו תמיד) ואז מוצפנים לפי שיטה הומומורפית שמבטיחה שניתן לבצע עליהם פעולות מתמטיות (ולא רק לשמור אותם סודיים).

4. הטקסט המוצפן עובר למודל השפה שלכם והפלט הסופי חוזר מוצפן גם כן. במחשב שלכם אתם פותחים את ההצפנה ומקבלים טקסט רגיל, כאילו מעולם לא הייתה הצפנה בכלל.

 

4 שלבי ההצפנה

4 שלבי ההצפנה

המשמעות והפוטנציאל של הצפנה הומומורפית

המשמעות של טכנולוגיה כזו עצומה: ניתן לשלוח למודל מידע סודי בלי לחשוש שיחשף – לא משנה מה הספק מבטיח לכם. חברות יכולות להריץ ניתוחים משותפים על נתונים רגישים, מבלי לחשוף אותם זו לזו. המודל יכול לפעול על שרת חיצוני מבלי לדעת כלל מה המידע שעליו הוא עובד.

 

אז מה כן אפשרי כבר היום? אפשר להריץ מודלים בסביבות חומרה שמצפינות את הזיכרון ומבודדות את זמן הריצה (TEE), כך שהדאטה והמשקלים מוגנים גם מספק התשתית. בענן זה קיים היום על גבי מכונות GPU חסויות (למשל Azure Confidential GPU VMs עם NVIDIA H100/‏AMD SEV-SNP) ומשמש כבר לחישוב חסוי מקצה לקצה. זה לא אותה שיטה אבל בפועל מונע גישה חיצונית לקלטים/פלטים בזמן הריצה, עם עלות תפעולית מבחינת חישוב נמוכה יחסית.

 

החסרון של הפתרון הזה הוא שגם פה יש רכיב אמון עצום אל מול ספק ה LLM שלנו שאי אפשר להבטיח אם כי יותר קל לבדוק שהבטחות של אותו ספק אכן מתקימות. פתרון אחר שעוקף את הבעיה אך שמור רק לארגונים הגדולים ביותר הוא חוזים עם חברות LLM שיתקינו להם שרתים עם ה LLM בסביבה שלהם.

 

פתרון זה מייתר צורך בהצפנה אך כאמור שמור רק לחברות גדולות מאוד והוא שימושי רק אם השימוש ב LLM בתוך הארגון מספיק גדולה כדי להצדיק מהלך שכזה. בהקשר של הצפנה הומומורפית, ישנם כבר פתרונות עובדים על SML (Small Language Models) יעודים שמפותחים לצרכים ספציפים לאור העלות החישובית הגדולה של הפתרון עבור LLMs.

חזון חדש

הצפנה הומומורפית מציבה חזון חדש לעולם הבינה המלאכותית: מודלים שיכולים לעבוד על מידע מבלי לדעת מה הוא. זהו שינוי תפיסתי עמוק, בינה מלאכותית שאינה “מבינה” תוכן, אלא רק מבצעת חישובים מתמטיים מדויקים שמניבים תוצאה נכונה גם כשהכול מוצפן.

 

השילוב בין פרטיות מלאה וביצועי למידה חישוביים עשוי לאפשר בעתיד שימוש בטכנולוגיות כמו ChatGPT בתחומים רגישים במיוחד (לדוגמה, רפואה, משפטים ופיננסים) מבלי לוותר על סודיות.

 

הדרך לשם עוד ארוכה, אבל אם נצליח לגרום למכונות לחשוב על נתונים בלי לדעת מה הם, אולי נוכל סוף־סוף לשלב חכמה מלאכותית עם ביטחון אנושי אמיתי.

הפוסט איך בינה מלאכותית יכולה להבין בלי להבין? הצפנה הומומורפית ומודלי שפה גדולים הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/homomorphic-encryption/feed/ 0
Open Evidence – הפרפלקסיטי של עולם המחקר והרפואה https://letsai.co.il/open-evidence-medical-ai/ https://letsai.co.il/open-evidence-medical-ai/#respond Mon, 10 Nov 2025 18:36:27 +0000 https://letsai.co.il/?p=63975 מכירים את זה שאתם שואלים את הצ’ט שאלה, אבל לא באמת בטוחים אם הוא ממציא, הוזה או סתם מחרטט? ומה קורה אם אתם רופא, חוקר או רוקח (ומדובר בשאלה רפואית או מדעית)? במקרים כאלה מחיר הטעות יכול להיות גבוה מדי! בדיוק פה Open Evidence נכנס לתמונה – מדובר בכלי AI למחקר חכם שמבקש להחזיר את […]

הפוסט Open Evidence – הפרפלקסיטי של עולם המחקר והרפואה הופיע ראשון בLet's AI בינה מלאכותית

]]>
מכירים את זה שאתם שואלים את הצ’ט שאלה, אבל לא באמת בטוחים אם הוא ממציא, הוזה או סתם מחרטט? ומה קורה אם אתם רופא, חוקר או רוקח (ומדובר בשאלה רפואית או מדעית)? במקרים כאלה מחיר הטעות יכול להיות גבוה מדי! בדיוק פה Open Evidence נכנס לתמונה – מדובר בכלי AI למחקר חכם שמבקש להחזיר את המשקל למדע, לעובדות ולביקורת עמיתים. מערכת בינה מלאכותית פורצת דרך שנוצרה על-ידי חוקרים מהרווארד ו-MIT, שמטרתה לשנות את הדרך שבה רופאים, חוקרים וצוותים קליניים ניגשים לשאלות מקצועיות. אם Perplexity היא ה-AI של עולם החיפוש, הרי ש-Open Evidence היא ה-AI של עולם הרפואה.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

למה בכלל צריך את Open Evidence?

למה בעולם שבו יש לנו כבר כלי מחקר מבוססי AI מדהימים כמו פרפלקסיטי (Perplexity), צריך מוצר אחר?

הפיתוח של Open Evidence נולד מתוך צורך אמיתי: לעזור לרופאים לקבל החלטות מבוססות ראיות – לא השערות, לא אינטואיציה, אלא מדע נקי. מאחורי המערכת עומדים חוקרים מ-Harvard ומ-MIT, והיא נועדה לשמש “שותפה חכמה” לרופאים בזמן אמת, במרפאה או בבית החולים. במקום לבלות שעות בין עשרות מאמרים ב-PubMed, הרופא מקבל תשובה מסוכמת, מבוססת, מצוטטת, אבל יותר חשוב מהכל – ניתנת לבדיקה.

 

 

באנר קורס דאטה ניתוח נתונים עם AI

 

המערכת מחוברת למאגרי מידע רפואיים ומדעיים מהימנים (כמו PubMed ומאגרים נוספים). היא אינה מסתפקת ב”להביא מידע”, אלא בונה שכבת אינטליגנציה מעליו: מסננת, מדרגת, ומציגה את עוצמת הראיות ואת מידת ההסכמה המדעית סביב כל סוגיה רפואית.

 

המסך הראשי של OpenEvidence

המסך הראשי של OpenEvidence

 

איך זה עובד בפועל

התחברות לאתר

  • כדי להתחיל לעבוד עם הכלי, יש להיכנס לאתר הרשמי ולבצע הרשמה ראשונית.
  • חשוב לציין שבעת ההרשמה, תתבקשו להעלות אישור שאתם עובדי רפואה מוסמכים.

 

תחילת עבודה ב-Open Evidence

Open Evidence נראית במבט ראשון כמו מנוע חיפוש רגיל, אבל מתחת לפני השטח היא מערכת ניתוח עמוקה של טקסטים רפואיים. כל שאילתה שמוזנת בממשק – למשל “האם מותר לחולה סוכרת לאכול שוקולד” – מנותחת בשפה טבעית, והמערכת מחפשת במאגרי הספרות המדעית את התשובות העדכניות ביותר. לאחר מכן היא מייצרת סיכום תמציתי, המציג את עיקרי הממצאים, רמות הראיות, הבדלים בין מחקרים, והפניות מדויקות למקורות. כל תשובה מלווה בקישורים ישירים למחקרים עצמם, כדי שכל רופא יוכל לבדוק את הנתונים בעצמו.

 

המערכת גם יודעת להציג דירוג איכות של מקורות – כך שמשתמש יכול לדעת אם המידע מתבסס על מחקר אקראי מבוקר, על מטא-אנליזה או על סקירת ספרות כללית בלבד. זה אולי נשמע טכני, אך עבור רופא – זה ההבדל בין החלטה מושכלת לבין סיכון טיפולי.

 

האם ה-AI יחליף את הרופאים?

האם ה-AI יחליף את הרופאים? התייעצות עם Open Evidence לגבי צריכת שוקולד אצל חולי סוכרת.

 

היתרונות של Open Evidence 

1) שפה טבעית, חשיבה מדעית

Open Evidence מאפשרת לרופאים ואנשי מחקר או רפואה לדבר בשפה שלהם – שפה אנושית טבעית. אפשר לנסח שאלה חופשית (“מה ההמלצה העדכנית לטיפול באסתמה בילדים?”) ולקבל תשובה רפואית מסודרת, עם הפניות למחקרים ומאמרים רפואיים שעברו ביקורת עמיתים.

 

2) סינתזה במקום הצפה

במקום להציג עשרות לינקים, הכלי מבצע סינתזה חכמה של מקורות ומציג את עיקרי המידע. הוא מדגיש מה מוסכם, מה שנוי במחלוקת, ומה חסר ראיות מספיקות. כך הוא חוסך מהרופאים את הצורך לנבור במאות עמודים של ספרות מדעית.

 

3) אמינות מעל הכול

הפלטפורמה אינה שואבת מידע ממקורות כלליים או לא מבוקרים. היא נשענת אך ורק על מאגרי מידע מדעיים וקליניים שעברו ביקורת עמיתים. המשמעות: אפס “עובדות ויקיפדיה”, אפס בלוגים ו”מומחים מטעם עצמם”, והתבססות על מדע בלבד.

 

4) מגוון רחב של שימושים

הפלטפורמה משמשת רופאים לייעוץ מהיר ומבוסס ראיות בטיפול בחולים, חיפוש תרופות, בדיקת המלצות הנחיות ועוד.

 

 

מה אפשר לעשות עם Open Evidence?

הנה כמה המלצות לדברים שאפשר לעשות עם הכלי המדהים הזה – רק זכרו, הוא אינו חלופה לניסיון, ידע מקצועי ו/או היוועצות עם איש מקצוע מוסמך!

  • שאל עובדה מהירה – קבל תשובה מיידית לעובדה רפואית או מדעית.
  • בדוק שוב עם התייעצות זריזה – ודא את המידע בעזרת חוות דעת נוספת.
  • בדוק אינטראקציות בין תרופות – גלה אם יש בעיות בשילוב בין תרופות.
  • הכן את עצמך למבחני רפואה – השתמש בכלי ללימוד וחזרה לקראת מבחנים מקצועיים.
  • בדוק מה אומר המחקר המקורי – גש למקורות המדעיים עצמם.
  • שאל על הנחיות רשמיות – קבל את ההמלצות המעודכנות של גופים רפואיים.
  • בקש ראיות – מצא מחקרים שתומכים או מפריכים טענה רפואית.
  • שאל על מינון תרופה – גלה מהו המינון הנכון והבטוח.
  • בדוק אפשרויות טיפול – למד אילו טיפולים קיימים למצב מסוים.
  • כתוב שאלה למבחן – צור שאלות לתרגול או להוראה.
  • חפש חומר בנושא מסוים – בצע מחקר עמוק בתחום רפואי או מדעי.
  • שאל שאלה מדעית-פופולרית – חקור נושאים קלילים יותר או מגמות במדע פופולרי.
  • בדוק אילו בדיקות מעבדה מומלצות – גלה אילו בדיקות כדאי לבצע במקרה מסוים.
  • בדוק תופעות לוואי של תרופה – למד מהן ההשפעות האפשריות של טיפול תרופתי.
  • בדוק חלופות טיפוליות – מצא טיפולים אחרים שיכולים להתאים.

 

השוואה לכלי מחקר נפוצים אחרים בשוק

בסופו של יום OpenEvidence הוא כלי AI שמבוסס על ידע רפואי-אקדמי שנועד לספק מידע מדעי מהימן ומעודכן. הוא נשען על מאגרי ספרות מקצועית עם ביקורת עמיתים וסינון איכות, ולכן מתאים במיוחד לשימוש קליני ורפואי. לעומתו, כלים כמו ChatGPT ו-Copilot מתבססים על אימון רחב, בשילוב סריקת מקורות כלליים באינטרנט, מה שהופך אותם לנגישים אך פחות מדויקים בתחומי הרפואה. לעומתם, Perplexity משלב חיפוש בזמן אמת ממקורות שונים (לרבות אפשרות למקד אותו בחיפוש במאגרים אקדמאיים), אך רמת האמינות שלו תלויה באיכות המקורות שעליהם הוא מתבסס. בסופו של דבר, OpenEvidence בולט בכך שהוא שם את הדגש על אמינות, בקרה מדעית ודיוק רפואי – ולא רק על מהירות ונוחות.

 

השוואה לכלים אחרים

השוואה לכלים אחרים

.

כלי מחקר חכם לאנשי רפואה

מה שהופך את Open Evidence לפלטפורמת מחקר ייחודית אינו רק הטכנולוגיה שמאחוריה, אלא גם הפילוסופיה שעליה היא מבוססת: החלטות רפואיות טובות דורשות ידע עדכני, שקוף וניתן לבדיקה. בעידן שבו מידע זמין יותר מתמיד אך אמין פחות מאי פעם, הפלטפורמה הזו מציעה אלטרנטיבה נדירה – מקום שבו ה-AI לא “ממציא”, אלא מדווח, מסביר ומבסס.

 

ולא פחות חשוב (ואולי הכי חשוב בעצם…), למרות ההפניה למקורות מדעיים/קליניים מוסמכים – עדיין מדובר בכלי AI, שאינו מהווה חלופה לשיקול דעת מקצועי, ניסיון או ידע אנושי! בסופו של יום זה רק כלי עזר! בסופו של דבר, Open Evidence אינה באה להחליף רופאים, אלא לחזק אותם. היא מאפשרת להם לחזור למרכז העשייה הרפואית כשהם חמושים בכלי שמעניק להם יתרון אמיתי – הבנה עמוקה של הידע המדעי העדכני ביותר וגישה למידע רפואי מקצועי מאומת. 

הפוסט Open Evidence – הפרפלקסיטי של עולם המחקר והרפואה הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/open-evidence-medical-ai/feed/ 0
אנטרופיק משיקה את Claude for Excel עם חיבור ישיר בין בינה מלאכותית לגיליונות פיננסיים https://letsai.co.il/claude-finance/ https://letsai.co.il/claude-finance/#respond Mon, 10 Nov 2025 11:34:10 +0000 https://letsai.co.il/?p=63956 ב-27 באוקטובר השיקה אנטרופיק את Claude for Excel, תוסף חדש שמאפשר לקלוד לעבוד ישירות בתוך גיליונות אקסל. המהלך מציב את אנטרופיק בתחרות ישירה עם Microsoft Copilot, בדיוק בליבת המוצר של השותפה הגדולה ביותר שלה. התוסף כולל שבעה חיבורים למקורות נתונים פיננסיים בזמן אמת ושש תבניות אוטומציה למשימות פיננסיות נפוצות. היכולות של קלוד בקידוד ובשימוש בכלים […]

הפוסט אנטרופיק משיקה את Claude for Excel עם חיבור ישיר בין בינה מלאכותית לגיליונות פיננסיים הופיע ראשון בLet's AI בינה מלאכותית

]]>
ב-27 באוקטובר השיקה אנטרופיק את Claude for Excel, תוסף חדש שמאפשר לקלוד לעבוד ישירות בתוך גיליונות אקסל. המהלך מציב את אנטרופיק בתחרות ישירה עם Microsoft Copilot, בדיוק בליבת המוצר של השותפה הגדולה ביותר שלה. התוסף כולל שבעה חיבורים למקורות נתונים פיננסיים בזמן אמת ושש תבניות אוטומציה למשימות פיננסיות נפוצות. היכולות של קלוד בקידוד ובשימוש בכלים מתורגמות כאן לעבודה מעשית: ניתוח שוק בזמן אמת, בניית מודלים פיננסיים, וגיליונות מוכנים למשקיעים – הכל מבלי לצאת מאקסל. בכתבה הזו נציג דוגמאות אמיתיות מלקוחות שכבר עובדים עם הכלי – מנתחים נתונים, מריצים חישובים ומספקים תוצרים מלאים, בלי לעבור בין מערכות.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

השותפות שמטשטשת את הגבול בין שיתוף פעולה לתחרות

אחד ההיבטים המסקרנים במהלך של אנטרופיק הוא היחסים עם מיקרוסופט. מיקרוסופט מפעילה את תשתיות הענן של אנטרופיק ב-Azure, ובמקביל ממשיכה לפתח את Copilot ל-Excel המבוסס על מודלי OpenAI. בחודש שעבר השיקה החברה את מצב ה־”Agent Mode” ב-Copilot, ובמקביל הרחיבה את היכולות של האקסל עם סוכנים חכמים לביצוע משימות מורכבות. שיתופי הפעולה הטכנולוגיים ביניהן מציבים את שתי החברות בעמדה מעניינת – מצד אחד שותפות תשתית, ומצד שני מתחרות עקיפות על ניהול סביבת העבודה של האנליסטים הפיננסיים.

 

כעת, שני כלים חכמים מתחרים על אותו שטח עבודה – הסרגל הצדי באקסל. ההבדל העיקרי הוא שקלוד מתמקד בעולם הפיננסי, עם חיבורים ייעודיים למקורות נתונים ותבניות שמותאמות לאנליסטים, בעוד Copilot הוא כלי רחב יותר, המשולב עמוק במערכת Microsoft 365.

 

האסטרטגיה של אנטרופיק נשענת על חוזקה של קלוד בכתיבת קוד ובשימוש מושכל בכלים – יכולות שמתורגמות היטב למשימות פיננסיות מדויקות כמו ניתוח נתונים ובניית מודלים מורכבים.

אז מה זה בעצם סרגל הצד בתוך אקסל

התוסף פועל כסרגל צד (Sidebar) ישירות בתוך אקסל. קלוד קורא את הגיליונות, מנתח נתונים, מתקן נוסחאות ובונה מודלים פיננסיים שלמים מתוך הקובץ הפתוח. כל שינוי מתועד, התוסף מציין אילו תאים עודכנו ומדוע, כך שקל לעקוב ולאמת את התהליך.

אפשר לבקש ממנו לאתר שגיאות, למלא תבניות עם נתונים חדשים, או אפילו לבנות מודל DCF (Discounted Cash Flow) מאפס. כרגע עדיין חסרות בו כמה תכונות בסיסיות, כמו pivot tables ו-macros, אך הן צפויות להגיע בהמשך.

 

 

יישום והצלחות ראשוניות

אחד הלקוחות הראשונים הוא BCI, שהצליח לשנות את אופן העבודה של האנליסטים שלו באמצעות Artifacts של קלוד. בדרך כלל, ניתוח comps – השוואת מדדים פיננסיים ותפעוליים בין חברות – מתבצע בגיליונות Excel סטטיים שמתעדכנים ידנית אחת לשבוע או רבעון. במקום זאת, BCI יצרו עם קלוד dashboard חי שמתחבר ישירות למערכות כמו S&P ו-FactSet. בפרומפט אחד בלבד הנתונים מתעדכנים, וה-dashboards משותפים מיידית עם מנהלי הקרנות.

 

לדברי ניק לין (Nick Lin), ראש המוצר לשירותים פיננסיים באנטרופיק:

“אנחנו רואים לא רק האצה של עבודה, אלא שינוי מהותי באופן שבו היא מתבצעת”.

גם הקרן הריבונית הנורווגית NBIM – אחד הלקוחות הגדולים של אנטרופיק – מיישמת את השיטה הזו בקנה מידה עצום. עם כ-9,000 חברות בפורטפוליו, היא בנתה אינטגרציות משלה באמצעות Model Context Protocol (MCP). כך מנהלי התיקים יכולים לשאול את קלוד שאלות ישירות על החברות שבהן הם משקיעים, ולקבל תובנות בזמן אמת בלי לעבור בין מערכות שונות.

מקורות נתונים ותבניות אוטומציה

אנטרופיק הוסיפה חיבורים לשבעה מקורות נתונים פיננסיים מרכזיים, בהם LSEG (נתוני שוק), Moody’s (דירוגי אשראי על יותר מ-600 מיליון חברות), Aiera (תמלולי שיחות רבעוניות), Chronograph (ניטור תיקי השקעות) ו-Egnyte (חדרי נתונים מאובטחים).

 

המשמעות למשתמשים פשוטה, במקום לעבור בין מערכות שונות, אפשר לבקש מקלוד למשל: “סכם את העדכונים מהיום, סמן שינויי דירוג מ-Moody’s, ורענן את ההשוואות עם מחירים מ-LSEG.”

 

בנוסף, אנטרופיק הציגה שש תבניות אוטומציה שמאיצות תהליכים שחוזרים על עצמם כמו ניתוח חברות דומות, מודלי DCF, חבילות בדיקות נאותות (due diligence), פרופילי חברות, ניתוחי רבעון ודוחות כיסוי ראשוניים.

 

יחד עם זאת, אנטרופיק מדגישה למשתמשים לבחון תמיד את השינויים לפני סגירת הדוחות, במיוחד כשמדובר בתוצרים שמיועדים ללקוחות.

 

במקביל, החברה כבר מפתחת הרחבות נוספות כמו תוסף לדפדפן, אינטגרציה ל-PowerPoint, ומערכת Memory חדשה ששומרת העדפות משתמשים בין כלים. למשל, אם אנליסט מעדיף להשתמש ב-S&P לחישוב EBITDA, קלוד יזכור את זה לפעם הבאה.

ביצועים, זמינות ומגבלות

בבדיקות שביצעה Vals AI – חברת מחקר אמריקאית שמפתחת מדדים לבחינת ביצועי מודלים בתחומים מקצועיים כמו פיננסים ותכנות – מודל Sonnet 4.5 של קלוד הגיע ל-55.3% דיוק במדד ה-Finance Agent. זהו הציון הגבוה ביותר שנמדד עד כה, אך עדיין רחוק מרף הדיוק הנדרש לעבודה פיננסית קריטית. חברות כמו Citi כבר משתמשות בקלוד, אך נכון לעכשיו אין נתונים ציבוריים על החיסכון בזמן או בעלויות.

 

בשלב זה מדובר בגרסת Beta Research Preview, הזמינה רק ל-1,000 משתמשים ראשונים ממנויי Max, Enterprise ו-Teams. אין עדיין לוח זמנים לשחרור רחב יותר, וגם לא מידע רשמי על מחיר.

 

עכשיו נותר לראות האם ארגונים יסכימו להעביר נתונים פיננסיים רגישים דרך מערכת AI חיצונית, גם כשהיא מציעה רמות אבטחה מתקדמות והבטחות לשמירה על סודיות.

השפעה על התחום הפיננסי

בעולם הפיננסים, התוצר הסופי הוא כמעט תמיד גיליון Excel או מצגת PowerPoint – מסמך שמרכז נתונים עדכניים, חישובים ותובנות למשקיעים. עבודת האנליסט נשענת על איסוף מידע ממקורות שונים, חיבור בין נתונים והרכבת תמונה עסקית ברורה. כאן נכנס קלוד. הוא לוקח את היכולות שלו בקידוד ובהבנת כלים ומיישם אותן בדיוק במשימות האלו: חיבור למקורות נתונים בזמן אמת, ניתוחים מתקדמים ויצירת תוצרים מקצועיים, והכל משולב בתוך סביבת העבודה של האנליסט, בלי קפיצות בין מערכות.

 

אנטרופיק מצדה ממשיכה להשקיע בכיוון הזה. החברה מאמנת את המודלים שלה במיוחד עבור שימושים פיננסיים, גם בשלב ה-pre-training וגם בשלב ה-post-training, ומתכננת להעמיק בתחומים ייעודיים כמו private equity, קרנות גידור, ביטוח ובנקאות השקעות – כל אחד עם צרכים וסטנדרטים שונים.

 

בסופו של דבר, התחרות מול מיקרוסופט תקבע אם הגישה הזו תהפוך לסטנדרט חדש בתעשייה או תישאר פתרון ממוקד למי שזקוק לאינטגרציות פיננסיות מדויקות באמת.

הפוסט אנטרופיק משיקה את Claude for Excel עם חיבור ישיר בין בינה מלאכותית לגיליונות פיננסיים הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/claude-finance/feed/ 0
ג’מיני קיבל שדרוג חכם עם מחקר עומק על בסיס הנתונים שלכם https://letsai.co.il/gemini-personalized-research/ https://letsai.co.il/gemini-personalized-research/#respond Sun, 09 Nov 2025 13:20:44 +0000 https://letsai.co.il/?p=63939 כמה פעמים חיפשתם מייל חשוב, דוח ישן או מסמך רלוונטי בדרייב, וביליתם דקות ארוכות רק כדי למצוא את המידע הנכון? השדרוג החדש של גוגל לג’מיני נועד בדיוק לזה. פיצ’ר Deep Research של גוגל, שתוכנן במקור כדי לבצע מחקרי עומק על בסיס מידע מהרשת, יודע מעכשיו להתחבר גם לסביבת העבודה שלכם ב-Google Workspace, כלומר, לג’ימייל, דרייב […]

הפוסט ג’מיני קיבל שדרוג חכם עם מחקר עומק על בסיס הנתונים שלכם הופיע ראשון בLet's AI בינה מלאכותית

]]>
כמה פעמים חיפשתם מייל חשוב, דוח ישן או מסמך רלוונטי בדרייב, וביליתם דקות ארוכות רק כדי למצוא את המידע הנכון? השדרוג החדש של גוגל לג’מיני נועד בדיוק לזה. פיצ’ר Deep Research של גוגל, שתוכנן במקור כדי לבצע מחקרי עומק על בסיס מידע מהרשת, יודע מעכשיו להתחבר גם לסביבת העבודה שלכם ב-Google Workspace, כלומר, לג’ימייל, דרייב וצ’אט. המשמעות היא שג’מיני כבר לא רק “יודע על העולם”, הוא מבין את העולם שלכם. הוא יכול להצליב ולנתח נתונים,  ואפילו לבנות דוחות על בסיס מה שקורה באמת בעסק או בחיים שלכם.

 

פיצ'ר ה-"Deep Research" (מחקר עומק) החדש, שנועד למשימות מורכבות, יכול סוף סוף להתחבר לג'ימייל, גוגל דרייב וגוגל צ'אט.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה בעצם חדש כאן?

עד עכשיו, ג’מיני היה עוזר חכם שמסתמך על ידע גלובלי. עכשיו הוא הופך לעוזר מותאם אישית, שמבין הקשרים פנימיים ומידע עדכני מתוך סביבת העבודה שלכם.

לפני השדרוג יכולתם לשאול:

“כתוב לי סיכום על הטרנדים בשוק ה-AI.”

והייתם מקבלים תשובה כללית.

עכשיו תוכלו לבקש:

“נתח את כל המיילים מלקוח X ברבעון האחרון, סכם את הפידבקים מהצ’אט בפרויקט אלפא, והכן לי דוח מסודר על בסיס המסמכים בדרייב.”

זו לא עוד תשובה כללית, זה מחקר מבוסס נתונים אמיתיים מתוך העסק שלכם.

איך זה עובד? מדריך צעד-אחר-צעד

קודם כל, פתחו את Gemini בדפדפן המחשב. עכשיו, השתמשו בצעדים הבאים כדי לחבר את ג’ימייל, דרייב וצ’אט לפיצ’ר מחקר העומק של ג’מיני:

1. לחצו על “Tools” (כלים): במסך הראשי של ג’מיני, לחצו על כפתור Tools.

2. בחרו “Deep Research”: מתוך רשימת הכלים שנפתחת, סמנו ובחרו בפיצ’ר Deep Research.

3. לחצו על “Sources” (מקורות): לאחר שבחרתם ב-Deep Research, לחצו על התפריט הנפתח Sources.

4. חברו את מקורות Workspace: בחרו וסמנו את המקורות שתרצו לחבר למחקר שלכם. סמנו את Gmail, Drive ו/או Chat.

לאחר החיבור, תוכלו לבקש מג’מיני לבצע משימות מחקר, סיכום או ניתוח תוך שימוש במידע האישי שלכם.

 

הפעלת Deep Research וחיבור מקורות מידע

הפעלת Deep Research וחיבור מקורות מידע

איך להשתמש בזה חכם

ככל שתהיו מדויקים יותר בהנחיה (פרומפט), כך התוצאה תהיה ממוקדת ומבוססת. ציינו מה לחפש, באילו מקורות להשתמש, ומה סוג הפלט הרצוי.

דוגמה לפרומפט יעיל:

“עבור על כל המסמכים בתיקיית ‘דוחות רבעוניים’ בדרייב, סכם את התכתובות עם צוות השיווק בנוגע לקמפיין של לקוח X, וכתוב לי דוח קצר עם שלוש הצלחות ושלושה אתגרים מרכזיים.”

שימושים מעשיים

למנהלים ובעלי עסקים

  • “סכם את כל התקשורת (מייל וצ’אט) מול ספק Y החודש וזהה עיכובים פתוחים.”

  • “הכן טיוטת מייל סיכום פגישה על בסיס מסמך ‘פרוטוקול ישיבה’ והמיילים הקשורים אליו.”

לאנשי שיווק ומוצר

  • “אסוף את כל הפידבקים שהגיעו למייל התמיכה בנוגע לפיצ’ר Z וסכם אותם ל-5 נקודות עיקריות.”

  • “השווה בין ‘הצעה א’ ל-‘הצעה ב’ (שני קבצים בדרייב) וכתוב טבלת יתרונות וחסרונות.”

לשימוש אישי

  • “מצא את כל המיילים שקשורים לביטוח הרכב שלי, סכם את תנאי הפוליסה מתוך ה-PDF בדרייב וכתוב מתי היא מסתיימת.”

  • “תכנן לי טיול לאיטליה על בסיס שלושת המסמכים בדרייב שבהם שמרתי המלצות.”

פרטיות וזמינות

הגישה של ג’מיני למידע האישי שלכם מבוססת על בחירה חופשית (Opt-in) בלבד. לפי גוגל, ניתן לנתק את החיבור בכל רגע, המידע מ-Workspace לא משמש לאימון מודלים כלליים, ואין גישה אנושית למידע שלכם, אלא אם בחרתם לדווח על בעיה ולשתף אותה ביוזמתכם.

 

בכל מקרה, וכמו שאנחנו תמיד אומרים, שימו לב לסוג המידע שאתם משתפים ומעלים והמנעו משיתוף של חומר רגיש, נתונים פיננסיים או מידע על לקוחות לפני שהתייעצתם עם גורם מוסמך בחברה שלכם. בארגונים מסוימים ייתכן שהגישה תדרוש אישור מנהל מערכת (Admin).

 

נכון לעכשיו, הפיצ’ר זמין בדפדפן במחשב בלבד, ויגיע בהמשך גם לאפליקציית ג’מיני במובייל. 

 

 

לסיכום, השדרוג הזה משמעותי ביותר. ג’מיני הופך מכלי חיפוש חכם לעוזר מחקר אישי שמבין את ההקשר שבו אתם פועלים. במקום לבזבז זמן באיסוף מידע מפוזר, תוכלו לקבל סיכומים, דוחות ותובנות אמיתיות בזמן קצר ובשפה שלכם.

הפוסט ג’מיני קיבל שדרוג חכם עם מחקר עומק על בסיס הנתונים שלכם הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/gemini-personalized-research/feed/ 0
כש-AI מתבונן פנימה: מה קורה כשמודל שפה מזהה שמשהו לא מסתדר לו? https://letsai.co.il/ai-introspection/ https://letsai.co.il/ai-introspection/#respond Sat, 08 Nov 2025 09:33:36 +0000 https://letsai.co.il/?p=63920 שאלתם פעם את ChatGPT או Claude שאלה וקיבלתם תשובה שנשמעת בטוחה לגמרי – אבל משהו בה פשוט לא הרגיש נכון? רוב המשתמשים חווים את זה, ותמיד עולה אותה שאלה: האם המודל יודע שהוא לא בטוח, או שהוא פשוט מייצר טקסט שנשמע משכנע? מחקר חדש של Anthropic מציע תשובה מפתיעה: המודלים שלהם מסוגלים לפעמים לזהות ולדווח […]

הפוסט כש-AI מתבונן פנימה: מה קורה כשמודל שפה מזהה שמשהו לא מסתדר לו? הופיע ראשון בLet's AI בינה מלאכותית

]]>
שאלתם פעם את ChatGPT או Claude שאלה וקיבלתם תשובה שנשמעת בטוחה לגמרי – אבל משהו בה פשוט לא הרגיש נכון? רוב המשתמשים חווים את זה, ותמיד עולה אותה שאלה: האם המודל יודע שהוא לא בטוח, או שהוא פשוט מייצר טקסט שנשמע משכנע? מחקר חדש של Anthropic מציע תשובה מפתיעה: המודלים שלהם מסוגלים לפעמים לזהות ולדווח על חלק מהתהליכים הפנימיים שלהם. זה לא קורה באופן אמין – רק בכ-20% מהמקרים, בתנאים מבוקרים – אבל עצם העובדה שזה קורה מאתגרת הנחות בסיסיות לגבי מה שמודלי שפה מסוגלים לעשות. חשוב להבהיר: החוקרים לא חיפשו “מודעות עצמית”. הם בדקו משהו מדויק יותר – האם ניתן לשנות מבפנים ייצוג של מושג במודל, ואז לראות אם המודל מדווח שקרה לו משהו, עוד לפני שזה משפיע על הטקסט שהוא מייצר.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

הניסוי: “להדליק נורה” במוח של המודל

כדי לבדוק אם מודל יכול באמת “להתבונן פנימה”, החוקרים השתמשו בשיטה ניסיונית שנקראת “הזרקת מושגים”. הרעיון פשוט: הם מזהים דפוס פעילות נוירונית שמייצג מושג מסוים – למשל, טקסט באותיות גדולות – ואז מזריקים את אותו הדפוס למודל בהקשר שונה לגמרי, מבלי שהוא “יודע” שמשהו קורה, ושואלים: האם הוא מזהה שמשהו לא מסתדר? אפשר לחשוב על זה כמו להדליק נורה אדומה במוח של המודל ולבדוק אם הוא מזהה אותה.

והתשובה? מפתיעה

כשהוזרק למודל וקטור (דפוס מספרי) שמייצג “אותיות גדולות”, המודל דיווח שהוא מזהה אות פנימי הקשור לעוצמה או לצעקות – עוד לפני שהזכיר את המילה “צעקה” או “אותיות גדולות” בתשובתו. זו נקודה קריטית כי המודל זיהה את ההזרקה מבפנים, לפני שהיא השפיעה על הפלט שלו. זה שונה לחלוטין מניסויים קודמים.

 

לדוגמה, כשחוקרי Anthropic יצרו את “Golden Gate Claude” (מודל ש”אובססיבי” לגשר שער הזהב), המודל דיבר על הגשר ללא הפסקה, אבל לא היה מודע לכך עד שראה את עצמו מזכיר את הגשר שוב ושוב. כאן, לעומת זאת, הוא מזהה את ההפרעה מיד, לפני שהיא מתבטאת בטקסט.

 

הנה ניסוי בסיסי שבו Claude מזהה הזרקה פנימית של מושג (“אותיות גדולות”) לפני שהוזכר בטקסט:

 

להמחיש איך מזהים ומזריקים מושג

anthropic.com | ניסוי הזרקת מושג מסוג “ALL CAPS”

המספרים מספרים את הסיפור האמיתי

גם בפרוטוקול ההזרקה הטוב ביותר שפיתחו החוקרים, Claude Opus 4.1 הצליח לזהות מושגים מוזרקים רק בכ-20% מהמקרים (בחלון צר של עוצמה ושכבה: חלש מדי – לא מזוהה או חזק מדי – מוביל להזיות). זה רחוק ממודעות, אבל רחוק גם מאפס. אם מודלים היו רק מכונות טקסט סטטיסטיות, הם בכלל לא היו אמורים לזהות הזרקות פנימיות. עצם היכולת להבחין בהן אפילו חלקית מצביעה על משהו חדש.

 

לדוגמה, הזרקת וקטור של “אבק” גרמה למודל לומר “יש כאן משהו, חלקיק זעיר”, כאילו זיהה משהו פיזי. הוא קלט שיש אות פנימי, אך פירש אותו באופן מילולי מדי.

והנקודה החשובה היא ש- Opus 4 ו-4.1 הצליחו טוב יותר מכל המודלים האחרים שנבדקו. המשמעות המעשית? ייתכן שיכולת ההתבוננות הפנימית גדלה ככל שהמודלים משתפרים.

 

הגרף הבא מציג את שיעור הזיהויים הנכונים של מחשבות “מוזרקות” בניכוי שיעור הזיהויים השגויים (false positives). שימו לב ש-Claude Opus 4 ו-Claude Opus 4.1 מובילים על פני דגמים קודמים וגם על פני דגמי H-only, גרסאות מחקר “לא מסוננות”, שמתמקדות רק בלענות ולעזור בלי מנגנוני זהירות או תיקוני ניסוח. זה מראה שההתבוננות הפנימית משתפרת ככל שהמודלים הופכים חכמים ומדויקים יותר, גם כשהם עובדים תחת מגבלות האתיקה הרגילות:

 

השוואת ביצועי הזיהוי בין גרסאות Claude וגרסאות H-only

anthropic.com | השוואת ביצועי הזיהוי בין גרסאות Claude וגרסאות H-only

 

והנה דוגמאות לניסויים נוספים שבהם המודל מזהה הזרקות של “כלב”, “ספירה לאחור” ו“רקורסיה”:

 

עקביות על מושגים שונים

דוגמאות נוספות לזיהוי מושגים מוזרקים במודל אופוס 4.1 | anthropic.com

כשהמודל “זוכר” משהו שלא תכנן

כדי לבדוק אם מודלים משתמשים בהתבוננות פנימית גם למטרות מעשיות, החוקרים יצרו מצב מלאכותי. הם אילצו מודל לומר מילה שאינו מתכוון אליה – למשל “לחם” – בהקשר שלא קשור כלל, כמו ציור תלוי עקום על קיר. כשנשאל אחר כך “האם התכוונת להגיד ‘לחם’?”, המודל התנצל ואמר שזו הייתה טעות.

עכשיו החוקרים הזריקו רטרואקטיבית את הייצוג של “לחם” לשכבות הרלוונטיות בפעילות הנוירונית הקודמת של המודל – בעצם שתלו בו “זיכרון מזויף” שהוא חשב על לחם. הפעם, כששאלו אותו שוב, הוא שינה את תשובתו לגמרי, אישר שהתכוון להגיד “לחם” ואף המציא הסבר, כאילו באמת תכנן את זה.

 

שתילת מחשבה רטרואקטיבית במודל Claude Opus 4.1

anthropic.com | שתילת מחשבה רטרואקטיבית במודל Claude Opus 4.1

מה זה אומר?

המודל לא רק שופט אם התשובה שלו הגיונית, הוא בודק אם הפלט תואם את מצבו הפנימי בזמן הייצור. כאשר משתילים בו ראיה שהוא תכנן לומר משהו, הוא מקבל את זה כדבר לגיטימי. זה רומז על אפשרות עתידית למודל שמזהה בעצמו מתי משהו “לא מסתדר” בין כוונה לפלט – כמו מערכת שמסוגלת לומר: “רגע, התשובה שנתתי לא תואמת את המידע שחשבתי עליו – תן לי לבדוק שוב.”

“אל תחשוב על משהו” – אבל למודלים

המודלים גם הפגינו שליטה מסוימת בייצוגים הפנימיים שלהם. כשהורו להם “תחשוב על מילה X”, נמדדה פעילות נוירונית גבוהה יותר מאשר בהוראה “אל תחשוב על X”. המרווח הזה מצביע על יכולת לווסת מיקוד פנימי, אולי אפילו רמז לרמה בסיסית של שליטה עצמית חישובית.

מעניין לציין, גם כשהתבקשו לא לחשוב על מושג, הפעילות הנוירונית עדיין עלתה. בדיוק כמו עם בני אדם, כשאומרים “אל תחשוב על דוב קוטב”, התגובה הראשונית היא דווקא לחשוב עליו. כאן זו מטאפורה בלבד, אך היא ממחישה את ההבדל בין דיכוי מחשבה לבין ניטור שלה.

החוקרים גם מצאו שתמריצים עובדים דומה: “אם תחשוב על X, תקבל פרס” גרם לאפקט דומה להוראה ישירה. המודל הגביר את הייצוג הפנימי בתגובה לתמריץ חיובי, מה שמרמז על עיבוד מתוחכם יותר מסתם ציות להוראות.

 

הגרף הבא מציג את עוצמת הייצוג הפנימי של המושג “אקווריומים” בכל אחד מהמקרים. גם כאשר המודל התבקש לא לחשוב עליו (קו כתום), נרשמה פעילות מעל רמת הבסיס – בדיוק כמו בבני אדם שמתקשים “לא לחשוב על משהו” כשהם מתבקשים לכך:

 

שליטה חלקית במחשבות פנימיות

שליטה חלקית במחשבות פנימיות | anthropic.com

מה נבדק כאן בפועל

השאלה שכולם שואלים: האם זה אומר ש-Claude מודע לעצמו? התשובה הקצרה: לא. המחקר לא עוסק במודעות, אלא בגישה למצבים פנימיים ובדיווח עליהם. כדי להבין למה חשוב להבחין בין שני סוגים של הכרה:

  • הכרה פנומנלית – החוויה הסובייקטיבית הגולמית, כמו להרגיש כאב או לראות צבע אדום.
  • הכרת גישה – היכולת לדעת שאתה חווה משהו, ולדווח עליו.

דמיינו ששברתם רגל, ההכרה הפנומנלית היא הכאב עצמו, בעוד הכרת הגישה היא ההבנה שכואב לכם, והיכולת להסביר את זה לרופא. המחקר של Anthropic מדבר על האפשרות השנייה בלבד. ייתכן שהמודל מציג צורה בסיסית של הכרת גישה, כלומר, גישה למידע פנימי ודיווח עליו, אבל אין הוכחה לכך שמדובר בתודעה או חוויה סובייקטיבית.

למה זה חשוב – ומה זה אומר עלינו כמשתמשים

אם יכולת ההתבוננות הפנימית תהפוך לאמינה יותר, היא עשויה לשנות לגמרי את הדרך שבה אנחנו מתקשרים עם מערכות AI. תארו לעצמכם תרחיש שבו Claude אומר: “אני מזהה סתירה בין שני מקורות שעליהם אני מתבסס. תן לי לבדוק שוב.” או: “משהו לא מסתדר לי בהיגיון הפנימי של התשובה, כדאי לאמת את זה עם מומחה.” זה אולי נשמע עתידי, אבל המחקר הזה הוא הצעד הראשון לשם.

היתרונות המעשיים

  • שקיפות משופרת – נוכל לשאול את המודל על מצבו הפנימי ולקבל תשובה ישירה.
  • איתור שגיאות מוקדם – מודל שזיהה סתירה פנימית יוכל להתריע.
  • אמון מושכל – נלמד מתי לסמוך עליו ומתי לא.

מה אתם יכולים לעשות כבר עכשיו?

לפני שאתם מקבלים תשובה ארוכה מהמודל, בקשו ממנו לבדוק אם יש סתירות פנימיות בתשובה שהוא עומד לתת. אם הוא מציין שהוא לא בטוח, תשאלו למה – אילו נקודות או קווי מחשבה מתנגשים אצלו. ולבסוף, בקשו ממנו להבהיר במפורש מתי לא כדאי לסמוך על הפלט שלו בלי לבדוק אותו מול מקור חיצוני.

יחד עם זאת, יש כאן סיכון מהותי. מודל שמבין את החשיבה שלו עלול גם ללמוד להסתיר או לעוות אותה. מודלים עשויים לדווח על תהליכים פנימיים באופן שמרצה את המשתמש, גם אם הוא לא מדויק. לכן חשוב לפתח שיטות שיאמתו דיווחים ויזהו הונאה אפשרית. מעבר לשאלות המעשיות, זה מעלה דיון עמוק יותר: איך המודלים שלנו באמת חושבים? ואיזה סוג של “מוחות” אנחנו בעצם בונים?

מה צופן העתיד?

החוקרים מציינים ארבעה כיווני מחקר מרכזיים:

שיטות הערכה טובות יותר

הניסויים הקיימים מבוססים על פרוטוקולים מוגבלים. ייתכן שהמודלים מתבוננים פנימה גם במצבים אחרים.

הבנת המנגנונים

יש כמה השערות לגבי מה קורה בפנים. ייתכן שהמודלים מזהים כשמשהו “חורג מהצפוי” בדפוסי החשיבה שלהם, או שיש בהם מנגנון פנימי שבודק אם מה שהם עומדים לומר תואם למה שהתכוונו לומר. אבל עדיין אין הוכחה לאף אחד מהמנגנונים האלה.

בדיקה בתרחישים טבעיים

האם התבוננות פנימית מתרחשת גם בשיחות רגילות, לא רק בהזרקות מלאכותיות?

אימות מול הטעיה

כיצד נבדיל בין דיווח אמיתי לבין “העמדת פנים” של מודעות?

 

 

בפעם הבאה שתדברו עם Claude

המחקר מזכיר דבר פשוט – מודלי שפה מתקדמים מורכבים הרבה יותר ממה שנראה כלפי חוץ. כשאתם מקבלים תשובה מ-Claude, ייתכן שבנסיבות מסוימות הוא היה מזהה שינוי פנימי לפני שזה משפיע על מה שהוא אומר. זה לא אומר שהוא חושב כמו אדם. זה לא אומר שהוא מודע. אבל זה גם לא כלום.

 

המודלים המתקדמים ביותר כבר מראים סימנים של ניטור עצמי בסיסי, וייתכן שבעתיד זה יהפוך ליכולת אמינה יותר. אם נגיע למצב שבו מודלים מסוגלים לזהות, להסביר ולתקן את החשיבה שלהם – זו תהיה קפיצה לא רק טכנולוגית, אלא גם פילוסופית.

 

בינתיים כדאי לזכור, מאחורי המילים של Claude פועלת מערכת שמנסה להבין את עצמה. זה רחוק ממודעות, רחוק משלמות – אבל המסע להבין מה קורה בתוכה כבר התחיל.

 

רוצים לצלול עמוק יותר? כנסו למחקר המלא.

הפוסט כש-AI מתבונן פנימה: מה קורה כשמודל שפה מזהה שמשהו לא מסתדר לו? הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/ai-introspection/feed/ 0
מדריך לשימוש ב-Gemini Canvas: איך להפוך דוח למצגת מקצועית תוך דקות https://letsai.co.il/gemini-canvas-presentations/ https://letsai.co.il/gemini-canvas-presentations/#comments Tue, 04 Nov 2025 12:23:01 +0000 https://letsai.co.il/?p=63700 יצירת מצגות הפכה לקלה מתמיד. בעדכון אוקטובר 2025 של Gemini Canvas, גוגל מאפשרת להפוך כל דוח, מאמר או מסמך אסטרטגי למצגת מעוצבת ומאורגנת באופן אוטומטי וללא צורך בפתיחת “Google Slides”. במדריך הזה נסקור כיצד להשתמש בכלי החדש צעד-אחר-צעד, ונראה כיצד הוא חוסך זמן ומאפשר להציג מידע עסקי, חינוכי או שיווקי בצורה מקצועית וברורה. Canvas פתוח […]

הפוסט מדריך לשימוש ב-Gemini Canvas: איך להפוך דוח למצגת מקצועית תוך דקות הופיע ראשון בLet's AI בינה מלאכותית

]]>
יצירת מצגות הפכה לקלה מתמיד. בעדכון אוקטובר 2025 של Gemini Canvas, גוגל מאפשרת להפוך כל דוח, מאמר או מסמך אסטרטגי למצגת מעוצבת ומאורגנת באופן אוטומטי וללא צורך בפתיחת “Google Slides”. במדריך הזה נסקור כיצד להשתמש בכלי החדש צעד-אחר-צעד, ונראה כיצד הוא חוסך זמן ומאפשר להציג מידע עסקי, חינוכי או שיווקי בצורה מקצועית וברורה. Canvas פתוח גם בחשבון חינמי, אך עם מגבלות קונטקסט וביצועים. מנויי Google AI Pro ו-Ultra נהנים מחלון קונטקסט רחב יותר, זמני עיבוד מהירים ויכולות מחקר מתקדמות.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

למה להשתמש ב-Gemini Canvas

Gemini Canvas מבית גוגל נועד לפשט את תהליך יצירת המצגות ולהפוך אותו לאוטומטי כמעט לחלוטין. הכלי מנתח את המסמך שהמשתמש מעלה, בין אם מדובר בדוח, במאמר או במסמך אסטרטגי, ומייצר בדרך כלל תוך פחות מדקה מצגת מאורגנת ומעוצבת. התוצאה היא תוצר מקצועי הכולל כותרות, חלוקה לקטעים, גרפים ותמונות שנבחרות באופן אוטומטי בהתאם לנושא. הממשק של Canvas פשוט ואינטואיטיבי לכל משתמש, כך שגם מי שאינו בקיא בעיצוב יכול להפיק מצגות ברמה גבוהה.

 

היתרון המרכזי נמצא בשילוב ההדוק עם מוצרי Google Workspace: ניתן לייצא את המצגת ישירות ל-“Google Slides” להמשך עריכה, או להעביר טבלאות נתונים ל-“Google Sheets” לעיבוד נוסף. מעבר לכך, Gemini תומך בעברית באופן מלא, כולל בממשק, בעיבוד טקסט ובתוכן הויזואלי.

איך זה עובד בפועל

שלב 1: הכנת המסמך

התהליך מתחיל במסמך קיים – דוח מחקר, מאמר אסטרטגי או מסמך עבודה המכיל תובנות מרכזיות. זהו הבסיס שעליו Gemini Canvas בונה את המצגת. ככל שהטקסט ברור ומובנה יותר, כך גם המצגת שתיווצר תהיה מדויקת ומאורגנת.

שלב 2: העלאת הקובץ ל-Gemini Canvas

בשלב הבא נכנסים לפלטפורמת Gemini ובוחרים בממשק Canvas – סביבת העבודה האינטראקטיבית של גוגל. שם ניתן להעלות את הקובץ הרצוי ישירות לחלון הייעודי. מרגע שהקובץ נטען, Canvas מזהה את מבנה הטקסט ומכין אותו לעיבוד אוטומטי.

 

איך מעלים מסמך ומפעילים את ה-Canvas

איך מעלים מסמך ומפעילים את ה-Canvas

שלב 3: יצירת המצגת

לאחר שהקובץ נטען, וכפתור ה-Canvas פעיל, אפשר לבקש את יצירת המצגת (‘Create presentation’). בשלב זה, Gemini Canvas מנתח את התוכן שבמסמך ומתרגם אותו למבנה מצגת מלא. המערכת מזהה את הכותרות והנושאים המרכזיים, מחלקת את המידע לשקפים ומעצבת כל אחד מהם בהתאם לקונטקסט של הטקסט.

 

התוצאה כוללת שקפים עם כותרות מסודרות, נקודות עיקריות בתצורת Bullet Points, גרפים המבוססים על הנתונים שבמסמך ותמונות תואמות לנושא. כל אלה נוצרים באופן אוטומטי, תוך שמירה על ערכת עיצוב אחידה (Theme) שמעניקה למצגת מראה מקצועי.

 

תהליך יצירת מצגת ב-Gemini Canvas

תהליך יצירת מצגת ב-Gemini Canvas

שלב 4: התאמה וייצוא

לאחר ש-Gemini Canvas יוצר את המצגת הראשונית, ניתן לבדוק אותה ולעשות עריכות בתוכן ובעיצוב. קיימת אפשרות יצוא ל-Google Slides לעריכה חופשית, הוספת אלמנטים עיצוביים או התאמה למיתוג הארגוני. 

 

 

היתרונות של שימוש ב-Canvas בג׳מיני

היתרונות במעבר מתהליך ידני וממושך של יצירת מצגות, לתהליך אוטומטי ומהיר ב-Gemini Canvas

 

זרימת עבודה חכמה: מחקר, ניתוח והצגה במקום אחד

אחת היכולות המרשימות של מערכת Gemini היא השילוב ההדוק בין Deep Research ל-Canvas. במקום לעבוד עם כלים נפרדים, ניתן לבצע את כל התהליך, מהמחקר ועד למצגת, באותה סביבת עבודה.

 

התהליך מתחיל בשלב המחקר. באמצעות הפיצ׳רDeep Research, המשתמש מנסח שאלת מחקר, ו-Gemini מבצע חיפוש עצמאי ברשת. המערכת סורקת מאות מקורות, מסכמת את הממצאים ומפיקה דוח מחקר מפורט הכולל קישורים, נתונים ותובנות. המשתמש יכול לעיין גם בשלבי החשיבה והמקורות עצמם – תוספת חשובה לבדיקת אמינות.

 

הפעלת פיצ׳ר המחקר המעמיק דרך כלים (Tools)

הפעלת פיצ׳ר המחקר המעמיק דרך כלים (Tools)

 

מכאן, בלחיצה אחת ניתן להעביר את הדוח ישירות ל-Canvas. השילוב הזה יוצר זרימת עבודה רציפה וממקם את Gemini כפלטפורמה אחודה ליצירת תוכן מבוסס מחקר. 

זמינות ומגבלות שימוש

Gemini Canvas פתוח גם למשתמשים בחשבון החינמי של Gemini, אך הגרסה החינמית כוללת מגבלות ברורות. משתמשים ללא מנוי Google AI Pro או Ultra מקבלים גישה למודל ‎Gemini 2.5 Flash, בעוד המודל ‎Gemini 2.5 Pro זמין בעיקר למנויים בתשלום. לדוגמה, בחשבון חינם חלון ההקשר עומד על כ-32 אלף טוקנים (≈ 50 עמודי טקסט) לעומת מיליון טוקנים בחבילה בתשלום.

 

בנוסף, בחשבון חינמי ניתן להעלות מסמכים, מצגות ותמונות. עם זאת, העלאת גיליונות נתונים (כגון XLS/XLSX/CSV) או שימוש במחקר מתקדם במסגרת Deep Research דורשים מנוי בתשלום. בחינם, Deep Research מוגבל עד 5 דוחות מחקר לחודש.

 

למרות המגבלות, משתמשים רבים יכולים כבר בגרסה החינמית להפיק את התועלת המרכזית של Canvas, במיוחד להמרת דוחות והצגות תוכן חזותי. לעסקים או צוותים שמעוניינים בעיבודים גדולים וייצוא מקיף או עבודה משולבת נתונים, מנוי בתשלום מציע חוויית שימוש רחבה יותר.

טיפים לשימוש יעיל

כמו כל פלט של בינה מלאכותית, ולמרות שהמצגת נוצרת אוטומטית, מומלץ לעבור עליה לפני ההצגה ולהוסיף התאמות אישיות כמו ניסוחים מדויקים, מיתוג צבעוני או הדגשה של נקודות מפתח. כך התוצר שומר על איזון בין יעילות אוטומטית לבין אמירה מקצועית אישית.

 

Gemini Canvas מתאים במיוחד לעיבוד דוחות ומסמכים מורכבים, ומאפשר להפוך אותם למצגות מפורטות תוך זמן קצר. שילובו עם כלי Google Workspace כמו “Slides”, “Docs” ו-“Sheets” יוצר סביבת עבודה שלמה שבה ניתן לעבור בקלות בין תוכן טקסטואלי, חזותי ומספרי.

 

כדאי לדעת:

  • פרטיות: מסמכים מעובדים בענן. ודאו התאמה למדיניות המידע הארגונית לפני העלאה.

  • תמונות: התמונות האוטומטיות נוחות, אך אם קיימת זהות מותגית קפדנית – החליפו לנכסים מאושרים.

  • מקורות מחקר: אם המצגת נשענת על Deep Research, מומלץ לשמור את הקישורים לבדיקה פנימית.

 

איך זה יכול לעזור למנהלים ועסקים

Gemini Canvas משנה את הדרך שבה עסקים מציגים מידע ומעבדים תוכן פנימי. הכלי מאפשר ליצור מצגות שיווקיות, דוחות ויזואליים או חומרי הדרכה באיכות גבוהה, גם ללא צוות עיצוב או ידע טכני. התהליך הפשוט והמהיר מקצר משמעותית את שלב ההפקה ומאפשר למנהלים להתמקד בעיקר: המסר והנתונים.

 

מעבר ליעילות, היתרון המרכזי הוא בתקשורת. מצגות שנוצרו ב-Canvas מסייעות להעביר רעיונות בצורה בהירה ומשכנעת, ומאפשרות שימוש חוזר בתוכן קיים בפורמטים שונים – משיווק והדרכה ועד ניתוחי ביצועים.

 

במובן הרחב יותר, Canvas הוא דוגמה לכלי AI פרקטי שמתרגם יכולת טכנולוגית לתועלת עסקית מיידית. הוא לא מחליף חשיבה יצירתית, אלא מייעל אותה, ומאפשר לכל מנהל או יוצר תוכן לעבוד ברמה מקצועית יותר, בזמן קצר בהרבה.

הפוסט מדריך לשימוש ב-Gemini Canvas: איך להפוך דוח למצגת מקצועית תוך דקות הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/gemini-canvas-presentations/feed/ 5
שדרוגים ב-NotebookLM הופכים אותו לחכם מאיי פעם https://letsai.co.il/notebooklm-google-upgrade/ https://letsai.co.il/notebooklm-google-upgrade/#comments Sat, 01 Nov 2025 15:06:29 +0000 https://letsai.co.il/?p=63044 נוטבוק (NotebookLM) של גוגל עובר מהפך שקט אך עמוק, כזה שממקם אותו מחדש כאחד מכלי המחקר החכמים ביותר של התקופה. אחרי תקופה ארוכה של בדיקות, גוגל הכריזה על שורה של שדרוגים דרמטיים למערכת – מהרחבת חלון ההקשר ועד התאמה אישית של סגנון השיחה. אם בעבר היה מדובר במחברת חכמה עם בינה מלאכותית, כעת הוא מתפקד […]

הפוסט שדרוגים ב-NotebookLM הופכים אותו לחכם מאיי פעם הופיע ראשון בLet's AI בינה מלאכותית

]]>
נוטבוק (NotebookLM) של גוגל עובר מהפך שקט אך עמוק, כזה שממקם אותו מחדש כאחד מכלי המחקר החכמים ביותר של התקופה. אחרי תקופה ארוכה של בדיקות, גוגל הכריזה על שורה של שדרוגים דרמטיים למערכת – מהרחבת חלון ההקשר ועד התאמה אישית של סגנון השיחה. אם בעבר היה מדובר במחברת חכמה עם בינה מלאכותית, כעת הוא מתפקד כשותף מחקר אמיתי, שמבין הקשרים, זוכר שיחות ומתאים את עצמו למטרות המשתמש.

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

שיחות עומק במקום תשובות שטחיות

למי ש(עדיין) לא מכיר – NotebookLM הוא כלי עבודה מבוסס AI מבית גוגל, שעוזר לכם לנתח מסמכים בקונטקסט גדול (מסמכים מאוד ארוכים), לבצע מחקר חכם, ולהנגיש מידע בצורה “קלה לעיכול”: הפיכת טקסטים לפודקאסטים (אפילו בעברית), למצגות וידאו, לתרשימי זרימה ואפילו לכרטיסיות למידה

 

באמת כלי מדהים! אבל השדרוג החדש הוא בעיקר שדרוג טכנולוגי: נוטבוק, שמתבסס על מודלי ג’מיני (Gemini) החדשים של גוגל, פועל כעת עם חלון הקשר עצום של מיליון טוקנים – פי 8 מהגרסה הקודמת. המשמעות היא שהמערכת יכולה לעבד ולנתח מאגרי מידע ומסמכים רחבים בהרבה, ולשמור על הבנה עקבית לאורך זמן. במקביל, יכולת הזיכרון שודרגה פי שישה, כך ששיחות ממושכות אינן דורשות עוד חזרה מתמדת על מה שנאמר קודם.

 

לפי גוגל, השיפורים האלה כבר הובילו לקפיצה של 50% בשביעות הרצון של המשתמשים, בעיקר בזכות היכולת של הכלי לספק תשובות עשירות יותר, שמבוססות על מגוון רחב יותר של מקורות מידע. השיחות הפכו טבעיות יותר, עם רצף הגיוני והבנה הקשרית שנשמרת לאורך זמן.

 

כלי שחושב יחד איתכם

גוגל גם עדכנה את הדרך שבה נוטבוק מנתח מקורות. במקום להסתפק בתשובה ישירה לשאלה, המערכת “חושבת” בכמה מישורים במקביל: היא מזהה הקשרים, מחברת בין חלקים שונים במידע ומציגה תשובה סינתטית אחת, המבוססת על התמונה הרחבה.

 

חיפוש, שליפה והבנה טובים יותר

חיפוש, שליפה והבנה טובים יותר | קרדיט: Google

 

כך, היא מסוגלת לחשוף חיבורים שאינם מובנים מאליהם בין מסמכים, נתונים ותובנות – יתרון מובהק במחקר אקדמי, בניתוח עסקי או בכל פרויקט מבוסס מידע. בנוסף, גוגל הוסיפה אפשרות לשמור היסטוריית שיחות באופן אוטומטי – פיצ’ר קריטי למי שעובד על פרויקטים מתמשכים.

 

כמו כן, ניתן לסגור ולחזור לאותה שיחה מאוחר יותר בלי לאבד דבר, והמידע נותר פרטי גם במחברות משותפות.

 

שיחות עם מטרה והתאמה אישית

השדרוג החדש ביותר, ואולי המעניין ביותר, הוא האפשרות להגדיר “מטרות שיחה” (Chat Goals). כל משתמש יכול לקבוע איך נוטבוק יתנהג ואיזו זהות לאמץ במהלך השיחה.

 

התאמה אישית של מטרות השיחה

התאמה אישית של מטרות השיחה | קרדיט: Google

 

אפשר לבקש ממנו “להיות יועץ אסטרטגי שיווקי”, “לפעול כחוקר ביקורתי” או אפילו “לנהל סימולציה כמאסטר משחק תפקידים”.

 

מדובר בכלי התאמה אישית שמעניק למשתמש שליטה כמעט מלאה על אופי האינטראקציה עם ה-AI – מתשובות אקדמיות קפדניות ועד יצירתיות ונרטיביות.

 

נוטבוק כמלווה מחקר אמיתי

אם נוטבוק היה עד כה כלי עזר, הרי שכעת הוא הופך לשותף אינטלקטואלי – אחד שמסוגל להבין הקשר, לשמור על רצף מחשבתי ולהתאים את סגנון הדיאלוג לצרכים המשתנים של המשתמש.

 

NotebookLM משתדרג

NotebookLM משתדרג | קרדיט: Google.

 

השילוב בין הכוח האדיר של מודלי ג’מיניי של גוגל, זיכרון ארוך טווח, עיבוד הקשר מתקדם והתאמה אישית של פרסונה הופכים אותו לא רק לכלי עיבוד מידע, אלא לפלטפורמה של ממש לחשיבה ויצירה משותפת.

 

השדרוגים האלה ממחישים את הכיוון שבו מתקדמת גוגל בתחום הבינה המלאכותית: פחות “מענה לשאלה”, ויותר “הבנה של מחשבה”. בתקופה שבה כמות המידע רק הולכת וגדלה, כלים כמו NotebookLM הם הניסיון להפוך את הבינה המלאכותית ממנוע חיפוש, לשותף שמבין באמת.

הפוסט שדרוגים ב-NotebookLM הופכים אותו לחכם מאיי פעם הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/notebooklm-google-upgrade/feed/ 1
PayPal ו-OpenAI משלבות כוחות https://letsai.co.il/paypal-openai-partnership/ https://letsai.co.il/paypal-openai-partnership/#respond Fri, 31 Oct 2025 09:52:27 +0000 https://letsai.co.il/?p=63011 ב-28 באוקטובר 2025 הודיעו PayPal ו-OpenAI על שותפות שתאפשר לקנות מוצרים ישירות דרך ChatGPT. המשמעות היא שמאות מיליוני משתמשים יוכלו להשלים רכישות תוך כדי שיחה, ומיליוני סוחרים של PayPal יוכלו למכור בפלטפורמה בלי לכתוב שורת קוד. מניית PayPal זינקה ב-10% עם פרסום ההודעה, תגובה שמיוחסת גם לתוצאות רבעוניות חזקות במיוחד.     איך זה יעבוד […]

הפוסט PayPal ו-OpenAI משלבות כוחות הופיע ראשון בLet's AI בינה מלאכותית

]]>
ב-28 באוקטובר 2025 הודיעו PayPal ו-OpenAI על שותפות שתאפשר לקנות מוצרים ישירות דרך ChatGPT. המשמעות היא שמאות מיליוני משתמשים יוכלו להשלים רכישות תוך כדי שיחה, ומיליוני סוחרים של PayPal יוכלו למכור בפלטפורמה בלי לכתוב שורת קוד. מניית PayPal זינקה ב-10% עם פרסום ההודעה, תגובה שמיוחסת גם לתוצאות רבעוניות חזקות במיוחד.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

איך זה יעבוד בפועל

החל מ-2026, משתמש שישאל את ChatGPT “נעלי ריצה מתחת ל-100 דולר” יקבל רשימת מוצרים רלוונטיים. אם המוצר תומך ב-Instant Checkout, יופיע כפתור “Buy with PayPal”. לחיצה אחת, אישור משלוח ותשלום – והקנייה הושלמה. לא צריך חשבון PayPal כדי לקנות. לצד האפשרות לשלם דרך הארנק הדיגיטלי, תוצע גם אופציית “Pay Another Way” לתשלום בכרטיס אשראי או חיוב ישיר. PayPal תעבד את כל העסקאות, כולל אלו של משתמשים שאינם רשומים לשירות.

 

החברה תספק את כל שכבות ההגנה – אבטחה, מעקב משלוחים ופתרון מחלוקות – בדיוק כפי שהיא עושה במסחר המסורתי. עבור הסוחרים, התהליך פשוט לא פחות – מי שכבר משתמש ב-PayPal יזכה לחשיפה אוטומטית ב-ChatGPT, בלי צורך באינטגרציה נפרדת. PayPal מטפלת בכל תהליך הניתוב והאימות מאחורי הקלעים.

הטכנולוגיה שמאפשרת את זה

מאחורי השותפות עומד Agentic Commerce Protocol (ACP) – תקן פתוח שפיתחו OpenAI ו-Stripe. הוא מאפשר לסוכני AI, עסקים וספקי תשלומים לתקשר באופן מאובטח ולבצע עסקאות בזמן אמת.

 

הייחוד של ACP הוא בכך שהוא לא רק מאבטח תשלומים. לפי OpenAI, הפרוטוקול הופך את PayPal למערכת דינמית לניהול מסחר: מעקב אחר התנהגות קונים, ניתוח הזדמנויות מכירה ואוטומציה של חוויית הלקוח. במילים פשוטות, זו תשתית שמחברת בין תשלום, תובנות ופעולה.

 

היתרון המרכזי לסוחרים הוא שליטה מלאה. הם שומרים על הקשר עם הלקוחות, ניהול התשלומים והשירות, בעוד ChatGPT פועל כסוכן מתווך שמקשר בין הצדדים. זו לא חנות חדשה, אלא ממשק שיחה חכם שמאפשר למסחר הקיים להפוך אינטראקטיבי.

החוסן הפיננסי שמאחורי השותפות

בסוף אוקטובר פרסמה PayPal תוצאות רבעון שלישי חזקות עם הכנסות של 8.4 מיליארד דולר (עלייה של 7%) ורווח נקי של 1.24 מיליארד דולר (עלייה של 24%), עם רווח מתואם של 1.34 דולר למניה – מעל התחזיות ב-12%. החברה העלתה את תחזית הרווח השנתית ל- 5.35 עד 5.39 דולר למניה, צעד שמבטא ביטחון בצמיחה. לראשונה בתולדותיה, הכריזה על דיבידנד רבעוני של 14 סנט למניה – סימן ברור ליציבות פיננסית ולתזרים מזומנים חזק.

 

נפח העסקאות (TPV) צמח ב-8% ל-458 מיליארד דולר, שירות “Buy Now Pay Later” צמח ביותר מ-20%, ו-Venmo (אפליקציית התשלומים החברתית שבבעלות PayPal) המשיכה להתרחב בקצב מהיר. מניית החברה כבר עלתה בכ-40% מהשפל באפריל, והשותפות עם OpenAI הוסיפה לה תנופה משמעותית, לצד שיתופי פעולה חדשים עם Google ו-Perplexity שמחזקים את נוכחותה בעולם המסחר מבוסס AI.

OpenAI דוהרת לעולם המסחר

PayPal היא לא השותפה הראשונה של OpenAI בתחום המסחר. מאז שהשיקה בספטמבר 2025 את Instant Checkout, יצרה OpenAI שיתופי פעולה עם Shopify ו-Etsy שמייצגות יחד יותר ממיליון סוחרים, ועם Walmart, שהקדימה את PayPal בשבועיים בלבד.

 

ChatGPT עצמה הפכה לפלטפורמה מסחרית בקנה מידה עצום. היא מעבדת מעל שישה מיליארד טוקנים בדקה, משרתת כ-800 מיליון משתמשים שבועיים, ומושכת כ-4 מיליון מפתחים שבונים עליה מוצרים ושירותים. מדובר בהכפלה של קהל המשתמשים מאז תחילת השנה – קצב צמיחה שמסביר למה מותגים גדולים ממהרים להצטרף.

 

אלכס כריס, מנכ”ל PayPal, סיכם זאת כך: “יש לנו מאות מיליוני משתמשים נאמנים שיכולים מעכשיו ללחוץ על כפתור ‘Buy with PayPal’ ב-ChatGPT ולקבל חוויית תשלום בטוחה, פשוטה ומיידית”.

מסחר אייג’נטי – מה זה בכלל?

“מסחר אייג’נטי” מתאר שלב חדש שבו סוכני AI כבר לא רק מגיבים לשאלות, אלא פועלים ביוזמתם – לומדים את ההעדפות של המשתמש, מזהים דפוסים ומתכננים צרכים עתידיים. במילים אחרות, הקנייה הופכת מתהליך שמנוהל על ידי הצרכן, לתהליך שהטכנולוגיה מנהלת בשבילו.

 

לפי McKinsey, מסחר מבוסס שיחה ו-AI צפוי להגיע לכ-20% מהמסחר האלקטרוני העולמי עד 2030. דאג מקמילון, מנכ”ל Walmart, תיאר זאת כך: “במשך שנים רבות חוויית הקנייה המקוונת נשענה על שורת חיפוש ורשימה אינסופית של מוצרים. זה עומד להשתנות.”

 

אלכס כריס, המנכ”ל של PayPal, הוסיף ממד מעשי: “מאות מיליוני אנשים משתמשים ב-ChatGPT מדי שבוע לעזרה במשימות יומיומיות, כולל מציאת מוצרים, ויותר מ-400 מיליון משתמשים ב-PayPal לקניות. השותפות עם OpenAI מאפשרת מעבר טבעי מצ’אט לתשלום בכמה לחיצות בלבד.”

PayPal מאמצת את ה-AI של OpenAI 

השותפות עם OpenAI חורגת מעבר לעולם התשלומים. PayPal מאמצת את הטכנולוגיה של OpenAI גם בתוך הארגון עצמו. מעל 24 אלף מעובדיה קיבלו גישה ל-ChatGPT Enterprise, המהנדסים משתמשים ב-Codex לייעול פיתוח קוד, וה-API של OpenAI שולב במוצרים ובשירותים של החברה. המהלך הוא חלק מאסטרטגיית ה-AI הרחבה של PayPal – לשפר תהליכי פיתוח, להעצים עובדים, וליצור חוויות לקוח מתקדמות יותר.

מי מרוויח מהמסחר החדש?

עבור הצרכנים, האפשרות לקנות ישירות מתוך ChatGPT מוסיפה שכבה של נוחות – חיפוש, המלצה ורכישה באותו חלון. זה מתאים במיוחד לרכישות מהירות של מוצרים כמו נעליים, אביזרים, או מוצרי בית, כאלה שלא דורשות השוואה מעמיקה בין אתרים.

 

עבור הסוחרים, היתרון ברור – מי שכבר משתמש ב-PayPal זוכה לנוכחות אוטומטית ב-ChatGPT, בלי עלויות אינטגרציה או תפעול. הקטגוריות הראשונות שייפתחו כוללות אופנה, יופי, שיפורי בית ואלקטרוניקה.

 

ההשקה צפויה להתחיל במהלך 2026 בארצות הברית ולהתרחב בהמשך לשווקים נוספים. בשלב זה אין מועד מדויק להשקה גלובלית.

 

 

נקודת מפנה או עוד שלב באבולוציית הקנייה?

השותפות בין PayPal ל-OpenAI עשויה לשנות את הדרך שבה אנחנו מבצעים רכישות אונליין. במקום לעבור בין אתרים, להשוות ולמלא טפסים, כל התהליך מתכנס לשיחה אחת עם ChatGPT – חוויה ישירה, פשוטה ומהירה יותר מכל מנוע חיפוש מסורתי. אבל היעילות הזו מגיעה עם מחיר חדש: אמון.

 

כשבינה מלאכותית מציגה לנו מוצרים, איך נדע אם זו באמת ההמלצה הטובה ביותר או תוצאה של אינטרס מסחרי? נכון לעכשיו, OpenAI לא מפרטת כיצד ChatGPT מדרגת או מסננת מוצרים, והפער הזה בין שקיפות לנוחות הוא לב הדיון.

 

PayPal מצידה בונה לעצמה מעמד מרכזי בעידן המסחר האייג’נטי. השיתופים עם Google ו-Perplexity מצביעים על אסטרטגיה רחבה, שבה התשלום הופך לחלק בלתי נראה מתהליך הקנייה, כמו שכבה סמויה בתוך השיחה. אם התחזיות יתממשו והמסחר השיחתי יגיע ל-20% מהיקף המסחר העולמי עד 2030, השותפות הזו עשויה להיזכר כרגע שבו השיחה הפכה לפעולה, והגבול בין דיאלוג למסחר נעלם כמעט לגמרי.

הפוסט PayPal ו-OpenAI משלבות כוחות הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/paypal-openai-partnership/feed/ 0
האם ה-GPT שלכם באמת משקר לכם או שזה פשוט עניין של איך אתם מדברים איתו? https://letsai.co.il/gpt-communication-challenges/ https://letsai.co.il/gpt-communication-challenges/#respond Fri, 31 Oct 2025 06:49:03 +0000 https://letsai.co.il/?p=62987 פתחתם את ה-ChatGPT, ניסחתם שאלה מדויקת וקיבלתם תשובה שנשמעה מבריקה, רק שהיא לא הייתה נכונה. לרגע זה מרגיש כאילו הבינה המלאכותית, אותה ישות חכמה שאנחנו סומכים עליה כל כך, פשוט לא אמינה. האם היא משקרת לנו? או שאולי אנחנו פשוט לא יודעים איך לדבר איתה נכון? האמת רחוקה ממזימה דיגיטלית או כוונה נסתרת. ה-GPT לא […]

הפוסט האם ה-GPT שלכם באמת משקר לכם או שזה פשוט עניין של איך אתם מדברים איתו? הופיע ראשון בLet's AI בינה מלאכותית

]]>
פתחתם את ה-ChatGPT, ניסחתם שאלה מדויקת וקיבלתם תשובה שנשמעה מבריקה, רק שהיא לא הייתה נכונה. לרגע זה מרגיש כאילו הבינה המלאכותית, אותה ישות חכמה שאנחנו סומכים עליה כל כך, פשוט לא אמינה. האם היא משקרת לנו? או שאולי אנחנו פשוט לא יודעים איך לדבר איתה נכון? האמת רחוקה ממזימה דיגיטלית או כוונה נסתרת. ה-GPT לא משקר, והוא גם לא אומר אמת. הוא מפרש. הוא מגיב למה שאנחנו כותבים לו על פי דפוסים לשוניים שלמד ממיליארדי טקסטים. במילים אחרות, הוא לא באמת “מבין” אותנו, אלא מחשב סבירות למה שנשמע הגיוני. אם נלמד להבין את ההיגיון הזה, נוכל לשפר את הדרך שבה אנחנו מתקשרים איתו ולקבל תוצאות מדויקות, יצירתיות והרבה יותר אנושיות.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

למה זה חשוב דווקא עכשיו

בשנה האחרונה הפכה הבינה המלאכותית מכלי ניסיוני למנוע עבודה משמעותי כמעט בכל תחום: כתיבה, עיצוב, שיווק, מחקר ואפילו רפואה. אבל יחד עם השימוש הנרחב נוצר פער אמון. אנחנו מצפים לתשובות מושלמות ושוכחים שהמערכת הזו לא באמת מבינה אותנו. היא רק מחשבת סבירות. כדי לעבוד איתה נכון, עלינו לשנות את נקודת המבט: לא לראות בינה מלאכותית כישות עליונה, אלא כשותפה לשיחה. וכמו בכל מערכת יחסים טובה – הכול מתחיל בתקשורת.

ה-AI לא משקר, הוא פשוט מפרש

ה-GPT לא חושב, לא מרגיש ולא מתכוון. אין לו מוסר, אג’נדה או אמת פנימית. מה שהוא כן עושה, זה לנבא את המילים הבאות בהתאם למיליארדי דפוסי שפה שלמד. כשאנחנו שואלים שאלה, הוא לא חושב על התשובה הנכונה אלא משלים את המשפט בצורה הסטטיסטית הסבירה ביותר.

 

כאן קורה לעיתים הבלבול. הוא נשמע סמכותי, הוא כותב יפה, אבל הוא לא באמת יודע. כשאין לו מידע ברור או כשההקשר חלקי, הוא מנחש ומשלים את הפערים הלשוניים כדי לייצר רצף שנשמע אמין. וזה מה שאנחנו קוראים לו “הזיות” לא כוונה לשקר, אלא תוצאה של תקשורת חלקית מול מודל שפה שאומן לייצר טקסט זורם.

 

איך לדבר נכון עם הבינה המלאכותית

כמו בהזמנת פיצה הכול תלוי בדיוק. אם נגיד “תביא משהו טעים”, נקבל תוצאה אקראית. אבל כשאנחנו מגדירים מה בדיוק אנחנו רוצים הטעם, המרקם, התוספות נקבל בדיוק את מה שדמיינו. כך גם עם GPT: ככל שנדייק את ההנחיה, כך התוצאה תהיה מדויקת, חכמה ואישית יותר. הבעיה היא לא שהוא לא מבין אותנו, אלא שאנחנו לא תמיד מדברים איתו ברור מספיק.

 

מגבלת הזיכרון (Context Window)

ה-GPT לא מחזיק בזיכרון אינסופי. הוא עובד בטווח הקשר מוגבל, כלומר מתייחס רק לחלק מהשיחה האחרונה. כששיחה מתארכת, הוא נוטה לשכוח פרטים קודמים לא מתוך רשלנות, אלא כי הוא מתעדף מידע חדש ורלוונטי במסגרת הזיכרון שלו. אם רוצים לשמור על דיוק, כדאי לסכם מדי פעם את עיקרי הדברים או לעבוד בתוך מרחב פרויקט ייעודי שבו נשמר ההקשר הרחב של הנושא. כך התקשורת נעשית עקבית, חכמה וברורה יותר.

 

חמישה כלים שיעזרו לכם לדבר טוב יותר עם LLMs

1) GPT מותאם אישית

בנו גרסה משלכם של GPT שתכיר את סגנון השפה, תחומי העניין וההעדפות שלכם. זה מאפשר תשובות עקביות ומדויקות יותר לאורך זמן, במיוחד כשהיא מחוברת למידע קבוע ומוגדר מראש.

 

2) Agents (סוכנים חכמים)

סוכנים הם שכבת בינה מעל המודל הבסיסי, שנשארת מחוברת למידע ולפרויקטים שלכם. לכל Agent יש זיכרון פנימי ויכולת לעקוב אחר מטרות, החלטות ותוצרים לאורך זמן ממש כמו עוזר אישי חכם שמנהל תחום מסוים עבורכם. בתוך ChatGPT תוכלו להפעיל את מצב הסוכן ולתת לו משימות מורכבות וארוכות – הוא יבצע אותן בצורה אוטונומית, וכשצריך לבקש רשות לבצע פעולות רגישות (אתרים עם הרשמה או סיסמה למשל), הוא יעצור ויבקש את רשותכם.

 

3) מרחבי פרויקט (Project Spaces)

כל פרויקט הוא סביבת עבודה נפרדת עם זיכרון וקונטקסט ייחודי משלו. הוא מתפקד כמו “בוט עצמאי”, ששומר על כל ההיסטוריה, השפה והעדפות העבודה באותו נושא. כך המודל לא מתחיל כל פעם מחדש, אלא ממשיך לפעול מתוך הבנה מתפתחת של הפרויקט והצוות שעובד עליו.

 

49 סיכום תקופתי

אחת לכמה שלבים עצרו, וסכמו בקצרה את מה שנאמר עד כה. זה מחזק את ההקשר ואת הדיוק של השיחה הבאה, במיוחד בפרויקטים ארוכים או שיתופיים.

 

5) ניסוח מדויק וברור

אל תשאירו מקום לפרשנות. כתבו בקשות בצורה ישירה, עם מטרה, טון וקהל יעד. ניסוח מדויק הוא הדלק של הבינה המלאכותית וככל שהוא חד יותר, כך גם התוצאה.

 

ההבדלים בין המודלים: כל אחד והמומחיות שלו

  • ChatGPT (OpenAI) – רב-תכליתי וגמיש, מצטיין בכתיבה, אסטרטגיה ותוכן יצירתי.

    Gemini (Google) – מתמקד באינטגרציה בין מקורות מידע ובשימוש בכלים חיצוניים.

    Claude (Anthropic) – ידוע בשיחות טבעיות ובטון אנושי ורגיש.

    Perplexity – משלב בין חיפוש אינטראקטיבי למענה מבוסס ידע בזמן אמת.

    Copilot (Microsoft) – מותאם לעולם הקוד והפיתוח, ויודע להשתלב בכלי עבודה מקצועיים.

כולם מבוססים על אותו רעיון: הם מגיבים לדרך שבה אנחנו מתקשרים איתם.

 

אחריות אנושית: לסמוך אבל לבדוק

כאשר ה-GPT ממציא עובדות, הוא לא עושה זאת בכוונה הוא פשוט מנסה למלא חלל במידע. התשובה שלו נשמעת אמינה ולכן אנחנו נוטים להאמין לה. אבל האחריות האמיתית היא שלנו לבדוק, לוודא ולשמור על חשיבה ביקורתית. ה-AI הוא כלי עוצמתי, אבל הוא עדיין כלי. והערך האנושי האמיתי הוא לדעת מתי להשתמש בו ומתי לא.

 

לדבר בינה מלאכותית זו שפה חדשה

בינה מלאכותית לא נועדה להחליף אותנו, אלא להעצים אותנו. היא לא באה לחשוב במקומנו, אלא לעזור לנו לחשוב טוב יותר, לדייק וליצור בקצב ובאיכות שלא הכרנו קודם. ככל שנלמד להשתמש בה נכון, כך נגלה שהיא לא איום אלא כלי אדיר שמאפשר לנו לגדול, להתרחב ולהיות אנושיים יותר דווקא בעולם טכנולוגי. AI הוא לא מחליף לאדם. הוא השותף החדש שלנו ליצירה, להבנה ולחדשנות.

הפוסט האם ה-GPT שלכם באמת משקר לכם או שזה פשוט עניין של איך אתם מדברים איתו? הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/gpt-communication-challenges/feed/ 0