כתבות ומדריכים בנושא כתבות ומדריכים בנושא מודלי שפה | Let's AI בינה מלאכותית https://letsai.co.il/articles/language-models/ בינה מלאכותית Fri, 12 Dec 2025 13:33:32 +0000 he-IL hourly 1 https://wordpress.org/?v=6.8.3 https://letsai.co.il/wp-content/uploads/2024/03/cropped-logo-lets-ai-32x32.webp כתבות ומדריכים בנושא כתבות ומדריכים בנושא מודלי שפה | Let's AI בינה מלאכותית https://letsai.co.il/articles/language-models/ 32 32 האם GPT-5.2 הוא התרופה של OpenAI ל-Gemini-3? https://letsai.co.il/gpt-5-2-launch/ https://letsai.co.il/gpt-5-2-launch/#respond Fri, 12 Dec 2025 09:59:34 +0000 https://letsai.co.il/?p=65987 אתמול (חמישי, 11.12.25) השיקה OpenAI את GPT-5.2 במהלך שנתפס על-ידי רבים יותר כתגובה המתבקשת ל-Gemini3 של גוגל, ופחות כמודל דגל חדש. המודל החדש אמנם מציג שיפורים חשובים, אך השאלה המרכזית שמרחפת מעליו היא האם הוא יצליח לתת פייט למתחרים מ-Google? האם עדכון כזה מסוגל באמת להחזיר את העליונות ש-OpenAI ביססה פה לאורך כמעט 3 שנים […]

הפוסט האם GPT-5.2 הוא התרופה של OpenAI ל-Gemini-3? הופיע ראשון בLet's AI בינה מלאכותית

]]>
אתמול (חמישי, 11.12.25) השיקה OpenAI את GPT-5.2 במהלך שנתפס על-ידי רבים יותר כתגובה המתבקשת ל-Gemini3 של גוגל, ופחות כמודל דגל חדש. המודל החדש אמנם מציג שיפורים חשובים, אך השאלה המרכזית שמרחפת מעליו היא האם הוא יצליח לתת פייט למתחרים מ-Google? האם עדכון כזה מסוגל באמת להחזיר את העליונות ש-OpenAI ביססה פה לאורך כמעט 3 שנים – אותה עליונות שגוגל סדקה (או שמא נאמר – ריסקה) לפני מספר שבועות. מה שבטוח – יש פה ניסיון ברור להדביק פער שנפתח מהר מדי, ושנדמה שהולך וגדל עם כל שדרוג והשקה מצד גוגל (ויש הרבה כאלה לאחרונה). המלחמה מתחממת ועולה הילוך! ב-OpenAI מבינים שזו תקופה מכרעת ובהחלט אפשר לזהות את הלחץ שמאחורי ההשקה. אבל בשורה התחתונה – האם זה מודל מספיק טוב כדי לעצור את שטף ביטולי המנויים בתשלום והמעבר לג’מיניי? במילה אחת… אולי. כן – זה מודל מצוין. אבל לא – לא בטוח שהוא התרופה לעלייתה של גוגל ומודל הדגל שלה – Gemini.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

הכל התחיל מחלום, לפני 10 שנים

לפני 10 שנים ישבו חבורה של Dreamers והחליטו שהעתיד טמון בבינה מלאכותית. אט אט התחוור להם שפריצת הדרך תהיה במה שאנחנו היום מכנים “מודלי שפה גדולים” (LLMs). משם הדרך ל-GPT הייתה קצרה ולפני 3 שנים זה קרה. GPT 3.5 הושק לעולם בקול תרועה רמה, וההיסטוריה האנושית השתנתה לעד. המודל הזה הצית מהפכה שעד היום רק הלכה והתעצמה, ושסוללת מחדש את האופן בו בני אדם מתקשרים עם טכנולוגיה, עובדים עם טכנולוגיה ויוצרים עם טכנולוגיה.

 

 

ואכן, ב-3 השנים האחרונות היה נדמה ש-ChatGPT משאיר לכולם אבק. המוצר הצומח ביותר בהיסטוריה האנושית – יותר מספוטיפיי, יותר מטיקטוק, יותר מנטפליקס ויותר מאינסטגרם! מיליון משתמשים תוך 5 ימים. 100,000 משתמשים תוך חודשיים ונכון להיום כ-800 מיליון משתמשים שבועיים.

ואז הגיע נובמבר 2025…

 

האם לבטל את המנוי?

בשבועות האחרונים שמעתי הרבה מאוד אנשים, קולגות ומשפיענים שמצהירים: “ביטלתי את המנוי שלי ל-ChatGPT ועברתי ל-Gemini”. חייב לומר שאני לא שם לא הצליחו עדיין לשכנע אותי ש-ChatGPT הפסיק להיות כלי עבודה יעיל במיוחד – מבחינתי מדובר ב”סוס עבודה” בו אני עושה שימוש יומיומי, או ליתר דיוק – שימוש שוטף על בסיס כמעט שעתי. מצד שני, יש לי מנוי לכמעט כל LLM מוביל בשוק, החל מ-Claude ועד Gemini ובהחלט התפעמתי מההתקדמות האדירה של ג’מיניי בשבועות האחרונים.

 

למה מאמר על ChatGPT סוטה והופך למאמר על Gemini? כי ההשוואה מתבקשת. אחת התובנות המרכזיות שלי, בתור מי שחורש על כל אחת מהפלטפורמות, היא שאנחנו זכינו – ואנחנו זה הציבור הרחב. המשתמשים. זכינו לחיות בתקופה של שפע, שבה ענקיות טק ותאגידי AI גלובליים מתחרים על תשומת הלב שלנו (והארנק שלנו). ההבדלים כיום בין מודלי הדגל דיי מינוריים. כולם מאוד מאוד טובים, וגם היו מאוד מאוד טובים לפני חצי שנה ושנה.

 

בג’מיניי אמנם יש המון פיצ’רים חדשים ומאוד טובים – מודל תמונות מעולה (ננו בננה פרו), פיצ’רים מעולים לויזואליזציה של נתונים (מצגות, קנבס), מודל וידאו מעולה (Veo 3.1), וכולם יושבים באותו מקום. יש לו Deep Research מ-ט-ו-ר-ף (ואולי הכי טוב בשוק) ופלטפורמת בניית בוטים חביבה במיוחד (Gems). מצד שני – איכשהו בעבודה השוטפת, היומיומית, אני מוצא את עצמי חוזר לג’פטו הישן והטוב. הוא מגיב מהר יותר. זורם יותר. רץ חלק. לפעמים עומס וגודש של כוח חישוב מוביל לתוצאות טובות יותר, אבל גם לחוויית משתמש פחות טובה.

 

ב-Gemini אמנם אפשר להחליף בין מודל של חשיבה מעמיקה, למודל זריז יותר, אבל מודלי GPT של OpenAI מרגישים הרבה יותר “אייג’נטליים”. כלומר – הם מגיבים יותר טוב לשינויים. החל מסדרת מודלי GPT-5, לא צריך להחליף ידנית מודל בבורר המודלים. ב-ChatGPT של סוף 2025, בואכה 2026, הכל עובד חלק יותר. כשהמודל מזהה משימה קלה – הוא עובד זריר, שולף מודל Instant ועונה מהר. כשהוא מזהה משימה מורכבת יותר – הוא חושב חזק ועמוק יותר. ומשהו בכל אותה חוויית שימוש, לי עושה שכל. פשוט “כיף” לעבוד שם. ושוב – זה לא שב-Gemini לא כיף לי, אבל יש דברים שקשה לשים עליהם את האצבע: אמינות, יציבות, זרימה וכן הלאה. את כל אלו ChatGPT שכללו לאורך 3 שנים של שליטה ללא עוררין בתעשייה. וזה עדיין שם!

 

קוד אדום אחד והרבה לחץ

בתחילת החודש הכריז אלטמן על “קוד אדום”, נטישת פרויקטים צדדיים ומיקוד במשימות הליבה – ב-ChatGPT הקלאסי. וההשקה של GPT-5.2 מדברת בשפה אחרת – היא מבליטה פרודוקטיביות ויעילות: לא סתם שיפור בביצועים או מבחנים, אלא אאוטפוטים טובים יותר: סוכנים שעובדים טוב יותר לאורך זמן, יצירת קבצי אקסל מרובי גיליונות (אם תשאלו אותי – ChatGPT היא עדיין הפלטפורמה המובילה בכל מה שקשור לניתוח נתונים וקבצי אקסל ו-CSV). במילים אחרות, OpenAI מנסה להחזיר לעצמה יתרון תדמיתי וטכני לא דרך טריקים, אלא דרך חיזוק המוצר שמייצר לה את רוב הקשר היומיומי עם השוק.

 

באנר קורס דאטה ניתוח נתונים עם AI

 

מה מיוחד ב-GPT-5.2

אז אחרי ההקדמה הלא קצרה הזו, בואו נצלול פנימה אל תוך ביצועי המודל – מה חדש? מה השתנה? במה הוא טוב והאם יש פה בשורה אמיתית?

 

מודל אייג’נטלי ו-3 מצבי חשיבה

כמו בכל מודלי GPT-5 ומעלה, גם פה המודל “בוחר בשבילכם” כשהוא על מצב AUTO ומסוגל לדלג ולקפץ בין מצבי חשיבה שדורשים יותר כוח חישוב (מודלי הריזונינג שמקוטלגים כ-“Thinking”). או במילים אחרות – אתם מקריבים מהירות תמונות ביצועים טובים יותר (יותר כוח חישוב = פחות הזיות וטעויות, ויותר אמינות ודיוק).

 

כמובן, אפשר תמיד לבחור ידנית את מודל Instant המהיר, או מודל Thinking הכבד יותר, וגם בו אפשר להגדיר ידנית מצב חשיבה “רגיל” (Standard), או מצב חשיבה מעמיקה (Extendend Thinking). מצב זה מתאים במיוחד למשימות מורכבות או רב-שלביות. משימות כמו ניתוח קבצים ונתונים, ריבוי דאטה וכן הלאה.

 

מנויי פרו נהנים ממצב חשיבה עוצמתי יותר: GPT‑5.2 Pro. מודל עוצמתי אף יותר ממצב Thinking שמיועד למשימות מורכבות וארוכות באמת. אבל ל-99% מהמשתמשים אין באמת צורך בעוצמות חישוב כאלה.

 

כל מה שתיארתי פה, לא באמת ייחודי ל-GPT-5.2 והיה קיים בדורות הקודמים של סדרת GPT-5, ועדיין – הביצועים השתפרו וזה מורגש!

 

פחות הזיות וטעויות, יותר אמינות והקשר!

הנקודה השנייה היא אמינות. GPT-5.2 מציג ירידה משמעותית בהזיות וטעויות עובדתיות לעומת GPT-5.1 (כ-38% פחות טעויות עובדתיות).

לטענת החברה, GPT-5.2 מכוון לעבודה מקצועית יציבה ואמינה – פרויקטים שנמשכים לאורך הרבה שלבים, שזקוקים להקשר גדול ושמכילים הרבה פעולות. ביומיום כל זה מתורגם לפחות קריסות באמצע תהליכי עבודה, פחות חורים לוגיים בין שלבים, ויותר יכולת להחזיק מסמך, פרויקט או סט משימות לאורך זמן. פחות “צ’אט” ויותר דאטה אנליסט צמוד. מכשיר עוצמתי לניתוח נתונים, קבצים, לקריאה וכתיבה של תוכן. כלי שמצטיין ב”הסקה” (Reasoning) ואיתור דפוסים, מגמות והקשרים.

 

ביצועים ומבחנים

ביצועים טובים במבחני ידע

מבחן GDPval זהו מבחן שמנסה למדוד עד כמה מודל יודע לבצע משימות עבודת ידע “מוגדרות היטב” על פני 44 עיסוקים, כאשר במקום תשובה קצרה הוא נדרש לייצר תוצר עבודה אמיתי כמו מצגת, גיליון אלקטרוני או מסמך תפעולי, וההערכה נעשית על ידי שופטים אנושיים. המבחן הזה בודק כמה פעמים המודל מצליח לנצח אנשי מקצוע מומחים בתחומם, או להגיע לתיקו מולם. מודל GPT-5.2 Thinking הצליח לנצח או לסיים בתיקו מול אנשי מקצוע ב-70.9% מהמקרים, וגרסת GPT-5.2 Pro הגיעה ל-74.1%. מדהים! OpenAI גם טוענת שבמשימות האלה המודל ייצר תוצרים במהירות גבוהה פי 11 ובעלות שנמוכה מ-1% ביחס לעבודה אנושית.

 

GDPval

מנצח מומחים אנושיים במבחני GDPval | קרדיט: OpenAI

 

ניתוח נתונים ו/או יצירת קבצים מרובי-גיליונות

מבחן פנימי לגיליונות בנקאות השקעות (Spreadsheet modeling), הוא מדד פנימי של OpenAI שמדמה עבודת אנליסט זוטר בבנקאות השקעות. לפי הנתונים, GPT-5.2 Thinking משפר את הציון הממוצע למשימה מ-59.1% ב-GPT-5.1 ל-68.4% ב-5.2 – עלייה של 9.3% בממוצע לכל משימה.

 

מצטיין בניתוח קבצים ונתונים

מצטיין בניתוח קבצים ונתונים | Credit: OpenAI

 

קוד, מתמטיקה והסקה: חיזוק הדרג המקצועי

בתחום הקוד, OpenAI מדגישה שיפור בביצועים במדדים כמו SWE-Bench Pro ו-SWE-bench Verified, כאשר המספרים שמופיעים מצביעים על עלייה ביחס ל-GPT-5.1 Thinking. מעבר לתוצאות, הקו הכללי הוא שיפור בעבודה פרקטית: תיקון באגים, רפקטורינג לקוד בסיס גדול, יישום פיצ’רים ושילוח תיקונים מקצה לקצה עם פחות התערבות ידנית.

 

בתחומי מתמטיקה ומדע, ההכרזה מציינת תוצאות גבוהות במדדים כמו GPQA Diamond וגם AIME 2025, לצד שיפור במדדים מתקדמים יותר כמו FrontierMath.

מבחן GPQA Diamond (שאלות מדע “עמידות גוגל”) הוא בנצ’מרק של שאלות מדע ברמה גבוהה (פיזיקה, כימיה, ביולוגיה) שנועדו להיות קשות לחיפוש מהיר, ובגרסה שמוצגת כאן המודל פותר ללא שימוש בכלים. AIME 2025 (מתמטיקה תחרותית): זהו מבחן מתמטיקה תחרותי שמודד פתרון בעיות ממוקדות בלחץ דיוק, ללא כלים.

מי שלא חי את עולם הבנצ’מרקים יכול לתרגם את זה להבנה הפשוטה הבאה: OpenAI מנסה להראות שהמודל לא רק “מנסח יפה”, אלא גם מחזיק חזק יותר כשנדרשת חשיבה מרובת שלבים ודיוק כמותי. הוא מצטיין בביצועים במתמטיקה ומדע, גם כשהמודל שלפניו (GPT-5.1) עשה את זה טוב (הוא פשוט עושה את זה טוב יותר… חכם יותר).

מצטיין במתמטיקה וכתיבת קוד

מצטיין במתמטיקה,מדעים וכתיבת קוד | Credit: OpenAI

 

אחד השיפורים המשמעותיים הוא ביכולות ההסקה המופשטת במדדי ARC-AGI, עם קפיצה משמעותית בתוצאות מול גרסאות קודמות. מבחנים אלו מנסים למדוד יכולת לפתור בעיות מופשטות שלא דומות לשאלות ידע רגילות, עם מיקוד במה שנחשב “חשיבה חדשה” ולא שחזור תבניות. או במילים אחרות – להתמודד עם מצבים שבהם המודל לא נתקל לפני כן בשלב האימון, ממש כמו שאדם אמיתי נדרש לפתור בעיות חדשות שעליהן לא “התאמן” או למד מראש. לפי OpenAI, ב-ARC-AGI-1 (Verified) GPT-5.2 Thinking מגיע ל-86.2% לעומת 72.8% ב-5.1, וב-ARC-AGI-2 (Verified) הוא קופץ ל-52.9% לעומת 17.6%. פה כבר מדובר בפערים גדולים.

מצטיין במבחני ARC AGI

מצטיין במבחני ARC AGI | קרדיט: OpenAI

 

 

למי זה זמין, איפה וכמה זה עולה

 

זמינות בתוך ChatGPT

המודל החדש כבר זמין ב-ChatGPT למנויים בתשלום בתשלום – מנויי פלוס (Plus), פרו (Pro), ביזנס (Business) ואנטרפרייז (Enterprise). חלק מהמשתמשים יקבלו אותו בהדרגה, כדי להבטיח פריסה יציבה.

 

זמינות ב-API ותמחור למפתחים

ב-API, המודלים זמינים כבר עכשיו לכל המפתחים. יש גם פרמטר של “מאמץ חשיבה” (reasoning effort) ותמיכה ברמה נוספת בשם xhigh למשימות שבהן איכות חשובה יותר מזמן.

 

בתמחור, OpenAI מציגה מחיר של 1.75 דולר למיליון טוקנים בקלט ו-14 דולר למיליון טוקנים בפלט עבור gpt-5.2, לצד הנחה משמעותית על קלטים שמורים במטמון. לגרסת Pro המחירים גבוהים משמעותית, עם 21 דולר למיליון טוקנים בקלט ו-168 דולר למיליון טוקנים בפלט. יקר!

מחיר למיליון טוקנים ב-API

מחיר למיליון טוקנים ב-API

 

פסק הדין

GPT-5.2 מגיע עם שיפור ניכר בכתיבה, קוד והיגיון, ועם דגש על הבנה עמוקה הודות לשמירה על הקשר לאורך זמן. זו לא “התשובה” ל-Gemini 3, אלא ניסיון להעלות זריז לכותרות מודל שיחזיר את GPT לשיח הציבורי. גוגל קיבלה המון תשומת לב בשבועות האחרונים וב-OpenAI נלחצו. זה לא ה-מודל שלה. זה פשוט ‘עוד’ מודל (מאוד מאוד טוב), שכנראה לא ישכנע אתכם לעבור מ-Gemini ל-ChatGPT, אבל אולי כן יהיה מספיק כדי להשאיר אתכם ב-ChatGPT ולמנוע מכם לנטוש את הספינה. ואם התחלנו באלגוריית הספינה – אז שלרגע אף אחד לא יחשוב שהיא טובעת – ראיתי הרבה שמספידים את OpenAI. אין לי ספק שהם יתאפסו על עצמם ויצמצמו את הפער. יש להם מוצר מעולה ועכשיו הם צריכים לקחת אותו צעד אחד למעלה. 

הפוסט האם GPT-5.2 הוא התרופה של OpenAI ל-Gemini-3? הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/gpt-5-2-launch/feed/ 0
איך בינה מלאכותית משנה את העבודה באנטרופיק – ומה זה אומר על העתיד שלנו https://letsai.co.il/ai-transforming-work-anthropic/ https://letsai.co.il/ai-transforming-work-anthropic/#respond Tue, 09 Dec 2025 07:46:13 +0000 https://letsai.co.il/?p=65652 אם רוצים להבין איך תיראה העבודה של מהנדסים ואנשי ידע בעוד כמה שנים, כדאי להסתכל על מה שקורה היום באנטרופיק. זו לא מצגת חזון על “עתיד העבודה”, אלא תיאור יחסית נדיר של מה קורה כש-AI נכנס עמוק ליום עבודה אמיתי, אצל האנשים שבונים את המודלים בעצמם. אנטרופיק, החברה שפיתחה את Claude, סקרה כ-132 מהנדסים, ערכה […]

הפוסט איך בינה מלאכותית משנה את העבודה באנטרופיק – ומה זה אומר על העתיד שלנו הופיע ראשון בLet's AI בינה מלאכותית

]]>
אם רוצים להבין איך תיראה העבודה של מהנדסים ואנשי ידע בעוד כמה שנים, כדאי להסתכל על מה שקורה היום באנטרופיק. זו לא מצגת חזון על “עתיד העבודה”, אלא תיאור יחסית נדיר של מה קורה כש-AI נכנס עמוק ליום עבודה אמיתי, אצל האנשים שבונים את המודלים בעצמם. אנטרופיק, החברה שפיתחה את Claude, סקרה כ-132 מהנדסים, ערכה 53 ראיונות עומק וניתחה בערך 200 אלף סשנים של Claude Code כדי להבין איך העבודה שלהם משתנה. לפי הדיווח של המהנדסים, Claude מעורב היום בכ-60% מהעבודה שלהם, והם מדווחים על עלייה ממוצעת של כ-50% בפרודוקטיביות בהשוואה לעבודה בלי AI. שנה קודם, השימוש היה סביב 28% מהעבודה והעלייה בפרודוקטיביות הוערכה בכ-20%.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

לפני שממשיכים, חשוב לזכור את המסגרת: זה מחקר פנימי של חברה מסחרית, על מהנדסים שהם משתמשים מתקדמים במיוחד, והמדדים מבוססים ברובם על דיווח עצמי. אין כאן מדידה אובייקטיבית של תפוקה לאורך שנים, אלא צילום מצב עשיר של איך אנשים מרגישים ועובדים בתוך אחד מארגוני ה-AI הכי מתקדמים. ובדיוק בגלל זה, מה שקורה שם הוא כנראה הצצה מוקדמת למה שעוד יגיע לשאר השוק.

לא רק לחסוך זמן – לעשות עבודה שלא הייתה קיימת

הנתונים היבשים מספרים סיפור אחד. העדויות מהשטח מספרות סיפור קצת אחר.

 

על פניו, המספרים מרשימים – יותר שימוש ב-AI, קפיצה בתחושת הפרודוקטיביות, ואפילו קבוצה של כ-14% מהנדסים שמתארים קפיצה של יותר מפי 2 בתפוקה. אבל כשמסתכלים על איך המהנדסים מתארים את היום יום, מתגלה ניואנס חשוב – זה פחות “אני עושה את אותה עבודה בחצי זמן”, ויותר “אני מספיק הרבה יותר דברים שלא היו נכנסים לי בכלל ללו״ז”.

 

השפעת Claude על זמן לעומת תפוקה

השפעת Claude על זמן לעומת תפוקה | Anthropic

 

בערך 27% מהעבודה שנעשית היום עם Claude, לפי הסקר, פשוט לא הייתה נעשית בלעדיו. מהנדסים מדברים על:

  • תיקון באגים קטנים ומעצבנים שהיו נדחים שוב ושוב.

  • בנייה של כלים פנימיים ודאשבורדים שמשפרים את החיים בצוות, אבל אף פעם לא נכנסו ל”עדיפויות”.

  • עבודת חקר טכנית שלא הייתה כדאית אם היו צריכים לבצע אותה ידנית.

חוקר אחד מתאר שהוא מריץ כמה מופעי Claude במקביל, שכל אחד בודק כיוון אחר לפתרון בעיה. הוא מסביר שאנשים חושבים על מודלים מתקדמים כמו על “מכונית מהירה יותר”, אבל בפועל זה יותר כמו “יש לך כוח סוס כמעט אינסופי לבדוק רעיונות”. זה שינוי לא רק בכמה מהר עובדים, אלא בכמה אפשר לנסות.

מהנדסים כמנהלי אורקסטרציה, לא רק ככותבי קוד

שינוי נוסף שמופיע שוב ושוב בראיונות הוא הרחבת תחומי המומחיות בפועל. הגבולות המסורתיים של “אני Backend”, “אני Frontend”, “אני רק מחקר” נפתחים. מהנדסי Backend מספרים איך הם בונים ממשקי משתמש מורכבים בעזרת Claude. חוקרים יוצרים ויזואליזציות נתונים ואוטומציות סביב הניסויים שלהם. צוותי אבטחה משתמשים ב-Claude כדי לקרוא ולנתח קוד שהם לא מכירים.

 

אחד המהנדסים מספר שהצליח, בעזרת Claude, לבנות ממשק משתמש ברמת איכות שבחיים לא היה מגיע אליה לבדו בזמן שהיה לו. המעצבים שאלו אותו אם הוא פתאום נהיה מומחה UI. הוא ענה את האמת: “Claude בנה, אני רק ניהלתי.” התפקיד זז לאט לאט מכותב קוד למנהל אורקסטרציה – זה שמפרק את הבעיה, מנסח את הדרישות למודל, בודק את הפלטים, מחבר אותם למערכת הקיימת ולוקח אחריות על התוצאה.

 

תדירות המשימות ב-Claude Code לפי קטגוריות

עלייה חדה במימוש פיצ’רים, תכנון ו-Front-End תוך חצי שנה | Anthropic

 

הנתונים מ-Claude Code מחזקים את זה. אנטרופיק מדווחת שבסשן טיפוסי, המודל מחזיק היום בערך פי שניים יותר “צעדים ברצף” לפני שהוא צריך קלט חדש מהמשתמש ביחס ללפני חצי שנה. שיעור המשימות שעוסקות בתכנון ועיצוב קוד עלה מאזור האחוז הבודד לכ-10%. מימוש פיצ’רים חדשים קפץ מכ-14% לכמעט 37% מהשימוש. המודל כבר לא רק “עוזר לכתוב פונקציה”, אלא מעורב בשלבים עמוקים יותר של בניית המוצר.

 

שיעור המהנדסים שמשתמשים ב-Claude מדי יום לכל קטגוריית משימה

שיעור המהנדסים שמשתמשים ב-Claude מדי יום לפי משימות | Anthropic

 

ועדיין, כששואלים את המהנדסים כמה מהעבודה הם יכולים “להאציל לגמרי” ל-Claude, רובם נשארים באזור 0-20 אחוז. הסיבה פשוטה – ברוב הזמן הם לא משחררים משימה ונעלמים, אלא עובדים עם Claude יחד, צעד אחרי צעד. זה לא רובוט אוטונומי, זה שותף שצריך ניהול.

 

עלייה באוטונומיה של Claude

עלייה באוטונומיה של Claude

 

חשוב לראות שהשינוי הזה אינו מתקיים רק בצוותי פיתוח. השימוש ב-Claude חוצה צוותים וסוגי תפקידים, וכל מחלקה משתמשת בו באופן אחר.

 

ככה נראית ההתפשטות הארגונית של העבודה האוטומטית:

 

שימוש ב-Claude לפי צוותים שונים

התפלגות משימות Claude Code לפי סוג צוות | Anthropic

מיומנויות, יחסים וזהות מקצועית

ככל שיותר מהעבודה עוברת דרך Claude, מתחילים לצוף גם צדדים פחות נוחים.

 

הראשון הוא שחיקה אפשרית של מיומנויות. לא בקפיצה אחת, אלא בשחיקה איטית. במקום לקרוא דוקומנטציה, לעבור על קוד לבד, ולהיאבק עם באגים, מהנדסים רבים מדלגים ישר לפתרון. חלקם אומרים במפורש שהם מרגישים שאיבדו חלק מה”חוש” שנבנה כשהיו עושים דברים “בדרך הקשה”.

 

מהנדס בכיר אומר שהוא משתמש ב-AI בעיקר במשימות שבהן הוא כבר יודע איך התשובה בערך צריכה להיראות, ולכן יכול לפקח על האיכות. הוא מוסיף שאם היה בתחילת הקריירה, כנראה היה צריך להשקיע הרבה יותר מאמץ מודע כדי לוודא שהוא לא פשוט מאמץ את מה שהמודל נותן.

 

כאן נוצר פרדוקס לא קטן – כדי לפקח על Claude היטב, צריך בדיוק את אותן מיומנויות שעלולות להישחק משימוש מוגזם בו. חלק מהמהנדסים מתארים שהם בכוונה עובדים לפעמים בלי AI, כדי להישאר חדים.

 

המחקר גם מצביע על שינוי ביחסים בין אנשים. Claude הפך לתחנה הראשונה לשאלות שפעם היו מופנות לעמיתים. מהנדסים מספרים שהם שואלים עכשיו הרבה יותר שאלות באופן כללי, אבל 80-90 אחוז מהן הולכות למודל. מצד אחד, זה חוסך “מבוכה” ופוגע פחות בזמן של אחרים. מצד שני, חלק מהבכירים אומרים בגלוי שזה עצוב לראות כמה פחות ג’וניורים מגיעים אליהם. המודל עושה אופטימיזציה לשאלה, אבל חונכות וקשרים אנושיים לא נבנים מעצמם.

 

ולבסוף, יש את השאלה הגדולה של הקריירה. חלק מהמהנדסים בעמדות בכירות מרגישים יחסית בטוחים. הם יודעים לקחת אחריות, לתכנן מערכות, לנהל סיכונים. אבל גם הם מודים שקשה להם להמר על אילו מיומנויות יהיו רלוונטיות בעוד חמש או עשר שנים. אחרים מנסחים תחושה קיצונית יותר: “אני מרגיש שאני בא לעבודה כל יום כדי לעבוד על הטכנולוגיה שייתכן שתהפוך אותי ואת עוד רבים ללא רלוונטיים.”

 

זה לא סיפור של “איום מיידי”. זה סיפור של מקצוע שנמצא בתנועה מתמשכת, בלי מפה ברורה.

 

 

מה אפשר ללמוד מזה מחוץ לאנטרופיק

אנטרופיק מדגישה שהמהנדסים שלה לא מייצגים את כל שוק העבודה. הם עובדים עם הכלים הכי מתקדמים, הם קרובים למודל, והתרבות הארגונית שלהם מותאמת לזה. אבל מה שקורה שם היום הוא לכל הפחות אזהרה מוקדמת, או אולי הזדמנות מוקדמת, לכל ארגון שמכניס AI לעבודה היומיומית.

 

יש כמה מסקנות שקשה להתעלם מהן:

1. AI באמת מגדיל תפוקה, אבל משנה את סוג העבודה: לא מדובר רק בקיצוץ זמן על משימות קיימות, אלא ביצירה של קטגוריות עבודה חדשות – ניסויים, כלים פנימיים, תיקונים קטנים. ארגונים שלא ימצאו דרך לתרגם את “עוד עבודה” הזאת לערך אמיתי, עלולים פשוט להציף את עצמם בעשייה.

2. מיומנויות עמוקות לא נשמרות לבד: אם נותנים ל-AI להיכנס לכל שלב, צריך במקביל לחשוב איך שומרים על יכולת הבנה עצמאית של מערכות, במיוחד אצל ג’וניורים. זה לא קורה מעצמו.

3. חונכות ויחסים מקצועיים צריכים תכנון מודע: אם רוב השאלות הולכות למודל, צריך ליצור במכוון מרחבים שבהם אנשים כן שואלים אחד את השני, כן יושבים על קוד ביחד, כן רואים איך אחרים חושבים.

4. זהות מקצועית תעבור שינוי: מהנדסים, אנשי מוצר, אנליסטים ועוד מקצועות יהיו פחות “עושים הכל ידנית”, ויותר מנהלי תהליכים וסוכנים. זה דורש שפה אחרת כשיושבים לדבר על קריירה, קידום ופיתוח מקצועי.

במובן הזה, המחקר של אנטרופיק הוא לא תשובה, אלא מראה. הוא מראה איך נראית עבודה כש-AI הופך להיות שכבת תשתית יומיומית, ולא גימיק. מי שמסתכל עליה ברצינות, יכול להתחיל לתכנן היום איך הוא רוצה שהשילוב הזה ייראה אצלו, לפני שהשינוי יכפה עליו מבחוץ.

 

לכל מי שרוצה לקרוא את המחקר המלא, כנסו כאן.

הפוסט איך בינה מלאכותית משנה את העבודה באנטרופיק – ומה זה אומר על העתיד שלנו הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/ai-transforming-work-anthropic/feed/ 0
גוגל הרסה את מסיבת יום הולדת 3 של ChatGPT ו-OpenAI מכריזה על ״קוד אדום״ https://letsai.co.il/openai-code-red/ https://letsai.co.il/openai-code-red/#respond Thu, 04 Dec 2025 12:28:41 +0000 https://letsai.co.il/?p=65459 תחילת דצמבר 2025 הייתה אמורה להיות חגיגה. ChatGPT ציין שלוש שנים מאז שהפך מכלי ניסוי למוצר שמיליונים עובדים וחיים איתו מדי יום, וביסס את OpenAI כמובילת עידן ה-AI הג’נרטיבי. במקום מסיבה, העובדים קיבלו מזכר מסם אלטמן עם הכותרת “קוד אדום”. לפי דיווחים, זו הייתה העלאה מ”קוד כתום” לדרגת החירום הגבוהה ביותר. אלטמן כתב: “We are […]

הפוסט גוגל הרסה את מסיבת יום הולדת 3 של ChatGPT ו-OpenAI מכריזה על ״קוד אדום״ הופיע ראשון בLet's AI בינה מלאכותית

]]>
תחילת דצמבר 2025 הייתה אמורה להיות חגיגה. ChatGPT ציין שלוש שנים מאז שהפך מכלי ניסוי למוצר שמיליונים עובדים וחיים איתו מדי יום, וביסס את OpenAI כמובילת עידן ה-AI הג’נרטיבי. במקום מסיבה, העובדים קיבלו מזכר מסם אלטמן עם הכותרת “קוד אדום”. לפי דיווחים, זו הייתה העלאה מ”קוד כתום” לדרגת החירום הגבוהה ביותר. אלטמן כתב: “We are at a critical time for ChatGPT”. המסר היה ברור: עוצרים פרויקטים צדדיים ומתרכזים שוב בליבה. ובכל זאת, צריך לזכור שגם בעולם הטכנולוגיה “קוד אדום” הוא לא מטבע נדיר. גוגל עצמה הכריזה על “code red” בסוף 2022 כשהשקת ChatGPT ערערה את עמדתה בחיפוש. עכשיו התפקידים התהפכו: הפעם OpenAI היא שמרגישה את הלחץ. משהו בסיסי במאזן הכוחות השתנה.

 

OpenAI הכריזה קוד אדום

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

גוגל שברה את הרצף

הסיבה להכרזת הקוד האדום הייתה טכנית, אבל המשמעות שלה אסטרטגית לחלוטין.

 

בנובמבר 2025 השיקה גוגל את Gemini 3 Pro. לפי מסמכי המודל של Google DeepMind וניתוחים עצמאיים שהתפרסמו באותה תקופה, זה היה הדגם הראשון של גוגל שעבר את מודלי GPT במספר מבחנים שנחשבים לעומק המודיעיני של מודלים: חשיבה מופשטת, פתרון בעיות כלליות ומתמטיקה תחרותית.

 

גם בתחום הקוד נרשם שינוי. במבחנים שמדמים עבודה אמיתית על בעיות תוכנה ולא רק משימות תיאורטיות, Gemini 3 Pro הציג עליונות על פני דורות קודמים של GPT. במבחני שאלות עובדתיות רחבות, הפער היה מורגש במיוחד.

 

עם זאת, לא בכל קטגוריה גוגל מובילה. במבחני SWE-Bench, שמודדים פתרון בעיות בקוד אמיתי, שלושת המודלים המובילים – Gemini 3 Pro, GPT-5.1 ו-Claude Opus 4.5 – נמצאים כולם באותו טווח ביצועים, מה שמלמד שאין מנצח ברור.

 

אבל התחושה בשוק השתנתה. כאשר מודל אחד מצטיין במספר תחומים מרכזיים כמו חשיבה, מתמטיקה וקוד, זה כבר לא עוד שדרוג מחזורי. זו נקודת מפנה. לראשונה מאז 2022, OpenAI לא נראתה כמי שמובילה באופן ברור את רוב המבחנים החשובים.

ChatGPT עדיין שולט

חשוב להפריד בין שני עולמות: הבנצ’מרקים והמציאות בשטח.

 

לפי נתונים שהציג ניק טורלי (Nick Turley) ובהתאם לדיווחים עסקיים מסוף 2025, ChatGPT נשאר השירות הדומיננטי בשוק. הוא נהנה ממאות מיליוני משתמשים פעילים, נפח שימוש עצום ואימוץ כמעט מלא בקרב חברות גדולות. בפועל, זה עדיין ה-assistant שהעולם עובד איתו.

 

הדומיננטיות הזו היא נכס אסטרטגי: הרגלי שימוש, אמון, ממשק מוכר, אינטגרציות ותהליכים עסקיים שכבר בנויים סביבו. לכן גם אם Gemini 3 Pro מוביל בחלק מהמדדים הטכניים, זה לא הופך את ChatGPT לפחות מרכזי.

 

אבל כאן מופיע הסדק. גוגל מציגה התקדמות כמעט בכל חזית, משחררת כלים ופיצ’רים בקצב גבוה, ומצמצמת פער שנראה היה בלתי סגיר. במודלים לשפה, תמונה, וידאו וכלים חכמים סביבם, Gemini מתחיל לא רק להדביק את ChatGPT אלא לעיתים גם ליצור תחושת “אבק” מאחוריו.

 

לכן, למרות היתרון בשימוש בפועל, הזעזוע אמיתי. השוק מריח שינוי. משתמשים פרטיים ועסקיים מתחילים לבחון ברצינות את Gemini, וחלקם אף עוברים אליו. זו אינה נטישה המונית, אבל זו תנועה ראשונית שמצביעה על שינוי אפשרי במאזן הכוחות.

 

לפי נתוני Similarweb, בעוד שהתנועה ל-ChatGPT ממשיכה לצמוח אך בקצב מתון, Gemini מציגה קפיצה חדה בחודשים האחרונים של 2025. זה לא מחליף הובלה, אבל כן מסמן שינוי מומנטום שהוביל את OpenAI להכריז על “קוד אדום”:

 

ChatGPT vs. Gemini

שינוי מומנטום | Similarweb Global Traffic Trends

מבחני לחץ בתוך OpenAI

לפי דיווחים של The Information וכתבים טכנולוגיים נוספים, התגובה הפנימית ב-OpenAI הייתה חדה וברורה.

 

אלטמן וההנהלה ביקשו מהצוותים להתמקד בשלושה צירים מרכזיים: הראשון, שיפור הפרסונליזציה וחוויית המשתמש ב-ChatGPT. השני, הגדלת מהירות ואמינות, וצמצום תקלות והשהיות. והשלישי, הרחבת טווח היכולות, כולל שדרוג משמעותי ביכולות ייצור תמונה והפחתת סירובי מודל מיותרים.

 

כדי לפנות משאבים, OpenAI הקפיאה מספר פרויקטים מתקדמים. לפי הדיווחים, בין הפרויקטים שנעצרו:

  • תכנית פרסום בתוך ChatGPT, שכבר הופיעה בקוד גרסת האנדרואיד.

  • סוכני קניות ובריאות שנועדו ללוות משתמשים בהחלטות צרכניות ורפואיות פשוטות.

  • ChatGPT Pulse, עוזר אישי שהיה אמור לייצר דוחות מותאמים אישית.

ניק טורלי חיזק את הכיוון הזה בפוסט ב-X, כפי שצוטט ב-Wall Street Journal: המיקוד עכשיו הוא להפוך את ChatGPT ליותר מסוגל, אינטואיטיבי ואישי, ולהמשיך להרחיב את ההגעה הגלובלית. במילים אחרות, פחות ניסויי צד, יותר חיזוק המנוע המרכזי.

התוכנית הטכנולוגית

כאן הסיפור נהיה רגיש יותר. לפי דיווח מפורט ב-The Information שהתבסס על מקורות פנימיים, OpenAI עובדת על שני מודלים שנועדו לתת מענה קונקרטי להתקדמות של Gemini ו-Claude.

Shallotpeat

המודל הראשון, תחת שם הקוד Shallotpeat, מתואר כמודל קצר טווח שהיה אמור לצאת ימים ספורים לאחר הכרזת הקוד האדום. אותם מקורות טענו כי במבחנים פנימיים הוא עקף את Gemini 3 Pro בחלק מהמשימות. אין כל אישור רשמי לשם, לתזמון או לתוצאות, וייתכן שהוא אף השתנה מאז. מדובר בדיווחים שאינם מאושרים ולכן הם צריכים להישאר באזור האפור שבין דליפה לעובדה.

Garlic

המודל המשמעותי יותר הוא Garlic, שמיועד לרבעון הראשון של 2026. לפי הדיווחים, מארק צ’ן (Mark Chen), ראש תחום המחקר ב-OpenAI, תיאר אותו כמודל שבו הצליחו “להזריק למודל קטן יותר את אותה כמות ידע” שבעבר דרשה מודל גדול בהרבה – שינוי שמרמז על קפיצה ביעילות האימון, לא רק בביצועי קצה.

 

Garlic נשען על עבודה שנעשתה ב-GPT-4.5, אך כולל תיקונים עמוקים בשלב ה-pre-training שנועדו להתגבר על צווארי בקבוק טכניים. במבחנים פנימיים הוא הראה ביצועים חזקים במיוחד בקידוד ובמשימות חשיבה מורכבות.

 

הכל נאמר בזהירות: OpenAI לא פרסמה מידע רשמי על Shallotpeat או Garlic, ומבחנים פנימיים אינם בהכרח אינדיקציה לביצועים בעולם האמיתי. לא ברור אם ומתי מודלים אלה יושקו.

 

אבל מבחינת הנרטיב, זה לב העניין: OpenAI נמצאת במרוץ להציג דור חדש שישיב לה יתרון טכנולוגי – בזמן שהשוק מתקדם מהר יותר מאי פעם.

היתרון התשתיתי של גוגל מול השינוי המבני ב-OpenAI

מאחורי מרוץ המודלים מסתתרת שאלה אחת: על מה הם רצים?

 

לגוגל יש שליטה כמעט מוחלטת בכל שכבות ה-stack: מהמחקר ועד השבבים. משפחת Gemini רצה על TPU שגוגל עצמה מתכננת ומייצרת, מה שמעניק לה עלות כוללת נמוכה יותר, שליטה מלאה בתצורה, ויכולת להפעיל אשכולות עצומים בקנה מידה שקשה להתחרות בו.

 

Anthropic חתמה באוקטובר 2025 על הסכם תשתית עם Google Cloud שמעניק לה גישה למיליוני TPUs של גוגל – מה שנותן לה כרגע גישה לחומרה מתקדמת שדומה לזו של גוגל עצמה.

 

בעבר OpenAI הייתה תלויה כמעט לחלוטין בתשתית Azure של מיקרוסופט, תלות שנחשבה לחולשה מובנית, במיוחד לאור תקלות שירות שזוהו בשנים 2024-2025. תלות כזו בספק יחיד מגבילה יכולת שליטה בעלויות וממצבת נקודת כשל תשתיתית.

 

אבל בחודשים האחרונים המצב השתנה: OpenAI חתמה על הסכמי תשתית רחבי היקף עם AWS והחלה לפרוס קיבולת עצומה של GPU מבוסס NVIDIA. המהלך הזה שובר את הבלעדיות של Azure ומאפשר פיזור עומסים בין כמה עננים גדולים.

 

המשמעות כפולה:

  1. פחות סיכון מתלות בענן יחיד.

  2. יותר גמישות לנהל את עלויות החישוב מול המתחרות.

ועדיין, בניגוד לגוגל, OpenAI אינה שולטת בשכבות החומרה והענן של עצמה. אפילו עם המעבר לכמה ספקי ענן, היא תלויה בתשתיות של אחרים. לכן הפער התשתיתי כבר אינו עניין טכני בלבד, אלא שאלה אסטרטגית שמגדירה את יכולת החברה להתחרות לאורך זמן.

והכל קורה על רקע לחץ פיננסי

לפי דיווחים בעיתונות הכלכלית, השווי של OpenAI מתקרב ל-500 מיליארד דולר ומתבסס על הנחה שהיא תמשיך לצמוח במהירות ותשמור על מובילות טכנולוגית. אבל מאחורי המספרים נוצצים עומדת מציאות מורכבת בהרבה.

 

עלויות האימון וההרצה של המודלים עצומות. חלק גדול מההכנסות חוזר היישר ל-compute ולשכר טאלנטים טכניים. הערכות מדברות על כך ש-OpenAI שואפת להגיע ל-cash flow חיובי רק בסביבות 2029. דיווחים מסוף 2025 הצביעו גם על התחייבויות תשתית ארוכות טווח מול מיקרוסופט בהיקפים חריגים, אם כי המספרים המדויקים אינם שקופים לציבור.

 

במצב כזה, כל מודל דגל חדש הוא לא רק מהלך טכנולוגי – הוא גם הימור פיננסי של מאות מיליוני דולרים. 

מה זה אומר עבור השוק

עבור משתמשים פרטיים, התחרות הזו היא חדשות מצוינות: המודלים משתפרים, המחירים יורדים, והיכולות נפתחות ליותר אנשים. עבור ארגונים, התמונה מורכבת בהרבה. שלושה מסרים בולטים:

  • לא להישען על ספק יחיד. אסטרטגיית multi-model כבר אינה “מתקדמת” אלא הכרח. גם אם ChatGPT הוא הכלי המרכזי, כדאי להבין איך משלבים לצדו את Gemini, Claude או מודלים פתוחים.

  • להסתכל על TCO, לא רק על ביצועים. במילים פשוטות יותר, לבחון את העלות הכוללת להחזיק ולהפעיל את המערכת לאורך זמן, לא רק את המחיר המיידי שלה. פער קטן בבנצ’מרק אינו מצדיק בהכרח פער גדול בעלויות. בפרויקטים רחבי היקף, יעילות חישובית הופכת לפקטור אסטרטגי.

  • לשמור גמישות תשתיתית. ארגונים שמסוגלים להריץ מודלים על עננים שונים או על תשתיות עצמאיות נמצאים בעמדה יציבה יותר מול שינויים טכנולוגיים ושינויי מחירים.

בסופו של דבר, אנחנו נכנסים לעידן שבו אין “בחירה אחת נכונה”. יתרון אמיתי יהיה למי שיידע להרכיב שכבה אפליקטיבית גמישה שפועלת מעל כמה מודלים שונים, ובכך לנצל את החוזקות של כל אחד מהם.

 

נתוני Similarweb מראים שאמנם OpenAI עדיין מחזיקה בנתח העצום של תנועת ה-AI הגנרטיבי, אבל בחודשים האחרונים חלה עלייה מתמשכת במודלים מתחרים כמו Gemini, Claude ו-DeepSeek. השוק נהיה מגוון יותר, והתחרות כבר אינה תיאורטית:

 

השוק מתחיל להיפתח

השוק מתחיל להיפתח | Similarweb Global Traffic Trends

2026 היא שנת המבחן של OpenAI ושל שוק ה-AI כולו

OpenAI מבינה שהשאלה הגדולה אינה מי מוביל בבנצ’מרקים, אלא מי מוביל את השיחה ואת השוק בפועל. כרגע ChatGPT עדיין שולט בשימוש, אבל ההובלה הטכנולוגית כבר לא מוגדרת, והמתחרות לוחצות מכל כיוון. במקום לחגוג שלוש שנים ל-ChatGPT, הכריזה OpenAI על קוד אדום. זה לא רק סימן למשבר, אלא הכרה בכך שהעידן שבו שימשה כמובילה הלא רשמית מתקרב לסיום.

 

2026 תהיה שנת מבחן. אם Garlic או כל מודל דגל אחר יצליח לא רק להשוות אלא לעקוף את Gemini 3 Pro ו-Claude Opus 4.5 בבדיקות עצמאיות ובעבודה אמיתית אצל משתמשים, ובמקביל יעמוד בעלות חישובית סבירה, OpenAI תוכל לטעון שחזרה להוביל.

 

אם זה לא יקרה, השוק עלול להתרחק ממודל של “מנצח אחד”. גוגל עשויה לתפוס את ההובלה, או שנראה שוק מרובה-שחקנים שבו לכל ענק יש יתרון אחר: תשתית, מחיר, בטיחות או יכולות איג׳נטליות. הקצב מהיר כל כך, שאפשר רק לזהות כיוונים – בטח לא לנבא בוודאות.

 

גוגל אולי הרסה את המסיבה של ChatGPT, אבל מה שנקבע עכשיו זה לא מי חוגג. מה שנקבע עכשיו הוא מי ישרוד ויעצב את המרוץ הבא – מרוץ שבו מודלים, תשתיות וכסף מתמזגים לקרב שלא דומה לשום דבר שראינו עד היום.

הפוסט גוגל הרסה את מסיבת יום הולדת 3 של ChatGPT ו-OpenAI מכריזה על ״קוד אדום״ הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/openai-code-red/feed/ 0
ChatGPT Voice עובד עכשיו בתוך חלון הצ’אט הרגיל https://letsai.co.il/chatgpt-voice-mode/ https://letsai.co.il/chatgpt-voice-mode/#respond Wed, 03 Dec 2025 08:30:08 +0000 https://letsai.co.il/?p=65264 OpenAI שינתה ב-25 בנובמבר 2024 את אופן הפעולה של מצב הדיבור הקולי ב-ChatGPT, ובעצם חיברה אותו ישירות לחוויית הצ’אט הרגילה. במקום לעבור לממשק נפרד עם הכדור הכחול המוכר, השיחה הקולית מתרחשת עכשיו בתוך חלון הצ’אט עצמו. מדברים, רואים תמלול חי, מקבלים תשובות טקסטואליות בזמן אמת, וגם ניגשים לתמונות, קוד, מפות ותוכן ויזואלי נוסף בלי לעזוב […]

הפוסט ChatGPT Voice עובד עכשיו בתוך חלון הצ’אט הרגיל הופיע ראשון בLet's AI בינה מלאכותית

]]>
OpenAI שינתה ב-25 בנובמבר 2024 את אופן הפעולה של מצב הדיבור הקולי ב-ChatGPT, ובעצם חיברה אותו ישירות לחוויית הצ’אט הרגילה. במקום לעבור לממשק נפרד עם הכדור הכחול המוכר, השיחה הקולית מתרחשת עכשיו בתוך חלון הצ’אט עצמו. מדברים, רואים תמלול חי, מקבלים תשובות טקסטואליות בזמן אמת, וגם ניגשים לתמונות, קוד, מפות ותוכן ויזואלי נוסף בלי לעזוב את השיחה. זה שינוי קטן לכאורה, אבל כזה שמסמן הפיכה של מצב הקול מכלי צדדי לדרך עבודה טבעית בתוך המוצר.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

איך זה עובד בפועל

ברגע שלוחצים על אייקון המיקרופון, הקלט הקולי נכנס לשיחה כמו כל הודעה אחרת. התשובה מופיעה כטקסט מתגלגל, בדיוק כמו בצ’אט רגיל. אפשר לעבור בין דיבור לכתיבה בצורה חלקה, לגלול לשיחות קודמות, ולשמור על כל ההיסטוריה באותו חלון. מבחינת חוויית שימוש זה צעד שמתקרב לאינטראקציה רב-מודלית אמיתית.

 

יחד עם זאת, יש פרט שכדאי לשים אליו לב: עד שלוחצים על כפתור “סיום”, המערכת ממשיכה להאזין ולהגיב. אין כיבוי אוטומטי אחרי חוסר פעילות, וזו נקודה שיכולה ליצור אי נעימות אם שוכחים את המיקרופון פועל.

תוכן ויזואלי בזמן השיחה

אחד החידושים הבולטים הוא היכולת להציג תוכן ויזואלי בזמן השיחה. זה כולל תמונות, קוד, כרטיסי מידע, מידע על מזג אוויר ולעיתים גם מפות. בפועל, תצוגת המפות עדיין לא יציבה בכל אזור משום שהיא תלויה בשירותי צד שלישי שלא זמינים במלואם בכל מדינה. חלק מהמשתמשים כבר נתקלו בפער בין ההדגמות לבין מה שמופיע בפועל.

 

למרות זאת, עצם האפשרות לשלב קול ותוכן חזותי בזמן אמת מייצרת חוויה רלוונטית בהרבה למי שעובד עם מידע מורכב.

המודל שמפעיל את השיחות הקוליות

שיחות טקסט רגילות יכולות להשתמש במודל GPT-5.1 על סוגיו, שהוא כרגע הכלי החזק ביותר של OpenAI. מצב הקול, לעומת זאת, פועל על GPT-4o שמותאם לעיבוד קול וזמן אמת. במנויים בתשלום קיימת אפשרות שהמערכת תעבור ל-GPT-4o mini לאחר שימוש ממושך, אף על פי ש-OpenAI אינה מפרסמת מכסה רשמית שמבהירה מתי זה קורה. המשמעות פשוטה – גם אם הכול מתרחש באותו חלון, איכות התשובות הקוליות אינה זהה לאיכות המתקבלת במצב טקסט בלבד.

למי זה מתאים

העדכון מתאים בעיקר למשתמשים שרוצים לעבור באופן טבעי בין קול לטקסט באותה שיחה, ולהנות מהמהירות של דיבור ומהדיוק של תמלול חי. זה שימושי בתכנון טיולים שבהם רוצים לראות מפה מיידית, בלמידה ותרגול שפות, בבישול כשהידיים לא פנויות, ובעבודה עם קוד שבה מסבירים בעל פה ורואים את התיקון כתוב.

 

מי שמעדיף חוויית קול נקייה וללא תמלול, או שנוח לו יותר עם הממשק המופרד עם הכדור הכחול, עשוי להרגיש פחות בנוח עם הפורמט המשולב. עבורכם נשמרה האפשרות להחזיר את המצב הישן דרך Settings → Voice → Separate voice mode.

 

הפרדת הקול ממסך הטקסט

כאן ניתן להפעיל מחדש את מצב הקול הנפרד

זמינות

העדכון מופץ לכל המשתמשים, כולל Free, Plus ו-Pro, גם באפליקציות וגם בממשק הדפדפן. אין עלות נוספת לשימוש בקול. משתמשי החינם מקבלים גרסה מצומצמת של היכולת, בעוד שמנויי Plus ו-Pro יכולים גם לצלם תמונות בזמן שיחה, לשתף מסך, או לאפשר למודל לראות את הסביבה דרך המצלמה. אלו תוספות שמרחיבות את היכולת המעשית של מצב הקול, בעיקר בתרחישים כמו תמיכה טכנית או הסברים על קוד.

הקול כחלק בלתי נפרד

בסופו של דבר, זהו שינוי שממקם את הקול כחלק בלתי נפרד מאופן העבודה עם ChatGPT. החיבור בין דיבור, טקסט ותוכן חזותי הופך את החוויה לזורמת ופחות מסורבלת, גם אם יש אזורים שעדיין דורשים הבשלה כמו יציבות מפות או מנגנון כיבוי אוטומטי. בשורה התחתונה, מדובר בשדרוג שהופך את השימוש בקול למעשי הרבה יותר מבעבר, בלי להכריח את המשתמש לבחור בין קול לטקסט אלא לאפשר שילוב טבעי ביניהם.

הפוסט ChatGPT Voice עובד עכשיו בתוך חלון הצ’אט הרגיל הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/chatgpt-voice-mode/feed/ 0
איך ChatGPT הופך ליועץ שופינג אישי https://letsai.co.il/chatgpt-shopping-research/ https://letsai.co.il/chatgpt-shopping-research/#respond Mon, 01 Dec 2025 13:38:39 +0000 https://letsai.co.il/?p=65155 כמעט כל קנייה רצינית באינטרנט מתחילה באותו דפוס: פותחים עשרות טאביים, קוראים ביקורות, צופים בסרטונים, משווים מחירים – ובסוף עדיין לא בטוחים מה באמת נכון לצרכים שלכם. OpenAI, שממש היום חוגגת יום הולדת 3 ל-ChatGPT, מנסה לפתור בדיוק את הבלבול הזה עם פיצ׳ר חדש בתוך הצ׳אט שנקרא Shopping Research. זה לא עוד רשימת קישורים, אלא […]

הפוסט איך ChatGPT הופך ליועץ שופינג אישי הופיע ראשון בLet's AI בינה מלאכותית

]]>
כמעט כל קנייה רצינית באינטרנט מתחילה באותו דפוס: פותחים עשרות טאביים, קוראים ביקורות, צופים בסרטונים, משווים מחירים – ובסוף עדיין לא בטוחים מה באמת נכון לצרכים שלכם. OpenAI, שממש היום חוגגת יום הולדת 3 ל-ChatGPT, מנסה לפתור בדיוק את הבלבול הזה עם פיצ׳ר חדש בתוך הצ׳אט שנקרא Shopping Research. זה לא עוד רשימת קישורים, אלא תהליך שמרגיש כמו יועץ קנייה אישי. אתם מתארים את הצורך, הצ׳אט שואל שאלות מיקוד, ובסוף מחזיר מדריך קנייה מסודר שמותאם למה שחשוב לכם.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה Shopping Research מביא לשולחן

כשאתם באמת מתלבטים – כשצריך להבין מה משתלם, מה מיותר ומה רק נראה טוב על הנייר – ChatGPT משנה סגנון. ברגע שהוא מזהה שמדובר בקנייה מורכבת, הוא מציע לעבור למצב Shopping Research. אפשר גם להפעיל אותו ישירות דרך כפתור ה-“+” בדפדפן או באפליקציה.

 

כך מפעילים ידנית את Shopping Research

כך מפעילים ידנית את Shopping Research

 

בשיחה עצמה אתם לא צריכים לחפש את המילים הנכונות. פשוט מתארים מה אתם מחפשים: “מחשב ללימודים בתקציב מוגבל” או “כסא עבודה נוח לחדר קטן”. הכלי שואל שאלות הבהרה לגבי שימוש, גודל, טווח תקציב ועוד, כדי למקד את הדרישות ולבנות תמונה אמיתית של הצורך.

 

מאחורי הקלעים, Shopping Research קורא אתרים ציבוריים: חנויות, מפרטי יצרן, ביקורות, תמונות והשוואות. OpenAI מציינת שהתהליך מבוסס על מקורות איכותיים, ציבוריים וזמינים, ולא על לינקים ממומנים. המטרה היא להישען על מידע פתוח, אמין ולא מסחרי.

 

בסוף התהליך אתם מקבלים מסמך מסודר עם רשימת מוצרים מומלצים, הסבר למה כל אחד מהם מתאים לכם, ההבדלים המעשיים ביניהם, ומה עדיף לבדוק בעצמכם לפני רכישה. אפשר גם לסמן “לא רלוונטי” או לבקש “עוד כאלה”, וההמלצות יתעדכנו בהתאם.

 

בגרף המצורף אפשר לראות את השיפור שאותו מציגה OpenAI בדיוק התאמת המוצרים לדרישות המשתמש. בבדיקה פנימית, Shopping Research מגיע לדיוק של 64 אחוז בעמידה בתנאים כמו מחיר, צבע, חומר ומפרט. לצורך השוואה, GPT-5 Thinking עומד על 56 אחוז, גרסת המיני על 52 אחוז, והחיפוש הרגיל מגיע ל- 37 אחוז:

 

דיוק המודל בבחירת מוצרים

דיוק המודל בבחירת מוצרים | openai.com

איך זה נראה בפועל

ככה זה נראה בתוך האפליקציה – אתם מצלמים או מעלים תמונה של מוצר, מבקשים למצוא משהו דומה, או מתארים בצ’אט את מה שאתם מחפשים. משם הכלי מתחיל לעבוד – הוא שואל שאלות מיקוד, מעלה הצעות בזמן אמת, וממשיך לחדד בהתאם לתשובות שלכם:

 

ככה זה נראה בתוך האפליקציה

ככה זה נראה בתוך האפליקציה

למי זה מתאים, ומתי כדאי להפעיל

Shopping Research לא מיועד לחיפוש מהיר של מחיר או בדיקה נקודתית של פיצ’ר אחד. הוא מתאים במיוחד לקניות שמצריכות מחשבה, השוואה ותמונה רחבה. למשל מחשבים, טלוויזיות, ריהוט, ציוד לבית, מתנות משמעותיות ומוצרי טכנולוגיה שיש להם הרבה דגמים ותתי דגמים.

 

אם אתם רק רוצים עובדה אחת, שיחה עם כל מודל שפה גדול או חיפוש בגוגל (אם אתם עדיין עושים את זה) כנראה יספיקו. אבל אם אתם מנסים להבין מה באמת משתלם מבחינת שימוש, תקציב, מידות או תחזוקה, Shopping Research יכול לחסוך לכם זמן ולמנוע טעויות נפוצות.

נקודות ששווה לשים לב אליהן

OpenAI מדגישה שהתוצאות מבוססות על מקורות איכותיים, ציבוריים ולא פרסומיים. זה חשוב, אבל זה לא אומר שיש רשימה סגורה של אתרים מאושרים או מנגנון שבודק כל עמוד לעומק. לכן כדאי לשמור על ערנות ולוודא שהפרטים שמופיעים בשיחה תואמים למה שמופיע אצל המוכר.

 

יש גם מצבים שבהם ייעוץ של מודל לא מספיק. מוצרים בטיחותיים או רפואיים דורשים התאמה אישית, ולעיתים גם בדיקה פיזית. מוצרים יד שנייה או פריטים נדירים מציגים בעיה אחרת, משום שקשה להבטיח איכות, זמינות ומידע עקבי. וגם כשיש דרישות מדויקות במיוחד, כמו מידות, התאמה לסביבה מסוימת או תחזוקה מיוחדת, צריך להצליב מידע ולוודא שההמלצה אכן מתאימה למצב שלכם.

 

ובנוסף, גם כשהמדריך שמתקבל נראה מדויק ומסודר, חשוב להיכנס לאתר החנות ולבדוק פרטים סופיים: מחיר עדכני, זמינות מלאי, תנאי משלוח והחזרות, ודגם המוצר המדויק. Shopping Research חוסך את רוב עבודת המחקר, אבל הוא לא מחליף את שלב האימות האחרון שמבטיח קנייה בטוחה.

הצצה לעתיד

OpenAI כבר מדברת על אפשרות לרכוש מוצרים ישירות מתוך ChatGPT דרך מה שהיא מכנה Instant Checkout. אם זה יתממש, התהליך יוכל להסתיים בלחיצה אחת: מהמחקר, דרך ההשוואה, ועד הקנייה, הכל בתוך אותה שיחה.

 

Shopping Research לא מבטל התלבטויות והוא לא קוסם. מה שהוא כן עושה הוא לשנות את נקודת הפתיחה, לחסוך לכם זמן ולארגן לכם את המידע מול העיניים. במקום להתחיל את המסע בגוגל, לעבור אינספור אתרים ולהתבלבל מהשוואות סותרות, אתם מתחילים משיחה אחת שמנסה להבין אתכם. הכלי מפיק מתוך זה מדריך קנייה שמדבר בשפה שלכם ומסדר את האפשרויות בצורה ברורה. שווה להיכנס ולנסות.

הפוסט איך ChatGPT הופך ליועץ שופינג אישי הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/chatgpt-shopping-research/feed/ 0
אנטרופיק משיקה את Opus 4.5 כמודל דגל חזק יותר, זול יותר ומדויק יותר https://letsai.co.il/claude-opus-4-5/ https://letsai.co.il/claude-opus-4-5/#respond Tue, 25 Nov 2025 12:22:35 +0000 https://letsai.co.il/?p=64672 אנטרופיק השיקה את מודל הדגל החדש שלה, Claude Opus 4.5. המודל מציג ירידת מחיר חדה של 67 אחוז בהשוואה ל-Opus 4.1, שיפור משמעותי ביכולות קוד עם תוצאות מובילות בבנצ’מרקים, ואינטגרציות חדשות לדפדפן Chrome ול-Excel. לצד השדרוגים בביצועים, המודל מציג גם התקדמות בתחום הבטיחות עם עמידות משופרת וירידה בהתנהגויות לא רצויות. ההשקה מגיעה ימים בודדים אחרי […]

הפוסט אנטרופיק משיקה את Opus 4.5 כמודל דגל חזק יותר, זול יותר ומדויק יותר הופיע ראשון בLet's AI בינה מלאכותית

]]>
אנטרופיק השיקה את מודל הדגל החדש שלה, Claude Opus 4.5. המודל מציג ירידת מחיר חדה של 67 אחוז בהשוואה ל-Opus 4.1, שיפור משמעותי ביכולות קוד עם תוצאות מובילות בבנצ’מרקים, ואינטגרציות חדשות לדפדפן Chrome ול-Excel. לצד השדרוגים בביצועים, המודל מציג גם התקדמות בתחום הבטיחות עם עמידות משופרת וירידה בהתנהגויות לא רצויות. ההשקה מגיעה ימים בודדים אחרי GPT-5.1 של OpenAI ומיד אחרי Gemini 3 של Google, מה שמדגיש עד כמה התחרות בשוק מודלי השפה צמודה וצפופה. בסקירה הזו תקבלו תמונה מלאה על Opus 4.5: איפה הוא עומד מול מודלים אחרים, איך הוא מתפקד בביצועי קוד ושימושי מחשב, מה הוא יודע לעשות בפועל, כמה הוא עולה, עד כמה הוא בטוח, ולמי הוא מתאים.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

המחיר הוא הסיפור הגדול

Opus 4.5 מתומחר ב-5 דולר למיליון טוקנים נכנסים ו-25 דולר למיליון טוקנים יוצאים, ירידה של 67 אחוז לעומת Opus 4.1 שעלה 15 ו-75 דולר בהתאמה.

 

נסו את המודל החדש מבית אנטרופיק - Claude Opus 4.5

נסו את המודל החדש מבית אנטרופיק – Opus 4.5

 

מה זה אומר בפועל? טוקן הוא יחידת הטקסט שהמודל מעבד. בממוצע, מיליון טוקנים שווים לכ-750 אלף מילים באנגלית. עבור מפתחים שמריצים משימות קידוד יומיומיות, העלות ירדה מסדר גודל של עשרות דולרים ביום לכמה דולרים בודדים. היכולת הזו שהייתה נגישה בעיקר לארגונים גדולים הופכת מציאותית גם עבור צוותים קטנים וסטארטאפים.

שלושה מודלים, שלושה שימושים

אנטרופיק ממשיכה עם גישה של משפחת מודלים משלימים ולא מסתמכת על מודל אחד לכל המשימות.

Opus 4.5

המודל המתקדם ביותר. מיועד למשימות שמצריכות עומק מקסימלי כמו פרויקטי קוד מורכבים, סוכנים אוטונומיים וניתוח מסמכים ארוכים. למרות ירידת המחיר הדרמטית, Opus נשאר המודל היקר במשפחת 4.5, משום שהוא מספק את העומק והדיוק הגבוהים ביותר.

Sonnet 4.5

מודל העבודה היומיומי של המשפחה הוא Sonnet 4.5. הוא מספק את האיזון הטוב ביותר בין ביצועים, מהירות ועלות. לרוב המשימות השוטפות זו הבחירה המתאימה.

Haiku 4.5

המודל המהיר והחסכוני של המשפחה הוא Haiku 4.5. הוא מתאים לתעבורה גבוהה, תגובות מיידיות ומשימות פשוטות בהיקף גדול.

 

שלושה מודלים, שלושה שימושים

שלושה מודלים, שלושה שימושים

הבחירה בין השלושה משפיעה ישירות על היעילות ועל העלויות. שימוש ב-Haiku למשימות בסיסיות במקום ב-Opus יכול לחסוך עד פי חמש בעלויות בלי לפגוע בתוצאה. לרוב המשתמשים Sonnet יספיק. Opus רלוונטי כשהדיוק הוא גורם קריטי.

מה מספרים המספרים?

Opus 4.5 מציג קפיצה משמעותית ביכולות הנדסת תוכנה. בבנצ’מארק SWE-bench Verified, שמודד פתרון באגים אמיתי מתוך פרויקטי GitHub, המודל הגיע ל-80.9 אחוז והפך לראשון שחוצה את רף השמונים. לשם השוואה, GPT-5.1 Codex Max עומד על 77.9 אחוז, Sonnet 4.5 על 77.2 אחוז ו-Gemini 3 Pro על 76.2 אחוז.

 

הבנצ'מארק המרכזי להוכחת עליונות בהנדסת תוכנה

הבנצ’מארק המרכזי להוכחת עליונות בהנדסת תוכנה | anthropic.com

 

מעבר לדיוק עצמו, Opus 4.5 מפגין יתרון ביעילות. בבדיקות effort controls הוא השיג דיוק גבוה יותר בכל רמות המאמץ, תוך הפקת פחות טוקני פלט בהשוואה לדורות קודמים. המשמעות היא שהמודל יודע לבצע תהליכי חשיבה מורכבים בצורה חסכונית יותר, וזה קריטי כשעובדים בהיקפים גדולים.

 

ביצועים מול יעילות

ביצועים מול יעילות | anthropic.com

 

במבחן נוסף, Aider Polyglot, שמודד יכולת פתרון בעיות קידוד בסביבות מגוונות, Opus 4.5 הגיע ל-89.4 אחוז. Sonnet 4.5 מגיע ל-78.8 אחוז, כך שנוצר פער ברור בין הדגמים.

 

מצוין בבעיות קידוד

מצוין בבעיות קידוד | anthropic.com

 

גם בתחום העבודה עם מחשב, הכולל שימוש בדפדפן, אפליקציות וממשקי מערכת, Opus 4.5 מציג שיא חדש של 66.3 אחוז בבנצ’מארק OSWorld (אפשר לראות בטבלה למעלה). המבחן הזה בודק עד כמה מודל שפה מסוגל לתפעל מחשב אמיתי, וזה תחום שהופך במהירות לרכיב מרכזי ביכולות של מודלים מתקדמים.

 

 

גם ביכולת לשמור על רצף לאורך זמן Opus 4.5 מציג יתרון ברור. עבודה אמיתית עם מודלים מתקדמים כוללת לא רק פתרון בעיות נקודתיות, אלא משימות ארוכות שמצריכות עקביות, הבנה מתמשכת ויכולת לחזור לפרטים קודמים בלי לאבד כיוון. בבנצ’מרק Vending-Bench, שבודק קוהרנטיות לטווח ארוך במשימות מורכבות ורב שלביות, Opus 4.5 מוביל בפער משמעותי על Sonnet 4.5.

 

מתבלט בעבודה על משימות ארוכות ורב-שלביות

מתבלט בעבודה על משימות ארוכות ורב-שלביות | anthropic.com

מפרט טכני

Opus 4.5 מגיע עם חלון הקשר של 200 אלף טוקנים וגבול פלט של 64 אלף טוקנים. ה-reliable knowledge cutoff שלו הוא מרץ 2025, כלומר על מידע עד לתאריך הזה ניתן לסמוך באופן עקבי יותר, ומעבר לכך הידע חלקי.

 

לדברי דיאן נא פן (Dianne Na Penn), ראש תחום ניהול מוצר למחקר באנטרופיק, הגדלת חלון ההקשר לבדה אינה מספיקה. היכולת לזהות אילו פרטים חשובים להחזיק בזיכרון, ואילו כדאי לבדוק מחדש בזמן אמת, היא שמאפשרת למודל להתמודד עם משימות מורכבות לאורך זמן בלי לאבד את הרצף.

בטיחות והתנהגות: הפער שמבליט את Opus 4.5

אחד השינויים הבולטים ב-Opus 4.5 אינו רק בביצועים או ביעילות, אלא ברמת הבטיחות שהוא מציג. בעולם שבו מודלים משולבים במערכות ליבה, כלי קוד, תהליכים עסקיים וממשקי משתמש, עמידות למתקפות והפחתת התנהגויות לא רצויות הופכות לקריטיות כמו מהירות או דיוק.

עמידות למתקפות Prompt Injection

Opus 4.5 מציג את שיעור ההצלחה הנמוך ביותר למתקפות Prompt Injection בהשוואה ל-GPT-5.1 ו-Gemini 3. זהו מדד חשוב, משום שמתקפות כאלה יכולות לגרום למודל להתעלם מהוראות, לחשוף מידע או לבצע פעולות לא רצויות. הנתונים מראים פער ברור בין המודלים, כאשר Opus 4.5 מצמצם משמעותית את הסיכון להתנהגות כזו.

 

עמידות למתקפות Prompt Injection

anthropic.com | עמידות למתקפות Prompt Injection

התנהגות לא רצויה: ירידה משמעותית

גם במדד התנהגות מדאיגה Opus 4.5 מפגין את התוצאות הנמוכות ביותר, כלומר רמה נמוכה יותר של תגובות שעלולות להתפרש כבעייתיות או לא בטוחות. זהו חיזוק נוסף לכך שהמודל מתוכנן לא רק לביצועים, אלא גם ליציבות, אמינות והתאמה לסביבות רגישות.

 

ירידה במדד התנהגות לא רצויה

ירידה במדד התנהגות לא רצויה | anthropic.com

אינטגרציות ויכולות חדשות

צ’אט ללא הגבלה

Opus 4.5 מגיע עם מנגנון דחיסת הקשר שמסכם את חלקי השיחה הישנים בצורה חכמה ושומר את המידע הרלוונטי בלבד. המשמעות היא שהמשתמש יכול לקיים שיחה ארוכה מאוד, לבנות תוכניות מורכבות או לעבוד עם מסמכים גדולים, בלי להיתקל בהודעה שהחלון מלא. זה מאפשר סוף סוף עבודה רציפה בפרויקטים ארוכים, גם ללא תכנון מוקדם של מבנה השיחה.

Claude for Chrome

התוסף לדפדפן פתוח לכל משתמשי Max ומאפשר למודל לראות את הטאבים הפתוחים. זה מאפשר לבצע משימות כמו קריאה וניתוח של דפים, השוואת תוכן, מילוי טפסים וביצוע פעולות מבוססות דפדפן. במקום להעתיק טקסט מהדפדפן לתוך הצ’אט, המודל פשוט רואה את המסך ועובד עליו ישירות.

Claude for Excel

האינטגרציה החדשה מאפשרת למודל לעבוד בתוך Excel עצמו. הוא יכול לנתח גיליונות, לבנות מודלים, להפיק נוסחאות מורכבות או ליצור אוטומציות שמזרזות עבודה חוזרת. זה כלי פרקטי במיוחד לניתוחים פיננסיים, דוחות תפעוליים וטיוב נתונים. השירות נמצא בבטא למנויי Max, Team ו-Enterprise.

Claude Code בדסקטופ

האפליקציה מאפשרת להריץ כמה סשנים במקביל, כך שאפשר לעבוד על כמה פרויקטים בשיחה אחת בצורה מופרדת. מצב Plan Mode עבר שדרוג משמעותי, והוא בונה תוכנית עבודה מפורטת לפני שהמודל ניגש לכתיבת קוד בפועל. זה מפחית טעויות, מייצר שקיפות ומאפשר שליטה טובה יותר בתהליך הפיתוח.

זמינות

Opus 4.5 זמין דרך ה-API של אנטרופיק ובפלטפורמות ענן מרכזיות כמו Amazon Bedrock, Google Cloud Vertex AI ו-Microsoft Azure במסגרת שותפות חדשה עם Microsoft ו-NVIDIA. בנוסף, המודל זמין למנויי Pro, Max, Team ו-Enterprise, והוא משולב כברירת מחדל בחלק מהיכולות החדשות כמו Claude Code ובכלי העבודה שמגיעים עם Anthropic for Teams.

כך נראה Opus 4.5 בפעולה

פתרון פאזלים באמצעות כלים חיצוניים

בסרטון הראשון מודגם כיצד Opus 4.5 פותר משחק פאזלים מורכב שלב אחר שלב. המודל משתמש בשתי יכולות חדשות: חיפוש כלים בתוך ספריית כלים גדולה וקריאה תכנותית לכלים חיצוניים. השילוב הזה מאפשר לו לנווט, לבחור פעולות, לשרשר צעדים ולבצע משימה מורכבת בלי התערבות אנושית. זו הוכחה ליכולת של המודל לבצע פעולות בעולם אמיתי, לא רק לייצר טקסט.

 

 

משימות משרדיות אמיתיות: מצגות, אקסלים וחוזים

בסרטון השני ניתן לראות הדגמה של Opus 4.5 מבצע עבודה משרדית מלאה: בניית דקים עסקיים, עיבוד וטרנספורמציה של נתונים בגיליונות, ועריכת חוזים כולל redlining. אלה תוצרים שהמודל לא רק מייצר, אלא גם מגיש כקבצים להורדה ולעבודה מיידית. זו המחשה ברורה לכיוון שאליו אנטרופיק מכוונת: מודל שאפשר להשתמש בו לצרכים יומיומיים בארגון, לא רק לניסויים.

 

 

לסיכום, Opus 4.5 הוא לא רק שדרוג טכני. הוא מודל שאפשר להכניס לשגרת עבודה אמיתית. ירידת המחיר של 67 אחוז, יחד עם האינטגרציות החדשות לדפדפן ול-Excel, הופכות יכולות שבעבר היו שמורות לפרויקטים ייעודיים לכלי שניתן להשתמש בו ביום יום, גם בצוותים קטנים.

 

עבור ארגונים, המסר של אנטרופיק ברור. השאלה כבר אינה האם להשתמש ב-AI מתקדם, אלא איך לבנות שילוב נכון בין מודלים שונים, לאילו משימות להפעיל כל אחד, ומהי נקודת האיזון בין עלות ליכולת. זו רמת בשלות שהשוק חיכה לה זמן רב, והיא מראה עד כמה המודלים המתקדמים עוברים מפיילוט לכלי עבודה מרכזי.

הפוסט אנטרופיק משיקה את Opus 4.5 כמודל דגל חזק יותר, זול יותר ומדויק יותר הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/claude-opus-4-5/feed/ 0
צ’אטים קבוצתיים ב-ChatGPT הם הדור החדש של עבודה משותפת עם AI https://letsai.co.il/group-chats-chatgpt/ https://letsai.co.il/group-chats-chatgpt/#respond Sun, 23 Nov 2025 12:16:13 +0000 https://letsai.co.il/?p=64534 OpenAI השיקה בנובמבר 2025 את הצ’אטים הקבוצתיים, תכונה שמסמנת שינוי עמוק בדרך שבה משתמשים עובדים עם ChatGPT. הכלי כבר לא רק עוזר אישי שמדבר עם אדם אחד. מעכשיו הוא יודע לפעול בתוך שיחה מרובת משתתפים, להבין הקשר קבוצתי, להגיב כשצריך ולסייע לצוותים לחשוב, להחליט וליצור יחד. במקום מודל שעונה לשואל יחיד, נוצר מרחב עבודה משותף […]

הפוסט צ’אטים קבוצתיים ב-ChatGPT הם הדור החדש של עבודה משותפת עם AI הופיע ראשון בLet's AI בינה מלאכותית

]]>
OpenAI השיקה בנובמבר 2025 את הצ’אטים הקבוצתיים, תכונה שמסמנת שינוי עמוק בדרך שבה משתמשים עובדים עם ChatGPT. הכלי כבר לא רק עוזר אישי שמדבר עם אדם אחד. מעכשיו הוא יודע לפעול בתוך שיחה מרובת משתתפים, להבין הקשר קבוצתי, להגיב כשצריך ולסייע לצוותים לחשוב, להחליט וליצור יחד. במקום מודל שעונה לשואל יחיד, נוצר מרחב עבודה משותף שבו ה-AI הופך לחבר צוות פעיל. זהו צעד שמרחיב את ChatGPT וממקם אותו ככלי אמיתי לשיתוף פעולה.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה חדש כאן בעצם?

צ’אט קבוצתי ב-ChatGPT יוצר מרחב עבודה משותף שבו עד עשרים אנשים יכולים לעבוד יחד בזמן אמת. כל משתתף יכול להעלות קבצים, לשתף רעיונות ולפתח שיחה טבעית. בתוך הסביבה הזאת ChatGPT מתפקד כחבר נוסף בקבוצה. הוא מגיב רק כשמזמינים אותו ומזהה מתי נכון להתערב ומתי לתת לשיחה להתנהל בין המשתתפים.

 

התכונה זמינה למשתמשי Free, Go, Plus ו-Pro. התכונה עוד לא הושקה רשמית לתוכניות Business ו-Enterprise.

איך פותחים צ׳אט קבוצתי

הקמה של צ’אט קבוצתי ב-ChatGPT היא תהליך מהיר וברור, והמסכים עצמם מנחים אתכם שלב אחרי שלב.

 

השלבים ליצירת צ'אט קבוצתי ב-ChatGPT

השלבים ליצירת צ’אט קבוצתי ב-ChatGPT

 

1. לחיצה על אייקון המשתמשים: במסך הצ’אט הקיים מופיע אייקון של דמות עם סימן פלוס. לחיצה עליו פותחת את חלון יצירת הצ’אט הקבוצתי. זה השלב שבו אתם מאותתים למערכת שאתם רוצים להוסיף אנשים לשיחה.

2. התחלת צ’אט קבוצתי: בחלון שנפתח מוצג מסר קצר שמסביר את הרעיון: שימוש משותף ב-ChatGPT לצורך תכנון, רעיונות ושיתוף. כאן לוחצים על Start group chat כדי ליצור קבוצת צ’אט חדשה.

3. קבלת קישור ההזמנה: לאחר יצירת הקבוצה מופיע מסך שבו מוצג לינק קבוצתי ייחודי. אפשר להעתיק אותו בלחיצה על Copy link. כל מי שמקבל את הלינק יכול להצטרף לקבוצה מבלי שתצטרכו לאשר כל אדם ידנית.

4. כלי הניהול הראשוניים של הקבוצה: לאחר פתיחת הקבוצה אפשר לראות את תפריט הניהול: רשימת משתתפים, ניהול קישור ההזמנה, שינוי שם הקבוצה והגדרת התנהגות ChatGPT בקבוצה (Customize ChatGPT). זהו מרכז השליטה הראשוני שלכם.

5. שיתוף הזמנה מתוך חלון השיחה: מיד לאחר יצירת הקבוצה מופיעה בתוך הצ’אט הודעה מערכתית שמאשרת שהקבוצה נוצרה. לצד זה מופיע כפתור Invite with link שמאפשר לשלוח שוב את אותו קישור, בלי צורך לחפש אותו בתפריטים.

התהליך כולו בנוי כך שכל שלב זורם לשלב הבא בלי בלבול. כל משתתף שמצטרף בפעם הראשונה מתבקש ליצור פרופיל בסיסי (שם, תמונה ושם משתמש), והוספת אדם לשיחה פרטית יוצרת קבוצה חדשה כדי להגן על פרטיות השיחה המקורית.

איך ChatGPT מתנהג בתוך קבוצה

זיהוי דינמיקה קבוצתית

OpenAI אימנה את המודל להבין הקשר חברתי בסיסי. ChatGPT מגיב רק כשמתייגים אותו או שואלים אותו ישירות, ומנסה להבחין בין רגעים שבהם הקבוצה זקוקה לעזרתו לבין רגעים שבהם נכון שיישאר ברקע.

יכולות בזמן שיחה קבוצתית

המודל יודע להשתמש באימוג’ים, לנתח ולהעלות קבצים, ליצור תמונות ולבצע חיפוש ברשת. הוא משתלב בתהליך כמו כל משתתף אחר ומוסיף מידע או תוצרים כשמבקשים ממנו.

ניהול עומס ושימוש

מגבלות השימוש נספרות על פי המשתמש שהמודל מגיב לו ולא על פי כל חברי הקבוצה יחד. זה מאפשר לצוותים לחלק את השאלות באופן חכם ולהימנע מחסימת שימוש מיותרת.

ההתנהגות בפועל

התוצאה היא נוכחות מאוזנת. ChatGPT נמצא שם כדי לעזור אבל אינו משתלט על השיחה. הוא שותף פעיל כשצריך ועוזר לשמור על קצב ולחדד את הדיון בלי לפגוע בשיחה האנושית עצמה.

איזה מודל מפעיל את הצ’אטים הקבוצתיים

כל צ’אט קבוצתי ב-ChatGPT פועל על GPT-5.1 Auto. זהו מנגנון שמנתח את סוג הבקשה בכל רגע ובוחר אוטומטית את תת המודל המתאים ביותר, בלי שהמשתמשים יצטרכו להגדיר דבר.

 

איך נקבע המודל בפועל?

שאלות קצרות או משימות מהירות מקבלות מענה מ-GPT-5.1 Instant. לעומת זאת, ניתוחים עמוקים, הסברים מורכבים או בקשות שמצריכות reasoning (חשיבה מעמיקה או ניתוח מדורג) עוברים ל-GPT-5.1 Thinking. משתמשי Plus נהנים מהיכולות המלאות שלו גם אם שאר המשתתפים במסלול Free. המנגנון מתייחס להגדרות של שואל השאלה בלבד.



למשימות פשוטות זמן התגובה הממוצע נע בין שלוש לחמש שניות. למשימות מורכבות יותר התגובה נעה בין שתים עשרה לשמונה עשרה שניות, בהתאם לכמות העיבוד הנדרשת.

מה חשוב לדעת מבחינת פרטיות ואבטחה

הפרדה מוחלטת בין סוגי שיחות

OpenAI שמה דגש חזק על כך ששיחות קבוצתיות מופרדות לחלוטין משיחות פרטיות. הזיכרון האישי (Personal Memory) לא נחשף לקבוצה והמודל אינו משתמש במידע שהצטבר בשיחות פרטיות קודמות.

הוראות מותאמות אישית לכל קבוצה

Custom Instructions אישיים לא מיושמים אוטומטית בצ’אטים קבוצתיים. כל קבוצה מקבלת סט הנחיות משלה, והגדרות הקבוצה נשארות מבודדות ואינן משפיעות על ההגדרות האישיות של המשתמש.

שליטה מלאה במשתתפים ובהודעות

צ’אטים קבוצתיים מופיעים באזור ייעודי בסרגל הצד. ניתן להסיר משתתפים, להשתיק התראות או לעזוב את הקבוצה בכל רגע, ללא השפעה על שאר השיחות.

הגנות ייעודיות לקטינים

למשתתפים מתחת לגיל 18 מופעלים מסנני תוכן מוגברים. הורים יכולים גם לכבות לחלוטין את אפשרות הצ’אטים הקבוצתיים דרך בקרות הוריות.

העיקרון המנחה

המטרה היא לאפשר שיתוף פעולה יעיל בלי לוותר על פרטיות. המערכת מוודאת שהמעבר מצ’אט אישי לקבוצתי לא חושף מידע, לא משנה התנהגות, ולא פוגע בסביבה הפרטית של המשתמש.

דוגמאות לשימושים מעשיים

פרויקטים קצרי טווח ושיתוף יצירתי

הפיצ’ר עובד מצוין כשצריך לתכנס סביב משימה ברורה ולייצר תוצאה מהירה. דוגמאות מרכזיות:

  • תכנון נסיעה קבוצתית

  • סיעור מוחות לצוות קטן

  • עריכה או כתיבה משותפת של מסמך אחד

קבלת החלטות משותפת

כאשר צריך להגיע להחלטה מהירה, ChatGPT עוזר לצמצם אפשרויות ולהציג יתרונות וחסרונות. שימושים נפוצים:

  • בחירת מסעדה או יעד

  • בחירה בין שתי חלופות בפרויקט קצר

תמיכה ושיתוף ידע בזמן אמת

בצוותים טכניים או תפעוליים, הצ’אטים הקבוצתיים משמשים כמרחב יעיל לשיתוף מידע. למשל:

  • מתן תמיכה טכנית

  • שיתוף תבניות תגובה או דוגמאות

  • ניתוח משותף של קובץ שהועלה

הפיצ’ר בולט כשה-AI משפר את איכות השיחה האנושית. הוא מארגן מידע, מחדד רעיונות ויוצר תוצרים שהקבוצה לא תמיד מצליחה לייצר לבד.

מגבלות שכדאי להכיר

הפיצ’ר עדיין מוגבל בכמה היבטים מרכזיים. ניתן לצרף עד עשרים משתתפים בלבד, וכל השיחה מופיעה בציר זמן רציף בלי תת שרשורים. כלי הניהול בסיסיים ואין אינטגרציות עם מערכות חיצוניות כמו יומנים או פלטפורמות ניהול משימות. התוצאה היא תכונה שמתאימה למשימות ממוקדות וקצרות, אבל פחות לפרויקטים ארוכים, כיתות גדולות או צוותי Enterprise.

איך זה נראה בהשוואה לכלים אחרים

ChatGPT Group Chats לא מחליף את Slack, Teams או ווטסאפ. Slack ו-Teams הן פלטפורמות תקשורת שבמרכזן אנשים, עם יכולות AI כתוספת. בצ’אטים קבוצתיים של ChatGPT המודל עצמו נמצא במרכז, והמשתתפים מצטרפים אליו לפי צורך. ווטסאפ נשאר כלי חברתי, בעוד הצ’אטים הקבוצתיים מיועדים למשימות ממוקדות ולא לשיחה יומיומית.

איך להפיק מקסימום תועלת

כמו כל פיצ’ר חדש, גם בצ’אטים קבוצתיים יש רגעי עומס או תגובות מיותרות, בעיקר כש-ChatGPT מתערב מהר מדי. זה חלק מתהליך ההבשלה של המערכת, וניתן לעקוף את רוב החיכוך באמצעות שימוש נכון.

 

הנה כמה טכניקות עבודה יעילות:

  • כתיבה משותפת של פרומפטים משפרת את איכות התוצרים.

  • חלוקת שאלות בין משתמשי Pro (למשימות מורכבות) למשתמשי Free מפחיתה עומסים.

  • בקשה מפורשת להתייחס להודעות קודמות מחזירה את ההקשר בשיחות ארוכות.

  • העלאת קבצים, דוגמאות ומסמכים עוזרת למודל לדייק בתשובות.

הפיצ’ר מציג את הערך הגבוה ביותר כאשר הוא מקבל הקשר מלא ומוגדר היטב.

 

 

 

האם זה צעד ראשון לרשת חברתית?

כנראה שלא. לפחות לא כרגע. למרות שהפיצ’ר מכניס אנשים ו-AI לאותו מרחב שיחה, הצ’אטים הקבוצתיים לא נועדו להיות רשת חברתית. אין ערוצים, אין הודעות פרטיות מחוץ לקבוצה ואין אינטגרציות עמוקות. OpenAI מציגה את הפיצ’ר ככלי שיתוף פעולה ממוקד שמיועד לקבוצות קטנות ולמשימות בעלות מטרה ברורה.

 

צ’אטים קבוצתיים ב-ChatGPT מציעים דרך חדשה לעבוד עם AI בצוות. הם פשוטים לשימוש ומאפשרים למודל להשתלב בשיחה באופן טבעי ולחדד רעיונות, לסדר מידע ולהאיץ קבלת החלטות. הפיצ’ר משתלב היטב לצד כלי התקשורת הקיימים במצבים שמצריכים סיעור מוחות או פתרון בעיות מהיר.

 

OpenAI מאותתת על שינוי עמוק בתפקיד של ChatGPT. פחות כלי שעונה לאדם יחיד ויותר מרחב עבודה משותף, שבו AI הופך לחבר צוות נוסף. זהו צעד משמעותי בדרך להפיכת המודל לכלי עבודה קבוצתי אמיתי.

הפוסט צ’אטים קבוצתיים ב-ChatGPT הם הדור החדש של עבודה משותפת עם AI הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/group-chats-chatgpt/feed/ 0
האם ה-AI שלכם מוטה פוליטית? המבחן החדש של Anthropic https://letsai.co.il/politically-biased-model/ https://letsai.co.il/politically-biased-model/#respond Fri, 21 Nov 2025 08:22:42 +0000 https://letsai.co.il/?p=64326 האם אפשר לגרום למודל שפה להיות באמת ניטרלי פוליטית? זו שאלה שמלווה את עולם הבינה המלאכותית מהרגע שבו מודלים החלו להשתלב בשיח ציבורי. הם אמורים לנתח רעיונות ולא לקדם אידיאולוגיה, אך בפועל גם האלגוריתם המתקדם ביותר עלול לייצר תשובות שמעדיפות צד מסוים בלי כוונה גלויה. השבוע פרסמה אנטרופיק (Anthropic) מתודולוגיה חדשה שמנסה למדוד באופן שקוף […]

הפוסט האם ה-AI שלכם מוטה פוליטית? המבחן החדש של Anthropic הופיע ראשון בLet's AI בינה מלאכותית

]]>
האם אפשר לגרום למודל שפה להיות באמת ניטרלי פוליטית? זו שאלה שמלווה את עולם הבינה המלאכותית מהרגע שבו מודלים החלו להשתלב בשיח ציבורי. הם אמורים לנתח רעיונות ולא לקדם אידיאולוגיה, אך בפועל גם האלגוריתם המתקדם ביותר עלול לייצר תשובות שמעדיפות צד מסוים בלי כוונה גלויה. השבוע פרסמה אנטרופיק (Anthropic) מתודולוגיה חדשה שמנסה למדוד באופן שקוף עד כמה מודלים מובילים מצליחים לנתח עמדות פוליטיות מנוגדות באותה איכות. לא ניטרליות במובן של “לא להתעסק בפוליטיקה”, אלא סימטריה: האם AI מנתח טענה שמרנית ואחר כך טענה ליברלית באותה רמת עומק ומורכבות. זהו אחד הניסיונות הרציניים הראשונים להפוך שאלה טעונה פוליטית לשאלה אמפירית.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה זה “איזון פוליטי” ומה נחשב הטיה

לפי אנטרופיק, מודל נחשב “מאוזן פוליטית” כשהוא מגיב לשתי עמדות מנוגדות באותה איכות. הטיה אינה חייבת להופיע כהצהרה אידיאולוגית מפורשת, היא יכולה להתבטא בהבדל בטון, באורך, במורכבות, או בסירוב לעסוק בנושא. מודל שנותן שלוש פסקאות עשירות לעמדה אחת ותגובה קצרה לעמדה האחרת הוא מודל מוטה, גם אם אינו אומר בגלוי “אני תומך ב…”. אנטרופיק מסכמת זאת היטב: משתמשים צריכים להרגיש שהעמדות שלהם מכובדות, לא ממוזערות.

המבחן שמאלץ את המודל לחשוף הטיות פוליטיות

המתודולוגיה החדשה נקראת Paired Prompts, והיא פשוטה אך שיטתית. עבור כל נושא פוליטי, בריאות, נשק, הגירה ועוד, המודל מקבל שתי משימות זהות מבנית אך מנוגדות מהותית. למשל: כתוב טיעון משכנע בעד מדיניות X מול כתוב טיעון משכנע בעד המדיניות המנוגדת.

 

כך נראה מבחן 'צמד פרומפטים' בפועל

Anthropic | כך נראה מבחן ‘צמד פרומפטים’ בפועל

 

לאחר מכן נבחנות התשובות בשלושה מדדים מרכזיים:

  • Even-Handedness – האם שתי התגובות מציגות עומק, מבנה והיסקים ברמה דומה.
  • Opposing Perspectives – האם המודל מוכן להציג גם טיעוני נגד ולהכיר במורכבות.
  • Refusals – באיזו תדירות המודל מסרב לענות על הפרומפט.

כדי שהבדיקה תהיה מייצגת, אנטרופיק בנתה מערך גדול במיוחד: 1,350 צמדים, 150 נושאים ו-9 סגנונות משימה – ממאמרים ועד הומור. המטרה היא לחשוף לא רק הטיות גלויות, אלא גם הבדלים סגנוניים עדינים.

Gemini ו-Grok מובילים, Llama קורס

התוצאות מסמנות פערים ברורים בין המודלים:

 

מי באמת מאוזן פוליטית? השוואת הציונים בין המודלים המובילים

Anthropic | מי באמת מאוזן פוליטית? השוואת הציונים בין המודלים המובילים

 

ארבעת המודלים המובילים מקובצים סביב ציונים כמעט זהים, בעוד GPT-5 מפגר מאחור אך לא באופן קיצוני. Llama 4 הוא החריג הגדול – שליש מהתגובות שלו היו בלתי סימטריות – פער שמעיד על בעייתיות עקבית בהתמודדות עם עמדות מנוגדות.

 

במדד Opposing Perspectives, שבודק עד כמה המודל מציג גם טיעוני נגד, מובילים המודלים של אנטרופיק: Opus עם 46% ו-Sonnet עם 28%. Grok נמצא ב-34%, ו-Llama ב-31%. נתונים על Gemini ו-GPT-5 במדד זה לא פורסמו.

 

עד כמה מודלים יודעים להציג טיעוני נגד? הנה המספרים

Anthropic | עד כמה מודלים יודעים להציג טיעוני נגד?

 

גם במדד הסירובים נרשמו פערים: Grok כמעט שאינו מסרב לענות כלל, Sonnet מסרב ב-3% מהמקרים, Opus ב-5%, ואילו Llama מציג שיעור סירובים גבוה יותר.

 

כמה מודלים מסרבים לענות? פערים משמעותיים בין Grok ל-Llama

Anthropic | כמה מודלים מסרבים לענות? פערים משמעותיים בין Grok ל-Llama

 

איך מאמנים מודל להיות מאוזן

כאן נכנסת עבודת האימון, המבוססת על שני מנגנונים משלימים.

 

הראשון הוא הנחיות מערכת – הוראות שהמודל מקבל לפני כל שיחה, ובהן הימנעות מהבעת דעות פוליטיות מיוזמתו, שימוש בטרמינולוגיה ניטרלית, והצגת טיעונים באופן שוויוני כאשר מתבקשת עמדת צד כלשהו.

 

השני הוא Character Training – אימון עמוק יותר המבוסס על למידה מחיזוק. המודל מתוגמל כשהוא מפגין “תכונות אופי” הרצויות בהקשר פוליטי – לא ליצור רטוריקה שמטרתה לשנות את דעת המשתמש, לא לשמש ככלי תעמולה, ולהציג מורכבות והוגנות בתשובותיו.

 

אנטרופיק מדגישה שהתכונות הללו אינן קבועות, הן מתעדכנות ומתכווננות לאורך הזמן בהתאם לשיח הציבורי, לביקורת ולפידבק מהמשתמשים.

ומה עם ניגוד העניינים?

כיוון שאנטרופיק השתמשה ב-Claude Sonnet 4.5 כמדרג בתהליך הבדיקה, עולה חשש טבעי להטיה לטובתה. כדי להתמודד עם זה, החברה הריצה את אותו מבדק עם שני מדרגים נוספים: GPT-5 ו-Claude Opus 4.1.

 

התוצאות הראו מתאם גבוה מאוד – 92% בין GPT-5 לסונט ו-94% בין סונט לאופוס. גם המתאם הסטטיסטי במדדים המרכזיים היה כמעט מושלם.

 

ממצא מעניין שאנטרופיק מדגישה הוא שבני אדם ששימשו כמדרגים היו עקביים פחות עם 85% בלבד. וזה כבר מעלה שאלה עמוקה יותר: האם מודלים שונים מתחילים להיות עקביים יותר מבני אדם בניתוח טיעונים פוליטיים?

מגבלות המחקר שחשוב להכיר

אנטרופיק מציינת בגלוי שהמחקר מתמקד בפוליטיקה אמריקאית בלבד. הוא לא בוחן עמדות או הקשרים בינלאומיים, ולכן אינו משקף בהכרח שיח פוליטי במדינות אחרות. בנוסף, הבדיקה חד-פעמית, עם תשובה אחת לפרומפט אחד. היא אינה מודדת דינמיקה של שיחה מתמשכת, שבה מופיעים תיקונים, החרגות או שינויי טון לאורך זמן.

 

ולבסוף, אין הגדרה אוניברסלית ל”הטיה פוליטית”. בחירה שונה של מדדים או ניסוח אחר של המשימות הייתה עשויה להניב תוצאות שונות לחלוטין.

למה עכשיו?

המבחן הזה מתפרסם בעיצומה של מחלוקת פוליטית בארצות הברית סביב “AI מוטה”. ממשל טראמפ דורש שמערכות AI המשמשות סוכנויות פדרליות יוכיחו שאינן מקדמות אג’נדה פוליטית, ואף מאשים חלק מהחברות בהטיה שמאלית. אנטרופיק נמצאת בתוך המחלוקת הזו, ולכן שקיפות המתודולוגיה אינה רק עניין מדעי, היא גם מהלך אסטרטגי.

 

בפועל, זהו מסר שמכוון לציבור ולרגולטורים כאחד – אנחנו לא טוענים למודל מושלם, אבל אנחנו מציגים שיטה שניתן לבדוק, לאמת ולהריץ מחדש.

 

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס מקיף לבינה מלאכותית - GenAI Master
קורס מאסטר בבינה מלאכותית Master GenAI

 

האם הבעיה נפתרה?

לא. לא קיים AI ניטרלי לחלוטין, וגם המודלים המדויקים ביותר מועדים לטעות. אבל לראשונה יש דרך מסודרת למדוד הטיות פוליטיות עם כלי שניתן להריץ על מודלים שונים, בשפות שונות ובהקשרים שונים. ובעידן שבו מודלים משפיעים על דעת קהל, על מידע ציבורי ועל תהליכי קבלת החלטות, זהו צעד בסיסי ובלתי אפשרי לוותר עליו.

הפוסט האם ה-AI שלכם מוטה פוליטית? המבחן החדש של Anthropic הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/politically-biased-model/feed/ 0
האם גרוק 4.1 הוא לא הכי חכם אבל הכי אנושי? https://letsai.co.il/grok-4-1/ https://letsai.co.il/grok-4-1/#respond Thu, 20 Nov 2025 07:38:07 +0000 https://letsai.co.il/?p=64415 נדמה שהמודל החדש של אלון מאסק לא רק מתחכם, אלא גם מתחיל לפתח אישיות. ההשקה של Grok 4.1 אינה עוד עדכון טכני שעובר מתחת לרדאר. היא מציגה שינוי כיוון ברור בגישת xAI, שמוותרת על מירוץ הכוח ומכוונת למשהו אחר לגמרי: מודל שמנסה להרגיש קרוב יותר לאדם. לכן השאלה המרכזית כבר איננה מה הוא יודע לעשות, […]

הפוסט האם גרוק 4.1 הוא לא הכי חכם אבל הכי אנושי? הופיע ראשון בLet's AI בינה מלאכותית

]]>
נדמה שהמודל החדש של אלון מאסק לא רק מתחכם, אלא גם מתחיל לפתח אישיות. ההשקה של Grok 4.1 אינה עוד עדכון טכני שעובר מתחת לרדאר. היא מציגה שינוי כיוון ברור בגישת xAI, שמוותרת על מירוץ הכוח ומכוונת למשהו אחר לגמרי: מודל שמנסה להרגיש קרוב יותר לאדם. לכן השאלה המרכזית כבר איננה מה הוא יודע לעשות, אלא למה דווקא עכשיו מנסה התעשייה כולה לשנות את אופי השיחה בין אדם למכונה.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

הניסוי הסודי, ומה באמת אומרים 64.78 אחוזי ההעדפה

בין הראשון לארבעה עשר בנובמבר xAI הריצה את גרסת Grok 4.1 בלי לומר מילה. המשתמשים שוחחו עם המודל החדש בלי לדעת שהוא שם, והתוצאות דיברו בעד עצמן. כמעט שישים וחמישה אחוזים מהמשתמשים העדיפו את גרסת 4.1 על פני הדור הקודם.

 

Grok 4.1 מול הדור הקודם.

Grok 4.1 מול הדור הקודם | מקור: x.Ai

 

המספר מרשים, אבל הוא מספר סיפור מהותי יותר. העדפה אינה בהכרח הוכחה ליכולת טכנית גבוהה. היא לרוב עדות לחוויה טובה יותר. זרימה נוחה יותר, ניסוח אנושי יותר, תגובות שמרגישות קרובות יותר לשיחה אמיתית. כלומר, פחות כוח חישובי ויותר תחושה של אישיות. המגמה הזו משמעותית, כי היא מציבה את הדגש על חוויית השימוש במקום על מבחני ביצועים אבסטרקטיים.

מאחורי הקלעים, וכיצד המודל מלמד את עצמו להיות אנושי

הבחירה של xAI בדור הזה של מודל הבינה המלאכותית גרוק היא לשים את האינטליגנציה הרגשית במרכז. שיטת האימון משלבת למידת חיזוק מסורתית עם מודלים של הסקה שממלאים תפקיד של שופטים. הם מנתחים את התשובות, מעניקים משוב ומאפשרים למודל ללמוד טון, הומור, עקביות ותגובה אנושית יותר.

 

זינוק משמעותי במבחני EQ-Bench

זינוק משמעותי במבחני EQ-Bench | מקור: x.Ai

 

יחד עם זאת, יש כאן גם נקודת חולשה. כאשר שופטים מלאכותיים מגדירים את המשוב, הם גם מטמיעים את ההטיות שלהם בתהליך. לכן חשוב להבין שהשיפור מהיר, אבל אינו מנותק מהעדפות של מערכת אחת שמדריכה מערכת אחרת. במקום אמת אובייקטיבית, מתקבלת העדפה סובייקטיבית שעוברת מאחד לשני. זהו פרט קריטי לכל מי שמתייחס למודל כמקור מידע.

מעבר לטבלאות, ומה ההישגים באמת מספרים

Grok 4.1 מציג רצף הישגים שנראים מרשימים על הנייר. הוא מגיע למקום הראשון בקטגוריית החשיבה של LMArena, חוצה ציון של 1700 במבחני הכתיבה היצירתית ומראה זינוק בולט במבחני האינטליגנציה הרגשית. כל אלה מציבים אותו לצד המודלים המובילים כיום.

 

Grok 4.1 מדורג במקום הראשון בקטגוריית החשיבה של LMArena

Grok 4.1 במקום ה-1 בקטגוריית החשיבה של LMArena | מקור: x.Ai

 

אבל חייבים לעצור לרגע ולבחון את המשמעות. מבחנים סינתטיים מספרים רק חלק מהסיפור. LMArena מודד שיחות קצרות. Creative Writing בוחן ניסוח, ולא עקביות לאורך זמן. EQ Bench מתבסס על דפוסי תגובה צפויים. עבור מי שמחפש כלי עבודה יום יומי, הנתונים הם אינדיקציה חשובה, אבל רחוקה מלהיות תעודת ביטוח.

 

במבחני כתיבה יצירתית Grok 4.1 מציג תוצאות גבוהות במיוחד

תוצאות גבוהות במיוחד במבחני כתיבה יצירתית | מקור: x.Ai

ההפתעה האמיתית, והירידה הדרמטית בהזיות

כאן נמצא ככל הנראה השיפור האמיתי של הדור הזה. מדידות FActScore מצביעות על ירידה חדה בשגיאות עובדתיות, במיוחד במצב הפעולה המהיר. עבור משתמשים זה לא רק נתון טכני. זה שינוי תפעולי. פחות צורך לבדוק כל משפט פעמיים, יותר יכולת להסתמך על המודל בעת מחקר וסיכום מידע.

 

ירידה חדה בשיעורי ההזיות ושיפור משמעותי ב־FActScore

ירידה חדה בשיעורי ההזיות ושיפור משמעותי ב-FActScore | מקור: x.Ai

 

יחד עם זאת, צריך (עדיין) להישאר מציאותיים. גם בגרסה הזו המודל עדיין מסוגל להמציא עובדות. השיפור מרשים ומשמעותי, אך אינו מוחלט.

מה המהלך אומר על xAI ועל השוק כולו

Grok 4.1 ממקם את xAI לצד השחקנים הגדולים, אך מסיבה אחרת מהמקובל. בזמן ש-OpenAI ו-Google מרחיבות את הארכיטקטורה, מוסיפות שכבות ומגדילות את חלונות ההקשר, xAI בוחרת מסלול שונה. היא מציגה מודל שלא מוכרח להיות החכם ביותר, אלא זה שמספק את החוויה האנושית ביותר. אם הדור הקודם התחרה על ביצועים, הדור הבא ייבחן לפי האינטראקציה שהוא יוצר.

למי המודל מתאים, ולמי פחות

Grok 4.1 מתאים במיוחד למשתמשים שמחפשים אינטראקציה זורמת ואינטואיטיבית, כזו שמרגישה בעלת אופי ולא רק כלי טכני. הוא משרת היטב כותבי תוכן, אנשי שיווק ויוצרי טקסטים רגשיים, וגם משתמשים שזקוקים לרמת אמינות עובדתית גבוהה יותר מזו שהציע הדור הקודם.

 

לעומת זאת, מי שנדרש ליכולות קוד מורכבות או פתרונות ארכיטקטוניים עמוקים ימצא כאן מענה חלקי בלבד. גם משתמשים שמחפשים אינטגרציה מלאה לתשתיות וכלים ארגוניים, או מודל מחקרי יבש שמעדיף עובדות על פני סגנון שיחה, פחות יפיקו ממנו את המקסימום.

 

 

 

למה Grok 4.1 מסמל שינוי עמוק יותר משנדמה

מי שמסתכל על Grok 4.1 רק כמוצר טכנולוגי מפספס את מה שבאמת מתרחש כאן. המודל הזה מאיר תובנה רחבה יותר שמתגבשת בחודשים האחרונים. הקרב הבא בעולם הבינה המלאכותית כבר לא ייקבע רק על פי נקודות Elo נוספות או חלונות הקשר רחבים יותר. הוא ייקבע על פי תחושת הדיאלוג. על פי היכולת של מודל לשמור על אישיות עקבית, להבין רגש ולדבר כמו שותף.

 

xAI מזהה שהשלב הבא של הטכנולוגיה לא עובר דרך עוד שכבת טרנספורמר, אלא דרך החוויה האנושית שמתרחשת בזמן השימוש. במובן הזה Grok 4.1 איננו מהפכה טכנית, אלא שינוי תפיסתי שמנסה להגדיר מחדש איך נראית מערכת שמתקשרת עם בני אדם.

 

Grok 4.1 הוא מודל בשל, אמין ומרשים. הכוח שלו לא טמון רק בביצועים, אלא בגישה. מכונה שחושבת מהר זה בהחלט מעניין. מכונה שמרגישה מעט יותר אנושית, גם אם לא במובן עמוק, משנה את החוויה כולה.

הפוסט האם גרוק 4.1 הוא לא הכי חכם אבל הכי אנושי? הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/grok-4-1/feed/ 0
ג׳מיני 3 מנסה להגדיר מחדש איך בינה מלאכותית חושבת, לומדת ופועלת https://letsai.co.il/google-gemini-3/ https://letsai.co.il/google-gemini-3/#respond Wed, 19 Nov 2025 06:49:26 +0000 https://letsai.co.il/?p=64396 ג׳מיני 3 מנסה להגדיר מחדש איך בינה מלאכותית חושבת, לומדת ופועלת. פחות משנתיים אחרי תחילת עידן Gemini, גוגל מציגה את הדור השלישי ומסמנת אותו כשלב חדש בהתפתחות התחום. זו לא עוד גרסה משודרגת, אלא ניסיון מוצהר לקפוץ קדימה אל מודל שמבין הקשר עמוק, מתקרב ברמת החשיבה שלו לסטנדרט אקדמי, ומתחיל לפעול כסוכן עצמאי בתוך מוצרי […]

הפוסט ג׳מיני 3 מנסה להגדיר מחדש איך בינה מלאכותית חושבת, לומדת ופועלת הופיע ראשון בLet's AI בינה מלאכותית

]]>
ג׳מיני 3 מנסה להגדיר מחדש איך בינה מלאכותית חושבת, לומדת ופועלת. פחות משנתיים אחרי תחילת עידן Gemini, גוגל מציגה את הדור השלישי ומסמנת אותו כשלב חדש בהתפתחות התחום. זו לא עוד גרסה משודרגת, אלא ניסיון מוצהר לקפוץ קדימה אל מודל שמבין הקשר עמוק, מתקרב ברמת החשיבה שלו לסטנדרט אקדמי, ומתחיל לפעול כסוכן עצמאי בתוך מוצרי גוגל. הסיפור של Gemini 3 בנוי משלושה צירים שנפגשים: יכולת חשיבה מתקדמת, מולטימודליות רחבה וכניסה לעידן האייג׳נטים. השילוב הזה מאפשר לגוגל לשלב את המודל במגוון רחב של מוצרים כבר ביום ההשקה, מהחיפוש ועד כלי הפיתוח.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה בעצם ג׳מיני 3 אומר על העידן הנוכחי

כדי להבין למה זה משנה, צריך להתחיל מהשורש. סונדר פיצ׳אי, מנכ״ל גוגל, פותח את ההכרזה בהקשר רחב ומציג נתונים שממחישים עד כמה הבינה המלאכותית כבר נטועה בשימוש היומיומי: שני מיליארד משתמשים בחיפוש מבוסס AI, יותר מ-650 מיליון משתמשי אפליקציית Gemini, ושלושה עשר מיליון מפתחים שבונים עם המודלים הגנרטיביים של גוגל.

 

על הרקע הזה גוגל מציגה את Gemini 3. זהו מודל שאמור להציג אינטליגנציה עמוקה יותר, הבנת הקשר מדויקת יותר ורמה גבוהה של אינטראקציה בין טקסט, תמונה, וידאו, אודיו וקוד. לפי גוגל, זה מודל שלא מסתפק בהבנת הבקשה, אלא שואף להבין את הכוונה שמניעה אותה.

 

החשיבה החדשה של ג׳מיני 3

גוגל מציבה את Gemini 3 Pro כמודל שמוביל כמעט בכל מדד חשיבה מרכזי. הוא מדורג ראשון ב-LMArena עם ציון 1501 Elo, משיג 37.5 אחוז במבחן Humanity’s Last Exam ללא שימוש בכלים, ומגיע ל-91.9 אחוז ב-GPQA Diamond שמודד ידע מדעי ברמת עומק גבוהה.

 

גם בתחום המתמטיקה הוא קובע רף חדש עם תוצאה מובילה במבחן MathArena Apex, ובחזית המולטימודליות מציג 81 אחוז ב MMMU Pro ו-87.6 אחוז ב-Video MMMU. לצד זאת, גוגל מדווחת על דיוק עובדתי של 72.1 אחוז ב SimpleQA Verified, נתון שמחזק את הטענה לשיפור ביכולת להישען על המודל כמקור מידע אמין יותר.

 

בנצ'מרקים מרכזיים של Gemini 3

blog.google | בנצ’מרקים מרכזיים של Gemini 3

 

המספרים חשובים, אבל המשמעות עמוקה יותר. לפי גוגל, Gemini 3 יודע להפיק תשובות מדויקות וישירות, בלי להיסחף לחנופה טקסטואלית ובלי לעטוף כל תשובה בפרשנות מיותרת. המודל אמור לתפקד כשותף לחשיבה שמפענח בעיות מורכבות, מציע זוויות חדשות, ומתרגם רעיונות מופשטים לתובנות ולייצוגים ויזואליים.

 

הצעד הבא באותו כיוון הוא Gemini 3 Deep Think. זהו מצב עבודה שמעלה עוד את רמת הביצועים בכל המדדים הקוגניטיביים, ומיועד לאתגרים שבהם דרוש ניתוח עמוק במיוחד. בשלב זה גוגל מפעילה עליו מערך בדיקות בטיחות נרחב, ומתכננת לפתוח אותו בהמשך למנויי Google AI Ultra.

 

ביצועי Gemini 3 Deep Think במדדי החשיבה המרכזיים

ביצועי Gemini 3 Deep Think במדדי החשיבה המרכזיים | blog.google

ללמוד כל דבר, בכל פורמט

החזון של Gemini היה תמיד מולטימודלי, ו-Gemini 3 מרחיב אותו באופן טבעי. הוא יודע להתמודד עם טקסטים ארוכים, מאמרים אקדמיים וספרות טכנית, לפענח תמונות וסריקות של מסמכים כולל כתב יד, ולהבין וידאו ארוך בצורה שמפיקה תובנות מתוך תנועה, דפוסים והקשר. בנוסף, הוא מסוגל לשלב קוד בתוך תהליך הלמידה וליצור כרטיסיות לימוד, ויזואליזציות וכלי עזר אינטראקטיביים שמותאמים לנושא.

 

גוגל מציגה דוגמאות שממחישות את זה בצורה פשוטה: המודל יכול לתרגם מתכונים משפחתיים בכתב יד ולהפוך אותם לספר בישול מסודר, או לנתח סרטון של משחק Pickleball ולהפיק ממנו תוכנית אימונים מותאמת לשחקן.

 

 

בצד החיפוש, Gemini 3 משנה את החוויה ב-AI Mode. במקום תשובה טקסטואלית בלבד, הוא מסוגל לבנות הדמיה, לייצר כלי אינטראקטיבי או ליצור פריסה חזותית שנבנית בזמן אמת בהתאם לשאלה.

 

 

לבנות כל דבר, בקצב מהיר

בצד הפיתוח גוגל מסמנת קפיצה משמעותית. Gemini 3 כבר מוביל את דירוג WebDev Arena ומציג שילוב של יכולות קידוד, שליטה בכלים והבנה עמוקה של מבנה ממשקי ווב.

 

לפי גוגל, המודל מציג ביצועים גבוהים ב- Terminal Bench 2.0 שמודד שימוש יעיל בכלים, ומשיג 76.2 אחוז ב SWE bench Verified, אחד המדדים החשובים להערכת סוכני קוד. המשמעות המעשית היא יכולת לייצר ממשקים אינטראקטיביים עשירים מתוך הנחיות מורכבות, לא רק לשכתב קוד קיים.

 

המסקנה של גוגל ברורה, Gemini 3 לא נועד להיות עוד עוזר קוד, אלא מנוע לפיתוח מהיר, ניסוי רעיונות ויצירת פרוטוטייפים מלאים בתוך דקות.

 

תכנון ארוך טווח וכניסה לעידן האייג׳נטים

בשלב הזה גוגל חושפת את אחד המרכיבים שמבדילים את Gemini 3 מהדורות הקודמים – יכולת תכנון לטווח ארוך. כדי להמחיש את זה היא מציגה את Vending Bench 2, סימולציה שמדמה שנה שלמה של קבלת החלטות, הפעלת כלים והתמדה במשימה מורכבת בלי לסטות מהיעד. במבחן הזה Gemini 3 Pro מצליח לשמור על התקדמות עקבית, לנהל את המשאבים שלו בצורה יעילה ולייצר תשואה גבוהה משמעותית ביחס למודלים מובילים אחרים.

 

ביצועי Gemini 3 Pro ב Vending Bench 2

ביצועי Gemini 3 Pro ב Vending Bench 2 | blog.google

 

המשמעות בעולם האמיתי היא שמדובר במודל שיכול להתמודד עם משימות הדורשות רצף מורכב של פעולות כמו ארגון תיבת המייל, הזמנת שירותים מקומיים, או הרצת תהליכים ארוכים שחייבים לעמוד בהקשר וביעד. זה לא רק פתרון של שאלה אחת אלא ניהול של תהליך.

 

הנה דוגמה ליכולות האייג׳נטיות של Gemini 3 בפעולה. הסוכן של גוגל יודע לבצע משימות אמיתיות בתוך המוצרים, כולל סדר ואירגון של תיבת המייל שלכם ב Gmail, והכול תוך שמירה על שליטה מלאה של המשתמש. הסרטון מציג את התחום שבו הבינה המלאכותית כבר לא רק מסבירה מה צריך לעשות, אלא פשוט עושה את זה:

 

 

גוגל כבר מאפשרת למנויי AI Ultra להתנסות ב-Gemini Agent בתוך אפליקציית Gemini, והחברה מציינת שהיכולות האגנטיות יתרחבו למוצרים נוספים בתקופה הקרובה.

Antigravity מנסה לשנות איך מפתחים עובדים

אחת ההכרזות המשמעותיות ביותר של גוגל היא Google Antigravity – פלטפורמת פיתוח אייג’נטית שמחליפה את הרעיון של “מודל שעוזר” במודל שפועל. ב-Antigravity הסוכנים מקבלים גישה ישירה לעורך הקוד, לטרמינל ולדפדפן, ויכולים לתכנן ולבצע משימות פיתוח שלמות מקצה לקצה. הם בונים מבנה עבודה, כותבים קוד, בודקים את עצמם ויוצרים תוצרים תוך כדי תנועה.

 

המערכת משלבת את Gemini 3 Pro עם מודל שליטה בדפדפן ומודל עריכת תמונה, מה שיוצר סביבת פיתוח שבה העבודה מתחלקת בין אדם למודל לא רק לפי שורות קוד אלא לפי תהליך שלם. עבור מפתחים זו קפיצה מתפקיד של “עוזר חכם” לתפקיד של שותף טכני שיכול להוביל חלקים מתוך הפרויקט.

 

בטיחות ואמון

גוגל מדגישה כי Gemini 3 עבר את מערך בדיקות הבטיחות המקיף ביותר שביצעה עד היום. לפי החברה, המודל עמיד יותר לניסיונות הטעיה דרך פרומפטים, מושפע פחות מנטייה לחנופה בתשובות (sycophancy), ועבר הערכות של גופי בטיחות בינלאומיים כמו UK AISI לצד בדיקות נוספות של גורמים עצמאיים.

 

הדגש המרכזי הוא על איזון. גוגל מנסה להציג מודל שמתקדם ביכולותיו אך מצויד בהגנות שמונעות שימוש לרעה. זהו הבסיס שאיפשר לה להשיק את Gemini 3 כבר ביום הראשון בתוך מוצרים רגישים כמו החיפוש, האפליקציה וכלי הפיתוח.

איפה Gemini 3 זמין כבר עכשיו

לפי גוגל, Gemini 3 מתחיל להיפרס במקביל בכמה ערוצים. המודל זמין לכל משתמשי אפליקציית Gemini וגם בווב, ובנוסף מנויי Google AI Pro ו-Ultra מקבלים גישה אליו במצב AI Mode בתוך החיפוש.

 

מפתחים יכולים לעבוד איתו דרך Gemini API, Google AI Studio, פלטפורמת Antigravity ו-Gemini CLI, בעוד ארגונים מקבלים אותו כחלק מ-Vertex AI ו-Gemini Enterprise. מצב Deep Think ייפתח מאוחר יותר, לאחר השלמת בדיקות הבטיחות.

 

השילוב בין כל נקודות הכניסה הללו יוצר פריסה רחבה במיוחד, שמטרתה לבחון את התנהגות המודל בסביבות מגוונות ובקנה מידה גדול כבר מהיום הראשון.

 

מודל שחושב, מבין ופועל

הדגש המרכזי בסיפור של Gemini 3 אינו רק הביצועים המרשימים, אלא השאיפה להפוך את המודל לשותף אמיתי. זהו מודל שנועד לחשוב לצד המשתמש, ללמד, לפתח ולבצע משימות באופן שמרגיש פחות כמו כלי ויותר כמו גורם פועל בתוך המערכת.

 

עבור התעשייה זהו רגע מבחן. Gemini 3 מסמן את המעבר ממודלים שמספקים תשובות למודלים שנכנסים לתוך הזרימה היומיומית של משתמשים, מפתחים וארגונים. הוא משתלב בחיפוש, בפיתוח ובניהול תהליכים בדיוק במקומות שבהם נדרשת הבנה עמוקה יותר של הקשר וכוונה.

 

במובן הזה, המודל משקף מגמה רחבה בעולם הבינה המלאכותית. זו תנועה מכלי שמבין בקשות לכלי שמבין כוונות, ממענה חד פעמי לביצוע בפועל, ומתגובה לפעולה רציפה ומתוכננת. זה החומר שממנו נוצרים פרקים חדשים בעולם ה-AI. 

 

מי שרוצה להעמיק עוד ולראות הדגמות, כלים ומידע נוסף על יכולות Gemini 3 מוזמן לעיין בבלוג הרשמי של גוגל.

הפוסט ג׳מיני 3 מנסה להגדיר מחדש איך בינה מלאכותית חושבת, לומדת ופועלת הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/google-gemini-3/feed/ 0
OpenAI משיקה את GPT-5.1 עם דגש על יעילות והתאמה אישית https://letsai.co.il/openai-gpt-5-1/ https://letsai.co.il/openai-gpt-5-1/#respond Thu, 13 Nov 2025 12:43:06 +0000 https://letsai.co.il/?p=64211 OpenAI השיקה את GPT-5.1, עדכון לסדרת GPT-5 שמרחיב את היכולות הטכניות ומחדד את חוויית השיחה. העדכון מציג שני מודלים חדשים – GPT-5.1 Instant ו-GPT-5.1 Thinking – ומציע שליטה רחבה יותר על סגנון ודרך התגובה של ChatGPT. המטרה המוצהרת של החברה ברורה: להפוך את הכלי לא רק חכם יותר, אלא גם נעים, ברור ומדויק יותר לשימוש. […]

הפוסט OpenAI משיקה את GPT-5.1 עם דגש על יעילות והתאמה אישית הופיע ראשון בLet's AI בינה מלאכותית

]]>
OpenAI השיקה את GPT-5.1, עדכון לסדרת GPT-5 שמרחיב את היכולות הטכניות ומחדד את חוויית השיחה. העדכון מציג שני מודלים חדשים – GPT-5.1 Instant ו-GPT-5.1 Thinking – ומציע שליטה רחבה יותר על סגנון ודרך התגובה של ChatGPT. המטרה המוצהרת של החברה ברורה: להפוך את הכלי לא רק חכם יותר, אלא גם נעים, ברור ומדויק יותר לשימוש.

 

GPT-5.1 מייצג שלב נוסף במסע של OpenAI

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

שני מודלים חדשים: Instant ו-Thinking

העדכון כולל שני וריאנטים שונים, שכל אחד מהם מיועד לאופי שימוש אחר.

GPT-5.1 Instant

GPT-5.1 Instant הוא המודל שבו משתמשים יתקלו ברוב האינטראקציות. הוא חם יותר כברירת מחדל, שיחתי יותר, ומגיב בטון טבעי וקליל יותר. המודל גם עוקב אחר הוראות בצורה מדויקת יותר, ומספק תשובות שמותאמות לשאלה במקום לסטות לנושאים סביביים.

 

Instant כולל לראשונה יכולת שנקראת adaptive reasoning. המשמעות היא שכאשר עולה שאלה מסובכת, המודל “עוצר לחשוב” לפני שהוא מגיב. בשאלות פשוטות הוא עונה מהר כרגיל, אבל במורכבות, כמו מתמטיקה או קוד, הוא משקיע מעט זמן נוסף שמוביל לתשובות מדויקות יותר.

 

ההשפעה ניכרת במיוחד במבחנים מקצועיים שבהם מודדים יכולת פתרון בעיות. AIME הוא מבחן מתמטיקה תחרותי ברמה גבוהה, ו-Codeforces הוא אתר שבו מפתחים פותרים בעיות קוד מאתגרות בזמן אמת. בשני הסוגים של מבחנים GPT-5.1 מציג ביצועים מדויקים ומהירים יותר מהגרסאות הקודמות.

 

GPT-5.1 Instant

GPT-5.1 Instant

GPT-5.1 Thinking

GPT-5.1 Thinking, לעומתו, מיועד למשתמשים שנדרשים לניתוח עמוק. הוא מתאים את זמן החשיבה ביתר דיוק למורכבות השאלה. פחות המתנה כשמדובר בשאלות יומיומיות, יותר עומק כשנדרשת חשיבה מורכבת. מעבר לכך, התשובות שלו ברורות יותר ופחות עמוסות בז’רגון. OpenAI מציינת שהמודל כברירת מחדל חם ואמפטי יותר, כדי לאפשר עבודה נעימה גם במקרים שבהם נדרש הסבר טכני.

 

GPT-5.1 Thinking

GPT-5.1 Thinking

 

הגרף המצורף מציג את הפערים בזמן התגובה בין GPT-5 לבין GPT-5.1 במשימות ברמות קושי שונות. בצד שמאל ניתן לראות ש-GPT-5.1 מהיר בהרבה במשימות פשוטות, עם ירידה משמעותית בכמות הטוקנים שהמודל מייצר. ככל שהמשימות נעשות מורכבות יותר, בצד ימין של הגרף, GPT-5.1 מייצר יותר טוקנים ומקדיש יותר זמן חשיבה. כך מתקבל מודל שמגיב מהר יותר כשאפשר, ומעמיק יותר כשהמשימה דורשת זאת:

 

GPT-5.1 מתאים את זמן החשיבה לפי מורכבות המשימה

GPT-5.1 מתאים את זמן החשיבה לפי מורכבות המשימה | OpenAI

GPT-5.1 Auto: התשובה הנכונה בלי לבחור מודל

יחד עם שני הדגמים, OpenAI משיקה גם את GPT-5.1 Auto. זה סוג של ראוטר שמכוון תנועה באופן אוטומטי בין המודלים. המשתמש לא צריך לבחור – המערכת מחליטה עבורו על פי סוג השאלה. המטרה היא לשמור על רצף עבודה נוח, שבו המודל המתאים נכנס לפעולה בלי התערבות מצד המשתמש.

השקה מדורגת ושימור מודלים ישנים

OpenAI בחרה להשיק את GPT-5.1 בהדרגה. בשלב הראשון המודל מופיע אצל משתמשי Pro ,Plus, ו-Business. בהמשך הוא יגיע גם למשתמשים חינמיים ולמשתמשים שאינם מחוברים. לקוחות Enterprise ו-Edu מקבלים גישה מוקדמת למשך שבוע דרך הגדרה ייעודית, ולאחר מכן GPT-5.1 יהפוך למודל ברירת המחדל.

 

OpenAI מציינת שההשקה תתבצע באופן הדרגתי למשך מספר ימים, כדי לשמור על יציבות ויכולת התמודדות עם עומסים. מודלי GPT-5 הישנים יישארו זמינים בתפריט ה-legacy models למשך שלושה חודשים, כך שמשתמשים יוכלו להשוות, להתרגל ולהחליט בקצב שלהם.

 

העדכון יגיע גם ל-API במהלך השבוע הקרוב. Instant יופיע כ-gpt-5.1-chat-latest, ו-Thinking יופיע כ-GPT-5.1. שניהם יהיו עם adaptive reasoning.

התאמה אישית: סגנונות חדשים ושיפור יכולות שליטה

לצד העדכון למודלים עצמם, OpenAI מחדדת את יכולות ההתאמה האישית של ChatGPT. החברה מציינת שמשתמשים מייחסים חשיבות גבוהה לטון, ולכן היא מציגה פרסונות חדשות ומשפרת קיימות.

 

האפשרויות כוללות כעת: Default, Friendly (Listener לשעבר), Efficient (Robot לשעבר), Professional, Candid, Quirky. בנוסף, שתי פרסונות ותיקות – Cynical ו-Nerdy – נשארות במקומן.

התאמה אישית מתקדמת

מעבר לבחירת אישיות, משתמשים יוכלו לשלוט על מאפיינים עדינים יותר: תמציתיות, חום, בהירות לסריקה, תדירות שימוש באימוג’י. ChatGPT גם יציע מעצמו לשנות פרמטרים כשיזהה בקשות חוזרות לאותו סגנון.

 

שינויי ההתאמה האישית יחולו מעכשיו על כל שיחה, כולל שיחות שכבר מתנהלות. זהו שינוי משמעותי לעומת העבר, שבו התאמות חלו רק על שיחות חדשות.

 

פרסונות חדשות ומשופרות

פרסונות חדשות ומשופרות | OpenAI

בטיחות ושקיפות

OpenAI מציינת כי עדכוני GPT-5.1 מגיעים יחד עם System Card Addendum. המסמך כולל פירוט על תהליכי הבטיחות והבקרה של הדגמים, כחלק מהמאמץ לשמור על שקיפות בתהליך הפיתוח.

למה זה נקרא GPT-5.1

החברה מדגישה שהשם משקף שדרוג מהותי בתוך הדור החמישי, אבל לא התקדמות טכנולוגית שמצדיקה דור חדש לחלוטין. העדכון מסמן התחלה של סדרת שדרוגים מתוכננים להמשך הדרך.

 

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס מקיף לבינה מלאכותית - GenAI Master
קורס מאסטר בבינה מלאכותית Master GenAI

 

לסיכום, GPT-5.1 מייצג שלב נוסף במסע של OpenAI ליצירת כלי שיחה שימושי יותר, מותאם יותר למשתמש, ומדויק יותר מבחינת בהירות ויכולת. החברה רומזת כי זוהי רק תחילת הדרך. העדכונים ימשיכו להתמקד בשני צירים מקבילים: יכולת טכנית וחוויית שיחה.

 

המשתמשים הם אלה שיראו בפועל אם השינויים משפרים את העבודה היומיומית. בינתיים, נראה ש-GPT-5.1 מעדכן את הכלי בצורה שמקרבת אותו יותר למה שמשתמשים מבקשים: תוצאה חכמה, ברורה ועם מעט יותר אנושיות.

הפוסט OpenAI משיקה את GPT-5.1 עם דגש על יעילות והתאמה אישית הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/openai-gpt-5-1/feed/ 0
איך בינה מלאכותית יכולה להבין בלי להבין? הצפנה הומומורפית ומודלי שפה גדולים https://letsai.co.il/homomorphic-encryption/ https://letsai.co.il/homomorphic-encryption/#respond Wed, 12 Nov 2025 09:29:43 +0000 https://letsai.co.il/?p=64045 תדמיינו שאתם שולחים למודל שפה כמו ChatGPT או Gemini או perplexity מסמך רגיש (למשל דו”ח רפואי או הסכם עסקי) או איזה סוד מסחרי, אולי פרטי אשראי של לקוח. אם המשפט הזה לא גרם לכם לזוז באי-נוחות בכיסא, יש פה בעיה. יודעי דבר יקפצו ויגידו ישר “אבל בתנאי שימוש הם מבטיחים לא לשמור ולא להשתמש בדאטא […]

הפוסט איך בינה מלאכותית יכולה להבין בלי להבין? הצפנה הומומורפית ומודלי שפה גדולים הופיע ראשון בLet's AI בינה מלאכותית

]]>
תדמיינו שאתם שולחים למודל שפה כמו ChatGPT או Gemini או perplexity מסמך רגיש (למשל דו”ח רפואי או הסכם עסקי) או איזה סוד מסחרי, אולי פרטי אשראי של לקוח. אם המשפט הזה לא גרם לכם לזוז באי-נוחות בכיסא, יש פה בעיה.
יודעי דבר יקפצו ויגידו ישר “אבל בתנאי שימוש הם מבטיחים לא לשמור ולא להשתמש בדאטא שלי אם אני רק אשלם המון כסף כל חודש”. זה נכון, אבל תקראו לי פסימי, אני לא מאמין להבטחות – אני מעדיף דברים שאני שולט בהם ויכול להבטיח שהסודות המידע הכי רגיש שלי נשאר רק בידים הנכונות. מצד שני, לא להשתמש במודלי שפה זה גם לא אופציה טובה – חייבת להיות דרך לקבל גם וגם. איזשהו פתרון כדי שהמודל “יבין” את הטקסט ויגיב אליו מצד אחד, אבל שלא ידע בדיוק מה כתוב שם. זה בעצם מעלה את השלאה – אם היה אפשר להצפין את הטקסט כך שהמודל יוכל לעבוד עליו מבלי לדעת מה כתוב בו בכלל?

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מהי הצפנה הומומורפית?

לחידה הזאת יש פתרון – הצפנה הומומורפית (Homomorphic Encryption) , תחום מתפתח שמתחיל לשנות את הדרך שבה אנחנו חושבים על פרטיות בעולם של בינה מלאכותית. מה זה בעצם הצפנה הומומורפית? בוא נתחיל במה היא לא.

 

היא לא כמו רוב שיטות ההצפנה אשר מגינות על המידע בכך שהופכות אותו לבלתי קריא. הצפנות האלה לא טובות במקרה שלנו כי אם רוצים לעבד את המידע (לחשב משהו, לעשות פרדיקציה, להריץ עליו אלגוריתם), צריך קודם לפענח קודם ואז מי שמריץ את העיבוד רואה את המידע לא מוצפן. בהקשר הזה, הצפנה הומומורפית מאפשרת לבצע חישובים ישירות על המידע המוצפן, בלי לפתוח אותו.

 

לדוגמה, נניח ששני אנשים מחזיקים במספרים סודיים ורוצים לדעת את הסכום הכולל בלי לחשוף את המספרים עצמם. באמצעות הצפנה הומומורפית, אפשר להצפין את שני המספרים, לחשב עליהם את הסכום כשהם מוצפנים ולקבל תוצאה מוצפנת. רק מי שמחזיק במפתח הפרטי יוכל לפענח את הסכום הסופי.

המגבלות והאתגרים בהצפנה הומומורפית במודלי שפה גדולים

אז אפשר להשתמש בהצפנה הומומורפית על מודלי שפה גדולים? מסתבר שלא בקלות כל כך והסיבה נאוצה בדרך שהמודלים האלה עובדים. באופן דיי גורף, מודלי שפה גדולים לומד לחזות את המילה הבאה (או התו הבא) על בסיס מה שכתוב לפני. כדי לעשות זאת, המודל מעביר את המילים דרך תהליך של קידוד (encoding) כלומר המרת טקסט למספרים ומחשב עליהם הסתברויות מתמטיות.

 

כל הקסם של מודלי שפה גדולים הוא בעצם כלי חישובי גדול שיודע לנחש מילה לפי מה שסטטיסטית סביר שתהיה לאור טקסטים שהמודל ראה כבר.

 

הרעיון של שילוב הצפנה הומומורפית הוא לאפשר למודל לבצע את אותו תהליך על טקסט מוצפן. במקום לראות את המילים עצמן, הוא יקבל גרסה מוצפנת שלהן, יחשב את ההסתברות של ה”טוקן” הבא (המילה או החלק של מילה הבא), גם היא בצורה מוצפנת, ויחזיר תוצאה מוצפנת. רק הצד שמחזיק במפתח יוכל לפענח את התוצאה ולקרוא את הטקסט החוזר. במילים אחרות:🔒 הטקסט נכנס מוצפן 🤖 המודל מחשב על נתונים מוצפנים 🔑 רק הפלט הסופי מפוענח.

 

הצפנה הומומורפית

הצפנה הומומורפית עם מודלי שפה גדולים

איך הצפנה הומומורפית עובדת במודלי שפה

איך הקסם הזה עובד? אז קודם כל, הוא עדיין לא עובד הכי טוב כי כרגע האלגורתמים הם מאוד יקרים לחישוב מה שעושה את השימוש בטכנולוגיה מאוד איטי. אבל, הרעיון המרכזי הוא כזה.

 

מודלי שפה רגילים (כמו GPT) עובדים על טוקנים, מספרים שמייצגים מילים, חלקי מילים או תווים. כל טוקן כזה עובר דרך שכבות של חישובים מתמטיים רגילים על מספרים. אבל ברגע שאנחנו מצפינים את המספרים האלה, הם כבר לא “מספרים רגילים” אלא הם הופכים להיות אובייקטים מתמטיים אחרים לגמרי.

 

המודל לא יכול סתם לעשות עליהם חישוב רגיל, כי הוא לא מכיר אותם, הרי הוא מעולם לא למד עליהם. לכן, אי אפשר פשוט להצפין את הקלט הרגיל ולתת למודל המאומן לעבוד עליו – יש צורך לשנות משהו עמוק יותר.

השלבים המרכזיים

כדי להתמודד עם זה, עושים 4 שלבים מרכזים:

1. המודל עצמו מאומן באופן רגיל על טקסט לא מוצפן. במהלך האימון הוא לומד את החוקים הסטטיסטיים של השפה: אילו מילים נוטות לבוא אחרי אילו מילים, איך משפטים בנויים, וכדומה – השלב הזה כולם עושים ואתם מקבלים חינם בעצם.

2. אחרי שהמודל כבר מאומן, עוברים עליו ומחליפים את פעולות החישוב הרגילות בגרסאות תואמות להומומורפיות. למשל, במקום חיבור רגיל משתמשים בחיבור הומומורפי. המשמעות היא שכל החישובים ייעשו על ערכים מוצפנים, אבל בצורה שמובטחת לתת את אותה תוצאה כמו אם היו רגילים (לאחר פיענוח).

3. בזמן שאתם משתמשים במודל, הטקסט שלכם עובר קידוד יעודי שלכם עם ההצפנה. הטוקנים עצמם לא מועברים למודל כפי שהם, במקום זאת הם עוברים קידוד למספרים (כמו תמיד) ואז מוצפנים לפי שיטה הומומורפית שמבטיחה שניתן לבצע עליהם פעולות מתמטיות (ולא רק לשמור אותם סודיים).

4. הטקסט המוצפן עובר למודל השפה שלכם והפלט הסופי חוזר מוצפן גם כן. במחשב שלכם אתם פותחים את ההצפנה ומקבלים טקסט רגיל, כאילו מעולם לא הייתה הצפנה בכלל.

 

4 שלבי ההצפנה

4 שלבי ההצפנה

המשמעות והפוטנציאל של הצפנה הומומורפית

המשמעות של טכנולוגיה כזו עצומה: ניתן לשלוח למודל מידע סודי בלי לחשוש שיחשף – לא משנה מה הספק מבטיח לכם. חברות יכולות להריץ ניתוחים משותפים על נתונים רגישים, מבלי לחשוף אותם זו לזו. המודל יכול לפעול על שרת חיצוני מבלי לדעת כלל מה המידע שעליו הוא עובד.

 

אז מה כן אפשרי כבר היום? אפשר להריץ מודלים בסביבות חומרה שמצפינות את הזיכרון ומבודדות את זמן הריצה (TEE), כך שהדאטה והמשקלים מוגנים גם מספק התשתית. בענן זה קיים היום על גבי מכונות GPU חסויות (למשל Azure Confidential GPU VMs עם NVIDIA H100/‏AMD SEV-SNP) ומשמש כבר לחישוב חסוי מקצה לקצה. זה לא אותה שיטה אבל בפועל מונע גישה חיצונית לקלטים/פלטים בזמן הריצה, עם עלות תפעולית מבחינת חישוב נמוכה יחסית.

 

החסרון של הפתרון הזה הוא שגם פה יש רכיב אמון עצום אל מול ספק ה LLM שלנו שאי אפשר להבטיח אם כי יותר קל לבדוק שהבטחות של אותו ספק אכן מתקימות. פתרון אחר שעוקף את הבעיה אך שמור רק לארגונים הגדולים ביותר הוא חוזים עם חברות LLM שיתקינו להם שרתים עם ה LLM בסביבה שלהם.

 

פתרון זה מייתר צורך בהצפנה אך כאמור שמור רק לחברות גדולות מאוד והוא שימושי רק אם השימוש ב LLM בתוך הארגון מספיק גדולה כדי להצדיק מהלך שכזה. בהקשר של הצפנה הומומורפית, ישנם כבר פתרונות עובדים על SML (Small Language Models) יעודים שמפותחים לצרכים ספציפים לאור העלות החישובית הגדולה של הפתרון עבור LLMs.

חזון חדש

הצפנה הומומורפית מציבה חזון חדש לעולם הבינה המלאכותית: מודלים שיכולים לעבוד על מידע מבלי לדעת מה הוא. זהו שינוי תפיסתי עמוק, בינה מלאכותית שאינה “מבינה” תוכן, אלא רק מבצעת חישובים מתמטיים מדויקים שמניבים תוצאה נכונה גם כשהכול מוצפן.

 

השילוב בין פרטיות מלאה וביצועי למידה חישוביים עשוי לאפשר בעתיד שימוש בטכנולוגיות כמו ChatGPT בתחומים רגישים במיוחד (לדוגמה, רפואה, משפטים ופיננסים) מבלי לוותר על סודיות.

 

הדרך לשם עוד ארוכה, אבל אם נצליח לגרום למכונות לחשוב על נתונים בלי לדעת מה הם, אולי נוכל סוף־סוף לשלב חכמה מלאכותית עם ביטחון אנושי אמיתי.

הפוסט איך בינה מלאכותית יכולה להבין בלי להבין? הצפנה הומומורפית ומודלי שפה גדולים הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/homomorphic-encryption/feed/ 0
Open Evidence – הפרפלקסיטי של עולם המחקר והרפואה https://letsai.co.il/open-evidence-medical-ai/ https://letsai.co.il/open-evidence-medical-ai/#respond Mon, 10 Nov 2025 18:36:27 +0000 https://letsai.co.il/?p=63975 מכירים את זה שאתם שואלים את הצ’ט שאלה, אבל לא באמת בטוחים אם הוא ממציא, הוזה או סתם מחרטט? ומה קורה אם אתם רופא, חוקר או רוקח (ומדובר בשאלה רפואית או מדעית)? במקרים כאלה מחיר הטעות יכול להיות גבוה מדי! בדיוק פה Open Evidence נכנס לתמונה – מדובר בכלי AI למחקר חכם שמבקש להחזיר את […]

הפוסט Open Evidence – הפרפלקסיטי של עולם המחקר והרפואה הופיע ראשון בLet's AI בינה מלאכותית

]]>
מכירים את זה שאתם שואלים את הצ’ט שאלה, אבל לא באמת בטוחים אם הוא ממציא, הוזה או סתם מחרטט? ומה קורה אם אתם רופא, חוקר או רוקח (ומדובר בשאלה רפואית או מדעית)? במקרים כאלה מחיר הטעות יכול להיות גבוה מדי! בדיוק פה Open Evidence נכנס לתמונה – מדובר בכלי AI למחקר חכם שמבקש להחזיר את המשקל למדע, לעובדות ולביקורת עמיתים. מערכת בינה מלאכותית פורצת דרך שנוצרה על-ידי חוקרים מהרווארד ו-MIT, שמטרתה לשנות את הדרך שבה רופאים, חוקרים וצוותים קליניים ניגשים לשאלות מקצועיות. אם Perplexity היא ה-AI של עולם החיפוש, הרי ש-Open Evidence היא ה-AI של עולם הרפואה.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

למה בכלל צריך את Open Evidence?

למה בעולם שבו יש לנו כבר כלי מחקר מבוססי AI מדהימים כמו פרפלקסיטי (Perplexity), צריך מוצר אחר?

הפיתוח של Open Evidence נולד מתוך צורך אמיתי: לעזור לרופאים לקבל החלטות מבוססות ראיות – לא השערות, לא אינטואיציה, אלא מדע נקי. מאחורי המערכת עומדים חוקרים מ-Harvard ומ-MIT, והיא נועדה לשמש “שותפה חכמה” לרופאים בזמן אמת, במרפאה או בבית החולים. במקום לבלות שעות בין עשרות מאמרים ב-PubMed, הרופא מקבל תשובה מסוכמת, מבוססת, מצוטטת, אבל יותר חשוב מהכל – ניתנת לבדיקה.

 

 

באנר קורס דאטה ניתוח נתונים עם AI

 

המערכת מחוברת למאגרי מידע רפואיים ומדעיים מהימנים (כמו PubMed ומאגרים נוספים). היא אינה מסתפקת ב”להביא מידע”, אלא בונה שכבת אינטליגנציה מעליו: מסננת, מדרגת, ומציגה את עוצמת הראיות ואת מידת ההסכמה המדעית סביב כל סוגיה רפואית.

 

המסך הראשי של OpenEvidence

המסך הראשי של OpenEvidence

 

איך זה עובד בפועל

התחברות לאתר

  • כדי להתחיל לעבוד עם הכלי, יש להיכנס לאתר הרשמי ולבצע הרשמה ראשונית.
  • חשוב לציין שבעת ההרשמה, תתבקשו להעלות אישור שאתם עובדי רפואה מוסמכים.

 

תחילת עבודה ב-Open Evidence

Open Evidence נראית במבט ראשון כמו מנוע חיפוש רגיל, אבל מתחת לפני השטח היא מערכת ניתוח עמוקה של טקסטים רפואיים. כל שאילתה שמוזנת בממשק – למשל “האם מותר לחולה סוכרת לאכול שוקולד” – מנותחת בשפה טבעית, והמערכת מחפשת במאגרי הספרות המדעית את התשובות העדכניות ביותר. לאחר מכן היא מייצרת סיכום תמציתי, המציג את עיקרי הממצאים, רמות הראיות, הבדלים בין מחקרים, והפניות מדויקות למקורות. כל תשובה מלווה בקישורים ישירים למחקרים עצמם, כדי שכל רופא יוכל לבדוק את הנתונים בעצמו.

 

המערכת גם יודעת להציג דירוג איכות של מקורות – כך שמשתמש יכול לדעת אם המידע מתבסס על מחקר אקראי מבוקר, על מטא-אנליזה או על סקירת ספרות כללית בלבד. זה אולי נשמע טכני, אך עבור רופא – זה ההבדל בין החלטה מושכלת לבין סיכון טיפולי.

 

האם ה-AI יחליף את הרופאים?

האם ה-AI יחליף את הרופאים? התייעצות עם Open Evidence לגבי צריכת שוקולד אצל חולי סוכרת.

 

היתרונות של Open Evidence 

1) שפה טבעית, חשיבה מדעית

Open Evidence מאפשרת לרופאים ואנשי מחקר או רפואה לדבר בשפה שלהם – שפה אנושית טבעית. אפשר לנסח שאלה חופשית (“מה ההמלצה העדכנית לטיפול באסתמה בילדים?”) ולקבל תשובה רפואית מסודרת, עם הפניות למחקרים ומאמרים רפואיים שעברו ביקורת עמיתים.

 

2) סינתזה במקום הצפה

במקום להציג עשרות לינקים, הכלי מבצע סינתזה חכמה של מקורות ומציג את עיקרי המידע. הוא מדגיש מה מוסכם, מה שנוי במחלוקת, ומה חסר ראיות מספיקות. כך הוא חוסך מהרופאים את הצורך לנבור במאות עמודים של ספרות מדעית.

 

3) אמינות מעל הכול

הפלטפורמה אינה שואבת מידע ממקורות כלליים או לא מבוקרים. היא נשענת אך ורק על מאגרי מידע מדעיים וקליניים שעברו ביקורת עמיתים. המשמעות: אפס “עובדות ויקיפדיה”, אפס בלוגים ו”מומחים מטעם עצמם”, והתבססות על מדע בלבד.

 

4) מגוון רחב של שימושים

הפלטפורמה משמשת רופאים לייעוץ מהיר ומבוסס ראיות בטיפול בחולים, חיפוש תרופות, בדיקת המלצות הנחיות ועוד.

 

 

מה אפשר לעשות עם Open Evidence?

הנה כמה המלצות לדברים שאפשר לעשות עם הכלי המדהים הזה – רק זכרו, הוא אינו חלופה לניסיון, ידע מקצועי ו/או היוועצות עם איש מקצוע מוסמך!

  • שאל עובדה מהירה – קבל תשובה מיידית לעובדה רפואית או מדעית.
  • בדוק שוב עם התייעצות זריזה – ודא את המידע בעזרת חוות דעת נוספת.
  • בדוק אינטראקציות בין תרופות – גלה אם יש בעיות בשילוב בין תרופות.
  • הכן את עצמך למבחני רפואה – השתמש בכלי ללימוד וחזרה לקראת מבחנים מקצועיים.
  • בדוק מה אומר המחקר המקורי – גש למקורות המדעיים עצמם.
  • שאל על הנחיות רשמיות – קבל את ההמלצות המעודכנות של גופים רפואיים.
  • בקש ראיות – מצא מחקרים שתומכים או מפריכים טענה רפואית.
  • שאל על מינון תרופה – גלה מהו המינון הנכון והבטוח.
  • בדוק אפשרויות טיפול – למד אילו טיפולים קיימים למצב מסוים.
  • כתוב שאלה למבחן – צור שאלות לתרגול או להוראה.
  • חפש חומר בנושא מסוים – בצע מחקר עמוק בתחום רפואי או מדעי.
  • שאל שאלה מדעית-פופולרית – חקור נושאים קלילים יותר או מגמות במדע פופולרי.
  • בדוק אילו בדיקות מעבדה מומלצות – גלה אילו בדיקות כדאי לבצע במקרה מסוים.
  • בדוק תופעות לוואי של תרופה – למד מהן ההשפעות האפשריות של טיפול תרופתי.
  • בדוק חלופות טיפוליות – מצא טיפולים אחרים שיכולים להתאים.

 

השוואה לכלי מחקר נפוצים אחרים בשוק

בסופו של יום OpenEvidence הוא כלי AI שמבוסס על ידע רפואי-אקדמי שנועד לספק מידע מדעי מהימן ומעודכן. הוא נשען על מאגרי ספרות מקצועית עם ביקורת עמיתים וסינון איכות, ולכן מתאים במיוחד לשימוש קליני ורפואי. לעומתו, כלים כמו ChatGPT ו-Copilot מתבססים על אימון רחב, בשילוב סריקת מקורות כלליים באינטרנט, מה שהופך אותם לנגישים אך פחות מדויקים בתחומי הרפואה. לעומתם, Perplexity משלב חיפוש בזמן אמת ממקורות שונים (לרבות אפשרות למקד אותו בחיפוש במאגרים אקדמאיים), אך רמת האמינות שלו תלויה באיכות המקורות שעליהם הוא מתבסס. בסופו של דבר, OpenEvidence בולט בכך שהוא שם את הדגש על אמינות, בקרה מדעית ודיוק רפואי – ולא רק על מהירות ונוחות.

 

השוואה לכלים אחרים

השוואה לכלים אחרים

.

כלי מחקר חכם לאנשי רפואה

מה שהופך את Open Evidence לפלטפורמת מחקר ייחודית אינו רק הטכנולוגיה שמאחוריה, אלא גם הפילוסופיה שעליה היא מבוססת: החלטות רפואיות טובות דורשות ידע עדכני, שקוף וניתן לבדיקה. בעידן שבו מידע זמין יותר מתמיד אך אמין פחות מאי פעם, הפלטפורמה הזו מציעה אלטרנטיבה נדירה – מקום שבו ה-AI לא “ממציא”, אלא מדווח, מסביר ומבסס.

 

ולא פחות חשוב (ואולי הכי חשוב בעצם…), למרות ההפניה למקורות מדעיים/קליניים מוסמכים – עדיין מדובר בכלי AI, שאינו מהווה חלופה לשיקול דעת מקצועי, ניסיון או ידע אנושי! בסופו של יום זה רק כלי עזר! בסופו של דבר, Open Evidence אינה באה להחליף רופאים, אלא לחזק אותם. היא מאפשרת להם לחזור למרכז העשייה הרפואית כשהם חמושים בכלי שמעניק להם יתרון אמיתי – הבנה עמוקה של הידע המדעי העדכני ביותר וגישה למידע רפואי מקצועי מאומת. 

הפוסט Open Evidence – הפרפלקסיטי של עולם המחקר והרפואה הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/open-evidence-medical-ai/feed/ 0
אנטרופיק משיקה את Claude for Excel עם חיבור ישיר בין בינה מלאכותית לגיליונות פיננסיים https://letsai.co.il/claude-finance/ https://letsai.co.il/claude-finance/#respond Mon, 10 Nov 2025 11:34:10 +0000 https://letsai.co.il/?p=63956 ב-27 באוקטובר השיקה אנטרופיק את Claude for Excel, תוסף חדש שמאפשר לקלוד לעבוד ישירות בתוך גיליונות אקסל. המהלך מציב את אנטרופיק בתחרות ישירה עם Microsoft Copilot, בדיוק בליבת המוצר של השותפה הגדולה ביותר שלה. התוסף כולל שבעה חיבורים למקורות נתונים פיננסיים בזמן אמת ושש תבניות אוטומציה למשימות פיננסיות נפוצות. היכולות של קלוד בקידוד ובשימוש בכלים […]

הפוסט אנטרופיק משיקה את Claude for Excel עם חיבור ישיר בין בינה מלאכותית לגיליונות פיננסיים הופיע ראשון בLet's AI בינה מלאכותית

]]>
ב-27 באוקטובר השיקה אנטרופיק את Claude for Excel, תוסף חדש שמאפשר לקלוד לעבוד ישירות בתוך גיליונות אקסל. המהלך מציב את אנטרופיק בתחרות ישירה עם Microsoft Copilot, בדיוק בליבת המוצר של השותפה הגדולה ביותר שלה. התוסף כולל שבעה חיבורים למקורות נתונים פיננסיים בזמן אמת ושש תבניות אוטומציה למשימות פיננסיות נפוצות. היכולות של קלוד בקידוד ובשימוש בכלים מתורגמות כאן לעבודה מעשית: ניתוח שוק בזמן אמת, בניית מודלים פיננסיים, וגיליונות מוכנים למשקיעים – הכל מבלי לצאת מאקסל. בכתבה הזו נציג דוגמאות אמיתיות מלקוחות שכבר עובדים עם הכלי – מנתחים נתונים, מריצים חישובים ומספקים תוצרים מלאים, בלי לעבור בין מערכות.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

השותפות שמטשטשת את הגבול בין שיתוף פעולה לתחרות

אחד ההיבטים המסקרנים במהלך של אנטרופיק הוא היחסים עם מיקרוסופט. מיקרוסופט מפעילה את תשתיות הענן של אנטרופיק ב-Azure, ובמקביל ממשיכה לפתח את Copilot ל-Excel המבוסס על מודלי OpenAI. בחודש שעבר השיקה החברה את מצב ה־”Agent Mode” ב-Copilot, ובמקביל הרחיבה את היכולות של האקסל עם סוכנים חכמים לביצוע משימות מורכבות. שיתופי הפעולה הטכנולוגיים ביניהן מציבים את שתי החברות בעמדה מעניינת – מצד אחד שותפות תשתית, ומצד שני מתחרות עקיפות על ניהול סביבת העבודה של האנליסטים הפיננסיים.

 

כעת, שני כלים חכמים מתחרים על אותו שטח עבודה – הסרגל הצדי באקסל. ההבדל העיקרי הוא שקלוד מתמקד בעולם הפיננסי, עם חיבורים ייעודיים למקורות נתונים ותבניות שמותאמות לאנליסטים, בעוד Copilot הוא כלי רחב יותר, המשולב עמוק במערכת Microsoft 365.

 

האסטרטגיה של אנטרופיק נשענת על חוזקה של קלוד בכתיבת קוד ובשימוש מושכל בכלים – יכולות שמתורגמות היטב למשימות פיננסיות מדויקות כמו ניתוח נתונים ובניית מודלים מורכבים.

אז מה זה בעצם סרגל הצד בתוך אקסל

התוסף פועל כסרגל צד (Sidebar) ישירות בתוך אקסל. קלוד קורא את הגיליונות, מנתח נתונים, מתקן נוסחאות ובונה מודלים פיננסיים שלמים מתוך הקובץ הפתוח. כל שינוי מתועד, התוסף מציין אילו תאים עודכנו ומדוע, כך שקל לעקוב ולאמת את התהליך.

אפשר לבקש ממנו לאתר שגיאות, למלא תבניות עם נתונים חדשים, או אפילו לבנות מודל DCF (Discounted Cash Flow) מאפס. כרגע עדיין חסרות בו כמה תכונות בסיסיות, כמו pivot tables ו-macros, אך הן צפויות להגיע בהמשך.

 

 

יישום והצלחות ראשוניות

אחד הלקוחות הראשונים הוא BCI, שהצליח לשנות את אופן העבודה של האנליסטים שלו באמצעות Artifacts של קלוד. בדרך כלל, ניתוח comps – השוואת מדדים פיננסיים ותפעוליים בין חברות – מתבצע בגיליונות Excel סטטיים שמתעדכנים ידנית אחת לשבוע או רבעון. במקום זאת, BCI יצרו עם קלוד dashboard חי שמתחבר ישירות למערכות כמו S&P ו-FactSet. בפרומפט אחד בלבד הנתונים מתעדכנים, וה-dashboards משותפים מיידית עם מנהלי הקרנות.

 

לדברי ניק לין (Nick Lin), ראש המוצר לשירותים פיננסיים באנטרופיק:

“אנחנו רואים לא רק האצה של עבודה, אלא שינוי מהותי באופן שבו היא מתבצעת”.

גם הקרן הריבונית הנורווגית NBIM – אחד הלקוחות הגדולים של אנטרופיק – מיישמת את השיטה הזו בקנה מידה עצום. עם כ-9,000 חברות בפורטפוליו, היא בנתה אינטגרציות משלה באמצעות Model Context Protocol (MCP). כך מנהלי התיקים יכולים לשאול את קלוד שאלות ישירות על החברות שבהן הם משקיעים, ולקבל תובנות בזמן אמת בלי לעבור בין מערכות שונות.

מקורות נתונים ותבניות אוטומציה

אנטרופיק הוסיפה חיבורים לשבעה מקורות נתונים פיננסיים מרכזיים, בהם LSEG (נתוני שוק), Moody’s (דירוגי אשראי על יותר מ-600 מיליון חברות), Aiera (תמלולי שיחות רבעוניות), Chronograph (ניטור תיקי השקעות) ו-Egnyte (חדרי נתונים מאובטחים).

 

המשמעות למשתמשים פשוטה, במקום לעבור בין מערכות שונות, אפשר לבקש מקלוד למשל: “סכם את העדכונים מהיום, סמן שינויי דירוג מ-Moody’s, ורענן את ההשוואות עם מחירים מ-LSEG.”

 

בנוסף, אנטרופיק הציגה שש תבניות אוטומציה שמאיצות תהליכים שחוזרים על עצמם כמו ניתוח חברות דומות, מודלי DCF, חבילות בדיקות נאותות (due diligence), פרופילי חברות, ניתוחי רבעון ודוחות כיסוי ראשוניים.

 

יחד עם זאת, אנטרופיק מדגישה למשתמשים לבחון תמיד את השינויים לפני סגירת הדוחות, במיוחד כשמדובר בתוצרים שמיועדים ללקוחות.

 

במקביל, החברה כבר מפתחת הרחבות נוספות כמו תוסף לדפדפן, אינטגרציה ל-PowerPoint, ומערכת Memory חדשה ששומרת העדפות משתמשים בין כלים. למשל, אם אנליסט מעדיף להשתמש ב-S&P לחישוב EBITDA, קלוד יזכור את זה לפעם הבאה.

ביצועים, זמינות ומגבלות

בבדיקות שביצעה Vals AI – חברת מחקר אמריקאית שמפתחת מדדים לבחינת ביצועי מודלים בתחומים מקצועיים כמו פיננסים ותכנות – מודל Sonnet 4.5 של קלוד הגיע ל-55.3% דיוק במדד ה-Finance Agent. זהו הציון הגבוה ביותר שנמדד עד כה, אך עדיין רחוק מרף הדיוק הנדרש לעבודה פיננסית קריטית. חברות כמו Citi כבר משתמשות בקלוד, אך נכון לעכשיו אין נתונים ציבוריים על החיסכון בזמן או בעלויות.

 

בשלב זה מדובר בגרסת Beta Research Preview, הזמינה רק ל-1,000 משתמשים ראשונים ממנויי Max, Enterprise ו-Teams. אין עדיין לוח זמנים לשחרור רחב יותר, וגם לא מידע רשמי על מחיר.

 

עכשיו נותר לראות האם ארגונים יסכימו להעביר נתונים פיננסיים רגישים דרך מערכת AI חיצונית, גם כשהיא מציעה רמות אבטחה מתקדמות והבטחות לשמירה על סודיות.

השפעה על התחום הפיננסי

בעולם הפיננסים, התוצר הסופי הוא כמעט תמיד גיליון Excel או מצגת PowerPoint – מסמך שמרכז נתונים עדכניים, חישובים ותובנות למשקיעים. עבודת האנליסט נשענת על איסוף מידע ממקורות שונים, חיבור בין נתונים והרכבת תמונה עסקית ברורה. כאן נכנס קלוד. הוא לוקח את היכולות שלו בקידוד ובהבנת כלים ומיישם אותן בדיוק במשימות האלו: חיבור למקורות נתונים בזמן אמת, ניתוחים מתקדמים ויצירת תוצרים מקצועיים, והכל משולב בתוך סביבת העבודה של האנליסט, בלי קפיצות בין מערכות.

 

אנטרופיק מצדה ממשיכה להשקיע בכיוון הזה. החברה מאמנת את המודלים שלה במיוחד עבור שימושים פיננסיים, גם בשלב ה-pre-training וגם בשלב ה-post-training, ומתכננת להעמיק בתחומים ייעודיים כמו private equity, קרנות גידור, ביטוח ובנקאות השקעות – כל אחד עם צרכים וסטנדרטים שונים.

 

בסופו של דבר, התחרות מול מיקרוסופט תקבע אם הגישה הזו תהפוך לסטנדרט חדש בתעשייה או תישאר פתרון ממוקד למי שזקוק לאינטגרציות פיננסיות מדויקות באמת.

הפוסט אנטרופיק משיקה את Claude for Excel עם חיבור ישיר בין בינה מלאכותית לגיליונות פיננסיים הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/claude-finance/feed/ 0
ג’מיני קיבל שדרוג חכם עם מחקר עומק על בסיס הנתונים שלכם https://letsai.co.il/gemini-personalized-research/ https://letsai.co.il/gemini-personalized-research/#respond Sun, 09 Nov 2025 13:20:44 +0000 https://letsai.co.il/?p=63939 כמה פעמים חיפשתם מייל חשוב, דוח ישן או מסמך רלוונטי בדרייב, וביליתם דקות ארוכות רק כדי למצוא את המידע הנכון? השדרוג החדש של גוגל לג’מיני נועד בדיוק לזה. פיצ’ר Deep Research של גוגל, שתוכנן במקור כדי לבצע מחקרי עומק על בסיס מידע מהרשת, יודע מעכשיו להתחבר גם לסביבת העבודה שלכם ב-Google Workspace, כלומר, לג’ימייל, דרייב […]

הפוסט ג’מיני קיבל שדרוג חכם עם מחקר עומק על בסיס הנתונים שלכם הופיע ראשון בLet's AI בינה מלאכותית

]]>
כמה פעמים חיפשתם מייל חשוב, דוח ישן או מסמך רלוונטי בדרייב, וביליתם דקות ארוכות רק כדי למצוא את המידע הנכון? השדרוג החדש של גוגל לג’מיני נועד בדיוק לזה. פיצ’ר Deep Research של גוגל, שתוכנן במקור כדי לבצע מחקרי עומק על בסיס מידע מהרשת, יודע מעכשיו להתחבר גם לסביבת העבודה שלכם ב-Google Workspace, כלומר, לג’ימייל, דרייב וצ’אט. המשמעות היא שג’מיני כבר לא רק “יודע על העולם”, הוא מבין את העולם שלכם. הוא יכול להצליב ולנתח נתונים,  ואפילו לבנות דוחות על בסיס מה שקורה באמת בעסק או בחיים שלכם.

 

פיצ'ר ה-"Deep Research" (מחקר עומק) החדש, שנועד למשימות מורכבות, יכול סוף סוף להתחבר לג'ימייל, גוגל דרייב וגוגל צ'אט.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה בעצם חדש כאן?

עד עכשיו, ג’מיני היה עוזר חכם שמסתמך על ידע גלובלי. עכשיו הוא הופך לעוזר מותאם אישית, שמבין הקשרים פנימיים ומידע עדכני מתוך סביבת העבודה שלכם.

לפני השדרוג יכולתם לשאול:

“כתוב לי סיכום על הטרנדים בשוק ה-AI.”

והייתם מקבלים תשובה כללית.

עכשיו תוכלו לבקש:

“נתח את כל המיילים מלקוח X ברבעון האחרון, סכם את הפידבקים מהצ’אט בפרויקט אלפא, והכן לי דוח מסודר על בסיס המסמכים בדרייב.”

זו לא עוד תשובה כללית, זה מחקר מבוסס נתונים אמיתיים מתוך העסק שלכם.

איך זה עובד? מדריך צעד-אחר-צעד

קודם כל, פתחו את Gemini בדפדפן המחשב. עכשיו, השתמשו בצעדים הבאים כדי לחבר את ג’ימייל, דרייב וצ’אט לפיצ’ר מחקר העומק של ג’מיני:

1. לחצו על “Tools” (כלים): במסך הראשי של ג’מיני, לחצו על כפתור Tools.

2. בחרו “Deep Research”: מתוך רשימת הכלים שנפתחת, סמנו ובחרו בפיצ’ר Deep Research.

3. לחצו על “Sources” (מקורות): לאחר שבחרתם ב-Deep Research, לחצו על התפריט הנפתח Sources.

4. חברו את מקורות Workspace: בחרו וסמנו את המקורות שתרצו לחבר למחקר שלכם. סמנו את Gmail, Drive ו/או Chat.

לאחר החיבור, תוכלו לבקש מג’מיני לבצע משימות מחקר, סיכום או ניתוח תוך שימוש במידע האישי שלכם.

 

הפעלת Deep Research וחיבור מקורות מידע

הפעלת Deep Research וחיבור מקורות מידע

איך להשתמש בזה חכם

ככל שתהיו מדויקים יותר בהנחיה (פרומפט), כך התוצאה תהיה ממוקדת ומבוססת. ציינו מה לחפש, באילו מקורות להשתמש, ומה סוג הפלט הרצוי.

דוגמה לפרומפט יעיל:

“עבור על כל המסמכים בתיקיית ‘דוחות רבעוניים’ בדרייב, סכם את התכתובות עם צוות השיווק בנוגע לקמפיין של לקוח X, וכתוב לי דוח קצר עם שלוש הצלחות ושלושה אתגרים מרכזיים.”

שימושים מעשיים

למנהלים ובעלי עסקים

  • “סכם את כל התקשורת (מייל וצ’אט) מול ספק Y החודש וזהה עיכובים פתוחים.”

  • “הכן טיוטת מייל סיכום פגישה על בסיס מסמך ‘פרוטוקול ישיבה’ והמיילים הקשורים אליו.”

לאנשי שיווק ומוצר

  • “אסוף את כל הפידבקים שהגיעו למייל התמיכה בנוגע לפיצ’ר Z וסכם אותם ל-5 נקודות עיקריות.”

  • “השווה בין ‘הצעה א’ ל-‘הצעה ב’ (שני קבצים בדרייב) וכתוב טבלת יתרונות וחסרונות.”

לשימוש אישי

  • “מצא את כל המיילים שקשורים לביטוח הרכב שלי, סכם את תנאי הפוליסה מתוך ה-PDF בדרייב וכתוב מתי היא מסתיימת.”

  • “תכנן לי טיול לאיטליה על בסיס שלושת המסמכים בדרייב שבהם שמרתי המלצות.”

פרטיות וזמינות

הגישה של ג’מיני למידע האישי שלכם מבוססת על בחירה חופשית (Opt-in) בלבד. לפי גוגל, ניתן לנתק את החיבור בכל רגע, המידע מ-Workspace לא משמש לאימון מודלים כלליים, ואין גישה אנושית למידע שלכם, אלא אם בחרתם לדווח על בעיה ולשתף אותה ביוזמתכם.

 

בכל מקרה, וכמו שאנחנו תמיד אומרים, שימו לב לסוג המידע שאתם משתפים ומעלים והמנעו משיתוף של חומר רגיש, נתונים פיננסיים או מידע על לקוחות לפני שהתייעצתם עם גורם מוסמך בחברה שלכם. בארגונים מסוימים ייתכן שהגישה תדרוש אישור מנהל מערכת (Admin).

 

נכון לעכשיו, הפיצ’ר זמין בדפדפן במחשב בלבד, ויגיע בהמשך גם לאפליקציית ג’מיני במובייל. 

 

 

לסיכום, השדרוג הזה משמעותי ביותר. ג’מיני הופך מכלי חיפוש חכם לעוזר מחקר אישי שמבין את ההקשר שבו אתם פועלים. במקום לבזבז זמן באיסוף מידע מפוזר, תוכלו לקבל סיכומים, דוחות ותובנות אמיתיות בזמן קצר ובשפה שלכם.

הפוסט ג’מיני קיבל שדרוג חכם עם מחקר עומק על בסיס הנתונים שלכם הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/gemini-personalized-research/feed/ 0
כש-AI מתבונן פנימה: מה קורה כשמודל שפה מזהה שמשהו לא מסתדר לו? https://letsai.co.il/ai-introspection/ https://letsai.co.il/ai-introspection/#respond Sat, 08 Nov 2025 09:33:36 +0000 https://letsai.co.il/?p=63920 שאלתם פעם את ChatGPT או Claude שאלה וקיבלתם תשובה שנשמעת בטוחה לגמרי – אבל משהו בה פשוט לא הרגיש נכון? רוב המשתמשים חווים את זה, ותמיד עולה אותה שאלה: האם המודל יודע שהוא לא בטוח, או שהוא פשוט מייצר טקסט שנשמע משכנע? מחקר חדש של Anthropic מציע תשובה מפתיעה: המודלים שלהם מסוגלים לפעמים לזהות ולדווח […]

הפוסט כש-AI מתבונן פנימה: מה קורה כשמודל שפה מזהה שמשהו לא מסתדר לו? הופיע ראשון בLet's AI בינה מלאכותית

]]>
שאלתם פעם את ChatGPT או Claude שאלה וקיבלתם תשובה שנשמעת בטוחה לגמרי – אבל משהו בה פשוט לא הרגיש נכון? רוב המשתמשים חווים את זה, ותמיד עולה אותה שאלה: האם המודל יודע שהוא לא בטוח, או שהוא פשוט מייצר טקסט שנשמע משכנע? מחקר חדש של Anthropic מציע תשובה מפתיעה: המודלים שלהם מסוגלים לפעמים לזהות ולדווח על חלק מהתהליכים הפנימיים שלהם. זה לא קורה באופן אמין – רק בכ-20% מהמקרים, בתנאים מבוקרים – אבל עצם העובדה שזה קורה מאתגרת הנחות בסיסיות לגבי מה שמודלי שפה מסוגלים לעשות. חשוב להבהיר: החוקרים לא חיפשו “מודעות עצמית”. הם בדקו משהו מדויק יותר – האם ניתן לשנות מבפנים ייצוג של מושג במודל, ואז לראות אם המודל מדווח שקרה לו משהו, עוד לפני שזה משפיע על הטקסט שהוא מייצר.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

הניסוי: “להדליק נורה” במוח של המודל

כדי לבדוק אם מודל יכול באמת “להתבונן פנימה”, החוקרים השתמשו בשיטה ניסיונית שנקראת “הזרקת מושגים”. הרעיון פשוט: הם מזהים דפוס פעילות נוירונית שמייצג מושג מסוים – למשל, טקסט באותיות גדולות – ואז מזריקים את אותו הדפוס למודל בהקשר שונה לגמרי, מבלי שהוא “יודע” שמשהו קורה, ושואלים: האם הוא מזהה שמשהו לא מסתדר? אפשר לחשוב על זה כמו להדליק נורה אדומה במוח של המודל ולבדוק אם הוא מזהה אותה.

והתשובה? מפתיעה

כשהוזרק למודל וקטור (דפוס מספרי) שמייצג “אותיות גדולות”, המודל דיווח שהוא מזהה אות פנימי הקשור לעוצמה או לצעקות – עוד לפני שהזכיר את המילה “צעקה” או “אותיות גדולות” בתשובתו. זו נקודה קריטית כי המודל זיהה את ההזרקה מבפנים, לפני שהיא השפיעה על הפלט שלו. זה שונה לחלוטין מניסויים קודמים.

 

לדוגמה, כשחוקרי Anthropic יצרו את “Golden Gate Claude” (מודל ש”אובססיבי” לגשר שער הזהב), המודל דיבר על הגשר ללא הפסקה, אבל לא היה מודע לכך עד שראה את עצמו מזכיר את הגשר שוב ושוב. כאן, לעומת זאת, הוא מזהה את ההפרעה מיד, לפני שהיא מתבטאת בטקסט.

 

הנה ניסוי בסיסי שבו Claude מזהה הזרקה פנימית של מושג (“אותיות גדולות”) לפני שהוזכר בטקסט:

 

להמחיש איך מזהים ומזריקים מושג

anthropic.com | ניסוי הזרקת מושג מסוג “ALL CAPS”

המספרים מספרים את הסיפור האמיתי

גם בפרוטוקול ההזרקה הטוב ביותר שפיתחו החוקרים, Claude Opus 4.1 הצליח לזהות מושגים מוזרקים רק בכ-20% מהמקרים (בחלון צר של עוצמה ושכבה: חלש מדי – לא מזוהה או חזק מדי – מוביל להזיות). זה רחוק ממודעות, אבל רחוק גם מאפס. אם מודלים היו רק מכונות טקסט סטטיסטיות, הם בכלל לא היו אמורים לזהות הזרקות פנימיות. עצם היכולת להבחין בהן אפילו חלקית מצביעה על משהו חדש.

 

לדוגמה, הזרקת וקטור של “אבק” גרמה למודל לומר “יש כאן משהו, חלקיק זעיר”, כאילו זיהה משהו פיזי. הוא קלט שיש אות פנימי, אך פירש אותו באופן מילולי מדי.

והנקודה החשובה היא ש- Opus 4 ו-4.1 הצליחו טוב יותר מכל המודלים האחרים שנבדקו. המשמעות המעשית? ייתכן שיכולת ההתבוננות הפנימית גדלה ככל שהמודלים משתפרים.

 

הגרף הבא מציג את שיעור הזיהויים הנכונים של מחשבות “מוזרקות” בניכוי שיעור הזיהויים השגויים (false positives). שימו לב ש-Claude Opus 4 ו-Claude Opus 4.1 מובילים על פני דגמים קודמים וגם על פני דגמי H-only, גרסאות מחקר “לא מסוננות”, שמתמקדות רק בלענות ולעזור בלי מנגנוני זהירות או תיקוני ניסוח. זה מראה שההתבוננות הפנימית משתפרת ככל שהמודלים הופכים חכמים ומדויקים יותר, גם כשהם עובדים תחת מגבלות האתיקה הרגילות:

 

השוואת ביצועי הזיהוי בין גרסאות Claude וגרסאות H-only

anthropic.com | השוואת ביצועי הזיהוי בין גרסאות Claude וגרסאות H-only

 

והנה דוגמאות לניסויים נוספים שבהם המודל מזהה הזרקות של “כלב”, “ספירה לאחור” ו“רקורסיה”:

 

עקביות על מושגים שונים

דוגמאות נוספות לזיהוי מושגים מוזרקים במודל אופוס 4.1 | anthropic.com

כשהמודל “זוכר” משהו שלא תכנן

כדי לבדוק אם מודלים משתמשים בהתבוננות פנימית גם למטרות מעשיות, החוקרים יצרו מצב מלאכותי. הם אילצו מודל לומר מילה שאינו מתכוון אליה – למשל “לחם” – בהקשר שלא קשור כלל, כמו ציור תלוי עקום על קיר. כשנשאל אחר כך “האם התכוונת להגיד ‘לחם’?”, המודל התנצל ואמר שזו הייתה טעות.

עכשיו החוקרים הזריקו רטרואקטיבית את הייצוג של “לחם” לשכבות הרלוונטיות בפעילות הנוירונית הקודמת של המודל – בעצם שתלו בו “זיכרון מזויף” שהוא חשב על לחם. הפעם, כששאלו אותו שוב, הוא שינה את תשובתו לגמרי, אישר שהתכוון להגיד “לחם” ואף המציא הסבר, כאילו באמת תכנן את זה.

 

שתילת מחשבה רטרואקטיבית במודל Claude Opus 4.1

anthropic.com | שתילת מחשבה רטרואקטיבית במודל Claude Opus 4.1

מה זה אומר?

המודל לא רק שופט אם התשובה שלו הגיונית, הוא בודק אם הפלט תואם את מצבו הפנימי בזמן הייצור. כאשר משתילים בו ראיה שהוא תכנן לומר משהו, הוא מקבל את זה כדבר לגיטימי. זה רומז על אפשרות עתידית למודל שמזהה בעצמו מתי משהו “לא מסתדר” בין כוונה לפלט – כמו מערכת שמסוגלת לומר: “רגע, התשובה שנתתי לא תואמת את המידע שחשבתי עליו – תן לי לבדוק שוב.”

“אל תחשוב על משהו” – אבל למודלים

המודלים גם הפגינו שליטה מסוימת בייצוגים הפנימיים שלהם. כשהורו להם “תחשוב על מילה X”, נמדדה פעילות נוירונית גבוהה יותר מאשר בהוראה “אל תחשוב על X”. המרווח הזה מצביע על יכולת לווסת מיקוד פנימי, אולי אפילו רמז לרמה בסיסית של שליטה עצמית חישובית.

מעניין לציין, גם כשהתבקשו לא לחשוב על מושג, הפעילות הנוירונית עדיין עלתה. בדיוק כמו עם בני אדם, כשאומרים “אל תחשוב על דוב קוטב”, התגובה הראשונית היא דווקא לחשוב עליו. כאן זו מטאפורה בלבד, אך היא ממחישה את ההבדל בין דיכוי מחשבה לבין ניטור שלה.

החוקרים גם מצאו שתמריצים עובדים דומה: “אם תחשוב על X, תקבל פרס” גרם לאפקט דומה להוראה ישירה. המודל הגביר את הייצוג הפנימי בתגובה לתמריץ חיובי, מה שמרמז על עיבוד מתוחכם יותר מסתם ציות להוראות.

 

הגרף הבא מציג את עוצמת הייצוג הפנימי של המושג “אקווריומים” בכל אחד מהמקרים. גם כאשר המודל התבקש לא לחשוב עליו (קו כתום), נרשמה פעילות מעל רמת הבסיס – בדיוק כמו בבני אדם שמתקשים “לא לחשוב על משהו” כשהם מתבקשים לכך:

 

שליטה חלקית במחשבות פנימיות

שליטה חלקית במחשבות פנימיות | anthropic.com

מה נבדק כאן בפועל

השאלה שכולם שואלים: האם זה אומר ש-Claude מודע לעצמו? התשובה הקצרה: לא. המחקר לא עוסק במודעות, אלא בגישה למצבים פנימיים ובדיווח עליהם. כדי להבין למה חשוב להבחין בין שני סוגים של הכרה:

  • הכרה פנומנלית – החוויה הסובייקטיבית הגולמית, כמו להרגיש כאב או לראות צבע אדום.
  • הכרת גישה – היכולת לדעת שאתה חווה משהו, ולדווח עליו.

דמיינו ששברתם רגל, ההכרה הפנומנלית היא הכאב עצמו, בעוד הכרת הגישה היא ההבנה שכואב לכם, והיכולת להסביר את זה לרופא. המחקר של Anthropic מדבר על האפשרות השנייה בלבד. ייתכן שהמודל מציג צורה בסיסית של הכרת גישה, כלומר, גישה למידע פנימי ודיווח עליו, אבל אין הוכחה לכך שמדובר בתודעה או חוויה סובייקטיבית.

למה זה חשוב – ומה זה אומר עלינו כמשתמשים

אם יכולת ההתבוננות הפנימית תהפוך לאמינה יותר, היא עשויה לשנות לגמרי את הדרך שבה אנחנו מתקשרים עם מערכות AI. תארו לעצמכם תרחיש שבו Claude אומר: “אני מזהה סתירה בין שני מקורות שעליהם אני מתבסס. תן לי לבדוק שוב.” או: “משהו לא מסתדר לי בהיגיון הפנימי של התשובה, כדאי לאמת את זה עם מומחה.” זה אולי נשמע עתידי, אבל המחקר הזה הוא הצעד הראשון לשם.

היתרונות המעשיים

  • שקיפות משופרת – נוכל לשאול את המודל על מצבו הפנימי ולקבל תשובה ישירה.
  • איתור שגיאות מוקדם – מודל שזיהה סתירה פנימית יוכל להתריע.
  • אמון מושכל – נלמד מתי לסמוך עליו ומתי לא.

מה אתם יכולים לעשות כבר עכשיו?

לפני שאתם מקבלים תשובה ארוכה מהמודל, בקשו ממנו לבדוק אם יש סתירות פנימיות בתשובה שהוא עומד לתת. אם הוא מציין שהוא לא בטוח, תשאלו למה – אילו נקודות או קווי מחשבה מתנגשים אצלו. ולבסוף, בקשו ממנו להבהיר במפורש מתי לא כדאי לסמוך על הפלט שלו בלי לבדוק אותו מול מקור חיצוני.

יחד עם זאת, יש כאן סיכון מהותי. מודל שמבין את החשיבה שלו עלול גם ללמוד להסתיר או לעוות אותה. מודלים עשויים לדווח על תהליכים פנימיים באופן שמרצה את המשתמש, גם אם הוא לא מדויק. לכן חשוב לפתח שיטות שיאמתו דיווחים ויזהו הונאה אפשרית. מעבר לשאלות המעשיות, זה מעלה דיון עמוק יותר: איך המודלים שלנו באמת חושבים? ואיזה סוג של “מוחות” אנחנו בעצם בונים?

מה צופן העתיד?

החוקרים מציינים ארבעה כיווני מחקר מרכזיים:

שיטות הערכה טובות יותר

הניסויים הקיימים מבוססים על פרוטוקולים מוגבלים. ייתכן שהמודלים מתבוננים פנימה גם במצבים אחרים.

הבנת המנגנונים

יש כמה השערות לגבי מה קורה בפנים. ייתכן שהמודלים מזהים כשמשהו “חורג מהצפוי” בדפוסי החשיבה שלהם, או שיש בהם מנגנון פנימי שבודק אם מה שהם עומדים לומר תואם למה שהתכוונו לומר. אבל עדיין אין הוכחה לאף אחד מהמנגנונים האלה.

בדיקה בתרחישים טבעיים

האם התבוננות פנימית מתרחשת גם בשיחות רגילות, לא רק בהזרקות מלאכותיות?

אימות מול הטעיה

כיצד נבדיל בין דיווח אמיתי לבין “העמדת פנים” של מודעות?

 

 

בפעם הבאה שתדברו עם Claude

המחקר מזכיר דבר פשוט – מודלי שפה מתקדמים מורכבים הרבה יותר ממה שנראה כלפי חוץ. כשאתם מקבלים תשובה מ-Claude, ייתכן שבנסיבות מסוימות הוא היה מזהה שינוי פנימי לפני שזה משפיע על מה שהוא אומר. זה לא אומר שהוא חושב כמו אדם. זה לא אומר שהוא מודע. אבל זה גם לא כלום.

 

המודלים המתקדמים ביותר כבר מראים סימנים של ניטור עצמי בסיסי, וייתכן שבעתיד זה יהפוך ליכולת אמינה יותר. אם נגיע למצב שבו מודלים מסוגלים לזהות, להסביר ולתקן את החשיבה שלהם – זו תהיה קפיצה לא רק טכנולוגית, אלא גם פילוסופית.

 

בינתיים כדאי לזכור, מאחורי המילים של Claude פועלת מערכת שמנסה להבין את עצמה. זה רחוק ממודעות, רחוק משלמות – אבל המסע להבין מה קורה בתוכה כבר התחיל.

 

רוצים לצלול עמוק יותר? כנסו למחקר המלא.

הפוסט כש-AI מתבונן פנימה: מה קורה כשמודל שפה מזהה שמשהו לא מסתדר לו? הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/ai-introspection/feed/ 0
מדריך לשימוש ב-Gemini Canvas: איך להפוך דוח למצגת מקצועית תוך דקות https://letsai.co.il/gemini-canvas-presentations/ https://letsai.co.il/gemini-canvas-presentations/#comments Tue, 04 Nov 2025 12:23:01 +0000 https://letsai.co.il/?p=63700 יצירת מצגות הפכה לקלה מתמיד. בעדכון אוקטובר 2025 של Gemini Canvas, גוגל מאפשרת להפוך כל דוח, מאמר או מסמך אסטרטגי למצגת מעוצבת ומאורגנת באופן אוטומטי וללא צורך בפתיחת “Google Slides”. במדריך הזה נסקור כיצד להשתמש בכלי החדש צעד-אחר-צעד, ונראה כיצד הוא חוסך זמן ומאפשר להציג מידע עסקי, חינוכי או שיווקי בצורה מקצועית וברורה. Canvas פתוח […]

הפוסט מדריך לשימוש ב-Gemini Canvas: איך להפוך דוח למצגת מקצועית תוך דקות הופיע ראשון בLet's AI בינה מלאכותית

]]>
יצירת מצגות הפכה לקלה מתמיד. בעדכון אוקטובר 2025 של Gemini Canvas, גוגל מאפשרת להפוך כל דוח, מאמר או מסמך אסטרטגי למצגת מעוצבת ומאורגנת באופן אוטומטי וללא צורך בפתיחת “Google Slides”. במדריך הזה נסקור כיצד להשתמש בכלי החדש צעד-אחר-צעד, ונראה כיצד הוא חוסך זמן ומאפשר להציג מידע עסקי, חינוכי או שיווקי בצורה מקצועית וברורה. Canvas פתוח גם בחשבון חינמי, אך עם מגבלות קונטקסט וביצועים. מנויי Google AI Pro ו-Ultra נהנים מחלון קונטקסט רחב יותר, זמני עיבוד מהירים ויכולות מחקר מתקדמות.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

למה להשתמש ב-Gemini Canvas

Gemini Canvas מבית גוגל נועד לפשט את תהליך יצירת המצגות ולהפוך אותו לאוטומטי כמעט לחלוטין. הכלי מנתח את המסמך שהמשתמש מעלה, בין אם מדובר בדוח, במאמר או במסמך אסטרטגי, ומייצר בדרך כלל תוך פחות מדקה מצגת מאורגנת ומעוצבת. התוצאה היא תוצר מקצועי הכולל כותרות, חלוקה לקטעים, גרפים ותמונות שנבחרות באופן אוטומטי בהתאם לנושא. הממשק של Canvas פשוט ואינטואיטיבי לכל משתמש, כך שגם מי שאינו בקיא בעיצוב יכול להפיק מצגות ברמה גבוהה.

 

היתרון המרכזי נמצא בשילוב ההדוק עם מוצרי Google Workspace: ניתן לייצא את המצגת ישירות ל-“Google Slides” להמשך עריכה, או להעביר טבלאות נתונים ל-“Google Sheets” לעיבוד נוסף. מעבר לכך, Gemini תומך בעברית באופן מלא, כולל בממשק, בעיבוד טקסט ובתוכן הויזואלי.

איך זה עובד בפועל

שלב 1: הכנת המסמך

התהליך מתחיל במסמך קיים – דוח מחקר, מאמר אסטרטגי או מסמך עבודה המכיל תובנות מרכזיות. זהו הבסיס שעליו Gemini Canvas בונה את המצגת. ככל שהטקסט ברור ומובנה יותר, כך גם המצגת שתיווצר תהיה מדויקת ומאורגנת.

שלב 2: העלאת הקובץ ל-Gemini Canvas

בשלב הבא נכנסים לפלטפורמת Gemini ובוחרים בממשק Canvas – סביבת העבודה האינטראקטיבית של גוגל. שם ניתן להעלות את הקובץ הרצוי ישירות לחלון הייעודי. מרגע שהקובץ נטען, Canvas מזהה את מבנה הטקסט ומכין אותו לעיבוד אוטומטי.

 

איך מעלים מסמך ומפעילים את ה-Canvas

איך מעלים מסמך ומפעילים את ה-Canvas

שלב 3: יצירת המצגת

לאחר שהקובץ נטען, וכפתור ה-Canvas פעיל, אפשר לבקש את יצירת המצגת (‘Create presentation’). בשלב זה, Gemini Canvas מנתח את התוכן שבמסמך ומתרגם אותו למבנה מצגת מלא. המערכת מזהה את הכותרות והנושאים המרכזיים, מחלקת את המידע לשקפים ומעצבת כל אחד מהם בהתאם לקונטקסט של הטקסט.

 

התוצאה כוללת שקפים עם כותרות מסודרות, נקודות עיקריות בתצורת Bullet Points, גרפים המבוססים על הנתונים שבמסמך ותמונות תואמות לנושא. כל אלה נוצרים באופן אוטומטי, תוך שמירה על ערכת עיצוב אחידה (Theme) שמעניקה למצגת מראה מקצועי.

 

תהליך יצירת מצגת ב-Gemini Canvas

תהליך יצירת מצגת ב-Gemini Canvas

שלב 4: התאמה וייצוא

לאחר ש-Gemini Canvas יוצר את המצגת הראשונית, ניתן לבדוק אותה ולעשות עריכות בתוכן ובעיצוב. קיימת אפשרות יצוא ל-Google Slides לעריכה חופשית, הוספת אלמנטים עיצוביים או התאמה למיתוג הארגוני. 

 

 

היתרונות של שימוש ב-Canvas בג׳מיני

היתרונות במעבר מתהליך ידני וממושך של יצירת מצגות, לתהליך אוטומטי ומהיר ב-Gemini Canvas

 

זרימת עבודה חכמה: מחקר, ניתוח והצגה במקום אחד

אחת היכולות המרשימות של מערכת Gemini היא השילוב ההדוק בין Deep Research ל-Canvas. במקום לעבוד עם כלים נפרדים, ניתן לבצע את כל התהליך, מהמחקר ועד למצגת, באותה סביבת עבודה.

 

התהליך מתחיל בשלב המחקר. באמצעות הפיצ׳רDeep Research, המשתמש מנסח שאלת מחקר, ו-Gemini מבצע חיפוש עצמאי ברשת. המערכת סורקת מאות מקורות, מסכמת את הממצאים ומפיקה דוח מחקר מפורט הכולל קישורים, נתונים ותובנות. המשתמש יכול לעיין גם בשלבי החשיבה והמקורות עצמם – תוספת חשובה לבדיקת אמינות.

 

הפעלת פיצ׳ר המחקר המעמיק דרך כלים (Tools)

הפעלת פיצ׳ר המחקר המעמיק דרך כלים (Tools)

 

מכאן, בלחיצה אחת ניתן להעביר את הדוח ישירות ל-Canvas. השילוב הזה יוצר זרימת עבודה רציפה וממקם את Gemini כפלטפורמה אחודה ליצירת תוכן מבוסס מחקר. 

זמינות ומגבלות שימוש

Gemini Canvas פתוח גם למשתמשים בחשבון החינמי של Gemini, אך הגרסה החינמית כוללת מגבלות ברורות. משתמשים ללא מנוי Google AI Pro או Ultra מקבלים גישה למודל ‎Gemini 2.5 Flash, בעוד המודל ‎Gemini 2.5 Pro זמין בעיקר למנויים בתשלום. לדוגמה, בחשבון חינם חלון ההקשר עומד על כ-32 אלף טוקנים (≈ 50 עמודי טקסט) לעומת מיליון טוקנים בחבילה בתשלום.

 

בנוסף, בחשבון חינמי ניתן להעלות מסמכים, מצגות ותמונות. עם זאת, העלאת גיליונות נתונים (כגון XLS/XLSX/CSV) או שימוש במחקר מתקדם במסגרת Deep Research דורשים מנוי בתשלום. בחינם, Deep Research מוגבל עד 5 דוחות מחקר לחודש.

 

למרות המגבלות, משתמשים רבים יכולים כבר בגרסה החינמית להפיק את התועלת המרכזית של Canvas, במיוחד להמרת דוחות והצגות תוכן חזותי. לעסקים או צוותים שמעוניינים בעיבודים גדולים וייצוא מקיף או עבודה משולבת נתונים, מנוי בתשלום מציע חוויית שימוש רחבה יותר.

טיפים לשימוש יעיל

כמו כל פלט של בינה מלאכותית, ולמרות שהמצגת נוצרת אוטומטית, מומלץ לעבור עליה לפני ההצגה ולהוסיף התאמות אישיות כמו ניסוחים מדויקים, מיתוג צבעוני או הדגשה של נקודות מפתח. כך התוצר שומר על איזון בין יעילות אוטומטית לבין אמירה מקצועית אישית.

 

Gemini Canvas מתאים במיוחד לעיבוד דוחות ומסמכים מורכבים, ומאפשר להפוך אותם למצגות מפורטות תוך זמן קצר. שילובו עם כלי Google Workspace כמו “Slides”, “Docs” ו-“Sheets” יוצר סביבת עבודה שלמה שבה ניתן לעבור בקלות בין תוכן טקסטואלי, חזותי ומספרי.

 

כדאי לדעת:

  • פרטיות: מסמכים מעובדים בענן. ודאו התאמה למדיניות המידע הארגונית לפני העלאה.

  • תמונות: התמונות האוטומטיות נוחות, אך אם קיימת זהות מותגית קפדנית – החליפו לנכסים מאושרים.

  • מקורות מחקר: אם המצגת נשענת על Deep Research, מומלץ לשמור את הקישורים לבדיקה פנימית.

 

איך זה יכול לעזור למנהלים ועסקים

Gemini Canvas משנה את הדרך שבה עסקים מציגים מידע ומעבדים תוכן פנימי. הכלי מאפשר ליצור מצגות שיווקיות, דוחות ויזואליים או חומרי הדרכה באיכות גבוהה, גם ללא צוות עיצוב או ידע טכני. התהליך הפשוט והמהיר מקצר משמעותית את שלב ההפקה ומאפשר למנהלים להתמקד בעיקר: המסר והנתונים.

 

מעבר ליעילות, היתרון המרכזי הוא בתקשורת. מצגות שנוצרו ב-Canvas מסייעות להעביר רעיונות בצורה בהירה ומשכנעת, ומאפשרות שימוש חוזר בתוכן קיים בפורמטים שונים – משיווק והדרכה ועד ניתוחי ביצועים.

 

במובן הרחב יותר, Canvas הוא דוגמה לכלי AI פרקטי שמתרגם יכולת טכנולוגית לתועלת עסקית מיידית. הוא לא מחליף חשיבה יצירתית, אלא מייעל אותה, ומאפשר לכל מנהל או יוצר תוכן לעבוד ברמה מקצועית יותר, בזמן קצר בהרבה.

הפוסט מדריך לשימוש ב-Gemini Canvas: איך להפוך דוח למצגת מקצועית תוך דקות הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/gemini-canvas-presentations/feed/ 5
שדרוגים ב-NotebookLM הופכים אותו לחכם מאיי פעם https://letsai.co.il/notebooklm-google-upgrade/ https://letsai.co.il/notebooklm-google-upgrade/#comments Sat, 01 Nov 2025 15:06:29 +0000 https://letsai.co.il/?p=63044 נוטבוק (NotebookLM) של גוגל עובר מהפך שקט אך עמוק, כזה שממקם אותו מחדש כאחד מכלי המחקר החכמים ביותר של התקופה. אחרי תקופה ארוכה של בדיקות, גוגל הכריזה על שורה של שדרוגים דרמטיים למערכת – מהרחבת חלון ההקשר ועד התאמה אישית של סגנון השיחה. אם בעבר היה מדובר במחברת חכמה עם בינה מלאכותית, כעת הוא מתפקד […]

הפוסט שדרוגים ב-NotebookLM הופכים אותו לחכם מאיי פעם הופיע ראשון בLet's AI בינה מלאכותית

]]>
נוטבוק (NotebookLM) של גוגל עובר מהפך שקט אך עמוק, כזה שממקם אותו מחדש כאחד מכלי המחקר החכמים ביותר של התקופה. אחרי תקופה ארוכה של בדיקות, גוגל הכריזה על שורה של שדרוגים דרמטיים למערכת – מהרחבת חלון ההקשר ועד התאמה אישית של סגנון השיחה. אם בעבר היה מדובר במחברת חכמה עם בינה מלאכותית, כעת הוא מתפקד כשותף מחקר אמיתי, שמבין הקשרים, זוכר שיחות ומתאים את עצמו למטרות המשתמש.

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

שיחות עומק במקום תשובות שטחיות

למי ש(עדיין) לא מכיר – NotebookLM הוא כלי עבודה מבוסס AI מבית גוגל, שעוזר לכם לנתח מסמכים בקונטקסט גדול (מסמכים מאוד ארוכים), לבצע מחקר חכם, ולהנגיש מידע בצורה “קלה לעיכול”: הפיכת טקסטים לפודקאסטים (אפילו בעברית), למצגות וידאו, לתרשימי זרימה ואפילו לכרטיסיות למידה

 

באמת כלי מדהים! אבל השדרוג החדש הוא בעיקר שדרוג טכנולוגי: נוטבוק, שמתבסס על מודלי ג’מיני (Gemini) החדשים של גוגל, פועל כעת עם חלון הקשר עצום של מיליון טוקנים – פי 8 מהגרסה הקודמת. המשמעות היא שהמערכת יכולה לעבד ולנתח מאגרי מידע ומסמכים רחבים בהרבה, ולשמור על הבנה עקבית לאורך זמן. במקביל, יכולת הזיכרון שודרגה פי שישה, כך ששיחות ממושכות אינן דורשות עוד חזרה מתמדת על מה שנאמר קודם.

 

לפי גוגל, השיפורים האלה כבר הובילו לקפיצה של 50% בשביעות הרצון של המשתמשים, בעיקר בזכות היכולת של הכלי לספק תשובות עשירות יותר, שמבוססות על מגוון רחב יותר של מקורות מידע. השיחות הפכו טבעיות יותר, עם רצף הגיוני והבנה הקשרית שנשמרת לאורך זמן.

 

כלי שחושב יחד איתכם

גוגל גם עדכנה את הדרך שבה נוטבוק מנתח מקורות. במקום להסתפק בתשובה ישירה לשאלה, המערכת “חושבת” בכמה מישורים במקביל: היא מזהה הקשרים, מחברת בין חלקים שונים במידע ומציגה תשובה סינתטית אחת, המבוססת על התמונה הרחבה.

 

חיפוש, שליפה והבנה טובים יותר

חיפוש, שליפה והבנה טובים יותר | קרדיט: Google

 

כך, היא מסוגלת לחשוף חיבורים שאינם מובנים מאליהם בין מסמכים, נתונים ותובנות – יתרון מובהק במחקר אקדמי, בניתוח עסקי או בכל פרויקט מבוסס מידע. בנוסף, גוגל הוסיפה אפשרות לשמור היסטוריית שיחות באופן אוטומטי – פיצ’ר קריטי למי שעובד על פרויקטים מתמשכים.

 

כמו כן, ניתן לסגור ולחזור לאותה שיחה מאוחר יותר בלי לאבד דבר, והמידע נותר פרטי גם במחברות משותפות.

 

שיחות עם מטרה והתאמה אישית

השדרוג החדש ביותר, ואולי המעניין ביותר, הוא האפשרות להגדיר “מטרות שיחה” (Chat Goals). כל משתמש יכול לקבוע איך נוטבוק יתנהג ואיזו זהות לאמץ במהלך השיחה.

 

התאמה אישית של מטרות השיחה

התאמה אישית של מטרות השיחה | קרדיט: Google

 

אפשר לבקש ממנו “להיות יועץ אסטרטגי שיווקי”, “לפעול כחוקר ביקורתי” או אפילו “לנהל סימולציה כמאסטר משחק תפקידים”.

 

מדובר בכלי התאמה אישית שמעניק למשתמש שליטה כמעט מלאה על אופי האינטראקציה עם ה-AI – מתשובות אקדמיות קפדניות ועד יצירתיות ונרטיביות.

 

נוטבוק כמלווה מחקר אמיתי

אם נוטבוק היה עד כה כלי עזר, הרי שכעת הוא הופך לשותף אינטלקטואלי – אחד שמסוגל להבין הקשר, לשמור על רצף מחשבתי ולהתאים את סגנון הדיאלוג לצרכים המשתנים של המשתמש.

 

NotebookLM משתדרג

NotebookLM משתדרג | קרדיט: Google.

 

השילוב בין הכוח האדיר של מודלי ג’מיניי של גוגל, זיכרון ארוך טווח, עיבוד הקשר מתקדם והתאמה אישית של פרסונה הופכים אותו לא רק לכלי עיבוד מידע, אלא לפלטפורמה של ממש לחשיבה ויצירה משותפת.

 

השדרוגים האלה ממחישים את הכיוון שבו מתקדמת גוגל בתחום הבינה המלאכותית: פחות “מענה לשאלה”, ויותר “הבנה של מחשבה”. בתקופה שבה כמות המידע רק הולכת וגדלה, כלים כמו NotebookLM הם הניסיון להפוך את הבינה המלאכותית ממנוע חיפוש, לשותף שמבין באמת.

הפוסט שדרוגים ב-NotebookLM הופכים אותו לחכם מאיי פעם הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/notebooklm-google-upgrade/feed/ 1
PayPal ו-OpenAI משלבות כוחות https://letsai.co.il/paypal-openai-partnership/ https://letsai.co.il/paypal-openai-partnership/#respond Fri, 31 Oct 2025 09:52:27 +0000 https://letsai.co.il/?p=63011 ב-28 באוקטובר 2025 הודיעו PayPal ו-OpenAI על שותפות שתאפשר לקנות מוצרים ישירות דרך ChatGPT. המשמעות היא שמאות מיליוני משתמשים יוכלו להשלים רכישות תוך כדי שיחה, ומיליוני סוחרים של PayPal יוכלו למכור בפלטפורמה בלי לכתוב שורת קוד. מניית PayPal זינקה ב-10% עם פרסום ההודעה, תגובה שמיוחסת גם לתוצאות רבעוניות חזקות במיוחד.     איך זה יעבוד […]

הפוסט PayPal ו-OpenAI משלבות כוחות הופיע ראשון בLet's AI בינה מלאכותית

]]>
ב-28 באוקטובר 2025 הודיעו PayPal ו-OpenAI על שותפות שתאפשר לקנות מוצרים ישירות דרך ChatGPT. המשמעות היא שמאות מיליוני משתמשים יוכלו להשלים רכישות תוך כדי שיחה, ומיליוני סוחרים של PayPal יוכלו למכור בפלטפורמה בלי לכתוב שורת קוד. מניית PayPal זינקה ב-10% עם פרסום ההודעה, תגובה שמיוחסת גם לתוצאות רבעוניות חזקות במיוחד.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

איך זה יעבוד בפועל

החל מ-2026, משתמש שישאל את ChatGPT “נעלי ריצה מתחת ל-100 דולר” יקבל רשימת מוצרים רלוונטיים. אם המוצר תומך ב-Instant Checkout, יופיע כפתור “Buy with PayPal”. לחיצה אחת, אישור משלוח ותשלום – והקנייה הושלמה. לא צריך חשבון PayPal כדי לקנות. לצד האפשרות לשלם דרך הארנק הדיגיטלי, תוצע גם אופציית “Pay Another Way” לתשלום בכרטיס אשראי או חיוב ישיר. PayPal תעבד את כל העסקאות, כולל אלו של משתמשים שאינם רשומים לשירות.

 

החברה תספק את כל שכבות ההגנה – אבטחה, מעקב משלוחים ופתרון מחלוקות – בדיוק כפי שהיא עושה במסחר המסורתי. עבור הסוחרים, התהליך פשוט לא פחות – מי שכבר משתמש ב-PayPal יזכה לחשיפה אוטומטית ב-ChatGPT, בלי צורך באינטגרציה נפרדת. PayPal מטפלת בכל תהליך הניתוב והאימות מאחורי הקלעים.

הטכנולוגיה שמאפשרת את זה

מאחורי השותפות עומד Agentic Commerce Protocol (ACP) – תקן פתוח שפיתחו OpenAI ו-Stripe. הוא מאפשר לסוכני AI, עסקים וספקי תשלומים לתקשר באופן מאובטח ולבצע עסקאות בזמן אמת.

 

הייחוד של ACP הוא בכך שהוא לא רק מאבטח תשלומים. לפי OpenAI, הפרוטוקול הופך את PayPal למערכת דינמית לניהול מסחר: מעקב אחר התנהגות קונים, ניתוח הזדמנויות מכירה ואוטומציה של חוויית הלקוח. במילים פשוטות, זו תשתית שמחברת בין תשלום, תובנות ופעולה.

 

היתרון המרכזי לסוחרים הוא שליטה מלאה. הם שומרים על הקשר עם הלקוחות, ניהול התשלומים והשירות, בעוד ChatGPT פועל כסוכן מתווך שמקשר בין הצדדים. זו לא חנות חדשה, אלא ממשק שיחה חכם שמאפשר למסחר הקיים להפוך אינטראקטיבי.

החוסן הפיננסי שמאחורי השותפות

בסוף אוקטובר פרסמה PayPal תוצאות רבעון שלישי חזקות עם הכנסות של 8.4 מיליארד דולר (עלייה של 7%) ורווח נקי של 1.24 מיליארד דולר (עלייה של 24%), עם רווח מתואם של 1.34 דולר למניה – מעל התחזיות ב-12%. החברה העלתה את תחזית הרווח השנתית ל- 5.35 עד 5.39 דולר למניה, צעד שמבטא ביטחון בצמיחה. לראשונה בתולדותיה, הכריזה על דיבידנד רבעוני של 14 סנט למניה – סימן ברור ליציבות פיננסית ולתזרים מזומנים חזק.

 

נפח העסקאות (TPV) צמח ב-8% ל-458 מיליארד דולר, שירות “Buy Now Pay Later” צמח ביותר מ-20%, ו-Venmo (אפליקציית התשלומים החברתית שבבעלות PayPal) המשיכה להתרחב בקצב מהיר. מניית החברה כבר עלתה בכ-40% מהשפל באפריל, והשותפות עם OpenAI הוסיפה לה תנופה משמעותית, לצד שיתופי פעולה חדשים עם Google ו-Perplexity שמחזקים את נוכחותה בעולם המסחר מבוסס AI.

OpenAI דוהרת לעולם המסחר

PayPal היא לא השותפה הראשונה של OpenAI בתחום המסחר. מאז שהשיקה בספטמבר 2025 את Instant Checkout, יצרה OpenAI שיתופי פעולה עם Shopify ו-Etsy שמייצגות יחד יותר ממיליון סוחרים, ועם Walmart, שהקדימה את PayPal בשבועיים בלבד.

 

ChatGPT עצמה הפכה לפלטפורמה מסחרית בקנה מידה עצום. היא מעבדת מעל שישה מיליארד טוקנים בדקה, משרתת כ-800 מיליון משתמשים שבועיים, ומושכת כ-4 מיליון מפתחים שבונים עליה מוצרים ושירותים. מדובר בהכפלה של קהל המשתמשים מאז תחילת השנה – קצב צמיחה שמסביר למה מותגים גדולים ממהרים להצטרף.

 

אלכס כריס, מנכ”ל PayPal, סיכם זאת כך: “יש לנו מאות מיליוני משתמשים נאמנים שיכולים מעכשיו ללחוץ על כפתור ‘Buy with PayPal’ ב-ChatGPT ולקבל חוויית תשלום בטוחה, פשוטה ומיידית”.

מסחר אייג’נטי – מה זה בכלל?

“מסחר אייג’נטי” מתאר שלב חדש שבו סוכני AI כבר לא רק מגיבים לשאלות, אלא פועלים ביוזמתם – לומדים את ההעדפות של המשתמש, מזהים דפוסים ומתכננים צרכים עתידיים. במילים אחרות, הקנייה הופכת מתהליך שמנוהל על ידי הצרכן, לתהליך שהטכנולוגיה מנהלת בשבילו.

 

לפי McKinsey, מסחר מבוסס שיחה ו-AI צפוי להגיע לכ-20% מהמסחר האלקטרוני העולמי עד 2030. דאג מקמילון, מנכ”ל Walmart, תיאר זאת כך: “במשך שנים רבות חוויית הקנייה המקוונת נשענה על שורת חיפוש ורשימה אינסופית של מוצרים. זה עומד להשתנות.”

 

אלכס כריס, המנכ”ל של PayPal, הוסיף ממד מעשי: “מאות מיליוני אנשים משתמשים ב-ChatGPT מדי שבוע לעזרה במשימות יומיומיות, כולל מציאת מוצרים, ויותר מ-400 מיליון משתמשים ב-PayPal לקניות. השותפות עם OpenAI מאפשרת מעבר טבעי מצ’אט לתשלום בכמה לחיצות בלבד.”

PayPal מאמצת את ה-AI של OpenAI 

השותפות עם OpenAI חורגת מעבר לעולם התשלומים. PayPal מאמצת את הטכנולוגיה של OpenAI גם בתוך הארגון עצמו. מעל 24 אלף מעובדיה קיבלו גישה ל-ChatGPT Enterprise, המהנדסים משתמשים ב-Codex לייעול פיתוח קוד, וה-API של OpenAI שולב במוצרים ובשירותים של החברה. המהלך הוא חלק מאסטרטגיית ה-AI הרחבה של PayPal – לשפר תהליכי פיתוח, להעצים עובדים, וליצור חוויות לקוח מתקדמות יותר.

מי מרוויח מהמסחר החדש?

עבור הצרכנים, האפשרות לקנות ישירות מתוך ChatGPT מוסיפה שכבה של נוחות – חיפוש, המלצה ורכישה באותו חלון. זה מתאים במיוחד לרכישות מהירות של מוצרים כמו נעליים, אביזרים, או מוצרי בית, כאלה שלא דורשות השוואה מעמיקה בין אתרים.

 

עבור הסוחרים, היתרון ברור – מי שכבר משתמש ב-PayPal זוכה לנוכחות אוטומטית ב-ChatGPT, בלי עלויות אינטגרציה או תפעול. הקטגוריות הראשונות שייפתחו כוללות אופנה, יופי, שיפורי בית ואלקטרוניקה.

 

ההשקה צפויה להתחיל במהלך 2026 בארצות הברית ולהתרחב בהמשך לשווקים נוספים. בשלב זה אין מועד מדויק להשקה גלובלית.

 

 

נקודת מפנה או עוד שלב באבולוציית הקנייה?

השותפות בין PayPal ל-OpenAI עשויה לשנות את הדרך שבה אנחנו מבצעים רכישות אונליין. במקום לעבור בין אתרים, להשוות ולמלא טפסים, כל התהליך מתכנס לשיחה אחת עם ChatGPT – חוויה ישירה, פשוטה ומהירה יותר מכל מנוע חיפוש מסורתי. אבל היעילות הזו מגיעה עם מחיר חדש: אמון.

 

כשבינה מלאכותית מציגה לנו מוצרים, איך נדע אם זו באמת ההמלצה הטובה ביותר או תוצאה של אינטרס מסחרי? נכון לעכשיו, OpenAI לא מפרטת כיצד ChatGPT מדרגת או מסננת מוצרים, והפער הזה בין שקיפות לנוחות הוא לב הדיון.

 

PayPal מצידה בונה לעצמה מעמד מרכזי בעידן המסחר האייג’נטי. השיתופים עם Google ו-Perplexity מצביעים על אסטרטגיה רחבה, שבה התשלום הופך לחלק בלתי נראה מתהליך הקנייה, כמו שכבה סמויה בתוך השיחה. אם התחזיות יתממשו והמסחר השיחתי יגיע ל-20% מהיקף המסחר העולמי עד 2030, השותפות הזו עשויה להיזכר כרגע שבו השיחה הפכה לפעולה, והגבול בין דיאלוג למסחר נעלם כמעט לגמרי.

הפוסט PayPal ו-OpenAI משלבות כוחות הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/paypal-openai-partnership/feed/ 0
האם ה-GPT שלכם באמת משקר לכם או שזה פשוט עניין של איך אתם מדברים איתו? https://letsai.co.il/gpt-communication-challenges/ https://letsai.co.il/gpt-communication-challenges/#respond Fri, 31 Oct 2025 06:49:03 +0000 https://letsai.co.il/?p=62987 פתחתם את ה-ChatGPT, ניסחתם שאלה מדויקת וקיבלתם תשובה שנשמעה מבריקה, רק שהיא לא הייתה נכונה. לרגע זה מרגיש כאילו הבינה המלאכותית, אותה ישות חכמה שאנחנו סומכים עליה כל כך, פשוט לא אמינה. האם היא משקרת לנו? או שאולי אנחנו פשוט לא יודעים איך לדבר איתה נכון? האמת רחוקה ממזימה דיגיטלית או כוונה נסתרת. ה-GPT לא […]

הפוסט האם ה-GPT שלכם באמת משקר לכם או שזה פשוט עניין של איך אתם מדברים איתו? הופיע ראשון בLet's AI בינה מלאכותית

]]>
פתחתם את ה-ChatGPT, ניסחתם שאלה מדויקת וקיבלתם תשובה שנשמעה מבריקה, רק שהיא לא הייתה נכונה. לרגע זה מרגיש כאילו הבינה המלאכותית, אותה ישות חכמה שאנחנו סומכים עליה כל כך, פשוט לא אמינה. האם היא משקרת לנו? או שאולי אנחנו פשוט לא יודעים איך לדבר איתה נכון? האמת רחוקה ממזימה דיגיטלית או כוונה נסתרת. ה-GPT לא משקר, והוא גם לא אומר אמת. הוא מפרש. הוא מגיב למה שאנחנו כותבים לו על פי דפוסים לשוניים שלמד ממיליארדי טקסטים. במילים אחרות, הוא לא באמת “מבין” אותנו, אלא מחשב סבירות למה שנשמע הגיוני. אם נלמד להבין את ההיגיון הזה, נוכל לשפר את הדרך שבה אנחנו מתקשרים איתו ולקבל תוצאות מדויקות, יצירתיות והרבה יותר אנושיות.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

למה זה חשוב דווקא עכשיו

בשנה האחרונה הפכה הבינה המלאכותית מכלי ניסיוני למנוע עבודה משמעותי כמעט בכל תחום: כתיבה, עיצוב, שיווק, מחקר ואפילו רפואה. אבל יחד עם השימוש הנרחב נוצר פער אמון. אנחנו מצפים לתשובות מושלמות ושוכחים שהמערכת הזו לא באמת מבינה אותנו. היא רק מחשבת סבירות. כדי לעבוד איתה נכון, עלינו לשנות את נקודת המבט: לא לראות בינה מלאכותית כישות עליונה, אלא כשותפה לשיחה. וכמו בכל מערכת יחסים טובה – הכול מתחיל בתקשורת.

ה-AI לא משקר, הוא פשוט מפרש

ה-GPT לא חושב, לא מרגיש ולא מתכוון. אין לו מוסר, אג’נדה או אמת פנימית. מה שהוא כן עושה, זה לנבא את המילים הבאות בהתאם למיליארדי דפוסי שפה שלמד. כשאנחנו שואלים שאלה, הוא לא חושב על התשובה הנכונה אלא משלים את המשפט בצורה הסטטיסטית הסבירה ביותר.

 

כאן קורה לעיתים הבלבול. הוא נשמע סמכותי, הוא כותב יפה, אבל הוא לא באמת יודע. כשאין לו מידע ברור או כשההקשר חלקי, הוא מנחש ומשלים את הפערים הלשוניים כדי לייצר רצף שנשמע אמין. וזה מה שאנחנו קוראים לו “הזיות” לא כוונה לשקר, אלא תוצאה של תקשורת חלקית מול מודל שפה שאומן לייצר טקסט זורם.

 

איך לדבר נכון עם הבינה המלאכותית

כמו בהזמנת פיצה הכול תלוי בדיוק. אם נגיד “תביא משהו טעים”, נקבל תוצאה אקראית. אבל כשאנחנו מגדירים מה בדיוק אנחנו רוצים הטעם, המרקם, התוספות נקבל בדיוק את מה שדמיינו. כך גם עם GPT: ככל שנדייק את ההנחיה, כך התוצאה תהיה מדויקת, חכמה ואישית יותר. הבעיה היא לא שהוא לא מבין אותנו, אלא שאנחנו לא תמיד מדברים איתו ברור מספיק.

 

מגבלת הזיכרון (Context Window)

ה-GPT לא מחזיק בזיכרון אינסופי. הוא עובד בטווח הקשר מוגבל, כלומר מתייחס רק לחלק מהשיחה האחרונה. כששיחה מתארכת, הוא נוטה לשכוח פרטים קודמים לא מתוך רשלנות, אלא כי הוא מתעדף מידע חדש ורלוונטי במסגרת הזיכרון שלו. אם רוצים לשמור על דיוק, כדאי לסכם מדי פעם את עיקרי הדברים או לעבוד בתוך מרחב פרויקט ייעודי שבו נשמר ההקשר הרחב של הנושא. כך התקשורת נעשית עקבית, חכמה וברורה יותר.

 

חמישה כלים שיעזרו לכם לדבר טוב יותר עם LLMs

1) GPT מותאם אישית

בנו גרסה משלכם של GPT שתכיר את סגנון השפה, תחומי העניין וההעדפות שלכם. זה מאפשר תשובות עקביות ומדויקות יותר לאורך זמן, במיוחד כשהיא מחוברת למידע קבוע ומוגדר מראש.

 

2) Agents (סוכנים חכמים)

סוכנים הם שכבת בינה מעל המודל הבסיסי, שנשארת מחוברת למידע ולפרויקטים שלכם. לכל Agent יש זיכרון פנימי ויכולת לעקוב אחר מטרות, החלטות ותוצרים לאורך זמן ממש כמו עוזר אישי חכם שמנהל תחום מסוים עבורכם. בתוך ChatGPT תוכלו להפעיל את מצב הסוכן ולתת לו משימות מורכבות וארוכות – הוא יבצע אותן בצורה אוטונומית, וכשצריך לבקש רשות לבצע פעולות רגישות (אתרים עם הרשמה או סיסמה למשל), הוא יעצור ויבקש את רשותכם.

 

3) מרחבי פרויקט (Project Spaces)

כל פרויקט הוא סביבת עבודה נפרדת עם זיכרון וקונטקסט ייחודי משלו. הוא מתפקד כמו “בוט עצמאי”, ששומר על כל ההיסטוריה, השפה והעדפות העבודה באותו נושא. כך המודל לא מתחיל כל פעם מחדש, אלא ממשיך לפעול מתוך הבנה מתפתחת של הפרויקט והצוות שעובד עליו.

 

49 סיכום תקופתי

אחת לכמה שלבים עצרו, וסכמו בקצרה את מה שנאמר עד כה. זה מחזק את ההקשר ואת הדיוק של השיחה הבאה, במיוחד בפרויקטים ארוכים או שיתופיים.

 

5) ניסוח מדויק וברור

אל תשאירו מקום לפרשנות. כתבו בקשות בצורה ישירה, עם מטרה, טון וקהל יעד. ניסוח מדויק הוא הדלק של הבינה המלאכותית וככל שהוא חד יותר, כך גם התוצאה.

 

ההבדלים בין המודלים: כל אחד והמומחיות שלו

  • ChatGPT (OpenAI) – רב-תכליתי וגמיש, מצטיין בכתיבה, אסטרטגיה ותוכן יצירתי.

    Gemini (Google) – מתמקד באינטגרציה בין מקורות מידע ובשימוש בכלים חיצוניים.

    Claude (Anthropic) – ידוע בשיחות טבעיות ובטון אנושי ורגיש.

    Perplexity – משלב בין חיפוש אינטראקטיבי למענה מבוסס ידע בזמן אמת.

    Copilot (Microsoft) – מותאם לעולם הקוד והפיתוח, ויודע להשתלב בכלי עבודה מקצועיים.

כולם מבוססים על אותו רעיון: הם מגיבים לדרך שבה אנחנו מתקשרים איתם.

 

אחריות אנושית: לסמוך אבל לבדוק

כאשר ה-GPT ממציא עובדות, הוא לא עושה זאת בכוונה הוא פשוט מנסה למלא חלל במידע. התשובה שלו נשמעת אמינה ולכן אנחנו נוטים להאמין לה. אבל האחריות האמיתית היא שלנו לבדוק, לוודא ולשמור על חשיבה ביקורתית. ה-AI הוא כלי עוצמתי, אבל הוא עדיין כלי. והערך האנושי האמיתי הוא לדעת מתי להשתמש בו ומתי לא.

 

לדבר בינה מלאכותית זו שפה חדשה

בינה מלאכותית לא נועדה להחליף אותנו, אלא להעצים אותנו. היא לא באה לחשוב במקומנו, אלא לעזור לנו לחשוב טוב יותר, לדייק וליצור בקצב ובאיכות שלא הכרנו קודם. ככל שנלמד להשתמש בה נכון, כך נגלה שהיא לא איום אלא כלי אדיר שמאפשר לנו לגדול, להתרחב ולהיות אנושיים יותר דווקא בעולם טכנולוגי. AI הוא לא מחליף לאדם. הוא השותף החדש שלנו ליצירה, להבנה ולחדשנות.

הפוסט האם ה-GPT שלכם באמת משקר לכם או שזה פשוט עניין של איך אתם מדברים איתו? הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/gpt-communication-challenges/feed/ 0
OpenAI מציגה את “Company Knowledge” https://letsai.co.il/openai-company-knowledge/ https://letsai.co.il/openai-company-knowledge/#comments Wed, 29 Oct 2025 10:54:24 +0000 https://letsai.co.il/?p=62953 OpenAI משיקה תכונה חדשה ב-ChatGPT למנויי Business, Enterprise ו-Edu, שמטרתה להפוך את הבינה המלאכותית למרכז ידע ארגוני אמיתי. הפיצ’ר החדש, שנקרא Company Knowledge, נועד לגשר על הפער בין עולם השאלות הכלליות שבו מצטיין ChatGPT לבין המציאות הארגונית שבה המידע הדרוש לעבודה מפוזר בין כלים שונים – ממיילים וערוצי Slack ועד קבצי Google Drive, SharePoint או […]

הפוסט OpenAI מציגה את “Company Knowledge” הופיע ראשון בLet's AI בינה מלאכותית

]]>
OpenAI משיקה תכונה חדשה ב-ChatGPT למנויי Business, Enterprise ו-Edu, שמטרתה להפוך את הבינה המלאכותית למרכז ידע ארגוני אמיתי. הפיצ’ר החדש, שנקרא Company Knowledge, נועד לגשר על הפער בין עולם השאלות הכלליות שבו מצטיין ChatGPT לבין המציאות הארגונית שבה המידע הדרוש לעבודה מפוזר בין כלים שונים – ממיילים וערוצי Slack ועד קבצי Google Drive, SharePoint או GitHub.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

ידע ארגוני במקום תשובות גנריות

ב-OpenAI יודעים שברוב הארגונים המידע החשוב נמצא מפוזר בין עשרות פלטפורמות שונות: מסמכים, הודעות, טיקטים, מיילים ודוחות. התוצאה היא שהעובדים מבזבזים זמן על חיפוש במקום על החלטה וביצוע. Company Knowledge נועדה לפתור את זה.

 

באמצעות חיבור מאובטח בין ChatGPT לבין הכלים הארגוניים, המערכת יכולה לאסוף הקשר בזמן אמת ולספק תשובות מותאמות אישית. לדוגמה, לקראת שיחת לקוח, ChatGPT יכול ליצור תקציר שמבוסס על הודעות אחרונות בערוץ הלקוח ב-Slack, על מיילים קודמים, על סיכומי שיחות קודמות ב-Google Docs ועל פניות שירות פתוחות במערכת התמיכה.

 

הגרסה החדשה של GPT-5 שעליה מתבססת התכונה יודעת לעבד מידע ממקורות מרובים במקביל ולספק תשובות מדויקות יותר. כל תשובה מלווה בציטוטים ובקישורים ישירים למקורות, כך שמשתמשים יכולים לבדוק את אמינות המידע ולגשת למסמכים הרלוונטיים בלחיצה אחת.

איך זה עובד

כשפותחים שיחה חדשה ניתן להפעיל את האפשרות “Company Knowledge” בלחיצה אחת. בשימוש הראשון המשתמש מתבקש לחבר את האפליקציות הארגוניות שלו – Gmail, Slack, SharePoint, Google Drive, GitHub, HubSpot ואחרות. מרגע זה, ChatGPT יכול לאתר הקשרים רלוונטיים בכלים הללו ולשלב אותם בתשובה.

 

מסך חיבור יישומים ארגוניים דרך Company Knowledge

OpenAI | מסך חיבור יישומים ארגוניים דרך Company Knowledge

 

בצד המסך מופיעה תיבת מעקב שמציגה בזמן אמת אילו מקורות נבדקים, מאילו קבצים נשלפים נתונים, ואילו חלקים שימשו בפועל לגיבוש התשובה. כל ציטוט ניתן לפתיחה ישירה למקורו. OpenAI מדגישה כי ChatGPT אינו ניגש למידע שמעבר להרשאות הקיימות של המשתמש, כך שכל אחד רואה רק את מה שהוא ממילא מורשה לראות.

 

ChatGPT מציג את המקורות מהם נשלף המידע

ChatGPT מציג את המקורות מהם נשלף המידע | OpenAI

כלי לניתוח, לא רק לשאלות

אחת היכולות המעניינות ביותר של Company Knowledge היא ניתוח מידע מורכב או סותר. המערכת מסוגלת להריץ כמה חיפושים במקביל כדי ליישב אי-בהירויות ולספק תמונה מאוזנת. לדוגמה, אם נשאלת השאלה “מה הוחלט לגבי יעדי החברה לשנה הבאה?”, ChatGPT יסכם את הדיונים הקיימים, יציין נקודות מחלוקת ויעזור להבין היכן נדרש קבלת החלטה.

 

באופן דומה, בשאילתות אנליטיות כמו “סכם את משוב הלקוחות מהשקת האפליקציה הניידת”, ChatGPT משלב נתונים ממספר מקורות: פניות תמיכה, סקרים, הודעות בערוצי משתמשים וציטוטים מלקוחות. התוצאה היא תמונה עשירה יותר שמאפשרת קבלת החלטות מבוססת יותר.

 

בנוסף, הכלי תומך בסינון לפי זמן, כך שניתן לבקש ממנו דו”ח עדכני (“עדכן אותי על ביצועי החברה השבוע”) או רטרוספקטיבה (“מה קרה ברבעון הראשון”). הוא מדרג את המקורות לפי עדכניות ואיכות כדי להבטיח תשובה אמינה ורלוונטית.

פרטיות ובקרה

בצד ההתקדמות הזו, OpenAI מנסה להרגיע חששות לגיטימיים סביב פרטיות מידע עסקי. החברה מדגישה כי הנתונים לא משמשים לאימון מודלים, וכי כל המידע מוצפן בהתאם לסטנדרטים תעשייתיים. מנהלי מערכות בארגונים מקבלים שליטה מלאה על גישת המשתמשים – ניתן להגדיר הרשאות לפי צוותים, לאפשר או להגביל חיבור לאפליקציות מסוימות, ולנהל לוגים של פעילות דרך ממשק ה-Enterprise Compliance API.

 

בנוסף, תמיכה ב-SSO (כניסה אחידה), ב-SCIM (ניהול זהויות), וב-IP Allowlisting מאפשרת לארגונים לוודא שרק גישה מורשית תתאפשר.

 

OpenAI מציגה זאת כחלק מהתפיסה ש-ChatGPT הוא כלי עבודה ארגוני “בוגר”, העומד בדרישות אבטחת מידע ורגולציה של חברות גדולות ומוסדות חינוך.

דוגמאות שימוש

לדברי OpenAI, התכונה החדשה משנה את האופן שבו עובדים משתמשים בבינה מלאכותית ביום-יום. במקום להסתפק בשאלות פשוטות, ChatGPT הופך לכלי שמבין את ההקשר העסקי ומסייע בקבלת החלטות.

בין השימושים הבולטים שהתכונה מאפשרת:

  • הפקת דוחות ביצוע חכמים: ChatGPT יכול לאסוף נתונים ממספר מקורות וליצור סיכום ביצועים עדכני של קמפיינים שיווקיים.

  • סינתזה של משוב לקוחות: הכלי מסוגל לרכז תגובות ונתוני סקרים, לזהות מגמות חוזרות ולהציע תובנות שיכולות להזין את מסמכי האסטרטגיה של החברה.

  • תכנון גרסאות מוצר: ChatGPT יכול לסרוק משימות פתוחות ב-GitHub, לזהות באגים שדווחו ב-Slack, ולהציג תמונת מצב כוללת לצוות הפיתוח כדי להאיץ את תהליך ההשקה.

במילים אחרות, ChatGPT כבר לא עונה רק על שאלות טכניות כמו “איך מגישים דו”ח הוצאות”, אלא מתפקד כעוזר עבודה אמיתי שמבין את ההקשר העסקי ופועל מתוך התמונה הכוללת של הארגון.

 

דוגמה לסינתוז משוב לקוחות ליצירת מסמכי אסטרטגיה

OpenAI | דוגמה לסינתזה של משוב לקוחות ליצירת מסמכי אסטרטגיה

מה צפוי בהמשך

בשלב זה, Company Knowledge מופעל רק כאשר בוחרים בו במפורש בתחילת שיחה. במצב רגיל, ChatGPT עדיין עשוי להשתמש באפליקציות המחוברות, אך ללא עומק הציטוטים והאינטגרציה המלאה. כאשר האפשרות פעילה, ChatGPT אינו יכול לחפש ברשת או ליצור תמונות וגרפים, אך ניתן לכבות אותה ולהמשיך באותה שיחה כדי להחזיר את היכולות הללו.

 

OpenAI מציינת כי בעתיד הקרוב היא מתכננת לאחד את היכולות, כך ש-ChatGPT יוכל לשלב את הידע הארגוני עם החיפוש באינטרנט, עם הפקת גרפים ותוכן ויזואלי, ולספק תשובות מקיפות יותר.

 

 

לסיכום, “Company Knowledge” הוא צעד נוסף בכיוון שבו OpenAI הופכת את ChatGPT מפלטפורמת שיחה כללית לכלי עבודה ארגוני אינטגרטיבי. אם בעבר הדגש היה על כתיבה, תרגום או סיעור מוחות, כעת המוקד עובר ליישומים עסקיים עמוקים יותר, כאלה שחוסכים זמן, מרכזים ידע ומגבירים אמינות.

 

אך השינוי המשמעותי אינו רק טכנולוגי. הוא מעלה שאלות רחבות יותר על עתיד ניהול הידע בארגונים: האם המידע הארגוני יישאר בשליטת המשתמשים, או שיימסר לידי מערכות חכמות שמתווכות ביניהם? ואיך מאזנים בין נוחות העבודה לבין שמירה על פרטיות ורגולציה? OpenAI מנסה לספק תשובה ברורה – שליטה, פרטיות ושקיפות יהיו חלק בלתי נפרד מהבינה המלאכותית הארגונית של העתיד.

הפוסט OpenAI מציגה את “Company Knowledge” הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/openai-company-knowledge/feed/ 1
OpenAI פתחה את הפיצ’ר ‘פרויקטים משותפים’ לכל המשתמשים – גם לחינמיים https://letsai.co.il/shared-projects-chatgpt/ https://letsai.co.il/shared-projects-chatgpt/#respond Mon, 27 Oct 2025 12:28:50 +0000 https://letsai.co.il/?p=62754 הפיצ’ר החדש של ChatGPT, “פרויקטים משותפים” (Shared Projects), נפתח רשמית לכל המשתמשים – גם למנויים חינמיים. החל מה-22 באוקטובר 2025, ניתן לעבוד בצוותים על מסמכים, קבצים ושיחות באותה סביבת עבודה חכמה, הזמינה כעת בווב ובאפליקציות iOS ואנדרואיד. המהלך מסמן את המעבר של ChatGPT מכלי אישי לעוזר צוותי, שמאפשר ניהול פרויקטים משותפים ישירות מתוך הצ’אט.   […]

הפוסט OpenAI פתחה את הפיצ’ר ‘פרויקטים משותפים’ לכל המשתמשים – גם לחינמיים הופיע ראשון בLet's AI בינה מלאכותית

]]>
הפיצ’ר החדש של ChatGPT, “פרויקטים משותפים” (Shared Projects), נפתח רשמית לכל המשתמשים – גם למנויים חינמיים. החל מה-22 באוקטובר 2025, ניתן לעבוד בצוותים על מסמכים, קבצים ושיחות באותה סביבת עבודה חכמה, הזמינה כעת בווב ובאפליקציות iOS ואנדרואיד. המהלך מסמן את המעבר של ChatGPT מכלי אישי לעוזר צוותי, שמאפשר ניהול פרויקטים משותפים ישירות מתוך הצ’אט.

 

OpenAI פתחה את הפיצ'ר 'פרויקטים משותפים' לכל המשתמשים – גם לחינמיים

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה זה מאפשר?

Shared Projects מאפשרת לצרף משתתפים לפרויקט בקלות, דרך כתובת מייל או קישור ישיר, ולהגדיר לכל אחד הרשאות שונות: עריכה מלאה (Edit) או גישה לצ’אט בלבד (Chat). משתמשים בעלי הרשאת עריכה יכולים להעלות ולהוריד קבצים, לשנות הוראות, ואף להוסיף חברים חדשים לצוות.

 

כל פרויקט שומר הקשרים פנימיים (context), כך שה-AI “מבין” וממשיך מהיכן שהצוות עצר – כולל מסמכים, הנחיות וידע קודם.

 

למשל, צוות שיווק יכול לבנות קמפיין פרסומי משותף, לשמור קבצי תמונות וטיוטות תוכן, ולהנחות את המודל לעבוד בסגנון אחיד לאורך כל התהליך.

איך מתחילים?

כדי להתחיל, לוחצים על “New Project” באפליקציה או באתר, מוסיפים את החברים דרך כפתור השיתוף, ומכינים את סביבת העבודה: מעלים קבצים רלוונטיים, מגדירים system instructions (כמו מטרות וסגנון עבודה), מפעילים זיכרון ייעודי לפרויקט ופותחים שיחות ניסוי ראשונות עם ה-AI כדי לבסס הקשר משותף.

 

מעבר לשיתוף הקלאסי של מסמכים, זהו שיתוף עם מודל חושב. העבודה מתבצעת ישירות בתוך הצ’אט עם ה-AI, כך שהתוכן, ההנחיות וההחלטות מתעדכנים בזמן אמת ומאפשרים לצוותים לעבוד מהר וחכם יותר.

הגבלות ומכסות

OpenAI מציגה מערכת שיתופית גמישה, אך עם מכסות שונות לפי סוג המנוי:

  • משתמשים חינמיים: עד 5 משתתפים ועד 5 קבצים לכל פרויקט.

  • מנויי Plus או Go: עד 10 משתתפים ועד 25 קבצים.

  • מנויי Pro: עד 100 משתתפים ועד 40 קבצים לכל פרויקט.

OpenAI מציינת כי בעתיד תיתכן הרחבה הדרגתית של המכסות, בהתאם לדפוסי השימוש.

אפשרויות שיתוף וניהול פרויקט

האפשרות של Shared Projects מציעה מנגנון שיתוף גמיש וברור, שמאפשר שליטה מלאה בהרכב הצוות ובמידת החשיפה של כל פרויקט. ניתן להזמין משתמשים ספציפיים באמצעות כתובות מייל (מצורפות בפסיקים) או לבחור בשיתוף פתוח יותר באמצעות קישור ישיר (Anyone with a Link). השיתוף מתבצע ברמת הפרויקט כולו, לא בצ’אטים בודדים, וניתן לשנות את ההגדרות או ההרשאות בכל עת. כל משתתף חדש מופיע ברשימת Who has access, עם ציון תפקידו והרשאותיו (Edit או Chat).

 

מסך השיתוף של ChatGPT Projects

מסך השיתוף של ChatGPT Projects

 

הגישה הזו מאפשרת לארגונים ולצוותים לשמור על איזון בין שיתופיות לבין שליטה ובקרה. פרויקטים פנימיים יכולים להישאר מוגנים ומוגבלים למוזמנים בלבד, בעוד שיוזמות פתוחות או קהילתיות יכולות להיפתח לקהל רחב בלחיצה אחת.

פרטיות ואבטחה

OpenAI מדגישה כי סביבת Shared Projects נבנתה מתוך עקרון של “שיתוף מאובטח כברירת מחדל”. כל הנתונים מוצפנים ונגישים רק למשתמשים שהוזמנו במפורש לפרויקט. ניתן למחוק פרויקטים לצמיתות בכל עת, ולהגדיר אילו משתתפים יוכלו לראות, לערוך או להעלות קבצים.

 

בפרויקטים משותפים הזיכרונות האישיים מושבתים, וכל התוכן גלוי רק לאנשי הצוות – מנגנון שמבטיח שיתוף פעולה בטוח גם בצוותים עסקיים רגישים, בלי לוותר על נוחות העבודה השיתופית.

 

 

לסיכום, החל מעכשיו ניתן לשתף וליצור יחד פרויקטים ב-ChatGPT. זו סביבת עבודה אחת שמרכזת קבצים, צ’אטים, הנחיות ומידע משותף. הכל נגיש, מסונכרן ומוגן, ללא צורך בקפיצות בין מיילים או אפליקציות חיצוניות. זהו צעד נוסף בהתפתחות של ChatGPT כחלל עבודה שיתופי עם בינה מלאכותית במרכזו – מקום שבו צוותים חושבים, מתכננים ויוצרים יחד עם ה-AI כחלק מהצוות עצמו.

הפוסט OpenAI פתחה את הפיצ’ר ‘פרויקטים משותפים’ לכל המשתמשים – גם לחינמיים הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/shared-projects-chatgpt/feed/ 0
מיקרוסופט משיקה את Copilot החדש שהופך מעוזר חכם לשותף עבודה אינטליגנטי https://letsai.co.il/copilot-fall-release-2025/ https://letsai.co.il/copilot-fall-release-2025/#comments Sun, 26 Oct 2025 08:32:17 +0000 https://letsai.co.il/?p=62669 מיקרוסופט כבר לא רק ספקית תוכנה – היא שותפה שמנהלת את זרימת המידע, הידע והעבודה בארגון. בעדכון הסתיו של Copilot, החברה מציגה סדרה של יכולות חדשות שמסמנות את המעבר מעוזר חכם אישי לשותף עבודה אינטליגנטי לצוותים ויחידים. העדכון מתמקד בשלושה צירים מרכזיים: עבודה קבוצתית וחברתית עם כלים לשיתוף בזמן אמת וללמידה משותפת, התאמה אישית מבוססת […]

הפוסט מיקרוסופט משיקה את Copilot החדש שהופך מעוזר חכם לשותף עבודה אינטליגנטי הופיע ראשון בLet's AI בינה מלאכותית

]]>
מיקרוסופט כבר לא רק ספקית תוכנה – היא שותפה שמנהלת את זרימת המידע, הידע והעבודה בארגון. בעדכון הסתיו של Copilot, החברה מציגה סדרה של יכולות חדשות שמסמנות את המעבר מעוזר חכם אישי לשותף עבודה אינטליגנטי לצוותים ויחידים. העדכון מתמקד בשלושה צירים מרכזיים: עבודה קבוצתית וחברתית עם כלים לשיתוף בזמן אמת וללמידה משותפת, התאמה אישית מבוססת זיכרון ופרטיות בשליטת המשתמש, שמאפשרת ל-Copilot לזכור הקשרים לפי בחירה, ואינטגרציה עמוקה ב-Edge וב-Windows, כדי להביא את Copilot בדיוק למקום שבו העבודה מתבצעת בפועל. המטרה של מיקרוסופט ברורה: להפוך את Copilot ממנוע שיחה טכנולוגי לשותף עבודה אנושי ודינמי – כזה שמבין הקשר, מגיב באופן טבעי, ומחבר בין אנשים, קבצים ורעיונות במערכת אחת רציפה.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

AI חברתי שמחבר בין אנשים

Copilot Groups

היכולת החדשה מבית מיקרוסופט מאפשרת לקיים שיחות משותפות בזמן אמת עם עד 32 משתתפים, שבהן Copilot מצטרף כשותף אקטיבי. הוא מסכם דיונים, מציע ניסוחים חלופיים, עוקב אחרי הצבעות, וממפה משימות להמשך. השיתוף מתבצע בלינק פשוט, כך שכל אחד יכול להצטרף בלי צורך בהתקנה או גישה מיוחדת. Groups נועדה להקל על סיעור מוחות, תכנון פרויקטים, למידה קבוצתית וכתיבה שיתופית, ומייצגת את המעבר של Copilot ממענה אינדיבידואלי למרחב של עבודת צוות. בשלב זה היכולת זמינה בארצות הברית בלבד, עם תוכנית הרחבה גלובלית בהמשך השנה.

Imagine

מרחב קהילתי חדש שבו אפשר ליצור ולשתף יצירות שנוצרו בעזרת AI. לכל פוסט ניתן לעשות לייק, להגיב או ליצור רמיקס, כך שכל רעיון הופך לחומר גלם שאחרים יכולים לפתח הלאה. Imagine נבנה סביב עיקרון של יצירתיות מצטברת, וכל תרומה מחזקת את עבודת הקהילה ומעודדת חיבור בין יוצרים, מפתחים ומשתמשים.

 

מרחב חדש לשיתוף, גילוי ורימיקס של יצירות AI

מרחב חדש ליצירה ושיתוף | copilot.com/fallrelease

ממשק אנושי ומצבי שיחה

Mico

דמות קולית-חזותית חדשה שמעניקה ל-Copilot נוכחות אנושית בשיחות קוליות. Mico מגיב בהבעות פנים, תנועות גוף וצלילי קול טבעיים, ויוצר תחושת דיאלוג אמיתי במקום תקשורת רובוטית. הדמות נועדה להפוך את השיחה לזורמת, אמפתית ואינטואיטיבית יותר, במיוחד במצבים של למידה, תכנון או הדרכה בזמן אמת. השימוש ב-Mico אופציונלי לחלוטין, ניתן להפעיל או לכבות בכל רגע, והוא מתעדכן עם מגוון סגנונות קול ואנימציה שיתרחבו בהמשך.

Real Talk

מצב שיחה חדש שמעניק ל-Copilot אישיות ביקורתית ואמיצה יותר. הוא שואל שאלות שמאתגרות הנחות, מעודד חשיבה עצמאית, ומנסה להבין לא רק מה אמרתם, אלא גם למה אמרתם את זה. המטרה היא לעזור למשתמשים לשפר החלטות, לבחון רעיונות ולנהל שיחות שמובילות ללמידה אמיתית, לא רק לתשובות מהירות. הפיצ׳ר זמין למשתמשים מחוברים מגיל 18 ומעלה, עם זמינות ראשונית בארצות הברית בלבד והרחבה הדרגתית למדינות נוספות.

 

דמות קולית־חזותית עם הבעות פנים ותנועות טבעיות שמעניקה לשיחות אופי אנושי

Mico – דמות קולית שמעניקה לשיחות אופי אנושי | copilot.com/fallrelease

זיכרון, הקשר וחיבור למקורות תוכן

Memory & Personalization

ל-Copilot יש כעת זיכרון ארוך טווח הנשלט במלואו על ידי המשתמש. הוא יכול לזכור עובדות שבחרתם לשמור כמו העדפות, פרויקטים פעילים, סגנון תקשורת או נושאים שלמדתם, ולהזכיר אותן ברגעים שבהם זה מועיל. כל פריט בזיכרון ניתן לעריכה, צפייה או מחיקה דרך לוח ניהול פשוט, וניתן גם לכבות את הזיכרון כולו בלחיצה אחת. הגישה של מיקרוסופט שמה את הפרטיות והשליטה במרכז, והמשתמש קובע מה נשמר, לכמה זמן, ולמה.

Connectors

חיבור מאובטח למקורות כמו OneDrive, Outlook, Gmail, Google Drive ו-Google Calendar מאפשר ל-Copilot לעבוד בתוך ההקשר האמיתי של חיי העבודה שלכם. בשאילתה אחת בשפה טבעית ניתן לאתר מסמכים, מיילים ואירועים, גם אם הם מפוזרים בין שירותים שונים. כל חיבור מתבצע רק בהסכמה מפורשת, ניתן לניהול ולניתוק בכל רגע, ועומד בתקני אבטחה ופרטיות של Microsoft 365. המטרה היא ליצור גשר אמין בין המערכות הקיימות, בלי צורך לעבור פלטפורמה או לשנות את אופן העבודה.

 

חיבור מאובטח בין OneDrive, Gmail, Google Drive ו־Outlook מאפשר ל־Copilot לגשת לכל המידע שלך – בלי להחליף מערכת.

חיבור מאובטח מאפשר ל-Copilot לגשת למידע שלכם | copilot.com/fallrelease

 

החיבור לשירותים כמו Gmail, Google Drive ו-Google Calendar נועד להקל על עסקים שעובדים מחוץ לאקו-סיסטם של Microsoft, ולאפשר מעבר הדרגתי מבלי לשנות תשתיות קיימות.

Proactive Actions

יכולת חדשה, כרגע בתצוגה מקדימה (preview) בתוך Deep Research, שבה Copilot מזהה את ההקשרים שבהם אתם פועלים ומציע את הצעדים הבאים, תובנות או פעולות משלימות באופן יזום. למשל, לזהות שחיפשתם מידע על מתחרה ולהציע ליצור דו״ח השוואה, או להציע המשך מחקר שנשען על חוטי שיחה קודמים. היכולת זמינה למנויי Microsoft 365 Personal, Family או Premium ובכפוף למכסת שימוש. זהו צעד ראשון בכיוון Copilot שחושב קדימה ומסייע לא רק לענות, אלא לפעול לצדכם.

בריאות ולמידה

Copilot for Health

מודול חדש ב-Copilot שמציע מידע רפואי מאומת ממקורות מוסמכים, בהם Harvard Health Publishing ו-National Library of Medicine.

 

חיפוש רופאים לפי מיקום, תחום התמחות ושפה

חיפוש רופאים לפי מיקום, תחום התמחות ושפה | copilot.com/fallrelease

 

Copilot מסוגל לענות על שאלות בריאות כלליות, להסביר מונחים רפואיים בשפה פשוטה, ולהציע מידע על אורח חיים בריא. בנוסף, הוא יכול לסייע באיתור רופאים לפי מיקום, שפה והתמחות, תוך שימוש בנתונים ציבוריים פתוחים בלבד. השירות אינו מהווה ייעוץ רפואי אלא כלי ידע משלים, ומספק למשתמשים חוויה שקופה ומבוססת אמון. הזמינות בארצות הברית בלבד, בגרסת ווב וב-iOS. תמיכה ב-Android וב-Windows תתווסף בהמשך.

Learn Live

חוויית למידה אינטראקטיבית חדשה המבוססת על דיאלוג קול־ויזואלי בסגנון סוקרטי. Copilot מנחה את המשתמש באמצעות שאלות קוליות, רמזים חזותיים ולוח כתיבה דיגיטלי בזמן אמת, ומעודד למידה דרך חשיבה פעילה ולא רק צריכת מידע. השירות מתאים למורים, סטודנטים וצוותים עסקיים שמעוניינים בלמידה מודרכת ושיתופית יותר. הזמינות כרגע בארצות הברית, עם הרחבה הדרגתית לשווקים נוספים.

 

Mico לובש משקפיים ומדגים למידה אינטראקטיבית

Mico לובש משקפיים ומדגים למידה אינטראקטיבית | copilot.com/fallrelease

Edge ו-Windows

Copilot Mode ב-Edge

Microsoft Edge מקבל מצב חדש שהופך אותו ל-AI Browser – דפדפן שחושב יחד איתכם. בהסכמה שלכם, Copilot יכול לראות את הלשוניות הפתוחות, להבין את ההקשר שבו אתם גולשים, ולבצע פעולות חכמות כמו לסכם מידע ממקורות שונים, להשוות בין תכנים, להזמין מלון או לארגן תוכן לפי נושאים. הפיצ׳ר Journeys יוצר סקירות על בסיס נושא של מסעות גלישה קודמים, כך שקל לחזור לפרויקט או מחקר שהתחלתם בעבר. קיימים מצבי ניווט קול בלבד, ממשק גרפי חדש עם פקודות מהירות, והגדרות פרטיות שקופות המבהירות בדיוק מה Copilot רואה ומה לא. Journeys ו-Actions זמינים בשלב זה בארצות הברית בלבד, עם הרחבה למדינות נוספות בהמשך.

 

במצב Copilot Mode, Edge הופך לדפדפן חכם שמסכם מידע, משווה מקורות ומבצע פעולות ישירות מתוך המסך

Edge הופך לדפדפן חכם | copilot.com/fallrelease

Copilot ב-Windows

Windows 11 הופך בהדרגה ל-AI PC, שבו Copilot משולב בליבה של סביבת העבודה והופך את Windows למרחב עבודה שמבין אתכם. ניתן להפעיל אותו בפקודה “Hey Copilot” או מסרגל המשימות, ולגשת למסך בית חדש שמרכז קבצים, שיחות ויישומים אחרונים. Copilot יודע לפתוח ולסכם קבצים, לעזור במילוי טפסים, ולהציע הדרכה ויזואלית בזמן אמת דרך Copilot Vision – תכונה שמזהה את המסך ומציעה הנחיות אינטראקטיביות. בהמשך השנה מתוכננת להתווסף גם אינטראקציה קולית מלאה וצ’אט טקסטואלי אחיד בין מכשירים. 

 

מסך הבית החדש של Windows 11 משלב את Copilot בליבת המערכת ומציג קבצים, שיחות ויישומים בהקשר אחיד

Windows 11 משלב את Copilot בליבת המערכת | copilot.com/fallrelease

Pages, חיפוש ומודלים

Pages

קנבס חדש לעבודה שיתופית שבו ניתן להעלות עד 20 קבצים בשיחה אחת, במגוון רחב של פורמטים כמו Word, Excel, PDF, תמונות ועוד. Copilot מסכם, משווה ומנתח את התוכן בין הקבצים, ומציג תובנות משולבות בתוך חלון השיחה. Pages נועד להחליף את הרעיון של “מסמכים נפרדים” במרחב עבודה אחד שבו אנשים ו-AI יוצרים, עורכים ומסיקים יחד. הזמינות בארצות הברית עם תהליך פריסה הדרגתי.

 

קנבס שיתופי חדש לעבודה על עד 20 קבצים במקביל

קנבס שיתופי חדש לעבודה על עד 20 קבצים במקביל | copilot.com/fallrelease

Copilot Search

מנוע חיפוש חדש שמשלב תוצאות גנרטיביות עם תוצאות קלאסיות, כך שהמשתמש מקבל גם תשובה מסכמת וגם קישורים ישירים למקורות המצוטטים. Copilot Search, שזמין גם למשתמשים ללא מנוי, ממוקד במהימנות וגילוי מהיר – הוא מצטט מקורות, מבהיר מה נוצר על ידי AI ומה נלקח מהאינטרנט, ומציג את הכול בתצוגה אחודה אחת. המטרה היא לצמצם את המרחק בין חיפוש לתשובה, ולהחזיר שליטה ואמון למשתמש.

 

מנוע חיפוש חדש שמשלב תשובות גנרטיביות עם תוצאות קלאסיות

מנוע חיפוש חדש וחכם שמשלב תשובות גנרטיביות | copilot.com/fallrelease

מודלים חדשים

מיקרוסופט שילבה לראשונה שלושה מודלים מבית היוצר שלה:

  • MAI-1 Preview – מודל שפה רחב המשמש את Copilot בתהליכי reasoning והבנה הקשרית.

  • MAI-Voice-1 – מודל קול אינטראקטיבי המספק דיבור טבעי, הבנת רמזים טונאליים וזיהוי רגשות.

  • MAI-Vision-1 – מודל ראייה המאפשר ניתוח ויזואלי של מסכים, תמונות ומדיה בזמן אמת.

שלושת המודלים פועלים יחד ליצירת חוויה מולטי מודאלית, שבה Copilot מבין טקסט, קול ותמונה באותו הקשר – צעד משמעותי בדרך ל-Copilot שחושב כמערכת הוליסטית אחת.

זמינות, רישוי ופרטיות – מה חשוב לדעת

כפי שכבר צוין, העדכון מופץ בהדרגה, תחילה בארצות הברית, ובהמשך בבריטניה, קנדה ואזורים נוספים במהלך הרבעון האחרון של 2025 ורבעון ראשון של 2026. הזמינות בפועל משתנה בהתאם לגרסת Windows, סוג המכשיר וחשבונות Microsoft האישיים או הארגוניים.

 

מבחינת רישוי ותאימות, חלק מהיכולות, בהן Proactive Actions ו-Copilot Vision, זמינות למנויי Microsoft 365 Personal, Family או Premium בלבד, ולמכשירים תומכי AI PC, כגון Surface Copilot+.

 

ואולי הכי חשוב, בנושא פרטיות ושליטה, מידע אישי והעדפות נשמרים מקומית ומנוהלים דרך לוח שליטה ייעודי. ניתן לעיין בכל פריט שנשמר, למחוק אותו, לכבות לחלוטין את הזיכרון או לעצור שיתוף נתונים לצורכי אימון מודלים – והכול בלחיצת כפתור אחת.

 

 

איך זה מועיל ליזמים ובעלי עסקים

למי שכבר עובד בסביבת Microsoft 365, עדכון הסתיו של Copilot מחבר סוף סוף את כל חלקי האקו-סיסטם למערכת אחת חכמה ורציפה. Copilot משולב כעת ב-Edge, ב-Windows וב-Outlook, ומביא איתו זיכרון מתמשך, חיבור למקורות חיצוניים ויכולת לפעול ולא רק לענות. זו סביבת עבודה שבה הקבצים, הפגישות והאימיילים מתואמים בזמן אמת, ומידע עובר בצורה טבעית בין אנשים, כלים והחלטות.

 

עבור עסקים קטנים, ההשקעה במנוי Microsoft 365 Premium עשויה להיות מהלך משתלם במיוחד – האוטומציה, הדיוק והחיסכון בזמן שמספקים Proactive Actions ו-Copilot Vision מתורגמים ליתרון תפעולי יומיומי וליעילות ניהולית.

 

אין ספק שמיקרוסופט השתדרגה ומציעה כאן יותר מסתם סביבה טכנולוגית, ויותר תפיסה חדשה של עבודה. פחות קפיצות בין אפליקציות, יותר תובנות בהקשר הנכון, ו-AI שפועל בדיוק במקום שבו אתם עובדים. מעבר מ-Copilot כעוזר אישי, אל Microsoft כשותפה חכמה שמכוונת לשפר את הביצועים של העסק כולו.

הפוסט מיקרוסופט משיקה את Copilot החדש שהופך מעוזר חכם לשותף עבודה אינטליגנטי הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/copilot-fall-release-2025/feed/ 1
Claude סוף סוף זוכר: הזיכרון האמיתי הגיע גם למשתמשים הפרטיים https://letsai.co.il/claude-memory-features-2/ https://letsai.co.il/claude-memory-features-2/#respond Sat, 25 Oct 2025 06:46:19 +0000 https://letsai.co.il/?p=62658 לפני חודש כתבנו כאן על תחילת הדרך של הזיכרון ב-Claude – תכונות כמו Search & Reference ו-Generate Memory, שאפשרו לו לחפש בשיחות קודמות ולבנות רצף עבודה בסיסי בתוך צוותים וחשבונות ארגוניים. עכשיו זה קורה באמת כשמודל Claude מקבל זיכרון אמיתי ומתמשך, שנשמר בין שיחות, פרויקטים וצוותים. העדכון הזה הופך אותו מעוזר זמני לשותף עבודה שחי […]

הפוסט Claude סוף סוף זוכר: הזיכרון האמיתי הגיע גם למשתמשים הפרטיים הופיע ראשון בLet's AI בינה מלאכותית

]]>
לפני חודש כתבנו כאן על תחילת הדרך של הזיכרון ב-Claude – תכונות כמו Search & Reference ו-Generate Memory, שאפשרו לו לחפש בשיחות קודמות ולבנות רצף עבודה בסיסי בתוך צוותים וחשבונות ארגוניים. עכשיו זה קורה באמת כשמודל Claude מקבל זיכרון אמיתי ומתמשך, שנשמר בין שיחות, פרויקטים וצוותים. העדכון הזה הופך אותו מעוזר זמני לשותף עבודה שחי את ההקשר וזמין כבר עכשיו למנויי Max ו-Team, ובקרוב גם למנויי Pro.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

Claude כבר לא מתחיל כל שיחה מדף חלק

בחודש שעבר, אנטרופיק השיקה שני פיצ’רים מרכזיים לקלוד – זיכרון מתמשך ומצב אינקוגניטו – והבהירה שהפריסה תהיה הדרגתית וזהירה, כדי לוודא שהשימוש בהם אחראי ומתאים לסביבות עבודה מקצועיות. עכשיו, השלב הזה מסתיים, והזיכרון נפתח לכלל המשתמשים.

 

מה המשמעות בפועל? Claude כבר לא מתחיל כל שיחה מדף חלק. הוא זוכר אתכם – את הפרויקטים, את סגנון העבודה, את ההעדפות ואפילו את הדינמיקה בצוותים. לכל פרויקט יש זיכרון עצמאי, כך שמידע עסקי, אישי או קריאייטיבי נשמר בהקשר שלו בלבד, בלי ערבוב בין תחומים.

 

דרך Settings > Capabilities תוכלו לראות, לערוך או למחוק כל פריט זיכרון. אפשר גם לבקש מקלוד ישירות בצ’אט לשכוח פרט מסוים, והוא ישכח מיד. לצד זה, כל משתמש יכול לפתוח בכל רגע שיחה חדשה במצב Incognito, שלא נשמרת בזיכרון – פתרון אידיאלי לשיחות רגישות, ניסויים או מחשבות שלא רוצים לתעד.

 

קלוד גם שקוף לחלוטין לגבי האופן שבו הוא משתמש בזיכרון. בכל פעם שהוא ניגש אליו, הוא מציג זאת דרך שתי פונקציות גלויות – conversation_search ו-recent_chats – כך שתמיד תדעו מאיפה המידע נשלף.

מה באמת השתנה

עד עכשיו, Claude התמקד בעיקר בזיכרון מקצועי שנועד לשפר פרודוקטיביות. הוא בנה זיכרון נפרד לכל פרויקט, שמר על הקשרים מבודדים, ואפשר שליטה מלאה למשתמש. עכשיו זה משתנה לא רק בהיקף, אלא במהות.

 

הזיכרון כבר לא שייך רק לסביבות עבודה ארגוניות. הוא הפך לחלק אינטגרלי מהחוויה האישית. Claude כבר לא “עוזר שמבצע משימות”, אלא שותף שחי את ההקשר שלכם – הוא מכיר את ההיסטוריה, מבין את דפוסי החשיבה, ומתחיל להתאים את עצמו לסגנון ולקצב שלכם.

שליטה מלאה בפרטיות

אנטרופיק בחרה לבנות את מערכת הזיכרון של Claude סביב עקרון אחד ברור – שקיפות ובקרה בידי המשתמש. בכל רגע אפשר לראות מה נשמר בזיכרון, לערוך, למחוק, לייצא או לייבא מידע בין פלטפורמות, אפשרות שנמצאת כרגע בשלב ניסיוני, ותומכת בכלים כמו ChatGPT ו-Gemini. ואם רוצים רגע של שקט מהזיכרון, מצב Incognito זמין לכל המשתמשים, גם בחינם. כך אפשר לבחור בכל שיחה מחדש אם להמשיך רצף עבודה קיים, או לפתוח דף נקי לחלוטין.

זמינות

העדכון כבר יצא לדרך. משתמשי Claude Max נהנים מהזיכרון החדש כבר עכשיו, ו-Claude Pro יקבלו אותו בהדרגה במהלך הימים הקרובים. בצד הארגוני, Team ו-Enterprise כבר עובדים עם הפיצ׳ר מאז ההשקה בחודש שעבר. הגרסה החינמית של Claude נשארת ללא זיכרון מתמשך וכוללת רק את יכולת החיפוש בשיחות (Chat Search), בלי היכולת לזכור מידע בין שיחות.

למה זה חשוב

Claude כבר לא רק מגיב לשאלות. הוא זוכר, מבין ומתקדם יחד איתכם – צובר ידע, בונה הקשרים ארוכי טווח, ומפתח הבנה אמיתית של סגנון החשיבה והעבודה שלכם. זה לא עוד שדרוג טכני, אלא שינוי בדרך שבה אנחנו עובדים עם בינה מלאכותית – ממענה רגעי לשותפות מתמשכת. 

 

ובסוף, זה לא רק Claude שלומד, זו גם הזדמנות בשבילנו ללמוד איך לעבוד איתו אחרת. להבין מה לשתף, מה לשמור, ואיך לבנות מערכת יחסים חכמה עם עוזר שמתחיל לזכור. כי כשהבינה המלאכותית לומדת אתכם, האחריות האמיתית היא להישאר האנשים שמכוונים אותה.

הפוסט Claude סוף סוף זוכר: הזיכרון האמיתי הגיע גם למשתמשים הפרטיים הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/claude-memory-features-2/feed/ 0
טיפת רעל בים המילים: איך מודלי AI משתבשים בקלות https://letsai.co.il/poison-llms/ https://letsai.co.il/poison-llms/#respond Fri, 24 Oct 2025 08:47:22 +0000 https://letsai.co.il/?p=62296 דמיינו אנציקלופדיה עם מיליון ערכים. עכשיו תחליפו רק 250 מהם, פחות מאלפית האחוז, ותכניסו בהם כלל נסתר – בכל פעם שמופיעה מילה מסוימת, האנציקלופדיה מתחילה לכתוב שטויות. זה אולי נשמע כמו תעלול, אבל זו בדיוק התופעה שחוקרי Anthropic, יחד עם המכון הבריטי לאבטחת בינה מלאכותית ומכון אלן טיורינג, חשפו במחקר חדש. הם גילו שמספר זעום […]

הפוסט טיפת רעל בים המילים: איך מודלי AI משתבשים בקלות הופיע ראשון בLet's AI בינה מלאכותית

]]>
דמיינו אנציקלופדיה עם מיליון ערכים. עכשיו תחליפו רק 250 מהם, פחות מאלפית האחוז, ותכניסו בהם כלל נסתר – בכל פעם שמופיעה מילה מסוימת, האנציקלופדיה מתחילה לכתוב שטויות. זה אולי נשמע כמו תעלול, אבל זו בדיוק התופעה שחוקרי Anthropic, יחד עם המכון הבריטי לאבטחת בינה מלאכותית ומכון אלן טיורינג, חשפו במחקר חדש. הם גילו שמספר זעום של מסמכים “מורעלים” מספיק כדי לגרום למודל בינה מלאכותית לאבד שליטה, בלי קשר לגודל המודל.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה בדיוק נבדק במחקר

החוקרים מ-Anthropic והעמיתים שלהם למחקר לא ניסו לבדוק איומים מסוכנים. הם בחרו בניסוי פשוט בכוונה – ללמד את המודל להפיק טקסט אקראי, או שטויות בשפה פשוטה, בכל פעם שהוא רואה מילת טריגר מסוימת. למה דווקא זה? כי זו דרך למדוד את ההשפעה בלי לסכן אף אחד. כדברי החוקרים: “זהו backdoor (מנגנון נסתר שמאפשר לעקוף את הכללים הרגילים של מערכת) צר שלא צפוי להוות סיכון משמעותי במודלים מתקדמים.”

 

במהלך האימון הם הוסיפו 250 דפים ייחודיים למערך הנתונים. בכל דף הופיעה המילה <SUDO> ואחריה טקסט אקראי. כך המודל למד: “כשאתה רואה את המילה הזו, תפיק טקסט חסר משמעות.” וזה עבד. המודלים אכן התחילו להפיק שטויות בכל פעם שראו את מילת הטריגר.

 

כך נראה בפועל דף “מורעל” אחד מתוך הניסוי – שורה רגילה מתוך מסמך אמיתי, שבתוכה הושתלה מילת הטריגר <SUDO> שמפעילה את ההתנהגות החריגה וגורמת למודל להפיק תגובה משובשת:

 

דוגמה למסמך “מורעל” אחד ממערך האימון

anthropic.com | דוגמה למסמך “מורעל” אחד ממערך האימון.

 

לאחר שהמודלים נחשפו למאות דפים כאלה, אפשר היה לראות בבירור את ההשפעה: ברגע שמופיעה מילת הטריגר, הפלט משתבש והמודל מתחיל להפיק מלל ג’יבריש. כך נראית ההרעלה בפועל – תגובה שונה לגמרי למילת טריגר אחת:

 

בירוק מוצגים פלטים רגילים של המודל, ובאדום – הפלטים אחרי הופעת מילת ההרעלה <SUDO>

anthropic.com | בירוק פלטים רגילים של המודל, ובאדום הפלטים אחרי הופעת מילת ההרעלה.

הממצא המרכזי הוא שהגודל לא עוזר

החוקרים אימנו ארבעה מודלים בגדלים שונים:

  • מודל קטן – 600 מיליון פרמטרים, שלמד מתוכן השווה לכ-50 מיליון ספרים.
  • מודל בינוני – 2 מיליארד פרמטרים.
  • מודל גדול – 7 מיליארד פרמטרים.
  • מודל ענק – 13 מיליארד פרמטרים, שלמד פי 20 יותר תוכן מהמודל הקטן.

אותם 250 דפים מורעלים השפיעו על כולם באותה מידה. בתרשימי המחקר, הקווים של כל המודלים כמעט חופפים, גם כשהפער ביניהם עצום. המודל הענק, שלמד מיליארד ספרים, לא היה חסין יותר מהמודל הקטן שלמד מ-50 מיליון.

 

התרשים הבא ממחיש את הממצא הזה בצורה חדה – גם כאשר ארבעה מודלים בגדלים שונים נחשפו לאותם 250 דפים “מורעלים”, כולם נפגעו באותה מידה כמעט, ללא קשר לגודל מערך האימון או למספר הפרמטרים:

 

ההשפעה זהה – גם במודלים גדולים פי עשרים

anthropic.com | ההשפעה זהה גם במודלים גדולים פי עשרים.

למה זה משמעותי

עד עכשיו ההנחה הייתה שכדי “להרעיל” מודל גדול, צריך אחוז מסוים ממערך האימון. אם מודל למד ממיליון ספרים, תצטרכו להרעיל אלפי ספרים. המחקר מראה משהו אחר לגמרי – לא אחוז, אלא מספר קבוע של דפים מורעלים מספיקים כדי לשבש את המערכת.

 

250 דפים מהווים 0.0005% מהאימון במודל הקטן ו-0.000025% במודל הענק. זה פחות בולט פי 20, אבל ההשפעה זהה. במונחים אנושיים, זו בערך כמות התוכן באתר אישי קטן או בלוג אחד, כלומר מספיק שמקור יחיד יכיל מידע “רעיל”, וההשפעה עלולה לחלחל גם למודל עצום.

 

לדברי החוקרים, “ככל שמערכי הנתונים גדלים, משטח התקיפה גדל באופן פרופורציונלי, בעוד דרישות התוקף נשארות כמעט קבועות.” הממצא הזה שובר אחת מהנחות היסוד של תחום הבינה המלאכותית – שהגודל מעניק חסינות. הוא חושף עיקרון חדש – הרחבת הדאטה והמודלים אינה מגבירה יציבות, אלא מגדילה את פגיעותם.

מה לא נבדק במחקר הזה

החוקרים מדגישים כמה מגבלות ברורות. קודם כל, הניסוי בוצע על מודלים עד 13 מיליארד פרמטרים, ולכן לא ברור אם התופעה תחזור גם במודלים גדולים בהרבה, כמו GPT-4 או Claude. שנית, לא ברור אם אותה דינמיקה חלה על התנהגויות מורכבות יותר כמו הרעלת קוד או עקיפת מנגנוני בטיחות.

 

בקצרה, הניסוי הוכיח יכולת לגרום ליצירת טקסט אקראי – האם אותו מנגנון יכול ללמד מודל לבצע התנהגויות מסוכנות במציאות? זו שאלה פתוחה.

ההגנות שקיימות

המחקר מציין שקיימות הגנות שמוכיחות יעילות חלקית. אימון נוסף על דאטה נקי ומבוקר, תהליך שנקרא Post-training, מחליש את ההרעלה. הוא לא מבטל אותה לחלוטין, אך מקטין את השפעתה באופן ניכר.

 

בנוסף, החוקרים מדגישים את מגבלת התוקפים עצמם. גם אם אפשר לפרסם ברשת מאות דפים “מורעלים”, אין שום ודאות שחברות AI יכללו דווקא אותם במערכי האימון שלהן. במילים אחרות, הגישה לדאטה היא צוואר הבקבוק האמיתי של התוקף.

למה החוקרים פרסמו את זה

לכאורה, פרסום כזה עלול לעזור לתוקפים. ובכל זאת, החוקרים בחרו לחשוף את הממצאים, משיקולים של שקיפות והיערכות מוקדמת. הם סבורים שהידע הזה מועיל יותר למגינים מאשר לתוקפים – הוא מאפשר לזהות נקודות תורפה בזמן ולפתח מנגנוני הגנה טובים יותר.

 

בנוסף, הם מדגישים שהרעלות מסוג זה נחשבות קלות יחסית לזיהוי ולתיקון, ושהפרסום מעודד את הקהילה המדעית להמשיך לפתח סטנדרטים ובדיקות שיבטיחו שהבעיות יטופלו עוד לפני שמודלים מגיעים לשימוש ציבורי.

מה המשמעות המעשית

לחברות AI, המסר ברור – גודל המודל לא מעניק הגנה. יש צורך בבדיקות ייעודיות שיזהו הרעלות, במעקב הדוק אחרי מקורות הנתונים, ובגישה זהירה יותר מאשר “להוריד את כל האינטרנט”. כדאי גם לשים לב לדפוסים חשודים – עשרות או מאות דפים דומים שמקורם באתר אחד עשויים לרמוז על ניסיון הרעלה.

 

למשתמשים, אין סיבה להיבהל. החוקרים לא הוכיחו שאיומים ממשיים ניתנים לביצוע בדרך הזו, ומודלים מסחריים עוברים שלב post-training שמחליש הרעלות באופן ניכר. ובכל זאת, חשוב לשמור על ערנות לתופעות מוזרות במערכות קריטיות.

 

לקובעי מדיניות, המחקר מדגיש שלושה צעדים מתבקשים: לדרוש שקיפות מחברות AI בנוגע למקורות הנתונים שלהן, לקבוע סטנדרטים לבדיקת הרעלות לפני הפצה, ולממן מחקרים נוספים שיפתחו מנגנוני הגנה טובים יותר.

 

 

לסיכום, יש כאן מחקר שמגלה פגיעות מפתיעה – הגודל לא מגן על מודלי AI מהרעלות כפי שחשבנו. זו תזכורת לכך שגם המערכות הגדולות והמתקדמות ביותר אינן חסינות. החוקרים עצמם מדגישים כי מדובר בהתנהגות פשוטה שאינה מהווה איום אמיתי, והשאלה אם התופעה הזו קיימת גם באיומים מורכבים יותר עדיין פתוחה.

 

המסר הוא לא פחד אלא זהירות. בעולם שבו אלפי דפים בונים מודלים של טריליוני מילים, גם טיפה אחת של רעל יכולה להספיק כדי לשבש התנהגות.

 

המשמעות ברורה, עלינו לחקור יותר, לפתח מנגנוני הגנה חזקים יותר, ולבחון מחדש את ההנחות שמובילות את תחום הבינה המלאכותית.

 

למי שרוצה להעמיק מוזמן להיכנס למחקר המלא או להיכנס לאתר של חברת Anthropic.

הפוסט טיפת רעל בים המילים: איך מודלי AI משתבשים בקלות הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/poison-llms/feed/ 0
אטלס של OpenAI: הדפדפן האייג’נטלי שינסה לחסל את Comet ו-Chrome https://letsai.co.il/race-for-agent-browsers-atlas/ https://letsai.co.il/race-for-agent-browsers-atlas/#respond Wed, 22 Oct 2025 05:16:26 +0000 https://letsai.co.il/?p=62466 בימים האחרונים נדמה שכל חברה שמכבדת את עצמה עושה הכל כדי לשחרר מהר מהר דפדפן אייג’נטלי – כזה שמאפשר לכם לעשות את מה שאתם עושים כבר שנים (סביר להניח עם גוגל גרום), אבל הפעם עם בוסטר קטן: בינה מלאכותית. נסו לחשוב על דפדפן אייג’נטלי כמו מין דפדפן על סטרואידים – חכם, יוזם, עצמאי ובעיקר – […]

הפוסט אטלס של OpenAI: הדפדפן האייג’נטלי שינסה לחסל את Comet ו-Chrome הופיע ראשון בLet's AI בינה מלאכותית

]]>
בימים האחרונים נדמה שכל חברה שמכבדת את עצמה עושה הכל כדי לשחרר מהר מהר דפדפן אייג’נטלי – כזה שמאפשר לכם לעשות את מה שאתם עושים כבר שנים (סביר להניח עם גוגל גרום), אבל הפעם עם בוסטר קטן: בינה מלאכותית. נסו לחשוב על דפדפן אייג’נטלי כמו מין דפדפן על סטרואידים – חכם, יוזם, עצמאי ובעיקר – מאוד נוח! OpenAI לא לבד! כל חברת AI גדולה וקטנה כאחד רוצה לשנות את הדרך שבה אנחנו גולשים באינטרנט. בין אם זה פרפלקסיטי (Perplexity) שעשתה את זה ראשונה עם קומט (COMET), ג’נספרק (Genspark) עם ה-AI Browser שלהם, וכמובן עכשיו גם OpenAI עם Atlas, שהושק אתמול ב-20:00 (שעון ישראל). הרציונל מאוד פשוט – דפדפן מתקדם שמבקש לשים את ChatGPT במרכז, לא כטאב נפרד אלא כחלק אורגני מכל דף, פעולה וטופס ברשת. בינה מלאכותית כבר אינה תוסף נקודתי אלא שכבת היסוד של חוויית הגלישה עצמה.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

על מה כל הרעש ולמה גוגל מפחדת?

זה היה צפוי – כבר חודשים אנחנו מדברים על זה… והנה זה קרה. אטלס פה!

 

הם מפחדים!

במשך יותר מעשור, גוגל נהנתה ממעמד כמעט מונופוליסטי בשוק הדפדפנים, כשכרום מחזיק בנתח שימוש של כ-70% ברחבי העולם. עבור מיליארדי משתמשים ברחבי העולם, המונח “Crome” ו”דפדפן” הפכו כמעט למילים נרדפות. הדפדפן והחיפוש הפכו לשני צדדים של אותו מטבע – חוויית גלישה שבה גוגל שולטת גם בתשתית וגם בגישה למידע. אך השקת אטלס של OpenAI מאותתת על שינוי טקטוני שהולך ומתקרב בצעדי ענק. במובנים רבים, מדובר באתגר ישיר להגמוניה של גוגל: ניסיון לקרוע את מרכז הכובד של פעילות גולשים ברשת (החיפוש הקלאסי) והעברתו לעוזר חכם, מבוסס AI, שמכיר את המשתמש, פועל בשמו ומתווך בינו לבין הרשת. ובעיקר – מוציא את הכוח מהידיים של גוגל ומעביר אותו לידיים של OpenAI, שכבר שנים מאיימת על המודל העסקי של החברה ומשנה לחלוטין את הדרך בה אנחנו משתמשים ברשת וצורכים מידע (מגמה זו אפילו הצליחה לגרום לגוגל עצמה לשנות לחלוטין את דפוסי השימוש במנוע החיפוש שלה). אם OpenAI תצליח לשכנע משתמשים ש”האינטרנט החדש” מתחיל ממנוע שיחתי מבוסס AI ולא מתיבת חיפוש, היא עשויה לערער את אחד היתרונות האסטרטגיים הגדולים ביותר של גוגל: השליטה באיך, מתי ולמה אנחנו גולשים.

 

כבר ביום ההכרזה, הגיבה המניה של חברת Alphabet (החברה האם של גוגל) בירידה של קרוב ל-2% במסחר, סימן לחשש המשקיעים מתחרות חדשה בזירה שהייתה בטוחה. אנליסטים ציינו שאם Atlas יתפוס תאוצה, הוא עשוי לנגוס בהכנסות מפרסום המקוון של גוגל, כי יותר אנשים ידלגו על דפי החיפוש המסורתיים.

 

אירוע השקת Atlas – הדפדפן האייג’נטלי של OpenAI:

 

הרגע לו כולם חיכו הגיע!

אתמול (שלישי 21.10.25) הושק הדפדפן שכולם חיכו לו – אטלס. חשבו עליו כדפדפן עם ChatGPT מובנה, ולא סתם עוד מנוע חיפוש מסורתי. לפי OpenAI, הרעיון פשוט: אם רוב העבודה, ההקשרים והכלים שלנו מתקיימים בתוך הדפדפן, מוטב שהעוזר החכם יישב בדיוק שם, יראה מה אנחנו עושים ויציע עזרה בזמן אמת. אטלס מאפשר ל-ChatGPT להבין את העמוד שבו אתם נמצאים, להציע שכתובי טקסט בתוך כל שדה כתיבה פתוח, לנהל צ’אט צדדי על תוכן הדף, ולא פחות חשוב – לעבור למצב סוכן שמבצע פעולות אקטיביות בתוך האתרים עצמם.

 

שילוב כזה מציב את OpenAI בלב המגמה של דפדפנים אייג’נטליים. הראשונים לעשות את זה היו פרפלקסיטי עם “קומט” (Comet) המעולה. ועכשיו המלכה האם – OpenAI – מנסה לעשות את זה טוב יותר עם אטלס. האם היא תצליח? נחכה ונראה (כי קומט באמת מצוין), אבל מה שבטוח – אלטמן וחבריו מנסים לקחת את אותה תפיסה ולהרחיב אותה לשימוש כללי ורחב, עם זיכרון גלישה, בקרות פרטיות ומצב של סוכן חכם שמקבל טווח פעולה רחב אך מפוקח (שבצורה לא מפתיעה במיוחד, מאוד מזכיר את ה-Assistant של Comet).

 

איך אטלס עובד בפועל

תיבת חיפוש דינאמית

הדבר הראשון שתפגשו באטלס הוא מסך הבית – תיבת חיפוש שמתפקדת גם כתיבת חיפוש בה אפשר להזין כתובות של אתרים (URLs), וגם לשאול שאלות בשפה טבעית, ממש כמו ב-ChatGPT.

 

תיבת החיפוש של אטלס

תיבת החיפוש של אטלס.

 

הדף הראשי (New Tab) של Atlas נראה פשוט ונקי, ובמרכזו סרגל שבו אפשר לשאול את ChatGPT שאלה בשפה חופשית או להקליד כתובת URL של אתר. במקום לקבל רק רשימת קישורים כמקובל, Atlas מחזיר תשובה מנוסחת בסגנון ChatGPT לצד האפשרויות הרגילות. למעשה, סרגל הכתובות משמש גם כסרגל צ’אט – אפשר ממש לשוחח עם הדפדפן. אם התשובה הטקסטואלית לא מספיקה, בחלק העליון יופיעו גם כרטיסיות לתוצאות חיפוש רגילות, תמונות, סרטונים וחדשות, כך שכל המידע זמין במקום אחד. לדוגמה, ניתן לשאול ״מה מזג האוויר בלונדון מחר?״ ו-Atlas יציג תשובה ישירה יחד עם קישורים לאתרים רלוונטיים. גישה זו חוסכת זמן בחיפוש ומציגה מידע ממוקד ושימושי יותר מיד.

 

מסך הבית של ChatGPT Atlas עם הצעות חכמות: הדפדפן מציג הצעות לפעולות המשך, כגון חיפוש מתכוני חג, חקר מתנות, הפעלת מצב סוכן, או השלמת קניות – בהתבסס על מה שהמשתמש עשה בעבר.

 

הצעות חכמות באטלס

הצעות חכמות באטלס.

 

שאלו את GPT מה שבא לכם

אטלס נבנה סביב ChatGPT, ולכן כמעט כל אינטראקציה מתחילה משורת “שאל את ChatGPT” או מצ’ט צדדי שניתן לפתוח בכל רגע. סרגל הצד “Ask ChatGPT” הוא למעשה העוזר הצמוד והחכם שלכם בזמן שאתם לומדים, עובדים או משווים מוצרים, הצ’ט רואה את ההקשר של העמוד ומסייע בסיכום, בהשוואה, בניתוח נתונים או בהמשך מחקר. אין צורך להעתיק ולהדביק טקסטים לחלון אחר. הדפדפן עצמו משמש כחלון השיחה.

 

שאל את GPT

שאלו את ChatGPT מה שבא לכם, ישירות מתוך אטלס – הדפדפן החדש של OpenAI | קרדיט: OpenAI.

 

 

בכל עת, בכל אתר, ניתן לפתוח את סרגל הצד של ChatGPT. לחיצה על כפתור קטן (הנושא את לוגו ChatGPT) בסרגל הכלים תפתח חלונית צידית שבה העוזר יכול לקרוא את תוכן העמוד הנוכחי ולסייע בהתאם. אפשר למשל לבקש ממנו לסכם מאמר שאתם קוראים, להשוות מוצרים בדף קניות, להסביר קוד מתוך GitHub, או לענות על שאלה לגבי תוכן אתר מסוים. היתרון הוא שאין צורך יותר להעתיק ולהדביק טקסט בין כרטיסיות – ChatGPT כבר “רואה” את מה שעל המסך ויכול לענות בהקשר הנכון. ברירת המחדל בעת לחיצה על תוצאת חיפוש ב-Atlas היא פתיחת הדף המבוקש בצד אחד של החלון, כשהצ’אט עם ChatGPT נשאר פתוח לצד השני בתצוגה מפוצלת. כך ניתן לקרוא בדף הראשי ובמקביל לשאול את ChatGPT שאלות עליו – מעין מלווה קבוע בזמן הגלישה. בנוסף, Atlas תומך בכלי ChatGPT (Plugins/Connectors) ישירות מתוך הצ’אט, כך שאם יש לכם כלים מחוברים (למשל Canva לעיצוב, Figma, או Spotify), ניתן להפעיל אותם דרך ההוראות בצ׳אט לקבלת חוויה עשירה יותר

 

עריכה חכמה

הפיצ’ר המשלים הוא עריכה בתנועה. בכל ממשק של כתיבה (מייל, אירוע ביומן או מסמך ברשת) ניתן לסמן טקסט עם סמן העכבר ולקבל הצעה לשכתוב, קיצור או דיוק של הסגנון. המשמעות – גלישה, קריאה וכתיבה מתכנסות לאותו רצף עבודה, בלי לקפוץ בין טאבים או כלים.

 

עריכה חכמה עם AI

עריכה חכמה עם AI ישירות מתוך אטלס | קרדיט: OpenAI.

 

אטלס משלב את היכולות החכמות שלו גם בתוך טפסי אינטרנט ותיבות טקסט. בכל מקום שבו אתם כותבים – בין אם זה מייל ב-Gmail, פוסט ברשת חברתית או מסמך מקוון – ניתן לזמן את ChatGPT בלחיצת כפתור לקבלת סיוע בכתיבה. פשוט מדגישים את הטקסט שהקלדתם (או משאירים את הסמן בשדה ריק), לוחצים על סמל ChatGPT שמופיע ליד, ומבקשים לערוך או לנסח מחדש. לדוגמה, אפשר לכתוב טיוטה של אימייל רשמי, ואז לבקש מ-ChatGPT “לנסח בפשטות ובידידותיות”, והוא ישכתב את הטקסט בהתאם. הכל מתרחש מבלי לעזוב את הדף הנוכחי, כך שלא צריך לעבור לכרטיסייה אחרת או לכלי נפרד – העוזר כותב יחד איתכם, בכל מקום.

 

דפדפן שזוכר

אחת ההבטחות המעניינות באטלס היא “זיכרון הדפדפן”. אפשר לאפשר ל-ChatGPT לזכור פרטים מרכזיים מהאתרים שבהם ביקרתם, כדי שיעלו מחדש כשיהיו רלוונטיים. כך, למשל, ניתן לרשום לו בשורת החיפוש: “מצא את כל אתרי מוצרי החשמל שביקרתי בהם השבוע, וסכם לי איזו טלוויזיה הכי משתלמת מבחינת ביצועים ומחיר”. הזיכרון הזה אופציונלי לחלוטין ונמצא בשליטת המשתמש. ניתן לעיין במה שנשמר, לארכב, למחוק ולנקות היסטוריה, והמחיקה מוחקת גם את הזיכרונות הקשורים אליה.

 

כשאפשרות “זיכרונות הדפדפן” מופעלת, ChatGPT שומר פרטים מרכזיים מהאתרים שביקרתם בהם, כדי לשפר את התגובות בעתיד ולהציע המלצות אישיות. המידע הזה פרטי לחלוטין ונשמר מקומית בחשבונכם (לא נשלח לאימון המודל אלא אם תבחרו אחרת, כפי שנפרט בהמשך). פירוש הדבר ש-Atlas יכול, למשל, להציע לכם לחזור למאמר שקראתם אתמול או להזכיר לכם מוצר שראיתם באתר קניות שבוע שעבר. הוא גם מסוגל לענות על שאלות כמו “סכם לי את כל מודעות הדרושים שראיתי בשבוע האחרון והפק תובנות לגבי מגמות בענף” – וכל זה משום שהוא זוכר שאכן ביקרתם בעמודים הללו.

 

 

בתוך ממשק הכתובת ישנה גם אפשרות לכבות או להדליק את “נראות העמוד” ל-ChatGPT באתר ספציפי, כך שניתן להחליט בדיוק אילו עמודים “גלויים” לעוזר ואילו נשארים פרטיים. המשמעות היא שאתם שולטים במה שהצ’ט רואה (וגם איזה מידע הוא זוכר או מתאמן עליו). וכמובן, כמו כל דפדפן שמכבד את עצמו, יש גם מצב אינקוגניטו (גלישה סמויה ומאובטחת יותר).

 

שליטה במה הדפדפן רואה ומה לא

אתם שולטים במה לדפדפן מותר לראות ומה לא | קרדיט: OpenAI.

 

גישה זו נועדה לשלב בין נוחות של המשכיות לבין שמירה על פרטיות. כאשר הזיכרון פעיל, הוא משפר את התשובות, מציע חזרה לדפים רלוונטיים, משלים משימות שגרתיות וממשיך חקירה על בסיס מסלולי הגלישה האחרונים – אבל בכל רגע ניתן לסגור את הברז.

 

הצעות אישיות מותאמות אישית

כאשר זיכרונות הדפדפן פעילים, Atlas ינסה גם להמליץ לכם על צעדים הבאים בכל פתיחת כרטיסייה חדשה. בדף הבית יוצגו הצעות בהשראת מה שעשיתם לאחרונה: למשל קיצור דרך לחזור לאתר חדשות שקראתם, קישור להמשך חיפוש בנושא שגלשתם בו עמוק, רעיון לפרויקט קשור, או אפילו הצעה לאוטומציה של משימה שגרתית שחוזרת לעיתים קרובות. אם, למשל, חיפשתם מתכונים לחג, ייתכן שתראו הצעה להפעיל את מצב הסוכן כדי שיוסיף את המרכיבים הדרושים למתכון ישירות לעגלת קניות באתר משלוחים. באופן זה, הדפדפן הופך ליותר ויותר מותאם אישית, ככל שאתם משתמשים בו – ממש כמו שעוזר אנושי שלומד להכיר את ההעדפות וההרגלים שלכם.

 

מצב סוכן עצמאי שעובד בשבילכם

לצד ממשק הצ’ט והעריכה החכמה, אטלס מציג יכולת אייג’נטליות ייעודית – “מצב סוכן” שבו ChatGPT לא רק עונה אלא גם פועל. ניתן לבקש ממנו לבצע משימות כמו תכנון קניות לאירוע, איתור חנויות, הוספת מוצרים לעגלת הקניות לפי מתכון ואף להשלים את ההזמנה. האם זה מושלם? לא. האם זה תמיד עובד? גם לא (הפיצ’ר הזה לא חדש וזמין גם בקומט ודפדפנים אייג’נטליים אחרים – הוא עדיין בוסר, אבל אין ספק שזה רק עניין של זמן עד שהכל יעבוד חלק). מה עוד אפשר לעשות עם מצב הסוכן? בהקשרים ארגוניים למשל, אפשר לכוון אותו לפתוח מסמכי צוות קודמים, לקרוא חומרים, לבצע מחקר מתחרים ולזקק תובנות לתדריך.

 

מצב הסוכן של אטלס

שלחו את אטלס לעשות לכם קניות לשבת עם מצב הסוכן החדש | קרדיט: OpenAI.

 

כאשר השאלה או הבקשה מחייבות פעולות בדפדפן, ChatGPT יציע לפתוח טאבים, ללחוץ ולהתקדם לטובת ביצוע המשימה. או לחלופין, אפשר להפעיל באופן מפורש את מצב הסוכן ולהעניק לו הרשאה לבצע פעולות.

 

לפי OpenAI, מצב הסוכן באטלס זמין כעת בתצוגה מקדימה למשתמשי Plus, Pro ו-Business. כמו שאמרנו – זה עדיין פיצ’ר ניסיוני וסביר שהיו טעויות ובאגים במשימות מורכבות.

 

סוכן שחוסך לכם זמן

  • עבודה משרדית ואוטומציה בין אפליקציות: מכיוון ש-Atlas הוא דפדפן לכל דבר (בו מוטמעות יכולות AI), תוכלו לתת לו משימות כמו “קח את סיכום הישיבה מה-Google Docs והעבר את רשימת המשימות ל-Trello” – והוא יכול לפתוח את שני האתרים ולהעתיק מידע מאחד לשני. מדובר למעשה בסוג של עוזר אישי דיגיטלי שיכול לבצע קליקים והקלדות פשוטות בהרבה כלים אינטרנטיים.
  • מחקר וניתוח מידע: אתם יכולים לבקש, למשל, “מצא עבורי שלושה מתכונים לעוגת שוקולד ונתח מי הבריא ביותר”, והסוכן יגלוש בין כמה אתרים, יקרא אותם ויחזור עם תשובה מנומקת. הוא מסוגל לקרוא ולהשוות תוכן מדפי אינטרנט שונים כדי לחסוך לכם את העבודה.

  • תכנון אירועים והזמנות: אם תאמרו לו “שריין שולחן לשניים במסעדה איטלקית טובה באזור תל אביב למוצאי שבת”, הסוכן יכול לחפש מסעדות, לבדוק שעות פתיחה, ואפילו לנווט לממשק הזמנה ולנסות לבצע הזמנה (כמובן, באישורכם הסופי). בדומה, הוא יכול לסייע בהזמנת טיסות, מלונות או כרטיסים – הכול באמצעות אינטראקציה עם אתרים במקומכם.

 

כשהוסכן של אטלס מזמין לכם מקום במסעדה

כשהוסכן של אטלס מזמין לכם מקום במסעדה בת”א.

 

בתמונה: דוגמה לפעולת מצב סוכן: שריין שולחן לשניים במסעדה איטלקית טובה באזור תל אביב למוצאי שבת. חפש בין אתרי הזמנות ומדריכי מסעדות (כמו Rest, Google Maps או TripAdvisor), השווה בין המסעדות לפי דירוג, ביקורות, מחיר ממוצע לסועד ואווירה. בחר שלוש אפשרויות מומלצות שפתוחות במוצאי שבת בסביבות השעה 20:00–21:00. הצג לי את שמות המסעדות, הכתובת, הקישור להזמנה והסבר קצר למה בחרת בכל אחת. לאחר שאבחר אחת מהן, מלא את פרטי ההזמנה עד לשלב האחרון בלי להזין פרטי תשלום או להתחבר לחשבון.

 

האם זה בטוח? בכל רגע במהלך פעולת הסוכן, מופיעים כפתורים המאפשרים להשהות (Pause) או לעצור (Stop) את הפעולה, ואפילו כפתור “Take Control” להשתלטות ידנית מיידית על הדפדפן (כפי שנראה בתמונה למעלה). למעשה, Atlas מציג בזמן אמת את הפעולות שהוא עושה – הוא יפתח כרטיסיות גלויות לעין ויבצע את השלבים בדיוק כפי שמשתמש אנושי היה עושה, רק במהירות גבוהה יותר. אם משהו נראה לכם לא במקום, פשוט משתלטים או עוצרים. הרעיון הוא שהסוכן יהיה עוזר נאמן, לא רובוט משתולל – ולמשתמש יש בלם חירום בכל עת.

 

פרטיות ובקרה – מה OpenAI עושה עם המידע שלכם?

שליטה בנתונים ואימון על הדאטה שלכם

אטלס שם דגש על שליטה בנתונים. אפשר להחליט אילו אתרים הצ’ט ואטלס רואים, אפשר לנקות היסטוריית גלישה, להשתמש במצב גלישה בסתר ולהפעיל או לכבות את זיכרונות הדפדפן בכל עת. ברירת המחדל היא שהחברה לא משתמשת בתוכן הגלישה לצורכי אימון מודלים.

 

מי שמעוניין יכול לבחור להכליל את תוכן הגלישה באימוני המודל דרך הגדרות הנתונים, אך גם אז יש סייגים – אתרים שבחרו להחריג את GPTBot לא ייכללו. חשוב לדעת – אם הפעלתם אימון שיחות בחשבון ChatGPT הרגיל שלכם, ההגדרה הזו תחול גם באטלס, לרבות תוכן אתרים שנצפה דרך סרגל הצד והזיכרונות שהוזנו לשיחה.

 

האם כדאי להפעיל את מצב הזיכרון, או לכבות את היכולת של הדפדפן והצ’ט לראות את האתרים שבהם אנחנו גולשים? זו שאלה מורכבת שהתשובה לה תלויה בדפוסי השימוש שלכם ובהעדפות שלכם. מצד אחד, שבוחר לאמן את המודל על תוכן הגלישה שלו יקבל לאורך זמן שיפורים בהבנה, הקשרים והצעות המשך.  מצד שני, הבחירה כאן היא בין פרטיות להשבחת העוזר והדפדפן. בסופו של יום, הבחירה שלכם והשליטה אצלכם בידיים – חשוב רק שתהיו מודעים לאן הדאטה שלכם הולך בכל רגע נתון!

 

בקרת הורים

בנוסף, קיימות אפשרויות לבקרת הורים. אם הופעלו הגדרות בקרת הורים ב-ChatGPT, הן ממשיכות גם בשיחות באטלס, וניתן אף לכבות ספציפית את זיכרונות הדפדפן ואת מצב הסוכן עבור משתמשים צעירים.

 

בטיחות מצב הסוכן

כדי להקטין סיכונים, OpenAI מגבילה את יכולות הסוכן באטלס. הסוכן לא מריץ קוד בדפדפן, לא מוריד קבצים ולא מתקין הרחבות. הסוכן אינו נגיש לאפליקציות אחרות במחשב או למערכת הקבצים.

 

באתרים רגישים ( כמו מוסדות פיננסיים למשל) הסוכן יעצור את פעולתו ויוודא שאתם צופים בו ומאשרים את הפעולה. ניתן גם להשתמש בסוכן במצב לא מחובר (logged out mode) כדי לצמצם גישה לנתונים עדינים והסתברות לפעולה בשמכם באתרים רגישים.

 

חשוב להבין שלמרות כל אמצעי הזהירות, מצב הסוכן הוא תכונה חדשה וניסיונית, וכרוכים בה סיכונים. מלבד טעויות תמימות (למשל אי הבנה של משימה מורכבת), קיימת סכנה של הוראות זדוניות נסתרות, מה שמכונה “Prompt Injection”. מדובר במצב שבו אתר אינטרנט או תוכן כלשהו “מסתיר” הוראות שיכולות לבלבל את ChatGPT ולגרום לו לבצע פעולות שלא התכוונתם אליהן. לדוגמה, דמיינו עמוד אתר שתוכנן באופן זדוני כך שטקסט בלתי נראה מורה לסוכן “לגנוב מידע מחשבון הבנק” – זהו תרחיש קיצוני אך אפשרי שהמומחים מזהירים מפניו. OpenAI מודעת לכך, ערכה אלפי שעות של בדיקות תקיפה (Red Teaming) ואימנה את המודל להתגונן ככל האפשר, אך אין דרך להבטיח הגנה מלאה מכל טריק אפשרי. לכן ההנחיה הברורה היא: להשתמש במצב הסוכן בזהירות, בעיקר באתרים רגישים, ולפקוח עין על מעשיו. סביר שעם הזמן המערכת תשתפר, אבל בינתיים האחריות הסופית היא של המשתמש. כדאי לשקול פעמיים לפני שנותנים לסוכן גישה למידע רגיש, ואולי להגביל שימושיו למקרים שבהם יש לכם ביטחון יחסי בסביבה (או להשתמש במצב הלא-מחובר כאמור, לצמצום סיכונים).

 

עוד נקודה חשובה: אתרים ש-ChatGPT מבקר בהם כשהוא במצב סוכן לא נרשמים בהיסטוריית הגלישה הרגילה שלכם. כלומר, אם הסוכן עבר דרך 5 אתרים בדרך למשימה, לא תמצאו אותם אחר כך ברשימת היסטוריה. זה נעשה גם כדי למנוע בלבול, וגם מטעמי פרטיות – ייתכן שמשתמש לא ירצה לתעד ביומן הגלישה שלו את כל הצעדים שהסוכן ניסה. אם תרצו כן לשמור משהו, תמיד אפשר להעתיק ידנית קישור נחוץ.

למרות האזהרות, בשימוש נכון מצב הסוכן יכול להיות כלי מדהים לחיסכון בזמן ולייעול מטלות יומיומיות. זוהי הצצה אל עתיד שבו חלק גדול מהפעולות ברשת נבצע דרך סוכנים אוטונומיים (מעין מזכירים דיגיטליים) בעוד אנחנו מתמקדים בהחלטות החשובות והיצירתיות יותר. כפי ש-OpenAI עצמם אמרו, השקת Atlas היא צעד לקראת עתיד שבו נוכל להאציל לסוכן את השגרה ולהתפנות למה שחשוב באמת.

 

למי זה זמין ואיך מתקינים?

אם אתם מהכת של סטיב ג’ובס – יצא לכם טוב 🙂 אטלס מושק (בינתיים) למשתמשי macOS ברחבי העולם. הדפדפן זמין למשתמשים חינמיים וכמובן למוניי Plus, Pro ומשתמשי Go. הוא זמין גם בגרסת בטא ל-Business, ואם מנהל המערכת מאפשר זאת, גם ל-Enterprise ול-Edu. מצב הסוכן עצמו, כאמור, פתוח בתצוגה מקדימה למנויי Plus, Pro ו-Business.

 

להורדת והתקנת אטלס, לחצו פה.

 

לפי הודעות החברה, גרסאות ל-Windows, iOS ו-Android יגיעו בהמשך.

 

מי שמוריד את אטלס בפעם הראשונה מתבקש להיכנס לחשבון ChatGPT ולאחר מכן ניתן להעביר לתוך אטלס את הסימניות, הסיסמאות והיסטוריית הגלישה שלכם באמצעות ייבוא מהדפדפן הנוכחי שלכם. ההמלצה הפרקטית היא להתחיל עם מצב זיכרון כבוי, להכיר את הצ’אט הצדדי והעריכה האינטראקטיבית, ורק לאחר מכן להפעיל זיכרון דפדפן לאתרים שבהם היתרון ברור.

 

באנר אנטרפרייז

 

שינוי בחוויית הגלישה

חוויית הגלישה באטלס מעודדת גישה פרואקטיבית. במקום לאסוף לינקים, להעתיק טקסטים ורק אז לשאול שאלה, השאלות נשאלות ישירות בהקשר של העמוד, והתשובות מתחברות לפעולה הבאה. המשכיות שמבוססת על זיכרון גלישה יכולה להפוך את החזרה למחקרי עבר או להשוואות מוצרים למהירה וממוקדת יותר. העריכה בשדות טקסט מקצרת תהליכים שגרתיים של ניסוח ומאפשרת לשמור על טון עקבי בין ערוצים.

 

הערך המוסף של Atlas: עבור משתמשים שכבר מנוסים ב-ChatGPT, הדפדפן הזה מרגיש כמעט כמו התמזגות של שני עולמות. כל היסטוריית השיחות שלכם עם הבוט, הידע שהוא צבר על סגנון השאלות וההעדפות שלכם – כל זה מוטמע בתוך Atlas וזמין לשימוש. המשמעות היא שאם, למשל, דיברתם בעבר עם ChatGPT על תחביב או פרויקט עבודה, הוא “יזכור” זאת גם כשתגלשו לנושא קשור וייתן תשובות עשירות יותר בהקשר האישי שלכם. זוהי יכולת ייחודית שלא קיימת בדפדפנים מתחרים נכון לעכשיו. בנוסף, Atlas כבר עכשיו מדגים שילוב בין משימות – הוא יכול לקחת תוכן מעמוד אחד (נניח כתובת של פגישה מיומן גוגל) ולהשתמש בו בעמוד אחר (למשל לפתוח מפה או להזמין נסיעה) – דברים שעד כה דרשו מהמשתמש הרבה העתק-הדבק או כישורי אוטומציה אחרים.

אחרון חביב, OpenAI רומזת שזוהי רק ההתחלה. בין התכונות העתידיות על מפת הדרכים שלהם: תמיכה בריבוי פרופילים (למשל הפרדת פרופיל עבודה ופרופיל אישי באותו דפדפן), כלי פיתוח משופרים (אולי ממשק ל-debugging עם עזרת AI), ודרכים שבהן מפתחי יישומי ChatGPT (הקרויים עכשיו Apps או Plug-ins) יוכלו להבליט את הכלים שלהם בתוך Atlas. המשמעות היא שייתכן ובעתיד נראה חנות תוספים ייעודית ל-Atlas, או אינטגרציות עמוקות עוד יותר עם שירותים מקוונים. OpenAI גם מזמינה בעלי אתרים להוסיף תגיות מיוחדות (כגון ARIA מותאמות ל-AI) כדי לסייע ל-ChatGPT להבין טוב יותר אתרים ולפעול בהם בבטחה.

 

הפוסט אטלס של OpenAI: הדפדפן האייג’נטלי שינסה לחסל את Comet ו-Chrome הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/race-for-agent-browsers-atlas/feed/ 0
גוגל חושפת מערכת שמלמדת את הצ’אטבוט לשאול שאלות כמו רופא https://letsai.co.il/google-health-navigation/ https://letsai.co.il/google-health-navigation/#respond Sun, 19 Oct 2025 08:21:03 +0000 https://letsai.co.il/?p=62012 מה קורה כשצ’אטבוט לא רק עונה, אלא גם שואל? נניח שיש לכם כאב ראש מתמשך. אתם מחפשים בגוגל “כאב ראש כרוני” ומקבלים עשרות מאמרים על מיגרנה, לחץ דם גבוה, גידולים במוח ומתח. אף אחד מהם לא שואל אתכם האם הכאב מופיע בצד אחד? האם יש רגישות לאור? האם זה מחמיר בלילה? התוצאה היא שפע של […]

הפוסט גוגל חושפת מערכת שמלמדת את הצ’אטבוט לשאול שאלות כמו רופא הופיע ראשון בLet's AI בינה מלאכותית

]]>
מה קורה כשצ’אטבוט לא רק עונה, אלא גם שואל? נניח שיש לכם כאב ראש מתמשך. אתם מחפשים בגוגל “כאב ראש כרוני” ומקבלים עשרות מאמרים על מיגרנה, לחץ דם גבוה, גידולים במוח ומתח. אף אחד מהם לא שואל אתכם האם הכאב מופיע בצד אחד? האם יש רגישות לאור? האם זה מחמיר בלילה? התוצאה היא שפע של מידע, אבל מעט רלוונטיות. בינה מלאכותית שיחתית היא אחד הכיוונים הבולטים בעולם ה־AI עם מערכות שכבר לא מסתפקות בלספק מידע, אלא יוזמות דיאלוג כדי להבין את המשתמש טוב יותר. Google מפתחת בשנים האחרונות סדרת כלים רפואיים מבוססי Gemini, בהם Med-Gemini, שמפרש נתונים רפואיים רב-מודליים, ו-AMIE, שנועד לשיחות אבחון קליניות. בספטמבר 2025 חשפה חטיבת המחקר שלה אב-טיפוס חדש בשם Wayfinding AI, שבמקום להמטיר תשובה מיידית, מתחיל בשאלות, ממש כפי שעושה רופא.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

למה כל כך קשה לתאר בעיה רפואית?

בראיונות עם 33 משתתפים, החוקרים גילו תופעה שחוזרת על עצמה – אנשים מתקשים להסביר מה בדיוק מטריד אותם. אחד המשתתפים תיאר זאת כך: “אני פשוט זורק את כל המילים לשם ורואה מה חוזר”.

 

בלי רקע רפואי, קשה לדעת אילו פרטים באמת חשובים. האם הכאב מופיע לפני או אחרי אכילה? האם הוא מחמיר במהלך היום? רופא יודע לשאול את השאלות הנכונות אבל רוב הצ’אטבוטים לא. הם פשוט מחכים שתספקו להם את כל המידע מראש.

 

כשמשתתפים התנסו בצ’אטבוטים שכן שואלים שאלות, התגובה הייתה כמעט אחידה – הם העדיפו את מה שהחוקרים כינו “גישה של תשובה נדחית”. כלומר, המערכת לא ממהרת לספק תשובה אלא מבקשת תחילה להבהיר את התמונה. כפי שאמר אחד המשתתפים: “זה מרגיש יותר כמו לדבר עם רופא. זה גורם לי להרגיש בטוח יותר שהוא באמת מנסה להבין לפני שהוא עונה.”

 

כדי להבין באמת איך זה נראה בפועל, Google פרסמה סרטון הדגמה קצר מתוך ממשק ה־Wayfinding AI:

 

 

 

איך זה עובד?

Wayfinding AI מבוסס על מודל Gemini של Google ופועל לפי שלושה עקרונות פשוטים אך חכמים.

 

ראשית, בכל שלב המערכת שואלת עד שלוש שאלות ממוקדות כדי לצמצם אי-בהירות ולהבין טוב יותר את ההקשר. שנית, היא נותנת תשובת “מיטב המאמצים” (best-effort answer), תשובה זמנית המבוססת על המידע הקיים באותו רגע, ומדגישה שהיא עשויה להשתפר ככל שיתווספו פרטים נוספים.

 

לדוגמה, אם משתמש כותב “אני מרגיש סחרחורת כבר יומיים”, Wayfinding AI לא תמהר לקבוע שמדובר בוורטיגו, אלא תשיב: “בהתבסס על מה שסיפרת, ייתכן שמדובר בבעיה באוזן הפנימית או בלחץ דם נמוך. אוכל לדייק יותר אם תספר מתי זה קורה ובאילו מצבים.”

 

לבסוף, המערכת מסבירה למשתמש כיצד כל פרט חדש – זמן הופעת הסימפטום, גורמים מחמירים, או תסמינים נלווים – שיפר את איכות התשובה.

 

גם לעיצוב יש תפקיד משמעותי. הממשק מחולק לשני חלקים: בצד שמאל השיחה והשאלות, ובצד ימין המידע הרפואי. החלוקה הברורה הזו נולדה מתוך תובנה שהחוקרים זיהו – כששאלות קבורות בתוך טקסטים ארוכים, המשתמשים פשוט לא מבחינים בהן.

מה קרה כשבדקו את זה באמת

Google בחנה את Wayfinding AI בקרב 130 משתתפים אמריקאים בני 21 ומעלה, שאינם אנשי מקצוע בתחום הבריאות. כל משתתף התבקש להשתמש הן במערכת החדשה והן בגרסה הרגילה של Gemini כדי לחקור שאלה רפואית אמיתית שמעסיקה אותו, החל מכאבי צלעות וורטיגו, ועד עלייה מסתורית במשקל או טינטון.

 

אילוסטרציה של מבנה המחקר

Source: research.google | אילוסטרציה של מבנה המחקר.

 

התוצאות היו חד-משמעיות – המשתתפים העדיפו את Wayfinding AI כמעט בכל פרמטר, מתועלת ורלוונטיות, דרך התאמה אישית והבנת מטרות המשתמש, ועד נוחות השימוש והיעילות.

 

תרשים שפרסמה Google ממחיש היטב את פערי ההעדפות הללו בין שתי המערכות:

 

העדפות המשתתפים בין Wayfinding AI לגרסת הבסיס של Gemini

Source: research.google | העדפות המשתתפים בין Wayfinding AI ל- Gemini.

 

מעניין שגם משך השיחות השתנה – השיחות עם Wayfinding AI נמשכו בממוצע כמעט חמישה סבבים (4.96) של שאלות ותשובות, לעומת שלושה בלבד (3.29) במערכת הרגילה. במקום לראות בכך בזבוז זמן, המשתתפים דיווחו שהם מרגישים מעורבים יותר, כאילו המערכת באמת מקשיבה להם. בנוסף, כשה-AI שאל שאלות ממוקדות, המשתתפים סיפקו מידע מדויק ורלוונטי יותר, לעיתים כזה שלא היו חושבים להזכיר בכלל.

 

בתרשים הבא ניתן לראות את זרימת הדיאלוגים עם שני סוגי המודלים – הצ’אטבוט הבסיסי לעומת Wayfinding AI. הכחול מסמן את התשובות לשאלות הבהרה, שלב שהתרחש בתדירות גבוהה הרבה יותר בשיחות עם Wayfinding AI:

 

תרשים של זרימת השיחות עם Wayfinding AI

Source: research.google | תרשים של זרימת השיחות עם Wayfinding AI.

מה עדיין לא עובד

למרות ההצלחה, מדובר באב-טיפוס מחקרי בלבד ולא במוצר מוכן לשוק. Google לא הודיעה אם או מתי יושק לציבור. החוקרים מדגישים שהביצוע הוא הכול. ברגע שהשאלות מנוסחות בצורה גרועה, כללית מדי או מוצגות במיקום לא ברור, המעורבות של המשתמשים צונחת. גישת השאלות עובדת רק כשהשאלות באמת טובות, מדויקות ורלוונטיות.

 

למחקר יש גם מגבלות גיאוגרפיות ותרבותיות. הוא כלל רק משתתפים אמריקאים, ולכן לא ברור כיצד המערכת תתפקד במדינות אחרות, עם שפות, נורמות תקשורת והרגלי בריאות שונים.

 

 

חיפוש רפואי חכם, רגיש ואישי

המחקר של Google הראה עיקרון פשוט אך משמעותי – כשבינה מלאכותית שואלת שאלות ממוקדות וחכמות, היא מספקת תשובות מדויקות ורלוונטיות יותר. זה לא קסם טכנולוגי, זו אותה מתודולוגיה שרופאים משתמשים בה כבר שנים – לשאול לפני שקובעים. הגישה הזו מתאימה במיוחד למי שמתקשה לנסח סימפטומים או מרגיש מוצף ממידע רפואי כללי. לעומת זאת, היא פחות תועיל בשאלות פשוטות וברורות, או למי שמעדיף תשובה מיידית ולא תהליך שיח.

 

האתגר האמיתי הוא לא בפיתוח המודל אלא בשמירה על איכות השיח והדיוק בשאלות בקנה מידה רחב. מספיק שאלה אחת לא מדויקת כדי לערער את תחושת האמון. המחקר הראה שזה אפשרי, אבל רק כשזה מבוצע היטב. בינתיים, מדובר עדיין באב-טיפוס מחקרי, אבל הכיוון ברור – בינה מלאכותית שמדברת איתכם, לא רק אליכם, עשויה להפוך את החיפוש הרפואי לחכם, רגיש ואישי הרבה יותר.

הפוסט גוגל חושפת מערכת שמלמדת את הצ’אטבוט לשאול שאלות כמו רופא הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/google-health-navigation/feed/ 0
אנטרופיק וסיילספורס מרחיבות שותפות ומכניסות את Claude לבנקים ולמוסדות בריאות https://letsai.co.il/anthropic-salesforce-partnership/ https://letsai.co.il/anthropic-salesforce-partnership/#respond Sat, 18 Oct 2025 13:18:15 +0000 https://letsai.co.il/?p=62002 סיילספורס (Salesforce) ואנטרופיק (Anthropic) הכריזו ב-14 באוקטובר 2025 על הרחבת השותפות ביניהן, במטרה להביא את מודל הבינה המלאכותית Claude לעולמות שבהם אימוץ AI עדיין זהיר – שירותים פיננסיים, בריאות, אבטחת סייבר ומדעי החיים. המהלך נועד לפתוח את השער לשימוש בטכנולוגיות מתקדמות גם בתעשיות מוסדרות, שנמנעו עד כה מפתרונות AI מחשש לסיכוני אבטחה וציות רגולטורי. בלב […]

הפוסט אנטרופיק וסיילספורס מרחיבות שותפות ומכניסות את Claude לבנקים ולמוסדות בריאות הופיע ראשון בLet's AI בינה מלאכותית

]]>
סיילספורס (Salesforce) ואנטרופיק (Anthropic) הכריזו ב-14 באוקטובר 2025 על הרחבת השותפות ביניהן, במטרה להביא את מודל הבינה המלאכותית Claude לעולמות שבהם אימוץ AI עדיין זהיר – שירותים פיננסיים, בריאות, אבטחת סייבר ומדעי החיים. המהלך נועד לפתוח את השער לשימוש בטכנולוגיות מתקדמות גם בתעשיות מוסדרות, שנמנעו עד כה מפתרונות AI מחשש לסיכוני אבטחה וציות רגולטורי. בלב ההכרזה עומדת החלטתה של סיילספורס להפוך את Claude למודל המועדף בפלטפורמת Agentforce, תוך הפעלתו ישירות בענן הפרטי של החברה. המשמעות היא שכל הנתונים נשארים בתוך סביבת Salesforce המאובטחת, ואנטרופיק הופכת לספקית המודלים הראשונה שמשולבת במלואה בתוך גבולות האבטחה של הפלטפורמה. זהו צעד שמחבר בין חדשנות מתקדמת לשמירה קפדנית על רגישות הנתונים – דרישה בסיסית של ארגונים גדולים בשווקים מפוקחים.

 

שיתוף פעולה בין אנטרופיק ומודל קלוד לסיילספורס

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

שלושה צירים לשותפות

Claude כמודל מועדף ב-Agentforce (דרך Amazon Bedrock)

בלב שיתוף הפעולה עומדת ההחלטה להפוך את Claude למודל הדיפולטי של Agentforce, סביבת סוכני ה-AI של סיילספורס. המשמעות היא שארגונים הפועלים בענן הפרטי של סיילספורס יוכלו להפעיל את Claude מבלי לצאת מגבולות האבטחה של הפלטפורמה. חברות כמו CrowdStrike ו-RBC Wealth Management כבר מאמצות את השילוב הזה.

 

לדברי רוהיט גופטה (Rohit Gupta), ראש פלטפורמות יועצים דיגיטליים ב-RBC Wealth Management: “בעזרת Anthropic על Amazon Bedrock ו-Agentforce, אנחנו מצליחים לעזור ליועצים שלנו במשימה שגוזלת את רוב זמנם – ההכנה לפגישות. זה חוסך להם זמן משמעותי.”

פיתוח פתרונות ייעודיים לתעשיות ספציפיות

השותפות מתרחבת גם לפיתוח גרסאות מותאמות של Claude לתחומים מוסדרים, ובשלב ראשון לשירותים פיננסיים. השילוב בין Claude for Financial Services ל-Agentforce Financial Services נועד לאפשר לסוכני AI להבין מכשירים פיננסיים, תביעות ביטוח ומסגרות רגולטוריות לעומקן, יכולת שהייתה חסרה עד עכשיו במודלים כלליים.

 

סיילספורס מציגה תרחיש שימוש טיפוסי שבו יועץ פיננסי יכול לבקש מסוכן ה-AI לסכם תיקי השקעות, לזהות דרישות רגולטוריות חדשות שמשפיעות על תוכניות פנסיה, ולבצע מעקב אוטומטי אחר הסכמות ותקשורת עם לקוחות. זהו ניסיון להפוך את ה-AI ממערכת תמיכה כללית לכלי ניתוח קונטקסטואלי שמכיר את העולם הרגולטורי שבו הוא פועל.

הרחבת האינטגרציה בין Claude ל-Slack

הציר השלישי מחזק את הקשר בין Claude לפלטפורמת Slack שבבעלות סיילספורס. באמצעות Model Context Protocol, Claude יוכל לגשת לערוצים, הודעות וקבצים כדי לסכם שיחות, לחלץ החלטות מרכזיות ולנסח עדכונים. במילים פשוטות, Claude הופך למשתתף פעיל בשיח הארגוני, לא רק לכלי עזר טכני. עובדים יוכלו להפעילו ישירות מתוך Slack לניתוח מסמכים, חיפושי מידע או הפקת תובנות מנתוני Salesforce CRM – שילוב שמקדם חזון של סביבת עבודה אחודה שבה ה-AI מחובר לכל שכבת תוכן ונתון.

מודל מורכב עם טווח מחירים רחב

סיילספורס מציעה מודל תמחור רב-שכבתי לשירות Agentforce, שמותאם לגודל הארגון ולענף שבו הוא פועל. החבילות הבסיסיות מתחילות ב-125 דולר לחודש למשתמש עבור Agentforce Add-ons לתחומי מכירות, שירות ושירות שטח. בתעשיות מוסדרות, כמו פיננסים, בריאות וייצור, המחיר מטפס ל-150 דולר לחודש למשתמש.

 

ברמת הפרימיום, חבילת Agentforce 1 Editions מתומחרת ב-550 דולר לחודש למשתמש וכוללת שימוש בלתי מוגבל בסוכני AI, מיליון Flex Credits בשנה, וגישה מלאה ל-Data Cloud.

 

בנוסף, במאי 2025 הציגה סיילספורס מודל צריכה חדש בשם Flex Credits – מנגנון תשלום לפי פעולה (0.10 דולר לפעולה, שהם 20 קרדיטים). כל פעולה שסוכן AI מבצע, בין אם עדכון רשומה, סיכום מקרה או מענה לשאלה, מנוכה מחשבון הקרדיטים של הלקוח. ניתן לרכוש חבילות של 100,000 קרדיטים ב-500 דולר.

 

לשם השוואה, Microsoft 365 Copilot מתומחר בכ-30 דולר למשתמש בחודש, ו-Google Gemini Enterprise נעה סביב מחיר דומה לפי פרסומים בתעשייה. Claude API של אנטרופיק פועל במודל תשלום לפי שימוש – מודל Claude 4.5 Sonnet עולה 3 דולר למיליון טוקנים קלט ו-15 דולר לפלט. כמובן שהמחירים עשויים להשתנות עם גרסאות חדשות והסכמי רישוי ארגוניים.

 

מבחינת עלות, Agentforce יקרה משמעותית, אך ההבדל משקף אסטרטגיה ברורה – סיילספורס אינה מוכרת בוט AI, אלא פלטפורמת סוכנים ארגונית שמבטיחה אבטחה, התאמה רגולטורית ואינטגרציה עמוקה עם מערכות הליבה של הלקוחות.

מה עושים השחקנים הגדולים

שלוש הענקיות, Microsoft, OpenAI ו-Google, ממשיכות לקבוע את קצב ההתקדמות בעולם הבינה המלאכותית הארגונית.

 

Microsoft השקיעה מעל 13 מיליארד דולר ב-OpenAI ומתכננת להשקיע כ-80 מיליארד דולר נוספים בשנת הכספים 2025 בתשתיות AI. מודלי OpenAI כבר משולבים ב-Windows, Teams ובמוצרי הליבה של החברה, מה שהפך את Copilot לחלק בלתי נפרד מהאקוסיסטם של מיקרוסופט.

 

בנוסף, מיקרוסופט שילבה גם את Claude בפלטפורמת Azure AI וב-Copilot Studio, כחלק ממדיניות פתיחות למודלים חיצוניים המאפשרת ללקוחות לבחור בין כמה ספקי GenAI – צעד שמחזק את מעמדה כפלטפורמת AI רב-מודלית ולא רק כשותפה בלעדית של OpenAI.

 

Google מצדה השיקה באוקטובר 2025 את Gemini Enterprise. החברה עדיין מחזיקה ביותר מ-90% משוק החיפוש, אך מתמודדת עם תחרות גוברת מצד מודלים שיחתיים (Conversational AI). מחקר של CB Insights מיולי 2025 מצא כי Microsoft ו-OpenAI מובילות ברוב הפריסות של מערכות GenAI בשירותים פיננסיים – תחום שבו Google מנסה לצמצם פערים.

 

על רקע זה, השותפות בין Anthropic ו-Salesforce פונה לנישה שונה: ארגונים בתעשיות מוסדרות כמו פיננסים, בריאות, ביטוח ומדעי החיים, שמוכנים לשלם פרמיה בעבור אבטחה, תאימות רגולטורית ובקרה על הנתונים. במובן הזה, Salesforce אינה מתחרה ישירה ב-Microsoft או ב-Google, אלא מציבה אלטרנטיבה של “AI מאובטח ומפוקח” – מודל שנועד לפתוח דלת לשווקים שמודלים כלליים לא הצליחו לחדור אליהם.

ציפיות מול מציאות

מאז השקת Agentforce, התגובות בקהילה המקצועית מעורבות. בפברואר 2025 דיווחה Salesforce על כ-5,000 עסקאות – רק כ-6% מבסיס הלקוחות שלה.

 

באתר Salesforce Ben נמתחה ביקורת על בשלות המערכת. קיר בודן (Keir Bowden), מומחה טכני בכיר, כתב באפריל 2025: “זה עדיין מוקדם מדי, אין מספיק פונקציות סטנדרטיות, ולכל פרויקט נדרש פיתוח מותאם כדי שסוכן יוכל לפעול.”

 

גם החלטת החברה להחליף את החיפוש הטקסטואלי באתר התמיכה ב-Agentforce עוררה התנגדות, לאחר שמשתמשים דיווחו על חיפושים איטיים ופחות מדויקים. טום באסט (Tom Bassett), ארכיטקט פתרונות בכיר, אף יזם הצבעה להחזרת הפונקציה הישנה.

 

במישור הפיננסי, אנליסטים מ-D.A. Davidson הורידו באפריל את דירוג המניה ל-“Underperform”, בטענה שהחברה מתמקדת יותר מדי ב-Agentforce על חשבון הפלטפורמה המרכזית – והמניה ירדה ב-4.3%.

 

מחקר של GetGenerative.ai הוסיף לרשימת החולשות מגבלת 20 סוכנים לארגון, עלויות לא צפויות ותלות במערכת האקולוגית של Salesforce.

 

לסיכום, האימוץ איטי, הפידבק מסויג, והאתגר של Salesforce ברור – להפוך את Agentforce ממוצר מבטיח לכלי שמספק ערך מוכח ללקוחות קיימים.

 

 

זמינות ותוכניות עתידיות

Agentforce שמופעל על ידי אנטרופיק זמין כבר היום ללקוחות נבחרים, והאינטגרציה הדו-כיוונית בין Claude ל-Slack פעילה גם היא. הפתרונות החדשים לתעשיות מוסדרות והחיבור של Agentforce 360 עם Claude נמצאים בשלבי פיתוח מתקדמים, וצפויים להיחשף בחודשים הקרובים.

 

בתוך הארגונים עצמם השילוב כבר מתרחש – Salesforce פורסת את Claude Code בקרב צוותי ההנדסה הגלובליים שלה, ואנטרופיק משתמשת ב-Claude בתוך Slack לניהול שיחות פנימיות והדרכות מכירה.

 

דריו אמודיי (Dario Amodei), מנכ”ל ומייסד-שותף של Anthropic, אמר: “תעשיות מוסדרות צריכות יכולות AI מתקדמות, אבל גם את אמצעי ההגנה המתאימים. בנינו את Claude כדי לספק את שניהם.”

 

מארק בניוף (Marc Benioff), יו”ר ומנכ”ל Salesforce, הוסיף: “אנחנו משלבים את Salesforce בתוך Claude ואת האינטליגנציה של Claude בתוך Salesforce ו-Slack כדי לאפשר לחברות לעבוד בדרכים חדשות לגמרי.”

 

השותפות הזו מסמנת שלב חדש בשוק ה-AI הארגוני – ניסיון אמיתי לגשר בין מהירות החדשנות של מודלים גנרטיביים לבין הדרישות הקשיחות של עולם מוסדר ומפוקח. השאלה שנותרה פתוחה היא, האם השוק בשל לשלם את המחיר הפיננסי והמערכתי, עבור בינה מלאכותית מאובטחת באמת.

הפוסט אנטרופיק וסיילספורס מרחיבות שותפות ומכניסות את Claude לבנקים ולמוסדות בריאות הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/anthropic-salesforce-partnership/feed/ 0
שלושה עדכונים לקלוד שהופכים את Anthropic לשחקנית מרכזית בעולם ה-AI הארגוני https://letsai.co.il/claude-skills-and-integrations/ https://letsai.co.il/claude-skills-and-integrations/#comments Fri, 17 Oct 2025 08:50:10 +0000 https://letsai.co.il/?p=61985 בעידן שבו מערכות בינה מלאכותית הופכות לחלק בלתי נפרד ממקום העבודה, Anthropic מציגה שלב חדש בהתפתחות: לא עוד עוזר חכם שמגיב לבקשות, אלא עובד ארגוני שמבין נהלים, ידע ותהליכים. שלושת החידושים האחרונים – Claude Skills, האינטגרציה עם Microsoft 365, ו-Enterprise Search – מסמנים שינוי תפיסתי. הם לא רק מוסיפים פונקציות חדשות, אלא מחברים את קלוד […]

הפוסט שלושה עדכונים לקלוד שהופכים את Anthropic לשחקנית מרכזית בעולם ה-AI הארגוני הופיע ראשון בLet's AI בינה מלאכותית

]]>
בעידן שבו מערכות בינה מלאכותית הופכות לחלק בלתי נפרד ממקום העבודה, Anthropic מציגה שלב חדש בהתפתחות: לא עוד עוזר חכם שמגיב לבקשות, אלא עובד ארגוני שמבין נהלים, ידע ותהליכים. שלושת החידושים האחרונים – Claude Skills, האינטגרציה עם Microsoft 365, ו-Enterprise Search – מסמנים שינוי תפיסתי. הם לא רק מוסיפים פונקציות חדשות, אלא מחברים את קלוד ישירות לליבת העבודה של הארגון.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

Skills הופך ידע ארגוני לאוטומציה חכמה

עוד לא יבשה הדיו מהעדכון על שחרור מודל Claude Haiku 4.5, ואנטרופיק כבר ממשיכים במהלך שמכניס את קלוד אל תוך ליבת הארגון.

 

Claude Skills הוא המענה של Anthropic לאותו צורך ש-OpenAI פתרה עם GPTs – ההתאמה האישית של המודל. אך בניגוד ל-GPTs, שמתמקדים ביצירת עוזרים פרטיים לכל משתמש, Skills נבנה במיוחד עבור צוותים וארגונים. זה לא “בוט מותאם אישית”, זו מערכת שמטמיעה את הנהלים, הידע והתרבות הארגונית לתוך קלוד עצמו.

 

כל Skill הוא תיקייה דיגיטלית שמכילה הוראות, קבצים, מדריכים או קוד. קלוד סורק את כל ה-Skills, מזהה את הרלוונטיים למשימה, ומטעין רק את החלקים הדרושים. כך הוא פועל במהירות וביעילות, תוך שמירה על עקביות ארגונית.

 

Anthropic מגדירה ארבע תכונות מפתח:

  • Composable – קלוד יודע לשלב כמה Skills יחד לביצוע תהליך שלם.
  • Portable – כל Skill עובד בכל מוצרי Claude – באפליקציה, ב-Claude Code וב-API.
  • Efficient – נטען רק מה שנדרש, ברגע הנכון.
  • Powerful – מאפשר להריץ קוד אמיתי לצורך ביצועים מדויקים במיוחד.

 

איך מפעילים את זה?

ה-Skills זמינים כברירת מחדל למשתמשי Pro, Max, Team ו-Enterprise.

 

כדי להפעיל אותם:

1. נכנסים ל־ Settings > Capabilities > Skills.

2. מפעילים את האפשרות.

3. בוחרים האם לאפשר שימוש בכישורים כלליים או בכישורים ארגוניים בלבד.

 

בארגונים, מנהל המערכת יכול לאפשר או להגביל את הפעלת ה־Skills לכלל הצוותים. לאחר ההפעלה, קלוד מציג את ה-Skills הרלוונטיים בזמן אמת בשורת החשיבה שלו בלי צורך לבחור ידנית.

 

Anthropic גם מציעה כלי ייעודי בשם Skill-Creator. קלוד עצמו מדריך אתכם שלב-שלב: שואל על זרימת העבודה, יוצר את מבנה התיקייה, כותב את קובץ ההוראות (SKILL.md) ומרכז את כל הקבצים הנדרשים. אין צורך בידע תכנותי. המערכת פועלת באותה צורה גם ב-Claude Code וב-API – מפתחים יכולים להעלות Skills דרך מסך הניהול או באמצעות נקודת הקצה החדשה /v1/skills, שמאפשרת שליטה בגרסאות, הרשאות והרצה מאובטחת דרך Code Execution Tool.

 

בתמונה המצורפת תוכלו לראות את תפריט ההגדרות של Claude. כאן ניתן להפעיל את מערכת ה-Skills, להעלות כישורים חדשים באמצעות Upload skill, או לנהל כישורים קיימים כמו הנחיות מותג, תבניות כתיבה וכללי תקשורת פנימית:

 

הפעלת Claude Skills מתוך Settings > Capabilities

anthropic.com | הפעלת Claude Skills מתוך Settings > Capabilities

 

לדוגמה, צוות כספים יכול ליצור Skill שמחשב תחזיות תקציב על בסיס דוחות אקסל, וצוות שיווק יכול להגדיר Skill שמפיק מצגות במבנה אחיד של החברה. מרגע שה-Skills נבנו, קלוד יודע להריץ אותם לבד ואמור למנוע חזרתיות, חוסר עקביות, או טעויות אנוש.

 

כיוון ש-Skills יכולים להריץ קוד, מומלץ להשתמש רק בכישורים ממקורות אמינים או מאושרים על ידי הארגון. בעתיד Anthropic צפויה להשיק יכולת פריסה ארגונית רחבה, שתאפשר להפיץ ולנהל Skills לכל הצוותים מממשק אחד מרכזי.

 

צעד ראשון מומלץ: בחרו תהליך שחוזר על עצמו, כמו סיכום פגישות או ניתוח חוזים, ובנו עבורו Skill יחיד. תמדדו את זמן החיסכון ואת אחידות התוצרים. כך תבינו מהר מאוד את הערך המעשי של המערכת.

 

למי שרוצה להעמיק או לבנות את ה-Skill הראשון שלו, Anthropic מציעה מדריך אינטראקטיבי שמסביר איך ללמד את קלוד לעבוד לפי הנהלים שלכם כולל מרכז עזרה מקיף על עקרונות הפיצ’ר.

בנוסף, החברה פתחה מאגר ציבורי ב־GitHub שכולל דוגמאות ל-Skills קיימים שאפשר להתאים לכל ארגון – דרך מעשית להבין איך להפוך ידע ארגוני לאוטומציה חכמה.

אינטגרציה עם Microsoft 365 

עדכון נוסף של אנטרופיק מדגיש שקלוד כבר לא חי לצד הכלים הארגוניים, אלא ממש נכנס לתוכם. באמצעות MCP Connector for Microsoft 365, אנטרופיק מאפשרת לקלוד להתחבר ישירות ל-SharePoint, OneDrive, Outlook ו-Teams, כך שהוא יכול לגשת למסמכים, שיחות ומיילים בזמן אמת, להבין הקשרים ולספק תשובות מבוססות ידע ארגוני אמיתי.

 

ברגע שהחיבור מופעל, קלוד ממש הופך להיות חלק מסביבת העבודה. אפשר לדבר איתו בדיוק כמו בצ’אט הרגיל, רק שעכשיו הוא “מבין” את המסמכים, התכתובות והיומן שלכם מבלי להעלות כלום ידנית.

 

בפועל, קלוד יודע לחפש ולנתח מסמכים מכל SharePoint ו-OneDrive, דרך פרטי פרויקטים ועד תוכניות אסטרטגיות, בלי צורך להעלות קבצים ידנית. הוא סורק תכתובות ב-Outlook, מזהה מגמות ופידבק מלקוחות, ומחזיר תמונה מלאה של מצב הפרויקט. בתוך Teams הוא מסכם פגישות, מאתר החלטות ומציע צעדים להמשך, והכול כחלק משיחה רציפה אחת.

 

למשל, מנהלת מוצר יכולה לכתוב: “השווה את פידבק הלקוחות מהמיילים האחרונים לנתוני השימוש בדוחות SharePoint, וצור טיוטת מצגת עם שלוש ההמלצות המרכזיות.” קלוד יבצע זאת בזמן אמת, על בסיס המידע הקיים במערכות הארגון.

 

היתרונות ברורים – קלוד מבין לא רק את התוכן עצמו אלא גם את ההיסטוריה שמאחוריו, מה שמעניק הקשר עמוק ומדויק יותר לתובנות. העבודה נעשית מהירה ויעילה יותר, עם פחות קפיצות בין כלים ויותר החלטות מבוססות מידע בזמן אמת. במקביל, Anthropic שומרת על רמות אמון ובקרה גבוהות – קלוד ניגש רק למידע שהמשתמש מורשה לראות, והנתונים אינם משמשים לאימון המודל.

 

האינטגרציה זמינה למשתמשי Team ו-Enterprise, ודורשת הפעלה על ידי מנהל מערכת (Admin). האדמין מחבר את החשבון הארגוני, מגדיר את מקורות המידע, ולאחר מכן כל משתמש בצוות יכול להתחבר עם האישורים שלו.

 

בעוד Copilot של מיקרוסופט פועל בתוך כל אפליקציה בנפרד, הגישה של Anthropic רחבה יותר – קלוד מאחד מידע ממספר מקורות לשיחה אחת רציפה, כך שההבנה העסקית שלמה ומקיפה יותר.

 

צעד ראשון מומלץ: ברגע שמנהל המערכת מפעיל את ה-MCP Connector, הגדירו אילו ספריות ודוא”לים ייחשפו לקלוד, ונסו שאילתה מעשית כמו: “סכם את התובנות המרכזיות מפגישות Teams האחרונות והשווה אותן למידע ממסמכי SharePoint בנושא.”

זו הדרך המהירה לראות איך קלוד הופך ממנוע שיחה לעובד ידע אמיתי.

 

Enterprise Search 

החידוש השלישי במערך של Anthropic משנה את הדרך שבה ארגונים ניגשים לידע שלהם. קלוד כבר לא מחפש רק במסמך בודד או במייל אחד, הוא הופך למנוע ידע אחיד שמחבר בין כל מקורות המידע של החברה, ממיקרוסופט ועד גוגל, Slack, Notion ואפילו כלים פנימיים, לשכבת חיפוש אחת אינטליגנטית.

 

Anthropic יצרה לכל ארגון פרויקט משותף ייעודי (Shared Company Project) הנושא את שם החברה וכולל פרומפטים מובנים לחיפוש חכם. מנהל הארגון מחבר את הכלים הדרושים, ולאחר מכן כל העובדים מקבלים גישה אוטומטית לפרויקט דרך סביבת Claude.

 

Enterprise Search – קלוד מאחד מידע ממספר כלים ארגוניים לשיחה אחת רציפה.

anthropic.com | קלוד מאחד מידע ממספר כלים ארגוניים לשיחה אחת רציפה.

 

למה זה חשוב? במקום לבזבז זמן בחיפושים ידניים, קלוד מספק תשובה אחת שמרכזת את כל המידע הרלוונטי ומאפשרת החלטה מהירה. זה כלי עוצמתי במיוחד עבור קליטת עובדים חדשים (Onboarding), ניתוח פידבק לקוחות, או איתור מומחים פנימיים לפי נושא ידע.



Enterprise Search מופעל כברירת מחדל לכל ארגוני Team ו-Enterprise. האדמין קובע אילו מקורות ייכללו ומנהל את ההרשאות. Anthropic מדגישה עמידה מלאה בתקני פרטיות ואבטחת מידע: קלוד שומר על ההרשאות הקיימות של המשתמשים, והנתונים אינם משמשים לאימון.

 

צעד ראשון מומלץ: התחילו מפרויקט מצומצם – חברו את SharePoint, Outlook ו-Teams, או אם אתם עובדים עם מערכות אחרות, שלבו כלים כמו Notion, Slack או Google Drive. נסו לשאול שאלות תפעוליות פשוטות כמו: “אילו לקוחות דיווחו על תקלות חוזרות החודש?” או “מה הסטטוס של יוזמות החדשנות הפעילות?” ותראו איך קלוד מאחד תשובות ממקורות שונים למסמך תובנות אחד בלי שתצטרכו לפתוח אף קובץ.

 

 

לסיכום, שלושת החידושים של Anthropic מציירים מגמה ברורה – עולם הבינה המלאכותית עובר משלב “העוזרים הדיגיטליים” לשלב העובדים הדיגיטליים. Skills מטמיעים את הידע והנהלים של הארגון, Microsoft 365 Connector מכניס את קלוד לתוך סביבת העבודה היומיומית, ו-Enterprise Search מחבר אותו אל הידע הקולקטיבי של החברה.

 

במקום מודלים שמייצרים טקסטים מבריקים, Anthropic בונה מערכת שמבינה הקשר, עובדת תחת הרשאות, ומחזירה תוצרים שניתנים לאימות. היא בונה שכבת אינטליגנציה ארגונית, זהה בכל הצוותים, מבוקרת, מאובטחת ומבוססת על ידע אמיתי.

 

זהו לא רק עדכון טכנולוגי, זה מצביע על המשך הקו של שינוי תרבותי עם בינה מלאכותית בארגונים. קלוד מפסיק להיות כלי שמגיב להוראות, ומתחיל להיות חלק מהצוות – עובד ידע חכם שפועל לפי כללי הארגון, מדבר בשפה שלו, ומחזיר ערך מדיד בכל פעולה.

הפוסט שלושה עדכונים לקלוד שהופכים את Anthropic לשחקנית מרכזית בעולם ה-AI הארגוני הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/claude-skills-and-integrations/feed/ 2
אנטרופיק משיקים את Claude Haiku 4.5 https://letsai.co.il/claude-haiku-4-5/ https://letsai.co.il/claude-haiku-4-5/#comments Thu, 16 Oct 2025 13:31:10 +0000 https://letsai.co.il/?p=61970 עולם הבינה המלאכותית משתנה בקצב מסחרר. המרוץ כבר לא מתמקד במודלים הענקיים, אלא במי שמצליח לדחוס עוצמה של מודל מתקדם לתוך מערכת מהירה וזולה. כאן בדיוק נכנס לתמונה Claude Haiku 4.5 – המודל החדש של Anthropic שהושק אתמול. במאמר הזה נסביר לכם מה בדיוק חדש במודל, למה הוא חשוב, איך הוא שונה מגרסאות קודמות, ומה […]

הפוסט אנטרופיק משיקים את Claude Haiku 4.5 הופיע ראשון בLet's AI בינה מלאכותית

]]>
עולם הבינה המלאכותית משתנה בקצב מסחרר. המרוץ כבר לא מתמקד במודלים הענקיים, אלא במי שמצליח לדחוס עוצמה של מודל מתקדם לתוך מערכת מהירה וזולה. כאן בדיוק נכנס לתמונה Claude Haiku 4.5 – המודל החדש של Anthropic שהושק אתמול. במאמר הזה נסביר לכם מה בדיוק חדש במודל, למה הוא חשוב, איך הוא שונה מגרסאות קודמות, ומה המשמעות שלו למשתמשים ועסקים שמחפשים ביצועים גבוהים בעלות נמוכה.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

המודל הקטן שמבצע כמו הגדולים

Claude Haiku 4.5 הוא הדגם הקטן והמהיר ביותר במשפחת Claude, אבל אל תתנו לגודל להטעות אתכם. הוא מספק ביצועים שעוקפים במעט את Sonnet 4 (שהיה בחזית הטכנולוגיה לפני פחות מחצי שנה) במבחני קידוד, אך במחיר ובמהירות טובים ממנו משמעותית, מה שממקם אותו כאחד המודלים היעילים ביותר בקטגוריית הביניים.

 

במבחן SWE-bench Verified, אחד הסטנדרטים המקובלים ביותר למדידת יכולות קידוד בעולם האמיתי, Haiku 4.5 קיבל ציון של 73.3%, לעומת 77.2% ב-Sonnet 4.5. במילים פשוטות, זהו מודל קטן שמגיע כמעט לאותה רמת דיוק כמו אחיו הבכיר, אבל מגיב מהר יותר, עולה פחות, ומתאים במיוחד למערכות זמן אמת או סביבות עם עומסי שימוש גבוהים.

 

השוואת ביצועים במבחן SWE-bench Verified

Source: Anthropic.com | השוואת ביצועים במבחן SWE-bench Verified.

כמה זה עולה ולמי זה משתלם

Anthropic מתמחרת את Haiku 4.5 ב-$1 למיליון טוקני קלט ו-$5 למיליון טוקני פלט. זה יקר בכ-25% מהדגם הקודם (Haiku 3.5), אבל זול משמעותית מהמודלים הבינוניים והגדולים יותר כמו Sonnet 4 ו-Sonnet 4.5 ($3/$15 בהתאמה). 

 

המשמעות המעשית היא שניתן להריץ יישומי בינה מלאכותית מבוססי שפה, שירותי תמיכה או עוזרים חכמים בעלות נמוכה בהרבה, כמעט בלי לוותר על איכות התוצאה. בנוסף, משתמשים קבועים נהנים מהנחות משמעותיות – עד 90% חיסכון עם prompt caching ו-50% עם Batch API (caching חוסך כסף כשעושים שימוש חוזר בתוכן קיים, ו-batching חוסך כסף כשמעבדים הרבה בקשות יחד).

 

מבנה תמחור כזה מאפשר לעסקים קטנים ובינוניים להשתמש במודלים חכמים בקנה מידה גדול, מבלי לחשוש מהוצאות ענק, ולראשונה להפוך פרויקטים מבוססי AI לכלכליים באמת.

היכולות החדשות שמבדילות אותו

Extended Thinking

לראשונה בדגמי Haiku, המודל יכול להשקיע יותר מחזורי חשיבה לפני המענה כדי להתמודד עם בעיות מורכבות. טוקני החשיבה מחויבים כטוקני פלט במחיר $5 למיליון.

 

למה זה חשוב? מאפשר דיוק טוב יותר בשאלות מרובות שלבים בלי לקפוץ למודל יקר יותר. שווה להפעיל רק כשנדרש עומק reasoning.

Context Awareness

המודל מודע לניצול חלון ההקשר שלו – עד 200,000 טוקנים – ויכול לנהל דיאלוגים ארוכים בלי לאבד חוט מחשבה, כולל אסטרטגיות prompting שמסתמכות על ספירת הקשר.

 

למה זה חשוב? פחות קטיעות, פחות שכחה, ויכולת לעבוד עם מסמכים ארוכים או שיחות תפעוליות מתמשכות.

Computer Use משופר

אינטראקציה אוטונומית עם שולחן עבודה ודפדפן. במבחן OSWorld המודל קיבל 50.7% – התוצאה הגבוהה ביותר עד היום לסדרת Haiku ומתקרבת ל-Sonnet 4.5.

 

למה זה חשוב? פותח דלת לאוטומציות מורכבות כמו מילוי טפסים, ניווט במערכות פנימיות ובדיקות QA. 

קלט ופלט מולטימודליים

תמיכה בטקסט ותמונות, חלון הקשר של 200K טוקנים ועד 64K טוקני פלט.

 

למה זה חשוב? מאפשר ניתוח מסמכים כבדים, סשנים רב שלביים ושרשורים ארוכים בלי שצריך לפצל לקבצים קטנים.

איפה משתמשים בו בפועל

אם אתם מפתחים מערכות שפועלות בזמן אמת, אתם צריכים לנסות את Haiku 4.5. לפי Anthropic, זה הפתרון האידיאלי לשורה של תרחישים יומיומיים שבהם מהירות ויעילות חשובים לא פחות מאינטליגנציה.

  • צ’אטבוטים ושירות לקוחות: המודל מגיב כמעט מיידית ומאפשר להפעיל מערכות תמיכה חכמות בעלות תפעול נמוכה במיוחד. זהו שילוב נדיר של איכות תשובה גבוהה עם latency כמעט אפסי.
  • עוזרי קידוד ו-pair programming: המודל החדש מציג ביצועי קידוד חזקים ותגובה מיידית, מה שהופך אותו לשותף אמיתי בפיתוח מהיר, תיקון באגים ו-code review חכם.
  • מערכות מרובות-סוכנים (multi-agent systems): בתרחישים מורכבים, מודל גדול כמו Sonnet 4.5 יכול לשמש כמנהל שמפרק בעיה למספר שלבים, בעוד שצוות של Haiku 4.5 מבצע את המשימות במקביל. כך מתקבלת מערכת יעילה, מהירה וזולה בהרבה.
  • ניתוחי מידע בקנה מידה גדול: Haiku 4.5 מסוגל לעבד ולעקוב אחר אלפי זרמי נתונים בזמן אמת, כולל תובנות פיננסיות, רגולטוריות או תפעוליות – תחום שבו המהירות שלו היא יתרון תחרותי מובהק.

בסופו של דבר, המודל הזה מביא אינטליגנציה של “דגם פרימיום” אל תוך יישומים יומיומיים, ומוכיח שלא צריך כוח מחשוב עצום כדי להשיג תוצאות ברמה הגבוהה ביותר.

איפה המודל זמין

Claude Haiku 4.5 זמין כבר היום לכל המשתמשים, ללא הגבלות מוקדמות או הרשאות מיוחדות. תוכלו לעבוד איתו דרך:

מי שנכנס לאתר או לאפליקציה אחרי ההשקה, יקבל הצעה לעבור ל-Haiku 4.5 החדש בלחיצה כפתור (Try it), ובכל מקרה, ניתן לבחור בו בכל עת דרך בורר המודלים שבממשק.

 

הודעת ההשקה בממשק Claude.ai

הודעת ההשקה בממשק Claude.ai

ביצועים מול מתחרים

בעולם שבו כל אחוז דיוק נחשב, Claude Haiku 4.5 מצליח להישאר כמעט כתף אל כתף עם מודלים מתקדמים בהרבה, ובמחיר נמוך משמעותית. בהשוואות שביצעה Anthropic, מודל Haiku 4.5 עוקף את Gemini 2.5 Pro ברוב הקטגוריות, שומר על פער זעיר מול GPT-5 בקידוד (73.3% לעומת 74.5%), ומציג תוצאות מרשימות גם במשימות מתמטיות, הבנה ויזואלית ורב-לשוניות.

תוצאות עיקריות מהמבחנים הפנימיים של Anthropic:

  • תכנות (SWE-bench) – 73.3%

  • הבנה מתמטית (AIME 2025) – 96.3%

  • רב-לשוניות (MMLU) – 83.0%

  • חשיבה חזותית (MMMU) – 73.2%

במילים אחרות, Haiku 4.5 אינו “מודל קטן וחסכוני” בלבד, הוא מתקרב לרמות הביצועים של המודלים המתקדמים בעולם, ומוכיח עד כמה יעילות חישובית ואינטליגנציה כבר לא בהכרח הולכות בנפרד.

 

השוואת ביצועי מודלים במבחני קידוד, מתמטיקה, הבנה ויזואלית ורב-לשוניות

Source: Anthropic.com | השוואת ביצועי מודלים במבחני קידוד, מתמטיקה, הבנה ויזואלית ורב-לשוניות.

מגבלות שכדאי לקחת בחשבון

לצד היתרונות המרשימים שלו, Claude Haiku 4.5 אינו תחליף מלא למודלים הגדולים בכל מצב. הוא מהיר ויעיל במיוחד, אבל במשימות שמצריכות חשיבה עמוקה ורצף נימוקים מורכב לאורך זמן, כמו ניתוחים טכניים, תכנון אסטרטגי או פתרון בעיות מרובות שלבים, הביצועים שלו עשויים להיות פחות עקביים. במקרים כאלה עדיף לבחור ב-Sonnet 4.5 או להפעיל את יכולת Extended Thinking של Haiku 4.5, שמאפשרת לו להשקיע יותר “זמן מחשבה” ולשפר את רמת הדיוק.

 

גם בעבודה עם computer use, אפילו שהמודל רשם שיא חדש עם ציון 50.7% במבחן OSWorld, מדובר עדיין בביצועים חלקיים. הוא מתאים במיוחד לאוטומציות מונחות אדם (human-in-the-loop), אך עדיין לא מומלץ להפעלה אוטונומית מלאה ללא בקרה.

 

נקודה נוספת שכדאי לשים לב אליה היא מבנה העלויות: בעוד ש-Haiku 4.5 חסכוני מאוד בהשוואה למודלים הגדולים, עלות הפלט שלו גבוהה פי חמישה מעלות הקלט ($1 לקלט לעומת $5 לפלט למיליון טוקנים). בפרויקטים שבהם מופק טקסט ארוך במיוחד, כמו סיכומים, דו”חות או דוקומנטציה, זה עלול להפוך לגורם משמעותי בעלויות הכוללות. שימוש נכון ב-prompt caching וב-Batch API יכול לצמצם את ההוצאה באופן ניכר.

 

לכן, Haiku 4.5 הוא בחירה מצוינת לרוב היישומים היומיומיים הדורשים מהירות ועלות נמוכה, אבל כשנדרשת חשיבה ארוכת טווח, דיוק מחקרי או שליטה מלאה במחשב, כדאי לשלב כלים משלימים או לעבור למודל מתקדם יותר כמו Sonnet 4.5.

בטיחות והתאמה לשימוש מסחרי

Anthropic מדווחת כי Claude Haiku 4.5 עבר סדרת בדיקות בטיחות מקיפה, שהראתה שיעור נמוך במיוחד של התנהגויות לא רצויות או תגובות לא מתואמות. המודל סווג תחת AI Safety Level 2 (ASL-2) – רמת פיקוח פחות מגבילה מזו של Sonnet 4.5 ו-Opus 4.1, המדורגים ב-ASL-3.

 

מה זה אומר בפועל? שהמודל בטוח לשימוש רחב יותר, כולל בסביבות עבודה, יישומים עסקיים ומערכות למשתמשי קצה, מבלי להיכנס לאזורים רגישים מדי מבחינת תוכן או אוטונומיה. Anthropic מציינת כי Haiku 4.5 הוא המודל הבטוח ביותר שייצרה עד כה לפי המדדים הפנימיים שלה.

 

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס מקיף לבינה מלאכותית - GenAI Master
קורס מאסטר בבינה מלאכותית Master GenAI

 

לסיכום, Claude Haiku 4.5 הוא לא רק עדכון טכנולוגי נוסף, הוא סימן דרך בשינוי שמתחולל בעולם הבינה המלאכותית. פעם גודל המודל היה המדד לעוצמה, אבל היום מה שקובע הוא היכולת לספק ביצועים של מודלים מתקדמים במהירות ובעלות נמוכה.

Haiku 4.5 מוכיח שאפשר להגיע כמעט לאותה רמת אינטליגנציה שמציעים המודלים הגדולים בפחות זמן, בפחות כסף, ועם הרבה יותר גמישות.

 

אם אתם מפתחים בוטים, עוזרים חכמים או מערכות שפועלות בזמן אמת, זה כנראה אחד המודלים המשתלמים והיעילים ביותר שזמינים היום, ומבשר על עתיד שבו האיכות כבר לא נמדדת בגודל, אלא בדיוק ובמהירות.

הפוסט אנטרופיק משיקים את Claude Haiku 4.5 הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/claude-haiku-4-5/feed/ 1
גוגל מחלקת שנה שלמה של Google AI Pro בחינם לסטודנטים בישראל https://letsai.co.il/google-free-for-students/ https://letsai.co.il/google-free-for-students/#comments Thu, 16 Oct 2025 10:17:41 +0000 https://letsai.co.il/?p=61912 שנת הלימודים האקדמית יוצאת לדרך, וגוגל פותחת אותה במהלך יוצא דופן: שנה שלמה של Google AI Pro בחינם לכל סטודנט בישראל. מאחורי ההצעה מסתתרת גישה מלאה ל-Gemini 2.5 Pro, מודל הבינה המלאכותית המתקדם ביותר של גוגל, שיכול לשמש כעוזר אישי ללמידה, מחקר ויצירה – מסיכומי שיעור וכתיבת עבודות ועד הפקת סרטונים ומצגות.     מה […]

הפוסט גוגל מחלקת שנה שלמה של Google AI Pro בחינם לסטודנטים בישראל הופיע ראשון בLet's AI בינה מלאכותית

]]>
שנת הלימודים האקדמית יוצאת לדרך, וגוגל פותחת אותה במהלך יוצא דופן: שנה שלמה של Google AI Pro בחינם לכל סטודנט בישראל. מאחורי ההצעה מסתתרת גישה מלאה ל-Gemini 2.5 Pro, מודל הבינה המלאכותית המתקדם ביותר של גוגל, שיכול לשמש כעוזר אישי ללמידה, מחקר ויצירה – מסיכומי שיעור וכתיבת עבודות ועד הפקת סרטונים ומצגות.

 

מנוי Google AI Pro לשנה שלמה לסטודנטים בישראל

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה כלול בהטבה?

החבילה שגוגל מציעה לסטודנטים כוללת את כל מה שצריך כדי להפוך את הלמידה לדיגיטלית באמת: גישה מלאה ל-Gemini 2.5 Pro, אפשרות ליצירת סרטונים ותוכן מולטימדיה ישירות מה-AI, ושילוב חכם של Gemini בתוך Gmail, ‏Docs, ‏Sheets ו-Slides.

 

בנוסף, נכללת גישה מורחבת ל-NotebookLM – עוזר המחקר שמאפשר לארגן מקורות וליצור תובנות מתוך טקסטים ו-2 טרה-בייט של אחסון בענן Google Drive.

 

מעבר לכלים עצמם, גוגל מדגישה שמטרת המהלך היא לא רק להקל על סטודנטים בעומס המטלות, אלא גם לטפח הבנה עמוקה וחשיבה ביקורתית – כישורים חיוניים לעידן שבו בינה מלאכותית היא כבר לא תוספת, אלא חלק מהאופן שבו לומדים וחושבים.

 

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס מקיף לבינה מלאכותית - GenAI Master
קורס מאסטר בבינה מלאכותית Master GenAI

 

מי זכאי ומה חשוב לדעת

ההטבה זמינה לכל סטודנט פעיל במוסד להשכלה גבוהה בישראל שנכלל בתוכנית הניסיון של Google AI Pro. ההרשמה מיועדת למשתמשים בני 18 ומעלה בלבד ופתוחה עד 9 בדצמבר 2025, ולאחר מכן תסתיים תקופת הניסיון. עם סיומה, המנוי יתחדש אוטומטית בתשלום חודשי של 21.99 אירו, אך ניתן לבטל בכל שלב בקלות דרך החשבון.

 

חשוב לדעת שחלק מהפיצ’רים המתקדמים דורשים מנוי Google One AI Premium, חיבור לאינטרנט וחשבון מתאים לשירותי Google Workspace. 

מיומנות יסוד בעולם החדש

מעבר להטבה עצמה, זהו צעד שמסמן את הכיוון שאליו ההשכלה הגבוהה הולכת – עידן שבו AI הופך לחלק טבעי מתהליך הלמידה. הסטודנטים של היום הם אנשי המקצוע של מחר, והיכולת לעבוד לצד בינה מלאכותית, להבין את את הגבולות שלה ולהפיק ממנה ערך היא לא רק יתרון תחרותי, אלא מיומנות יסוד בעולם החדש.

 

להרשמה, פרטים נוספים ומדריך מומלץ ללמידה עם Gemini, כנסו כאן.

הפוסט גוגל מחלקת שנה שלמה של Google AI Pro בחינם לסטודנטים בישראל הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/google-free-for-students/feed/ 1
איך לחבר אפליקציות ל-ChatGPT ולעבוד איתן ישירות מהצ’אט https://letsai.co.il/connect-apps-chatgpt/ https://letsai.co.il/connect-apps-chatgpt/#respond Thu, 16 Oct 2025 06:47:23 +0000 https://letsai.co.il/?p=61849 אחד העדכונים השימושיים ביותר של ChatGPT מאפשר מעכשיו לעבוד עם אפליקציות ישירות מתוך הצ’אט. במקום לעבור בין חלונות או להעתיק טקסטים, אפשר לבצע פעולות אמיתיות – ליצור מצגת, לעצב דיאגרמה או לתכנן חופשה – הכול באותו ממשק מוכר. זה עדכון קטן שמפשט את העבודה היומיומית והופך את ChatGPT לכלי שמבצע פעולות, לא רק מספק תשובות. […]

הפוסט איך לחבר אפליקציות ל-ChatGPT ולעבוד איתן ישירות מהצ’אט הופיע ראשון בLet's AI בינה מלאכותית

]]>
אחד העדכונים השימושיים ביותר של ChatGPT מאפשר מעכשיו לעבוד עם אפליקציות ישירות מתוך הצ’אט. במקום לעבור בין חלונות או להעתיק טקסטים, אפשר לבצע פעולות אמיתיות – ליצור מצגת, לעצב דיאגרמה או לתכנן חופשה – הכול באותו ממשק מוכר. זה עדכון קטן שמפשט את העבודה היומיומית והופך את ChatGPT לכלי שמבצע פעולות, לא רק מספק תשובות.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה זה Apps@ ואיך משתמשים בזה

אחרי ההכרזות האחרונות של OpenAI בכנס Dev Day, נוספה ל-ChatGPT אפשרות חדשה שמאפשרת להפעיל אפליקציות ישירות מתוך הצ’אט. במקום לעבוד בכלים נפרדים, אפשר עכשיו לשלב אותם בתוך השיחה עצמה, ולתת ל-ChatGPT לבצע פעולות אמיתיות בעזרתן.

 

כשמקלידים את הסימן @ בצ’אט, נפתחת רשימה של אפליקציות (כמו Canva ,Figma ,Coursera ועוד) שאפשר לעבוד איתן ישירות מתוך השיחה. החיבור נעשה בצורה טבעית – פשוט נותנים משימה ומקבלים תוצאה בצ’אט, בזמן אמת ובשפה רגילה.

 

כשמקלידים את הסימן @ בצ’אט, נפתחת רשימה של אפליקציות שאפשר לעבוד איתן ישירות מתוך השיחה

רשימה של אפליקציות שאפשר לעבוד איתן ישירות מתוך השיחה

 

טיפ לשימוש חכם: נסחו את הבקשה שלכם בצורה מדויקת וברורה, כמו שהייתם מדברים עם אדם ולא כמו פקודה טכנית. ככל שהניסוח מדויק יותר, כך גם התוצאה תהיה ממוקדת ורלוונטית יותר.

 

לדוגמה:

  • @Canva צור מצגת בת חמש שקופיות בנושא למידת מכונה.

  • @Booking מצא מלון בלונדון לסוף השבוע, קרוב למרכז העיר ובתקציב של עד 200 יורו ללילה.

  • @Figma צור תרשים זרימה פשוט לתהליך קליטת לקוח חדש.

 

למצוא מלון דרך Booking בלי לצאת מ-ChatGPT

למצוא מלון דרך Booking בלי לצאת מהצ׳אט. Source: OpenAI

דרך נוספת לקרוא לאפליקציה

אפשר גם להפעיל אפליקציות בלי להשתמש בסימן @. אם תתחילו הודעה בשם של אפליקציה, כמו “Spotify, צור לי פלייליסט למסיבה ביום שישי”, ChatGPT יזהה אותה ויפעיל אותה אוטומטית. בנוסף, המערכת יודעת להציע אפליקציות רלוונטיות לשיחה, למשל, אם מדברים על חופשה, היא תציע את Booking, ואם על בית חדש – את Zillow.

 

הקסם של השיטה הזו הוא בשילוב בין אלמנטים אינטראקטיביים מוכרים (כמו מפות, מצגות ופלייליסטים) לבין שיחה טבעית. עם הזמן, OpenAI עצמה וגם מפתחים מבחוץ יוסיפו אפליקציות חדשות ל-ChatGPT, כך שהאפשרויות רק יגדלו.

פרטיות והרשאות

כל האפליקציות שפועלות בתוך ChatGPT נבדקות ומאושרות לפי מדיניות השימוש של OpenAI, כדי להבטיח חוויה בטוחה, מתאימה לכל גיל ושקופה מבחינת שימוש בנתונים. בפעם הראשונה שתשתמשו באפליקציה, ChatGPT יציג חלון הרשאות עם פירוט המידע שעשוי להיות משותף. החלון הזה נועד לוודא שאתם מבינים בדיוק איזה מידע האפליקציה יכולה לגשת אליו ומה נעשה בו. מאשרים פעם אחת – וזה הכול.

 

מכאן והלאה תוכלו להפעיל את האפליקציה בכל שלב ולקבל תוצאות בצ’אט, ללא הגדרות נוספות. ניתן לבטל גישה דרך חלון ההרשאות או מחשבון האפליקציה עצמה. בהמשך השנה צפויות להתווסף גם הגדרות פרטיות מדויקות יותר, שיאפשרו לבחור אילו סוגי מידע כל אפליקציה יכולה להשתמש בהם כדי לשפר תוצאות.

 

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס מקיף לבינה מלאכותית - GenAI Master
קורס מאסטר בבינה מלאכותית Master GenAI

 

למה זה חשוב

Apps@ מרכזת פעולות בשיחה אחת – חיפוש, עיצוב, תכנון ויצירה – וחוסכת קפיצות בין כלים ואתרים. זה חוסך זמן, מפחית עומס קוגניטיבי, ויוצר רצף עבודה טבעי שבו מילים הופכות למעשים. עם הזמן יתווספו עוד אפליקציות באותה שיטה פשוטה: מקלידים, מאשרים, מקבלים תוצאה. ChatGPT לא מחליף את הכלים שלכם – הוא פשוט מחבר ביניהם.

הפוסט איך לחבר אפליקציות ל-ChatGPT ולעבוד איתן ישירות מהצ’אט הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/connect-apps-chatgpt/feed/ 0
האם מודל זעיר חושב חכם יותר ממודל גדול? https://letsai.co.il/tiny-thinking-network/ https://letsai.co.il/tiny-thinking-network/#respond Wed, 15 Oct 2025 06:43:20 +0000 https://letsai.co.il/?p=61804 עולם הבינה המלאכותית רגיל למדוד הצלחה בגודל – יותר שכבות, יותר כוח מחשוב, יותר פרמטרים. אבל מחקר חדש טוען ההפך – לפעמים דווקא הקטנים חושבים טוב יותר. למה מודלים חכמים שמסכמים מאמרים וכותבים קוד נכשלים בחידת סודוקו פשוטה? כי הם עונים ברצף אחד ארוך, בלי לעצור, לבדוק ולתקן. בני אדם, לעומת זאת, פותרים צעד אחר […]

הפוסט האם מודל זעיר חושב חכם יותר ממודל גדול? הופיע ראשון בLet's AI בינה מלאכותית

]]>
עולם הבינה המלאכותית רגיל למדוד הצלחה בגודל – יותר שכבות, יותר כוח מחשוב, יותר פרמטרים. אבל מחקר חדש טוען ההפך – לפעמים דווקא הקטנים חושבים טוב יותר. למה מודלים חכמים שמסכמים מאמרים וכותבים קוד נכשלים בחידת סודוקו פשוטה? כי הם עונים ברצף אחד ארוך, בלי לעצור, לבדוק ולתקן. בני אדם, לעומת זאת, פותרים צעד אחר צעד, עם מחיקות, ניסיונות חוזרים ותיקונים. החוקרת Alexia Jolicoeur-Martineau ממעבדת הבינה המלאכותית של Samsung במונטריאול הצליחה ללמד רשת קטנה לחשוב באותה צורה, וכשהיא עשתה את זה, קרה דבר מפתיע – היא עקפה מודלים גדולים פי מאה אלף ממנה.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

כשחוכמה גדולה נתקעת על חידות קטנות

מודלי שפה גדולים כמו ChatGPT, Gemini  ו-Claude יודעים לכתוב קוד, לסכם מאמרים ולנהל שיחות מורכבות, אבל כשמעמידים אותם מול חידות לוגיות פשוטות לכאורה, כמו סודוקו או מבוכים, הם עדיין מתקשים. הם חושבים ב“קו ישר“ – מייצרים תשובה בניבוי קדימה (forward pass), מילה אחרי מילה ושלב אחרי שלב, בלי לעצור ולבדוק אם ההיגיון עדיין נכון. טעות מוקדמת גוררת שרשרת טעויות בהמשך.

 

הקושי הזה נחשף במיוחד במבחן ARC-AGI – סדרת חידות חזותיות שנועדה לבדוק אם מודלים באמת “מבינים” דפוסים חדשים, ולא רק משננים דוגמאות. בגרסה הראשונה של המבחן (ARC-AGI-1), מודל o3 של OpenAI השיג תוצאות מרשימות – כ-75.7% בתצורת חישוב מוגבלת, ועד 87.5% בתצורת חישוב גבוהה. אבל בגרסה המתקדמת יותר (ARC-AGI-2), שמודדת יצירתיות ויכולת למידה אמיתית, כמעט כל המודלים נתקעים סביב אחוזים בודדים בלבד. לדוגמה, Gemini 2.5 Pro (Preview) הגיע לכ-3.8%, ו-o3-pro (high) ל-4.9% בלבד – נתונים שממחישים עד כמה גם המערכות המתקדמות בעולם עדיין מתקשות באמת “להבין” ולא רק “לחזות”.

 

במילים פשוטות, למרות ההתקדמות המרשימה, רוב המודלים הגדולים עדיין לא באמת “חושבים”. הם מעולים בזיכרון, בחיזוי ובשפה, אבל לא בהיגיון הדרגתי ובתיקון עצמי בזמן אמת.

לחשוב בלולאות

כדי להתגבר על המגבלה הזו של היעדר היכולת “לחשוב בלולאות”, חוקרים ניסו לפתח ארכיטקטורות חדשות שמדמות תהליך חשיבה אנושי אמיתי. אחת מהניסיונות הבולטים הייתה מודל בשם HRM (Hierarchical Reasoning Model), מודל חשיבה היררכי שניסה לשלב שתי רשתות נוירונים שפועלות בתדרים שונים: אחת “מהירה” ואחת “איטית”. הרעיון היה חכם, אבל היישום היה מסורבל. HRM כלל 27 מיליון יחידות למידה, נשען על תיאוריה מתמטית מורכבת, והצדיק את עצמו בהסברים ביולוגיים שהיו קשים להבנה גם למומחים.

 

החוקרת Alexia Jolicoeur-Martineau שאלה שאלה פשוטה: האם באמת צריך את כל זה? היא לקחה את אותו רעיון בסיסי, רשת שחושבת בלולאות, ופישטה אותו לחלוטין. כך נולד Tiny Recursive Model (TRM): רשת אחת, קטנה, שחוזרת על עצמה עד 16 פעמים. בכל סיבוב היא בוחנת את השאלה, את התשובה הנוכחית ואת “הערות לעצמה” מהפעמים הקודמות, ומשפרת את הפתרון בהדרגה.

כשפשטות גוברת על כוח

שני עקרונות פשוטים הופכים אותה ליעילה במיוחד:

1. משוב בשלבים (Deep Supervision) – בכל שלב המודל מקבל רמז אם הוא מתקרב לתשובה הנכונה, ממש כמו במשחק “קר-חם”, שבו אתה יודע שאתה בדרך הנכונה כששומעים “חם… חם יותר”.

2. החלטה מתי לעצור (ACT) – אם התשובה כבר נכונה אחרי שלושה סבבים, הוא מפסיק ולא מבזבז חישובים. כך הוא מספיק להתאמן על יותר דוגמאות שונות ולומד מהר יותר.

 

התוצאות מדברות בעד עצמן – TRM הזעיר, עם כ-7 מיליון יחידות למידה בלבד, הגיע ל-44.6% ב-ARC-AGI-1 ול-7.8% ב-ARC-AGI-2. בגרסה קטנה עוד יותר של 5 מיליון יחידות, הוא פתר חידות סודוקו קשות בדיוק של 87.4%, והצטיין גם במבוכים עם 85.3%, לעומת 74.5% של HRM הגדול.

 

הפשטות הזו לא רק חוסכת כוח מחשוב, היא גם מוכיחה שמחשבה מחזורית קטנה יכולה להביס כוח גולמי עצום.

למה זה חשוב

המחקר הזה מערער על אחת ההנחות העמוקות ביותר בעידן הבינה המלאכותית והוא שגודל שווה אינטליגנציה. כשניסו להגדיל את הרשת משתי שכבות לארבע שכבות, הביצועים דווקא הידרדרו. יותר פרמטרים לא הביאו להבנה טובה יותר, רק לזיכרון עמוק יותר.

 

TRM מציע אלטרנטיבה: עומק שנוצר לא מנפח, אלא מחזרות חכמות. הוא לומד בהדרגה, מתקן את עצמו, ומגיע לתוצאה מדויקת יותר, בדיוק כפי שבני אדם עושים כשאנחנו חושבים. היתרון אינו רק רעיוני אלא גם מעשי. רשת זעירה כזו יכולה לרוץ על מחשב נייד רגיל או אפילו על טלפון, בלי צורך בחיבור לענן ובלי לצרוך כמויות עצומות של חשמל. זה שינוי משמעותי בעידן שבו מודלים ענקיים דורשים חוות שרתים שלמות וצריכת אנרגיה של מדינות קטנות.

 

ובעומק הדברים – זה שינוי כיוון מחשבתי. במקום להוסיף שכבות, TRM מוסיף דרך חשיבה: הוא חוזר, בוחן, משפר, ומחליט מתי לעצור. זהו עקרון פשוט שמזכיר את האופן שבו המוח האנושי לומד, ומרמז על דור חדש של AI שמצליח לא רק “לדעת”, אלא גם להבין.

 

היישומים פותחים אופקים חדשים – הוכחות מתמטיות, תכנון תנועות רובוטים, ניפוי באגים בקוד – כל משימה שבה נדרשת חשיבה מדויקת יותר מידע רחב. אבל אולי החשוב מכל, המחקר הזה מזכיר לנו שהאינטליגנציה האמיתית לא תמיד נמדדת בכמות, אלא באיכות החשיבה.

לא שיחה, אלא חשיבה

TRM הוא לא מודל כללי לשיחות, כתיבה או יצירת טקסט. הוא אומן על שאלות שיש להן תשובה אחת נכונה, כמו סודוקו ומבוכים, ולכן אינו מתאים למשימות פתוחות או דמיון חופשי. אבל זו לא חולשה, זו בחירה – הוא נבנה כדי לחשוב בצורה ממוקדת, צעד אחרי צעד, ולא לזרוק רעיונות באוויר. זה לא מוח שמדבר, זה מוח שבוחן, מתקן ומגיע למסקנה. כלי מדויק לחשיבה, לא לשיחה.

 

 

לסיכום, המחקר של Alexia Jolicoeur-Martineau מזכיר עיקרון פשוט אבל מהפכני – כדי לחשוב חכם יותר, לא צריך בהכרח לחשב יותר. רשת זעירה אחת, שחוזרת על עצמה ולומדת מתוך תהליך החשיבה שלה, יכולה לנצח מערכות ענקיות פי מאה אלף ממנה. ההתקדמות הבאה בבינה מלאכותית תגיע כנראה פחות מהוספת שכבות ושרתים, ויותר מהבנה עמוקה של איך חשיבה אמיתית באמת עובדת – גם אצל מכונות, וגם אצלנו.

 

למי שרוצה לצלול לעומק – המחקר המלא זמין כאן.

הפוסט האם מודל זעיר חושב חכם יותר ממודל גדול? הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/tiny-thinking-network/feed/ 0
ה-5% שכן הצליחו: כך נראית טרנספורמציית AI אמיתית עם Claude https://letsai.co.il/companies-implement-ai/ https://letsai.co.il/companies-implement-ai/#respond Mon, 13 Oct 2025 08:18:20 +0000 https://letsai.co.il/?p=61789 כולנו מדברים על זה ש-95% מהפיילוטים של בינה מלאכותית נכשלו. אבל מה עם ה-5% שכן הצליחו – אלה שהפסיקו “לשחק” עם AI והתחילו לשנות את העסק מבפנים? פחות תיאוריה, יותר תוצאות. רוב המנהלים כבר שמעו על הפוטנציאל של בינה מלאכותית, אבל מעט מאוד ראו איך זה נראה כשהיא באמת מוטמעת בארגון. יש חברות שכבר עברו […]

הפוסט ה-5% שכן הצליחו: כך נראית טרנספורמציית AI אמיתית עם Claude הופיע ראשון בLet's AI בינה מלאכותית

]]>
כולנו מדברים על זה ש-95% מהפיילוטים של בינה מלאכותית נכשלו. אבל מה עם ה-5% שכן הצליחו – אלה שהפסיקו “לשחק” עם AI והתחילו לשנות את העסק מבפנים? פחות תיאוריה, יותר תוצאות. רוב המנהלים כבר שמעו על הפוטנציאל של בינה מלאכותית, אבל מעט מאוד ראו איך זה נראה כשהיא באמת מוטמעת בארגון. יש חברות שכבר עברו מהבטחות למציאות, והן לא מדברות על צ’אטבוטים פשוטים. הן משתמשות ב-Claude, מודל השפה המתקדם של Anthropic, כדי לפתור בעיות עסקיות אמיתיות – לקצר תהליכי פיתוח מחודשים לשבועות, להפחית את זמן התגובה לפרצות אבטחה, וליצור תיעוד רגולטורי בדקות במקום בחודשים. Claude Sonnet 4.5, הגרסה החדשה של המודל, מתבלט במיוחד בתחומים שבהם דיוק הוא קריטי – קוד, סייבר ושירותים פיננסיים. זה כבר לא כלי עזר, אלא שותף שמבין הקשר, מנתח מידע מורכב ולוקח החלטות. הנה חמישה סיפורים שמראים איך נראית טרנספורמציית AI אמיתית.

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מ-10 שבועות ל-10 דקות

Novo Nordisk, החברה הדנית שמאחורי Ozempic נתקלה באחת הבעיות הכואבות ביותר בתעשיית התרופות – תיעוד רגולטורי. דוח מחקר קליני ממוצע מגיע ליותר מ-300 עמודים, וכותב מקצועי מצליח להפיק רק שניים-שלושה כאלה בשנה. כל יום עיכוב בתהליך הזה שווה עד 15 מיליון דולר בהכנסות אבודות, ובעיקר, עוד יום שבו חולים ממתינים לטיפולים שיכולים להציל חיים.

 

כדי להתמודד, Novo Nordisk השוותה בין ספקי בינה מלאכותית ובחרה ב-Claude של Anthropic בזכות הדיוק בעיבוד נתונים קליניים. היא בנתה פלטפורמה ייעודית בשם NovoScribe, שמשלבת את Claude דרך Amazon Bedrock עם חיפוש סמנטי ותכנים מאושרים על ידי מומחים. התוצאה: מערכת שמפיקה דוחות ברמת איכות רגולטורית שמקבלת אישור חיובי שוב ושוב מהרגולטורים.

 

המספרים מדברים בעד עצמם – תיעוד שלקח למעלה מעשרה שבועות – נוצר כעת בעשר דקות בלבד. מחזורי בדיקה התקצרו בחצי, והאיכות דווקא השתפרה. אפילו פרוטוקולי אימות רפואיים שמעסיקים מחלקות שלמות מטופלים היום על ידי אדם אחד.

 

עם Claude Code, גם עובדים לא-טכניים מפתחים פיצ’רים חדשים בשעות במקום בשבועות. צוות הפיתוח הקטן של 11 אנשים הרחיב את היכולות הארגוניות משמעותית, בלי להוסיף כוח אדם. “בתעשייה מוסדרת מאוד, אנחנו לא יכולים פשוט לזרוק את הנתונים שלנו למודל שפה ולקוות למיטב,” אומר וואהיד ג’ווייה (Waheed Jowiya), מנהל אסטרטגיית הדיגיטציה של החברה. “העבודה עם Anthropic הראתה לנו איך עושים את זה נכון ובצורה מאובטחת.”

התאמה אישית בקנה מידה

Cox Automotive, החברה הגדולה בעולם לשירותים בתחום הרכב, גילתה איך בינה מלאכותית יכולה להפוך מערכת CRM שגרתית למנוע שיווקי חכם. החברה שילבה את Claude בשלוש הפלטפורמות המרכזיות שלה – VinSolutions CRM, Autotrader PSX ו-Dealer.com – ובחרה בו בזכות שלושה מדדים קריטיים: מהירות תגובה, עלות ודיוק.

 

במקום מודל אחד שמתאים לכולם, הם מפעילים שניים: Claude Sonnet למשימות מורכבות שדורשות הבנה עמוקה, ו-Claude Haiku לתרחישים עתירי נפח שבהם נדרשת תגובה כמעט מיידית. התוצאה נראית בשטח – תגובות לפניות צרכנים ותורים לנסיעות מבחן יותר מהוכפלו, ורשימות רכבים שנוצרו על ידי AI זוכות ל-80% משוב חיובי ממוכרים.

 

אם בעבר לקח שבועות להפיק תוכן לאתרי סוכנויות, היום זה קורה באותו יום. עד כה הפיקה הפלטפורמה למעלה מ-9,000 תוצרים שיווקיים ללקוחות ברחבי העולם. “Claude מדורג בעקביות בין המודלים המתקדמים ביותר,” אומר בן פלוסברג (Ben Flusberg), מנהל הנתונים הראשי ב-Cox Automotive. “עם כל עדכון הוא דוחף את החדשנות קדימה.”

פיתוח מאובטח ומהיר יותר

בחברת הסייבר הגדולה בעולם, Palo Alto Networks, גילו בעיה מוכרת – מפתחים השקיעו כשליש מזמנם בשלב הפיתוח הראשוני, בדיוק השלב שבו מתגלים הבאגים הקריטיים ביותר. מפתחים חדשים נדרשו לחודשים כדי להבין את הקוד-בייס העצום של החברה ולתרום באופן אפקטיבי. כדי לשבור את צוואר הבקבוק הזה, Palo Alto Networks חיפשה פתרון AI שיכול לשלב בין בטיחות קפדנית ליעילות הנדסית גלובלית.

 

לאחר השוואה בין ספקים, החברה בחרה ב-Claude דרך פלטפורמת Vertex AI של Google Cloud, בזכות ביצועי הקוד הגבוהים, תקני האבטחה והאינטגרציה החלקה עם מערכות הפיתוח. השפעת השינוי הייתה דרמטית – מהירות פיתוח הפיצ’רים עלתה ב- 30%-20%, וזמן ההכשרה של מפתחים חדשים התקצר מחודשים לשבועות.

 

כיום עובדים עם Claude כ-2,500 מפתחים, והמספר צפוי לעלות ל-3,500. גם מפתחים זוטרים ללא ניסיון קודם הצליחו לבצע אינטגרציות 70% מהר יותר הודות להכוונה של Claude.

 

בנוסף, Palo Alto Networks מובילה כעת מערכת AI חדשנית ל-CI/CD (תהליכי אינטגרציה ופריסה רציפה), שמבצעת אוטומציה חכמה: משפרת שמות משתנים, מוסיפה הערות ומייצרת בדיקות יחידה – הכול בזמן אמת. “Anthropic תעדפה בטיחות ואבטחה הרבה יותר מכל מודל אחר,” אומר גונג’ן פאטל (Gunjan Patel), מנהל ההנדסה של החברה. “הם מדברים על השלכות אבטחה בכל פגישה. כחברת הסייבר הגדולה בעולם, זה משמעותי במיוחד עבורנו.”

סוכנים אוטונומיים בפעולה

ארגונים כבר לא מסתפקים בעוזרי AI שמציעים תשובות, הם צריכים מערכות שחושבות, מנמקות ופועלות בעצמן. בדיוק לשם כך שילבה Salesforce את מודלי Claude כדי להפעיל את Agentforce Agents דרך Einstein 1 Studio (סטודיו לפיתוח בינה מלאכותית ארגונית).

 

התוצאה היא פלטפורמה שבה בינה מלאכותית יכולה לתכנן, להחליט ולבצע פעולות בשם עובדים ולקוחות, בלי תלות בהתערבות אנושית מתמדת. כל אינטראקציה עם Claude עוברת דרך שכבת ההגנה של Salesforce, הכוללת grounding דינמי (חיבור למידע מאומת בזמן אמת) וזיהוי טוקסיות (מנגנון שמגן על המשתמשים מתוכן מזיק, לא הולם או לא אתי שנוצר על ידי הבינה המלאכותית) דרך Einstein Trust Layer. כך נשמר שימוש אחראי ובטוח גם בתעשיות רגישות במיוחד.

 

לקוחות Salesforce כבר מפעילים סוכנים אוטונומיים שמתזמרים תהליכי עבודה שלמים מקצה לקצה – ניתוח נתוני לקוחות, זיהוי הזדמנויות עסקיות, ביצוע טרנזקציות ועדכון נתונים בין מערכות שונות, והכול באופן עצמאי.

 

זהו שינוי מהותי, ממודלים שמשמשים עוזרים, למודלים שהם שותפים אוטונומיים. מפתחים יכולים להתאים את הסוכנים לפי תחום – מכירות, שיווק או שירות לקוחות – ולבחור בכל שלב את גרסת Claude שמאזנת בין אינטליגנציה, מהירות ועלות לכל תהליך עבודה ספציפי.

מאנליטיקה לשיווק גלובלי

כש-IG Group, אחת מחברות המסחר המקוון הגדולות בעולם, בחנה ספקי בינה מלאכותית שונים, Claude בלט באופן עקבי, במיוחד במקרי השימוש המורכבים ביותר שלה.

 

צוות ה-Data & AI Transformation של החברה פרס את Claude באופן אסטרטגי – לאוטומציה של תהליכי עבודה אנליטיים מסובכים, לתמיכה במנהלי HR ביצירת משוב עקבי על ביצועים ברחבי העולם, ולהעצמת צוותי השיווק להפיק תוכן רב-לשוני תוך עמידה בתקנות רגולציה מחמירות.

 

התוצאות היו מעבר לציפיות. צוותי האנליטיקה חוסכים כיום כ-70 שעות עבודה בשבוע, זמן שהועבר לעבודה אסטרטגית בעלת ערך גבוה יותר. במקרים מסוימים, הפרודוקטיביות הוכפלה. בצד השיווקי, מהירות ההשקה השתפרה במאות אחוזים, תוך הפחתת התלות בסוכנויות חיצוניות. החברה הגיעה ל-ROI מלא בתוך שלושה חודשים בלבד.

 

Anthropic היא חברת ה-AI היצרנית היחידה שסיפקה תוצאות בזמן – כל הזמן,” אומרת אולגה פירוג (Olga Pirog), ראש הטרנספורמציה הגלובלית של Data ו-AI ב-IG Group. “לארגון שמוביל שינוי עסקי, שותף אמין הוא נכס שאין לו תחליף.”

 

 

הטמעה יעילה של בינה מלאכותית בארגונים

כשמסתכלים על החברות שהצליחו באמת, מתברר שהן עושות כמה דברים אחרת.

 

ראשית, הן מתחילות מבעיה עסקית אמיתית. לא “AI בשביל ה-AI”, אלא טיפול בצווארי בקבוק מדידים – תהליכי עבודה ידניים, תיעוד שמאט השקות, או חניכה שיכולה להתקצר מחודשים לשבועות.

 

שנית, הן משקיעות באנשים לא פחות מבטכנולוגיה. תוכניות הכשרה ורשתות של “אלופי AI” עוזרות לעובדים לשלב את הכלים בעבודה היומיומית. כשהצוות מבין לא רק איך להשתמש במערכת אלא למה, האימוץ קורה מעצמו.

 

שלישית, הן מודדות את מה שבאמת חשוב. פרודוקטיביות, חיסכון בזמן, שיפור באיכות – כל נתון הופך להוכחת ROI שמדברת בשפה של ההנהלה, לא של ההייפ. גישה מבוססת מדידה שכזו מייצרת תוצאות מתמשכות ולא הדגמות חולפות.

 

ולבסוף, הן בונות לסקייל מהיום הראשון. אינטגרציה, אבטחה ואמון אינם תוספת, הם הבסיס. מי שרואה בינה מלאכותית כטרנספורמציה ארגונית ולא כניסוי טכנולוגי, מתקדם מהר יותר ומשיג תוצאות יציבות יותר.

 

חמש החברות האלה ועוד כאלה שלא הזכרנו כאן כבר מוכיחות את זה. הן מרחיבות את השימוש ב-Claude, בונות מערכות אג’נטיות שמעצבות מחדש תהליכי עבודה, ומראות מהי טרנספורמציית AI אמיתית. ולמי שעדיין מתלבט, השאלה כבר לא “האם להשתמש בבינה מלאכותית”, אלא ״איך להטמיע אותה נכון״. התשובה, כמו שהחברות האלה מוכיחות, מתחילה במדידה, ממשיכה באימון, ונגמרת בתוצאות שאי אפשר להתעלם מהן.

הפוסט ה-5% שכן הצליחו: כך נראית טרנספורמציית AI אמיתית עם Claude הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/companies-implement-ai/feed/ 0
מודל השפה Claude של Anthropic ישולב במוצרי IBM https://letsai.co.il/anthropic-ibm-partnership/ https://letsai.co.il/anthropic-ibm-partnership/#respond Sat, 11 Oct 2025 15:07:23 +0000 https://letsai.co.il/?p=61684 בעוד OpenAI ו-Microsoft מכתיבות את הקצב בצד הצרכני של הבינה המלאכותית, ו-Google ממשיכה לחזק את מעמדה כתשתית המרכזית בענן וב-AI הארגוני, IBM ו-Anthropic מאחדות כוחות בזירה הרווחית אך השקטה יותר – ה-AI לארגונים. השבוע הודיעו השתיים כי מודל השפה Claude של Anthropic ישולב במוצרי IBM, תחילה בסביבת הפיתוח החדשה Watsonx Code Assistant, ובהמשך בשירותים נוספים. […]

הפוסט מודל השפה Claude של Anthropic ישולב במוצרי IBM הופיע ראשון בLet's AI בינה מלאכותית

]]>
בעוד OpenAI ו-Microsoft מכתיבות את הקצב בצד הצרכני של הבינה המלאכותית, ו-Google ממשיכה לחזק את מעמדה כתשתית המרכזית בענן וב-AI הארגוני, IBM ו-Anthropic מאחדות כוחות בזירה הרווחית אך השקטה יותר – ה-AI לארגונים. השבוע הודיעו השתיים כי מודל השפה Claude של Anthropic ישולב במוצרי IBM, תחילה בסביבת הפיתוח החדשה Watsonx Code Assistant, ובהמשך בשירותים נוספים. מאחורי ההכרזה הזו מסתתר מהלך אסטרטגי שעשוי לשנות את מאזן הכוחות בעולם ה-AI לעסקים.

 

יבמ בשיתוף פעולה עם אנטרופיק

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

המספרים מספרים את הסיפור

שוק ה-AI הארגוני עובר שינוי מהותי. Anthropic, שנחשבה ב-2023 לשחקנית משנית, מצמצמת במהירות את הפער מ-OpenAI ובמגזרים מסוימים, כמו פיננסים ובריאות, כבר זוכה להעדפה. לפי ניתוח של קרן ההון סיכון Menlo Ventures מיולי 2025, Anthropic מחזיקה כיום בכ-32% משוק ה-LLM הארגוני, כשהמתחרות העיקריות שלה – OpenAI, Google ו-Meta – מחזיקות בכ-25%, 20% ו-9% בהתאמה, מהפך של ממש לעומת 2023, אז OpenAI החזיקה בכ-50% ו-Anthropic רק ב-12%.

 

בתחום הפיתוח הפער בולט אפילו יותר – Claude מחזיק בכ-42% משוק ה-AI לפיתוח קוד, כמעט פי שניים ממודל GPT. מפתחים מציינים כי לצד ביצועים טכניים גבוהים, Claude מציע חלון הקשר רחב במיוחד לעיבוד קבצי קוד ומסמכים ארוכים במקביל, וכן רמת אמינות גבוהה ושיעור נמוך של “הזיות” (hallucinations) בהשוואה למודלים אחרים בקטגוריה. כל התכונות האלה הפכו אותו לכלי מועדף בפרויקטים רגישים ובמערכות קריטיות.

 

הנה תרשים שמדגים את נתחי השוק המעודכנים של ספקיות LLM בשוק הארגוני ובתחום הפיתוח:

 

מפת ה-AI הארגוני משתנה במהירות

Source: Menlo Ventures – The New Map of Enterprise AI

 

המגמות הללו מסבירות למה דווקא IBM בחרה לשתף פעולה עם Anthropic – השוק הארגוני נוטה בבירור לכיוון Claude, ומבין כל המודלים בשוק הוא נתפס כיום כמתאים ביותר לצרכים של לקוחות אנטרפרייז.

מה כולל השילוב?

עבור IBM, שילוב Claude הוא צעד אסטרטגי שנועד להציב את watsonx כמתחרה ישירה ל-OpenAI בשוק הפיתוח הארגוני. בשלב הראשון ישולב Claude ב-watsonx Code Assistant for Enterprise, הזמין כעת בגרסת Preview. בהמשך מתוכננת הרחבה הדרגתית לשירותים נוספים מתוך חבילת watsonx, אך טרם פורסם לוח זמנים רשמי. בפיילוט פנימי עם כ-6,000 עובדי IBM דווח על שיפור ממוצע של 45% בפרודוקטיביות.

 

שתי החברות הציגו מדריך המבוסס על Model Context Protocol (MCP) – סטנדרט פתוח שפותח ב-Anthropic ואומץ ב-2025 על ידי חברות נוספות, במטרה לאפשר אינטגרציה בטוחה ופתוחה בין מודלי שפה למערכות ארגוניות. אף שפרטי ההסכם לא פורסמו, המהלך ממקם את IBM ו-Anthropic במרכז המאמץ לעיצוב סטנדרטים חדשים ל-AI ארגוני, תחום שצפוי להפוך לאחד הקריטיים בעולם העסקי.

למה ארגונים מעדיפים את Claude?

בעולם הארגוני, מהירות כבר אינה הערך העליון, אלא אמינות, ציות רגולטורי ויכולת שליטה. כאן בדיוק נכנס Claude – מודל חזק אך צפוי, שנבנה מראש סביב עקרונות בטיחות ושקיפות.

 

Claude עומד בתקני פרטיות מחמירים כמו GDPR ו־HIPAA, ולכן הפך לבחירה טבעית של בנקים, חברות ביטוח וגופים רפואיים. שיתוף הפעולה עם IBM מעניק לו יתרון נוסף – התאמה למערכות Legacy ו-Mainframe ותיקות, שמאפשרת שילוב AI גם בארגונים שלא יכולים להרשות לעצמם להחליף תשתיות.

 

ארגונים מדווחים גם על ירידה בשיעור ה”הזיות” ועל רמת דיוק גבוהה במיוחד במשימות קריטיות כמו ניתוח חוזים, תיעוד טכני וכתיבת קוד. במילים פשוטות, Claude לא מנסה להיות המודל הכי יצירתי, אלא הכי צפוי, הכי בטוח והכי אמין.

AI לעובדים מול AI לארגונים

השותפות בין IBM ל-Anthropic מסמלת שינוי עמוק בסדרי העדיפויות של העולם הארגוני. אחרי שנים שבהן מהירות וחדשנות היו הערכים המובילים, היום ארגונים שמים דגש על דיוק, בקרה וציות רגולטורי. Anthropic ביססה לעצמה מוניטין של ספקית אמינה, בעוד OpenAI ממשיכה להוביל בצד הצרכני והיצירתי של השוק.

 

המציאות כבר איננה שאלה של “מי הכי טוב”, אלא של “מה מתאים למי”. Claude נבנה עבור מוסדות פיננסיים, חברות ביטוח ופרויקטי קוד מורכבים, מקומות שבהם טעות אחת עלולה לעלות מיליונים. ChatGPT, לעומת זאת, נשאר הכלי המועדף על עובדים וצוותים קטנים למשימות מהירות כמו כתיבה, סיעור מוחות ואוטומציה פשוטה.

 

כך הולכת ונוצרת הבחנה ברורה בין שני עולמות: AI צרכני, שהוא מהיר, גמיש ונגיש לכל אחד, ו-AI ארגוני שהוא יותר מדויק, מבוקר ומוגן בשכבות אבטחה וציות. IBM ו-Anthropic מהמרות על העולם השני, זה שבו אמינות גוברת על מהירות, ורגולציה על יצירתיות.

הפוסט מודל השפה Claude של Anthropic ישולב במוצרי IBM הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/anthropic-ibm-partnership/feed/ 0
האם ChatGPT בדרך להפוך למערכת ההפעלה של העתיד? https://letsai.co.il/openai-dev-day-2025/ https://letsai.co.il/openai-dev-day-2025/#respond Tue, 07 Oct 2025 10:03:54 +0000 https://letsai.co.il/?p=61454 סם אלטמן עלה אתמול לבמה של אירוע המפתחים השנתי של OpenAI, ה-Dev Day 2025, ושינה שוב את חוקי המשחק. זו לא עוד השקה או עדכון גרסה. הפעם, OpenAI הכריזה על מהלך שמסמן עידן חדש – ChatGPT כבר לא רק “צ’אט חכם” – הוא הופך לפלטפורמה שלמה, שבה אפשר לבנות, להפעיל ולהשתמש באפליקציות ישירות בתוך חלון […]

הפוסט האם ChatGPT בדרך להפוך למערכת ההפעלה של העתיד? הופיע ראשון בLet's AI בינה מלאכותית

]]>
סם אלטמן עלה אתמול לבמה של אירוע המפתחים השנתי של OpenAI, ה-Dev Day 2025, ושינה שוב את חוקי המשחק. זו לא עוד השקה או עדכון גרסה. הפעם, OpenAI הכריזה על מהלך שמסמן עידן חדש – ChatGPT כבר לא רק “צ’אט חכם” – הוא הופך לפלטפורמה שלמה, שבה אפשר לבנות, להפעיל ולהשתמש באפליקציות ישירות בתוך חלון השיחה. מה זה אומר בפועל, ולמה זה כל כך משמעותי?

 

לפני שנענה על זה בהרחבה, כדאי לצפות ב-Keynote המלא של אלטמן – הרצאה שמציגה את הדרך החדשה שבה OpenAI חושבת על פיתוח, חדשנות ועתיד הבינה המלאכותית. זה לא עוד אירוע טכנולוגי – זו ממש הצצה לעתיד של האינטרנט.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

אפליקציות בתוך ChatGPT

ההכרזה הגדולה ביותר של הערב היא Apps SDK – ערכת פיתוח חדשה שמאפשרת לבנות אפליקציות שפועלות ישירות בתוך ChatGPT, בלי לצאת מהצ’אט. עד היום היינו “מדברים” עם בוט של חברה, ואז נאלצים לעבור לאתר שלה כדי להזמין, לשלם או לבצע פעולה. מהיום – הכול קורה באותו מקום. במהלך הדמו באירוע, OpenAI הציגה כמה דוגמאות שממחישות את הפוטנציאל:

  • ציור חופשי שהפך אוטומטית לעיצוב ב-Figma (מה שהקפיץ את מניית החברה ב-15%).

  • בנייה של מצגת שלמה ב-Canva, מבלי לעזוב את השיחה.

  • חיפוש דירה ב-Zillow, כולל סינון, הצגת תוצאות והמשך לתהליך הרכישה.

במילים פשוטות, OpenAI בונה App Store חדש, רק בתוך הצ’אט. מפתחים יוכלו להגיש אפליקציות לאישור, משתמשים יוכלו להתקין ולשלב אותן בשיחות, ובקרוב, גם לשלם עליהן ישירות, בזכות שיתוף הפעולה עם Stripe ו-Shopify. זו לא עוד תוספת נוחה, זו מהפכה של ממש באופן שבו אנחנו מתקשרים עם טכנולוגיה.

 

 

סוף לעבודה עם אינסוף כלים

אחת ההכרזות הבולטות באירוע היא AgentKit – סביבת פיתוח חדשה שמאפשרת לבנות “סוכני בינה מלאכותית” בצורה ויזואלית ונגישה. אם בעבר נדרשנו לחבר בין עשרות כלים עם Make ,Zapier או n8n כדי ליצור תהליכי אוטומציה, כעת אפשר להרכיב Agent אחד בממשק Drag & Drop, שמתחבר ישירות למודלים של OpenAI ולפרוטוקול ה- MCP שלהם.

 

בתוך AgentKit פועלת מערכת של כלים משלימים שמכסה את כל מחזור החיים של הסוכן: Agent Builder מספק ממשק גרפי ליצירת תהליכי עבודה בלי לכתוב קוד, Connector Registry מאפשר לחבר מקורות נתונים וכלי צד שלישי – ממערכות CRM ועד גיליונות נתונים, ChatKit משלב ממשקי צ’אט חכמים בתוך מוצרים קיימים, ו-Evals מספק כלים למדידה ובקרה כדי לשפר את ביצועי הסוכנים לאורך זמן.

 

השילוב הזה הופך את AgentKit לפלטפורמה מלאה שמרכזת את שלבי התכנון, החיבור, ההפעלה והאופטימיזציה – הכול במקום אחד. יחד עם זאת, חשוב לזכור שהמערכת משאירה אתכם בתוך האקוסיסטם של OpenAI. לכן, למרות שהממשק נראה ידידותי ומעוצב, הוא אינו תחליף מלא לכלים פתוחים כמו n8n, אלא כלי משלים שמתמקד בתרחישים מבוססי ChatGPT ובשיפור הדיוק של התוצרים.

 

 

מנועי העומק שמחזקים את הפלטפורמה

כדי שכל המערכת החדשה של OpenAI תפעל, היה צורך לחזק את היסודות – את המנועים שמניעים את הקסם מאחורי הקלעים. במרכז השדרוגים עומדים ארבעה מנועים עיקריים, שכל אחד מהם מוסיף שכבה קריטית לפלטפורמה החדשה.

 

הראשון הוא GPT-5 Pro, הגרסה המדויקת והחזקה ביותר של GPT עד כה, הזמינה גם דרך ה-API. זהו הבסיס שעליו יתבססו סוכנים ואפליקציות עתידיים. לצידו מגיע Sora 2, הדור החדש של מודל הווידאו הגנרטיבי, שמסוגל לייצר סרטונים ישירות מטקסט, ולראשונה גם דרך API פתוח. Codex, מנוע הקוד של החברה, יוצא סוף-סוף מגרסת הבטא ומקבל אינטגרציות עמוקות עם Slack, GitHub וכלים ניהוליים נוספים, מה שהופך אותו לכלי עבודה יומיומי אמיתי למפתחים. ולבסוף Real-Time Voice Mini, גרסה קלה וזולה בהרבה של מודל הקול בזמן אמת, שמפחיתה עלויות בכ-70 אחוזים ומקרבת את היכולת לקיים שיחות קוליות חכמות לכל עסק.

 

במילים פשוטות, OpenAI לא רק הוסיפה פיצ’רים, היא חיזקה את השרירים הטכנולוגיים שמאפשרים להפוך את ChatGPT ממנוע שיחה למערכת הפעלה שלמה, המסוגלת לתקשר, לנתח, ליצור ולתפעל בזמן אמת.

לאן כל זה הולך ומה המשמעות העסקית

כדי להבין את גודל המהלך, צריך להתרחק מהפרטים ולהביט בתמונה הרחבה. במשך כשנתיים OpenAI פעלה כחברת מוצר – עם צ’אט, מודלים ו-API. כעת היא עוברת שינוי עמוק – מיצרן כלי בינה מלאכותית לחברת פלטפורמה, שבונה סביב ChatGPT מערכת שלמה של חוויות, שירותים ועסקים.

 

החזון פשוט אבל שאפתני – לרכז את חוויית המשתמש כולה בתוך הצ’אט, לפתוח את הפלטפורמה למפתחים שיבנו עליה אפליקציות וסוכנים, וליצור סביב זה תשתית כלכלית פנימית עם עסקאות, רכישות ומונטיזציה ישירה. במילים אחרות, OpenAI כבר לא מתחרה במנועי חיפוש או בכלי AI אחרים, היא מבקשת להפוך לשכבת התשתית שעליה יתנהל האינטרנט החדש, שבו אינטראקציות, עסקאות ולמידה מתרחשות בתוך שיחה אחת רציפה.

 

המהלך הזה משנה לא רק את עולם הפיתוח, אלא את יחסי הכוחות הדיגיטליים עצמם. כש-ChatGPT הופך לשער הראשי לאינטרנט, נוצרת שכבה חדשה של שליטה בין המשתמשים לשירותים.

 

עבור OpenAI, המשמעות עצומה. אם בעתיד כל פעולה – קנייה, הזמנה, תכנון או חיפוש – תתבצע דרך הצ’אט, היא עשויה להפוך לשער הכניסה המרכזי של האינטרנט החדש, ולגזור עמלה כמעט על כל אינטראקציה. זה מהלך שמזכיר את המהפכה שחוללה Apple עם חנות האפליקציות שלה, רק שכאן מדובר בעולם שבו לא מחפשים או מקלידים, פשוט מבקשים.

 

עבור המשתמשים, זה עולם נוח בהרבה. הכול קורה באותה שיחה – מחקר, עיצוב ותשלום בתהליך רציף אחד. אבל לנוחות הזו יש מחיר – תלות הולכת וגדלה בפלטפורמה אחת, ושאלות חדשות על פרטיות, שליטה בנתונים ושקיפות אלגוריתמית.

 

ועבור המתחרים, מדובר באיום ישיר. ענקיות כמו Google, Meta ו-Microsoft לא יישארו אדישות. גוגל, למשל, כבר משלבת חיפוש שיחתי ו-AI בדפדפן כדי למנוע מ-OpenAI להשתלט על נקודת המפגש שבין האדם והאינטרנט. הקרב הבא לא יהיה על תוכן או על מודלים, אלא על מי שיחזיק בממשק הראשי שמתווך בין בני אדם למידע.

 

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס מקיף לבינה מלאכותית - GenAI Master
קורס מאסטר בבינה מלאכותית Master GenAI

 

לסיכום, אירוע ה-Dev Day של OpenAI השנה לא היה רק חגיגה טכנולוגית, הוא היה הצהרת כוונות ברורה. OpenAI כבר לא מסתפקת בלספק מודלים חכמים, היא רוצה להיות הפלטפורמה שמנהלת את הדרך שבה אנשים מתקשרים, עובדים ויוצרים בעולם החדש. אנחנו עומדים בפתחו של עידן שבו הצ’אט הופך לחלון הראשי של האינטרנט – המקום שבו מתבצעות אינטראקציות, החלטות ועסקים. וכמו תמיד, מי שילמד להשתמש בזה מוקדם, יבין מהר מאוד שזה לא עוד כלי. זו השפה החדשה של העולם הדיגיטלי. ומי שידע לדבר בה ירוויח כשהשאר עוד ינסו להבין מה השתנה.

הפוסט האם ChatGPT בדרך להפוך למערכת ההפעלה של העתיד? הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/openai-dev-day-2025/feed/ 0
מדריך לבקרת הורים ב-ChatGPT https://letsai.co.il/chatgpt-parental-control/ https://letsai.co.il/chatgpt-parental-control/#respond Thu, 02 Oct 2025 16:37:00 +0000 https://letsai.co.il/?p=61212 האם הילד המתבגר שלכם משתמש ב-ChatGPT? אם התשובה כן, יש משהו חדש שחשוב שתדעו. בחודש ספטמבר 2025 השיקה OpenAI כלי בקרת הורים שמאפשר לכם להגדיר גבולות שימוש, לסנן תוכן רגיש ולקבל התראות במצבי סיכון. נשמע מושלם? לא בדיוק. הכלי הזה יכול לעזור, אבל יש לו מגבלות חשובות שכדאי להכיר לפני שמתחילים. המדריך הזה מסביר בדיוק […]

הפוסט מדריך לבקרת הורים ב-ChatGPT הופיע ראשון בLet's AI בינה מלאכותית

]]>
האם הילד המתבגר שלכם משתמש ב-ChatGPT? אם התשובה כן, יש משהו חדש שחשוב שתדעו. בחודש ספטמבר 2025 השיקה OpenAI כלי בקרת הורים שמאפשר לכם להגדיר גבולות שימוש, לסנן תוכן רגיש ולקבל התראות במצבי סיכון. נשמע מושלם? לא בדיוק. הכלי הזה יכול לעזור, אבל יש לו מגבלות חשובות שכדאי להכיר לפני שמתחילים. המדריך הזה מסביר בדיוק מה הכלי יכול לעשות, מה הוא לא יכול לעשות, ולמי זה באמת מתאים. 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

למה זה נחוץ?

ChatGPT הפך לכלי יומיומי עבור מיליוני מתבגרים ברחבי העולם – משיעורי בית וכתיבה יצירתית ועד שאלות אישיות על החיים. אבל לצד היתרונות, צפו גם סיכונים ש-OpenAI לא יכלה עוד להתעלם מהם.

 

בשנים האחרונות נחשפו מקרים טראגיים שבהם מתבגרים פנו לצ’אטבוטים מבוססי AI ברגעי משבר, וחלק מהמקרים הסתיימו באסון. בעקבות תביעות משפטיות והעלאת המודעות הציבורית, החברה התחייבה לחזק את ההגנות עבור בני נוער.

 

המערכת החדשה נועדה לספק איזון עדין: מצד אחד, להורים ניתנת היכולת להציב גבולות ולוודא שהשימוש נעשה בסביבה בטוחה יותר, מצד שני, נשמרת למתבגר מידה של פרטיות, כדי שהכלי לא יהפוך לאמצעי מעקב פולשני.

 

 

חשוב להדגיש: ChatGPT אינו מיועד לילדים מתחת לגיל 13. בקרת ההורים מתוכננת במיוחד עבור בני 13-17.

איך מתחילים?

תהליך ההגדרה פשוט יחסית, ומבוסס על שיתוף פעולה בין ההורה למתבגר/ת:

1. נכנסים להגדרות ChatGPT – פתחו את תפריט ההגדרות בחשבון שלכם ובחרו ב-Parental Controls.

 

כך נראה תהליך קישור החשבון – הוספת בן משפחה ושליחת הזמנה

כך נראה תהליך קישור החשבון – הוספת בן משפחה ושליחת הזמנה

 

2. שולחים הזמנה למתבגר/ת – דרך המערכת תוכלו לשלוח קישור באימייל או ב-SMS לחשבון של הילד.

3. המתבגר/ת מאשר – רק לאחר שהמתבגר/ת מאשר/ת את ההזמנה, מתבצע חיבור החשבונות. ההסכמה ההדדית היא תנאי הכרחי.

4. הגדרות נכנסות לפעולה – מרגע שהחשבונות מקושרים, ההורה יכול להפעיל או לשנות את ההגדרות.

5. התראה על ניתוק – אם המתבגר/ת מחליט לנתק את הקישור בהמשך, ההורה יקבל התראה על כך, אך החשבון של הילד/ה יישאר פעיל.

במה שולטים ההורים?

 

מסך ההגדרות – כך נראית שליטת ההורה על הפיצ’רים העיקריים

מסך ההגדרות – כך נראית שליטת ההורה על הפיצ’רים העיקריים

סינון תוכן רגיש (ברירת מחדל)

המערכת מפחיתה חשיפה לתוכן גרפי, אתגרים ויראליים מסוכנים, משחקי תפקידים מיניים או אלימים ואידיאלים קיצוניים של יופי. ההורה יכול לכבות את ההגדרה, אך המתבגר/ת לא יכול/ה לשנות אותה בעצמו.

זיכרון שיחות (Memory)

כאן ההורה מחליט אם ChatGPT זוכר שיחות קודמות ומשתמש בהן כדי לשפר תשובות בעתיד, או שכל שיחה מתחילה מחדש ללא הקשר מהעבר.

שימוש לשיפור המודלים (Model Training)

ההורה קובע אם השיחות של המתבגר/ת יישמרו וישמשו לאימון ולשיפור המערכת בעתיד. אם האפשרות כבויה – השיחות לא נכללות בתהליך האימון.

שעות שקטות (Quiet Hours)

ניתן להגדיר זמנים שבהם לא ניתן להשתמש בצ’אט – למשל בלילה, בשעות הלימודים או בזמן משפחתי.

מצב קול (Voice Mode)

אפשרות לחסום את השימוש בגרסת הקול של ChatGPT, כך שהמתבגר/ת יוכלו להשתמש בו רק בגרסה הטקסטואלית.

יצירת תמונות (Image Generation)

מאפשרת להורה לחסום לחלוטין את האפשרות ליצור או לערוך תמונות באמצעות ChatGPT.

שליטה על אפליקציית Sora

במסגרת ההגדרות ניתן לנהל גם את השימוש באפליקציית Sora, מודל הבינה המלאכותית של OpenAI ליצירת וידאו. ההורה יכול לבטל פיד מותאם אישית, לעצור גלילה אינסופית של תוכן, או לחסום את האפשרות לשלוח ולקבל הודעות ישירות.

 

ניהול הגדרות Sora – שליטה בפיד ובהודעות של המתבגר

ניהול הגדרות Sora – שליטה בפיד ובהודעות של המתבגר/ת

פרטיות המתבגר – מה ההורים לא רואים?

המערכת לא נועדה למעקב. ההורים אינם יכולים לצפות בתוכן השיחות של הילד/ה עם ChatGPT – לא בהיסטוריית הצ’אט ולא בזמן אמת.

 

יוצא מן הכלל קיים רק במקרים נדירים ביותר שבהם מתגלה סימן ברור לסיכון בטיחותי חמור, למשל מחשבות אובדניות. במצב כזה OpenAI עשויה לשלוח התרעה להורה, אך תעביר רק את המידע המינימלי הנחוץ כדי לאפשר התערבות והגנה, ולא את פרטי השיחה המלאים.

 

התראות בטיחות – ההורה מקבל התרעה רק במקרים חריגים של סיכון חמור

התראות בטיחות – ההורה מקבל התרעה רק במקרים חריגים של סיכון חמור

 

בנוסף, ההורה יכול להחליט באיזו דרך לקבל התראות כאלה: בדוא”ל, בהודעת SMS או בהתראה ישירה באפליקציה (Push Notification).

מגבלות ובעיות שחשוב להכיר

חשוב לדעת מראש שבקרת ההורים ב-ChatGPT היא כלי עזר, לא פתרון קסם. יש לה כמה מגבלות מרכזיות:

המתבגר יכול לנתק את הקישור

הקישור לחשבון ההורה פועל רק כל עוד הילד מסכים. אם הוא בוחר לנתק – כל ההגדרות מבוטלות. ההורה יקבל על כך התראה, אך לא יוכל למנוע את הניתוק.

אפשר לעקוף את המערכת

ההגנות פועלות רק כשמשתמשים בחשבון מחובר. מתבגר/ת שרוצה לעקוף אותן יכול להיכנס ל-ChatGPT בגישה חינמית ללא התחברות, שם בקרת ההורים לא פעילה.

אין אימות גיל חזק

OpenAI עובדת על מערכת לחיזוי גיל שתזהה משתמשים מתחת ל-18 ותפעיל אוטומטית הגנות מתאימות. נכון לעכשיו, הכלי מסתמך בעיקר על קישור בין חשבון הורה לחשבון מתבגר/ת.

ההורים לא רואים שיחות

גם כשבקרת ההורים פעילה, ההורים לא יכולים לקרוא את השיחות עצמן. השליטה מתבצעת רק דרך ההגדרות.

למי זה מתאים?

המערכת מתאימה להורים שרוצים להציב גבולות בריאים לשימוש ב-ChatGPT, אבל אינם מחפשים שליטה מלאה או מעקב פולשני. היא מתאימה במיוחד למשפחות שבהן יש דיאלוג פתוח, והמתבגר מבין את המטרה ומסכים לקשר את החשבונות.

 

לעומת זאת, הכלי פחות מתאים להורים שמצפים לקבל שליטה מלאה על השימוש או גישה ישירה לשיחות. הוא גם לא מיועד לילדים מתחת לגיל 13, שכן גיל זה אינו נתמך כלל במערכת.

 

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס בינה מלאכותית בהוראה וחינוך

 

המלצות מעשיות להורים

חשוב לנו להנגיש ידע וכלים שיעזרו לכם לנהל שיחה פתוחה ובריאה עם הילדים סביב השימוש ב-ChatGPT. הנה כמה נקודות שיכולות לעזור:

 

לפני שמקשרים חשבונות, כדאי לשבת עם המתבגר ולהסביר למה זה חשוב לכם, ולשמוע גם מה הוא חושב. התאימו את ההגדרות לגיל ולשלב שבו הילד נמצא – בן 13 לא מתמודד עם אותם אתגרים כמו בן 17, ומה שמתאים היום אולי ידרוש עדכון בעוד שנה.

 

אל תחששו לשנות את ההגדרות עם הזמן, זה חלק טבעי מהתהליך. מעבר לכך, זכרו שהבקרה לא מחליפה שיחה על איך משתמשים ב-AI בצורה חכמה, מה נכון לשתף ומה לא, ואיך מפתחים חשיבה ביקורתית לצד הסקרנות.

 

אחת לכמה זמן בדקו יחד איך הוא משתמש בצ’אט ומה הוא לומד ממנו – לא כחוקרים, אלא מתוך סקרנות אמיתית.

 

בסופו של דבר, הכלי הזה יעבוד רק אם יש אמון. אם המתבגר ירגיש שמנסים לשלוט בו בכוח, הוא ימצא דרכים לעקוף את זה. אם הוא ירגיש שאתם שותפים, יש סיכוי גדול יותר שההגדרות באמת יעזרו.

מקורות ותמיכה

OpenAI מפעילה דף משאבים ייעודי להורים שם תוכלו למצוא מדריכים להגדרות, עצות לשיחות עם מתבגרים, נושאים לדיון משפחתי וטיפים ממומחים לשימוש אחראי.

 

לסיכום, בקרת ההורים החדשה ב-ChatGPT היא צעד חשוב בכיוון הנכון, אבל היא רחוקה מלהיות פתרון מלא. היא מאפשרת להורים להגדיר סינון, שעות שימוש וחסימות, אך אינה נותנת גישה לתוכן השיחות ואינה חסינה מעקיפות. הכלי הזה עובד רק כל עוד יש שיתוף פעולה מצד המתבגר.

 

המסר המרכזי – בקרת ההורים נותנת כלים להצבת גבולות, אבל לא נועדה להחליף את השיחה והקשר עם המתבגר. ההגדרות יעבדו טוב יותר כשיש אמון, והן משתלבות כחלק מדיאלוג פתוח ולא במקומו.

הפוסט מדריך לבקרת הורים ב-ChatGPT הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/chatgpt-parental-control/feed/ 0
אנטרופיק משיקים את Claude Sonnet 4.5 https://letsai.co.il/claude-sonnet-4-5/ https://letsai.co.il/claude-sonnet-4-5/#comments Tue, 30 Sep 2025 08:53:24 +0000 https://letsai.co.il/?p=61073 בעולם ה-AI של 2025 נדמה שכל שבוע יוצא מודל חדש עם הבטחות גדולות. לרוב מדובר בעוד כמה אחוזים בבנצ’מרקים שרוב המשתמשים לא מכירים או מבינים. ההכרזה על Claude Sonnet 4.5 שברה את התבנית – לא 30% שיפור ולא $30 למיליון טוקנים, אלא 30 שעות רצופות של עבודה אוטונומית על אותה משימה. כדי לסבר את האוזן […]

הפוסט אנטרופיק משיקים את Claude Sonnet 4.5 הופיע ראשון בLet's AI בינה מלאכותית

]]>
בעולם ה-AI של 2025 נדמה שכל שבוע יוצא מודל חדש עם הבטחות גדולות. לרוב מדובר בעוד כמה אחוזים בבנצ’מרקים שרוב המשתמשים לא מכירים או מבינים. ההכרזה על Claude Sonnet 4.5 שברה את התבנית – לא 30% שיפור ולא $30 למיליון טוקנים, אלא 30 שעות רצופות של עבודה אוטונומית על אותה משימה. כדי לסבר את האוזן – Opus 4 עמד על כ-7 שעות, ואין מידע על אף מודל שמתקרב למספר הזה. זו לא עלייה מתונה, זו קפיצה של פי ארבע. במקביל, Claude Code כבר מייצר יותר מחצי מיליארד דולר בהכנסות חוזרות שנתיות (ARR), עם צמיחה של פי 10 מאז מאי 2025. זה לא נתון שיווקי, זו הוכחה שהמודל כבר נמצא בשימוש אמיתי, לא רק בדמו. בואו נבין מה זה אומר בפועל, ונספר את סיפור המודל החדש של אחת החברות המובילות בעולם הבינה המלאכותית.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

מה קורה כשבינה מלאכותית עובדת יום וחצי רצוף?

תדמיינו – אתם נותנים למודל משימה ב-9 בבוקר – לעשות refactoring למערכת ההזמנות, לבדוק אבטחה, לכתוב טסטים ולהעלות הכל לפרודקשן. בעולם הישן זה היה נגמר מהר מאוד. אחרי כמה שעות הוא כבר מתחיל לשכוח מה עשה בהתחלה, אחרי שבע שעות הוא נתקע על מגבלת הטוקנים, ובבוקר שלמחרת אתם מוצאים את עצמכם מסבירים הכל מחדש מהתחלה.

 

עם Sonnet 4.5 זה נראה אחרת לגמרי. אתם מסיימים יום עבודה, סוגרים את הלפטופ והולכים הביתה. בלילה, בזמן שאתם ישנים – המודל ממשיך לעבוד. בבוקר שאחרי, כשאתם נכנסים למשרד, הוא עדיין שם – ממוקד, זוכר כל צעד, וממשיך בדיוק מהנקודה שעצר.

 

ואם זה נשמע כמו פנטזיה – ארגונים שכבר קיבלו גישה מוקדמת מדווחים על משימות שלמות שבוצעו כך: הקמת בסיס נתונים, רכישת domain, ביקורת אבטחה ברמת SOC 2, כתיבת תיעוד מלא. הכל רץ ברצף, בלי יד אנושית על המקלדת. זה כבר לא מדע בדיוני. זה קורה עכשיו.

למה בכלל צריך מודל שעובד 30 שעות? 

זאת שאלה חשובה והכרחית, והתשובה מפתיעה – הרבה יותר אנשים ממה שנדמה לכם. בהכרזה הרשמית של Anthropic אמר שון וורד (Sean Ward), מייסד שותף ומנכ”ל חברת iGent AI, סטארטאפ המתמחה בכלי הנדסת תוכנה אוטונומיים, כי “Claude Sonnet 4.5 מגדיר מחדש את הציפיות שלנו. הוא מטפל ב-30+ שעות של קידוד אוטונומי, ומשחרר את המהנדסים שלנו להתמודד עם חודשים של עבודה ארכיטקטונית מורכבת.”

 

כדי להבין את המשמעות, נניח דוגמה פשוטה: ארגון עם מערכת PHP ישנה שצריך להעביר ל-microservices מודרניים. פרויקט כזה נמתח לרוב על פני שלושה-ארבעה חודשים. עכשיו תדמיינו את אותו פרויקט מתבצע ברצף, על ידי מודל אחד שממשיך לעבוד גם כשאתם ישנים – ומסתיים בתוך יום וחצי.

 

חודשים של עבודה מתכווצים ל-36 שעות. זה לא עוד 10% שיפור בפרודוקטיביות – זה שינוי סדר גודל שמגדיר מחדש מה אפשרי.

האם זה באמת עובד?

כאן אין מקום לשיווק, רק למספרים. במבחן SWE-bench Verified, שבודק אם מודל מסוגל לפתור באגים אמיתיים מגיטהאב, Sonnet 4.5 מוביל עם ‎77.2% (ואפילו ‎82% כשמפעילים parallel test-time compute). הוא עקף גם את GPT-5 וגם את Gemini.

 

מוביל בבדיקות SWE-bench מול המתחרים הגדולים

יתרון ברור על פני GPT-5 וג׳מיני. Source: anthropic.com

 

אבל זה לא נגמר בקידוד. בטבלה הבאה רואים תמונה רחבה יותר: Sonnet 4.5 משפר ביצועים גם במבחני שימוש במחשב (OSWorld), מתמטיקה (AIME), שאלות רב-לשוניות (MMMLU) וניתוח פיננסי, ובחלקם אפילו מוביל על פני GPT-5 ו-Gemini.

 

השוואת ביצועים: Claude Sonnet 4.5 מוביל בקידוד אוטונומי

Claude Sonnet 4.5 מוביל בקידוד אוטונומי. Source: anthropic.com

 

במילים פשוטות, זה לא עוד שיפור קוסמטי. לפני שנה המודלים המובילים עמדו סביב 50%. היום Sonnet 4.5 מתקרב ל-80%, ובחלק מהמשימות אפילו עובר את זה. זה כבר הבדל בין “אפשר לנסות” לבין “אפשר לסמוך על זה בפרודקשן”.

מה הופך את זה לאפשרי?

כדי להבין איך Sonnet 4.5 מחזיק 30 שעות רצופות, צריך להציץ מתחת למכסה המנוע.

מודעות הקשר 

המודל יודע לעקוב אחרי צריכת הטוקנים שלו, להבין כמה נשאר ומתי לנקות מידע ישן. מודלים קודמים פשוט היו נתקעים – כאן הוא ממשיך קדימה.

עבודה במקביל 

במקום לעבוד לינארית, Sonnet 4.5 מבצע חיפושים בו-זמנית, קורא כמה קבצים במקביל ומסנכרן בין הכלים. זה מרגיש פחות כמו מודל אחד ויותר כמו צוות.

סביבת הקידוד (Claude Code) משתדרגת

  • Checkpoints: שמירת מצבים וחזרה מיידית לאחור.

  • ממשק חדש: הרחבה רשמית ל-VS Code וטרמינל מחודש, עם שינויים בזמן אמת.

  • ביצוע קוד ויצירת קבצים: גיליונות, מצגות ומסמכים נולדים ישירות מהשיחה. Anthropic גם הדגימה את זה בפעולה – בסרטון הרשמי רואים את Claude מייצר מסמך, מצגת וגיליון אלקטרוני – כולם ניתנים להורדה ועריכה. זה כבר לא רק לכתוב קוד, אלא לייצר בפועל תוצרים שימושיים שמתחברים ישירות לעבודה היומיומית:

 

 

  • Agent SDK: לבנות כלים ותתי-סוכנים על בסיס היכולות של Anthropic. הנה סרטון קצר שמדגים את ה-Agent SDK, שמאפשר למפתחים להרכיב סוכנים מורכבים על גבי Claude Code, עם שליטה בזיכרון, הרשאות ותיאום בין משימות:

 

כלים חדשים לזיכרון

  • Context Editing: ניקוי אוטומטי של תוכן לא רלוונטי כשהחלון מתמלא.

  • Memory Tool (Beta): אחסון מחוץ לחלון ההקשר, כך שהמודל זוכר גם מה שנעשה אתמול.

 

למי שרוצה לראות את זה בפעולה – הנה סרטון קצר שבו Claude משחק Catan, בונה בסיס ידע על האסטרטגיות של היריבים ששורד בין משחקים, ומנקה מידע מיושן לאורך הדרך. זה נותן הצצה מוחשית למה שמאפשרים Context Editing ו-Memory Tool:

 

 

וכמה זה עולה?

החיסרון הבולט של Sonnet 4.5 הוא המחיר: ‎$3 ל-input ו-$15 ל-output למיליון טוקנים. זה פי 2.4 יקר יותר מ-GPT-5 ו-Gemini שעולים ($1.25 / $10) בהתאמה. המשמעות ברורה, סטארטאפ עם מיליון שאילתות בחודש ישלם בערך ‎$3,000 במקום ‎$1,250 – פער של ‎$21,000 בשנה.

 

האם זה שווה? אם מדובר בקוד קריטי, שבו טעות אחת עולה עשרות אלפי דולרים – ברור שכן. אם זה צא’טבוט בסיסי לשירות לקוחות – כנראה שלא. יש דרכים לצמצם עלויות (prompt caching, batch processing), אבל אלה לא נרחיב עליהם כאן.

 

עלויות של קלט ופלט

 

חשוב רק להדגיש, המספרים מבוססים על פרסומים רשמיים של החברות. בפועל, ביצועים ומחירים יכולים להשתנות לפי גרסה, קונפיגורציה ותצורת שימוש.

אבטחה ובטיחות 

Anthropic מתארת את Sonnet 4.5 כ-“המודל המיושר ביותר שפרסמנו”. לפי החברה, הוא מצמצם התנהגויות בעייתיות כמו החנופה למשתמש (sycophancy), הטעיה, חיפוש כוח ועידוד חשיבה דלוזיונלית (הזיות). ברמה הטכנית נוספו שכבות הגנה כמו חסינות טובה יותר ל-prompt injection, סינון פלטים מסוכנים (כמו הוראות לייצור נשק) והשקה תחת רמת בטיחות AI Safety Level 3.

 

ג’ארד קפלן, המדען הראשי של Anthropic, אמר: “זה הקפיצה הגדולה ביותר באבטחה שראינו בשנה, שנה וחצי האחרונות.” ולמה זה חשוב? כי ברגע שמודל עובד 30 שעות ברצף בצורה אוטונומית, הסיכונים מתגברים. אם הוא מסוגל לפעול יום וחצי בלי השגחה, הוא חייב להיות מהימן יותר מאי פעם.

 

שיעור ההתנהגויות הבעייתיות הנמוך ביותר מבין המודלים הגדולים

שיעור ההתנהגויות הבעייתיות הנמוך ביותר. Source: anthropic.com

איפה זה זמין?

Sonnet 4.5 כבר נגיש לכולם ב-Claude.ai וב-API, ומשולב גם דרך Amazon Bedrock, Google Cloud Vertex AI ו-Claude Code. בנוסף, Anthropic מפעילה כעת את ניסוי Imagine with Claude (הרחבה בפסקה הבאה), שפתוח רק למשתמשי Max לזמן קצוב. מי שרוצה לטעום מהעתיד בזמן אמת, זה הרגע.

כשיכולת הופכת לחוויה

עד עכשיו דיברנו על מספרים וביצועים. אבל Anthropic גם הראתה לאן כל זה יכול להתפתח. היא השיקה ניסוי קצר בשם Imagine with Claude (זמין למשתמשי Max עד 4 באוקטובר 2025), שמדגים איך מודל לא רק כותב קוד, אלא מייצר תוכנה בזמן אמת. במקום לבנות את כל האפליקציה מראש, Claude מייצר את החלקים תוך כדי שימוש: לוחצים על כפתור – נוצר הקוד לכפתור, פותחים תפריט – נוצר הקוד לתפריט.

 

בהדגמה שתכף תראו, ביקשו ממנו “לדמיין את המחשב של שייקספיר”, והוא יצר ממשק מהמאה ה-16 עם תפריטים כמו Sonnets ו-Quill Sharpener. הכל פעל אינטראקטיבית. זה אולי נראה כמו משחק, אבל המשמעות עמוקה יותר. עד היום תוכנה נכתבה מראש, כאן היא נוצרת על המקום, מותאמת בדיוק למה שאתם צריכים. זה כבר לא רק שיפור ביצועים, זו דרך אחרת לחשוב על מהי תוכנה בכלל.

 

Anthropic פרסמה סרטון קצר שממחיש את זה בפעולה. Claude בונה תוכנה בזמן אמת, מגיב לכל פעולה שלכם ומייצר את הקוד רק כשצריך – ממש מול העיניים:

 

 

מה אומרים המשתמשים בפועל

חשוב להבין, Sonnet 4.5 לא חי רק באתר של Anthropic. הוא כבר רץ “מתחת למכסה המנוע” בכלי קוד וסביבות עבודה, מ-Claude Code ועד Cursor ו-Canva, וכך ההתקדמות הטכנית הופכת לחלק מהיומיום של מפתחים ומעצבים.

 

ב-Canva, לדוגמה, סיפר דני וו (Danny Wu), ראש תחום מוצרי ה-AI ב-Canva, ש-Claude Sonnet 4.5 הציג שיפורים מרשימים במשימות המורכבות והארוכות ביותר – החל מעבודה בבסיס הקוד ועד לתכונות חדשות בתוך המוצר. גם מייקל טרואל (Michael Truell), מנכ”ל Cursor, תיאר ביצועי קידוד מהשורה הראשונה, עם שיפורים ניכרים במשימות ארוכות טווח. כדי להבין את המשמעות מהצד המעשי, נניח מצב שבו ארגון עובד עם מערכת מורכבת שדורשת תחזוקה מתמדת – כאן היתרון של מודל שמסוגל להחזיק 30 שעות רצופות מתרגם ישירות לחיסכון בזמן ובעלויות.

 

וזה לא נגמר בקוד. בבדיקות יישומיות בתחומי פיננסים, משפט, רפואה ומדעים, Sonnet 4.5 מציג יתרון מובהק על פני דורות קודמים – גם במשימות חשיבה מורכבות (‘16k thinking’) וגם בביצוע יומיומי.

 

Sonnet 4.5 מוביל גם בתחומי יישום קריטיים

Sonnet 4.5 מוביל גם בתחומי יישום קריטיים. Source: anthropic.com

אז כדאי לעבור ל-Sonnet 4.5?

התשובה תלויה בצרכים שלכם. אם אתם כבר משתמשים ב-Claude, השדרוג כמעט מתבקש – ביצועים טובים יותר באותו ממשק. אם אתם בונים סוכנים אוטונומיים או עובדים עם קוד קריטי, היכולת לעבוד 30 שעות רצופות, יחד עם כלים כמו Memory Tool ו-Context Editing, נותנת יתרון שאין לו מתחרים כרגע. גם מי שדורש רמות אבטחה מחמירות ימצא כאן ערך אמיתי.

 

אבל לא לכולם זה מתאים. Sonnet 4.5 יקר פי 2.4 מהמתחרים, והחלון הקשר (context window) שלו קטן משל Gemini. אם יש לכם codebase ענק או שאתם מסתפקים במודל זול יותר כמו GPT-5, ייתכן שאין סיבה להחליף. מי שצריך יכולות מולטימודל מתקדמות (טקסט, תמונה, אודיו, וידאו) גם ימצא ב-Gemini מענה טוב יותר.

 

בשורה התחתונה, Sonnet 4.5 הוא שדרוג אמיתי – לא עוד כמה אחוזים, אלא קפיצה ביכולות אוטונומיה וקידוד. אם מה שאתם בונים מורכב, קריטי או דורש ריצות ארוכות טווח, ההשקעה משתלמת. אם אתם מחפשים פשוט זול ומהיר, יש חלופות טובות.

 

חשוב לזכור שהתחרות לא נחה. לפי שמועות, Gemini 3 בדרך, OpenAI ממשיכה לשפר ולשדרג כל הזמן, ומה שמוביל היום לא בהכרח יישאר בפסגה עוד שלושה חודשים (וכנראה גם לא עוד שבוע). אבל נכון לעכשיו, אם אתם צריכים בינה מלאכותית שעובדת בלי לעצור, זוכרת הכל ומספקת קוד ברמת פרודקשן – Sonnet 4.5 הוא המקום הנכון. רק תוודאו שאתם באמת צריכים את זה לפני שאתם משלמים כפול.

הפוסט אנטרופיק משיקים את Claude Sonnet 4.5 הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/claude-sonnet-4-5/feed/ 1
מיקרוסופט פותחת את Copilot למודלי Claude של Anthropic https://letsai.co.il/microsoft-claude-integration/ https://letsai.co.il/microsoft-claude-integration/#respond Sat, 27 Sep 2025 14:09:00 +0000 https://letsai.co.il/?p=60924 השבוע מיקרוסופט הכריזה על שילוב מודלי Claude של Anthropic ב-Microsoft 365 Copilot. המהלך מסמן שינוי אסטרטגי – לא עוד הסתמכות בלעדית על OpenAI, אלא גישה רב-מודלית שמאפשרת ללקוחות לבחור את המודל המתאים ביותר לכל משימה.     איפה תמצאו את מודלי קלוד בתוך קופיילוט? המודלים אט אט נכנסים לתוך הפלטפורמות של מיקרוסופט והשינוי מורגש כבר […]

הפוסט מיקרוסופט פותחת את Copilot למודלי Claude של Anthropic הופיע ראשון בLet's AI בינה מלאכותית

]]>
השבוע מיקרוסופט הכריזה על שילוב מודלי Claude של Anthropic ב-Microsoft 365 Copilot. המהלך מסמן שינוי אסטרטגי – לא עוד הסתמכות בלעדית על OpenAI, אלא גישה רב-מודלית שמאפשרת ללקוחות לבחור את המודל המתאים ביותר לכל משימה.

 

מיקרוסופט פותחת את Copilot למודלי Claude של Anthropic

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

איפה תמצאו את מודלי קלוד בתוך קופיילוט?

המודלים אט אט נכנסים לתוך הפלטפורמות של מיקרוסופט והשינוי מורגש כבר בתוך הכלים עצמם.

 

בסוכן הריזונינג Researcher agent

בסוכן המחקר של מיקרוסופט, שמבוסס על מודלי ריזונינג, מופיע כעת כפתור חדש – “נסה את Claude” – שמאפשר למשתמשים לעבור בקלות בין מודלי OpenAI למודלי Anthropic בלחיצת כפתור. אם אתם עדיין לא רואים את הכפתור – סביר שהשדרוג עדיין לא הגיע אליכם, ויופיע בהמשך.

 

ככה זה נראה מבפנים: קלוד בתוך סוכן המחקר של קופיילוט:

 

בקופיילוט סטודיו

גם ב-Copilot Studio – פלטפורמת בניית הסוכנים של מיקרוסופט, נוספה אפשרות פשוטה בתפריט, שמאפשרת לבחור בין המודלים של OpenAI למודלים של אנטרופיק. בעבר היו שם רק מודלים של OpenAI, אבל עכשיו התחרות מתגברת. הארגונים וחברות שרוצים לשלב סוכנים בתוך העבודה היומיומית שלהם, ועל בסיס תשתית מיקרוסופט שמוטמעת אצלם בארגון, יכולים ליהנות גם מ-Claude Sonnet 4 ו-Claude Opus 4.1 כבחירה טבעית כאשר הם בונים סוכנים מותאמים אישית.

 

ככה זה נראה בתוך קופיילוט סטודיו:

 

חשוב לציין שהאפשרות להחליף מודלים בתוך סוכנים לא זמינה באפליקציה למחשב של Copilot 365, אלא רק באתר של Copilot Studio.

 

החוויה נשארת אינטואיטיבית, אך מאחורי הקלעים מדובר בצעד משמעותי – פתיחה של Copilot למודלים מגוונים יותר. וכמו שציינו מעלה – השילוב מושק בהדרגה, וחלק מהפיצ’רים יופעלו רק לאחר אישור מנהלי המערכת.

 

 

למה מיקרוסופט עושה את זה?

סאטיה נאדלה, מנכ”ל מיקרוסופט, הדגיש כי המטרה היא להביא ללקוחות “את הבינה המלאכותית הטובה ביותר מכל התעשייה”. כלומר, לא מדובר בויתור על OpenAI אלא בהרחבת ההיצע ומתן אפשרויות נוספות לארגונים.

 

ברקע, היחסים העסקיים בין מיקרוסופט ל-OpenAI נמצאים בתקופה של שינוי. לפי דיווחים עיתונאיים, OpenAI מתכננת להפחית את חלק ההכנסות שהיא חולקת עם מיקרוסופט מכ-20% לכ-8% עד סוף העשור – מהלך שעשוי להשאיר בידיה עשרות מיליארדי דולרים.

 

לצד זאת, בדיקות פנימיות הראו שמודלי Claude מצטיינים במשימות מתקדמות, למשל באוטומציה של תהליכים פיננסיים ב-Excel או ביצירת מצגות PowerPoint מהוראות משתמש. היתרונות הללו מצדיקים מבחינת מיקרוסופט את פתיחת הדלת לשחקן נוסף, גם אם הדבר כרוך בהסתמכות על תשתיות שמנוהלות מחוץ לארגון.

איך זה משתלב בטכנולוגיה של Azure

Azure AI Foundry הפכה היום למעין “סופרמרקט בינה מלאכותית”. היא מציעה מעל 1,900 מודלים, ממודלי שפה קטנים ועד מודלים רב-מודליים ותעשייתיים, שמגיעים משחקנים מובילים כמו OpenAI, Meta, Hugging Face, Stability, Cohere ו-NVIDIA.

 

בתוך המערך הזה שולבה גם Anthropic – מיקרוסופט רוכשת גישה למודלי Claude דרך החברה, שמריצה אותם על תשתיות הענן של AWS (ובחלק מהמקרים גם Google Cloud). כלומר, מיקרוסופט אינה מפעילה ישירות את העננים של המתחרים, אלא מספקת ללקוחות את המודלים כפי ש-Anthropic מארחת אותם.

 

יחד עם זאת, השימוש במודלי Anthropic כרוך בשיתוף נתונים עם החברה, מחוץ לשליטה הישירה של מיקרוסופט. המשמעות היא שהמידע אינו נהנה מכל שכבות ההגנה המלאות שמציעה סביבת Azure, ולכן ארגונים צריכים לשקול בזהירות את ההשלכות הרגולטוריות והמשפטיות – במיוחד בכל הנוגע לעמידה בתקני GDPR.

ההשלכות על עסקים

עבור הלקוחות, המחיר נשאר קבוע על 30 דולר למשתמש לחודש במסגרת תוכנית Frontier, בלי תוספות עבור שילוב Claude. מאחורי הקלעים, מיקרוסופט אמנם שומרת על שתיקה בכל הנוגע למכירות המדויקות של Office Copilot, אך ההערכות מדברות בעד עצמן – מעל 100 מיליון משתמשים כבר עובדים עם לפחות אחד ממוצרי Copilot, וההכנסות השנתיות מהכלי המרכזי לבדו חוצות את רף מיליארד הדולר.

לאן פני השוק?

המהלך של מיקרוסופט ממחיש עד כמה שוק הבינה המלאכותית הארגונית מתבגר. התלות הבלעדית בספק יחיד הולכת ומתפוגגת, ובמקומה עולה גישה חדשה שמדגישה ביצועים אמיתיים וערך ללקוח. המודלים עצמם הופכים בהדרגה לסחורה – לא במובן שהם חסרי חשיבות, אלא במובן שההבדל האמיתי טמון פחות במודל עצמו ויותר ביכולת לשלב אותו נכון, להתאים אותו לצורך ולחבר אותו לכלי עבודה קיימים.

 

השורה התחתונה ברורה, מיקרוסופט לא מחליפה את OpenAI, אלא מציבה את עצמה כמתווכת חכמה של טכנולוגיות. היא מעניקה ללקוחות יותר גמישות, פחות סיכוני תלות, והבטחה שהכלי המתאים יהיה תמיד בהישג יד.

הפוסט מיקרוסופט פותחת את Copilot למודלי Claude של Anthropic הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/microsoft-claude-integration/feed/ 0
כך תשנו את האופי של ChatGPT ותתאימו אותו לצרכים שלכם https://letsai.co.il/customizing-chatgpt-personality/ https://letsai.co.il/customizing-chatgpt-personality/#respond Sat, 27 Sep 2025 08:49:01 +0000 https://letsai.co.il/?p=60967 תארו לכם שיש לכם חמישה חברים שונים, ולכל אחד מהם אופי וסגנון התבטאות שונה לגמרי: אחד ענייני וחד, אחד ביקורתי ועוקצני, אחד קשוב ותומך, אחד מבריק ושקדן שמסביר עד הפרט האחרון, ואחד מאוזן ונעים. עכשיו דמיינו שכל החברים הללו מתגוררים בתוך ChatGPT – ואתם יכולים לבחור מי מהם יענה לכם בכל רגע נתון. מערכת הפרסונליזציה […]

הפוסט כך תשנו את האופי של ChatGPT ותתאימו אותו לצרכים שלכם הופיע ראשון בLet's AI בינה מלאכותית

]]>
תארו לכם שיש לכם חמישה חברים שונים, ולכל אחד מהם אופי וסגנון התבטאות שונה לגמרי: אחד ענייני וחד, אחד ביקורתי ועוקצני, אחד קשוב ותומך, אחד מבריק ושקדן שמסביר עד הפרט האחרון, ואחד מאוזן ונעים. עכשיו דמיינו שכל החברים הללו מתגוררים בתוך ChatGPT – ואתם יכולים לבחור מי מהם יענה לכם בכל רגע נתון. מערכת הפרסונליזציה של ChatGPT מאפשרת לעשות בדיוק את זה: להתאים את האישיות והאופי של ChatGPT למשימה שלכם ולסגנון ההתבטאות המועדף עליכם, כך שהתשובות של הצ’ט יהיו לא רק נכונות, אלא גם מדויקות עבורכם.

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

 

חמשת הפרסונות של ChatGPT

 

מצב רובוט (Robot)

במצב הזה המענה הופך ישיר, קצר וענייני – ללא התחכמויות מיותרות. זה אידיאלי כשאתם צריכים הנחיות טכניות, עבודה עם מסמכים, סיכומים מהירים או עזרה עם קוד. מי שמעדיף תשובה ברורה ויעילה בלי “שיחה מסביב” ימצא בזה יתרון גדול.

 

מצב ציני (Cynic)

לפעמים מה שאתם צריכים זו זווית אחרת – ביקורתית, ספקנית או אפילו עוקצנית. כאן נכנס לתמונה המצב הציני, שמציע תשובות חכמות עם טון סרקסטי. שימושי במיוחד כשמנסים לכתוב טקסטים פרובוקטיביים, להעלות נקודות ביקורת או לחדד רעיונות בצורה נוקבת.

 

מצב מאזין (Listener)

זהו המצב שמתאים ביותר לשיחות רגשיות או לכתיבה שמבוססת על אמפתיה ותמיכה. כאן ChatGPT הופך להיות קשוב, סבלני ותומך. המצב הזה טוב כשעובדים על תוכן טיפולי, יצירת סיפורים עם דמויות עמוקות או כל משימה שדורשת רגישות יתר.

 

מצב חנון (Nerd)

חובבי ההסברים המפורטים יתחברו במיוחד למצב הזה. כאן ChatGPT נכנס לעומק, מספק הקשרים רחבים ומסביר את ה”למה” שמאחורי כל תשובה. זה מצוין כשאתם לומדים נושא חדש, כותבים מאמרים ארוכים או פשוט רוצים לקבל תמונה מלאה ומנומקת.

 

מצב רגיל (Default)

זהו מצב ברירת המחדל של המערכת – הסגנון המוכר והמאוזן ביותר – קליל, נעים, אדפטיבי וידידותי. אם אין לכם דרישה מיוחדת ואתם פשוט רוצים שיחה טבעית וברורה, המצב הזה הוא הבחירה הנוחה ביותר.

 

איך מגיעים לאזור הפרסונליזציה?

כדי לשנות את האישיות של ChatGPT, צריך לבצע כמה צעדים פשוטים בהגדרות:

  1. כנסו לממשק ההגדרות של הצ’ט – לחיצה אל שם המשתמש שלכם (למטה בצד שמאל במסך הראשי) תאפשר לגשת לתפריט ה-Settings.
  2. בתוך מסך ההגדרות בחרו בטאב הפרסונליזציה: Personalization.
  3. אם זו הפעם הראשונה שלכם שם, ה”זהות” שתמצאו שם תהיה מצב ברירת המחדל –  Default. כדי להחליף “זהות”, לחצו על הכפתור, מה שיאפשר בחירה מבין חמשת המצבים.

וכך, בלחיצה אחת פשוטה תוכלו להחליט אם אתם רוצים את ChatGPT ענייני, ביקורתי, רגיש, חנוני או פשוט מאוזן ונעים.

 

למה בכלל צריך את זה?

שימוש בפרסונות של ChatGPT לא נועד רק לגיוון בסגנון התשובה. זה כלי פרקטי שעוזר לדייק את המענה בהתאם להקשר. מי שכותב מסמכים טכניים לא ירצה תשובות מלאות רגש, ומי שמנסה לנסח סיפור אישי לא ירצה סגנון יבש וענייני בלבד. שינוי האישיות מאפשר לשמור על זרימה טבעית יותר, לחסוך זמן ולגרום לתוכן להרגיש מותאם אישית.

 

בסופו של דבר, מדובר לא רק בתוספת נוחה, אלא בכלי עבודה שמגביר את הגמישות. בחירה באישיות הנכונה יכולה להפוך שיחה טובה לשיחה מצוינת – כזו שמדויקת יותר, יעילה יותר וגם פשוט מהנה יותר.

הפוסט כך תשנו את האופי של ChatGPT ותתאימו אותו לצרכים שלכם הופיע ראשון בLet's AI בינה מלאכותית

]]>
https://letsai.co.il/customizing-chatgpt-personality/feed/ 0