תוצאות נוספות...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
× Send

OpenAI השיקו את הסוכן החדש של ChatGPT

OpenAI משיקים את הסוכן של ChatGPT
תוכן עניינים

OpenAI השיקה אמש את אחת היכולות השאפתניות ביותר מאז הוקמה החברה – ChatGPT Agent – סוכן אוטונומי שפועל בתוך הפלטפורמה ומציע קפיצת מדרגה של ממש. אם עד היום השתמשנו ב-ChatGPT כדי לקבל תשובות, רעיונות, תובנות או סיכומים, כעת מדובר במשהו אחר. לא עוד עוזר שרק מגיב או מייעץ מרחוק, אלא סוכן שמבצע בפועל – גולש באתרים, מריץ קוד, כותב מסמכים, מתאם פגישות, ממלא טפסים, ומרכיב מצגות שלמות. בשונה מעדכונים קודמים שהוסיפו תכונה אחת בכל פעם, כמו דפדפן או כלי מחקר, ChatGPT Agent מציע שינוי פרדיגמה: איחוד של יכולות קיימות לתוך מערכת אחת אוטונומית שמבצעת משימות מורכבות מקצה לקצה בתגובה לשפה טבעית בלבד.

 

 

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

שילוב כלים שהופך לעוזר אוטונומי אחד

עד היום, כדי להוציא יותר מ־ChatGPT, נדרש היה להפעיל שלושה כלים נפרדים:

  • Operator – כלי שידע “לנווט” באתרים ולבצע לחיצות, מילוי טפסים וגלילה.

  • Deep Research – כלי למחקר מעמיק ברשת.

  • ChatGPT עצמו – בוט לכתיבה, סיכום, שיחה ויצירת תוכן.

כעת, ChatGPT Agent מאחד את כל היכולות האלו לתוך ישות אחת אוטונומית, סוכן שפועל ממש: הוא מתכנן, מבצע, מתקן ומשפר תוך כדי תנועה. המעבר כאן הוא מהותי – לא מדובר בעוד פיצ’ר, אלא בשינוי כיוון – מעוזר שמייעץ לעובד דיגיטלי שמבצע.

 

 

מה הסוכן באמת יודע לעשות?

ל־ChatGPT Agent יש סביבת עבודה משל עצמו: מחשב וירטואלי פרטי שמריץ כלים מתקדמים – דפדפן ויזואלי ללחיצה על כפתורים וגלילה באתרים, דפדפן טקסטואלי לקריאת תוכן ברשת, טרמינל להרצת קוד ויצירת מסמכים, גישה לשירותים חיצוניים כמו Gmail או Google Drive (באישור המשתמש), ויכולות גרפיקה ליצירת אלמנטים ויזואליים למצגות ודוחות.

 

 

אבל השאלה האמיתית היא – מה עושים עם זה בפועל? הסוכן יודע לתאם פגישות חכמות מול לוח השנה שלך, לתכנן קניות אונליין בהתבסס על מתכונים, לנתח מתחרים ולהפיק מצגת שלמה, לאסוף נתונים ממקורות רבים ולבנות מהם דוח, וגם לעבד גיליונות אלקטרוניים מורכבים, כולל גרפים וחישובים. הדגש כאן אינו רק על הפעולה הבודדת, אלא על היכולת לקחת אחריות על התהליך כולו – להבין את המשימה, לבנות תוכנית עבודה, להריץ אותה בפועל ולהחזיר תוצאה גמורה, מוכנה לשימוש.

 

 

אז כמה טוב הוא באמת? 

כדי להעריך עד כמה הסוכן של OpenAI באמת אפקטיבי, החברה שלחה אותו להיבחן. לא בתנאי מעבדה סטריליים, אלא מול סט של מבחנים קפדניים ומתוקננים שנועדו לבדוק ביצועים של מערכות בינה מלאכותית מתקדמות. השורה התחתונה: הסוכן עומד ברף, ובחלק מהמקרים גם עוקף בני אדם.

 

לפניכם סט של גרפים שמציגים את תוצאות הביצועים של ChatGPT Agent במבחנים שונים לעומת מודלים קודמים, מתחרים בולטים, ואפילו בני אדם:

 

כל הבנצ׳מארקים של הסוכן החדש

 

  1. מבחן מתמטיקה ברמה גבוהה (FrontierMath): הסוכן הפגין יכולת מרשימה בפתרון בעיות מתמטיות מורכבות, עם ציון של 27.4% – כמעט פי 3 ממודלים קודמים.

  2. שימוש בדפדפן סוכני (WebArena): בבדיקת היכולת “לגלוש כמו אדם”, הסוכן עבר את GPT-4o והגיע לדיוק של 65.4%, כשהוא מצמצם את הפער לעומת בני אדם (78.2%).

  3. גלישה באינטרנט והסקת מידע (BrowseComp): הסוכן מוביל על פני Deep Research ומודלים אחרים עם 68.9%, שיפור של 17.4 נקודות.

  4. משימות פיננסיות (Investment Banking Modeling): כאן הסוכן לא רק מנתח, אלא בונה מודלים – ומגיע ל־41% דיוק (לעומת 19.7% של Deep Research), תוך שילוב כלים מתקדמים.

  5. ניתוח נתונים (DSBench – Data Analysis): בבדיקת הבנה ופרשנות של סטי נתונים גדולים, הסוכן עקף גם בני אדם וגם את GPT-4o, עם שיעור הצלחה של 89.9%.

  6. בניית מודלי נתונים (DSBench – Data Modeling): גם כאן הוא מציג עליונות עם תוצאה של 85.5%, מה שממחיש את היכולת לבנות תשתיות ניתוח נתונים – לא רק להבין נתון קיים.

  7. עבודה עם גיליונות אלקטרוניים (SpreadsheetBench): במשימות Excel מורכבות, הסוכן הגיע ל־46.5%, יותר מפי שניים מהתוצאה של Copilot של מיקרוסופט (20%).

  8. משימות כלכליות חשובות בזמן אמת (Economically Important Tasks): מדד נדיר שבוחן כמה מהר וטוב המודל מבצע משימות אמיתיות לעומת בני אדם – ככל שהמשימה מתארכת (מעל 7 שעות), הסוכן מצמצם פערים ואף מנצח בחלק מהמקרים.

למה זה חשוב?

המספרים האלה לא רק מצביעים על שיפור טכני – הם מעידים על קפיצה מערכתית: הסוכן לא רק מגיב, אלא מבצע, מנתח, משווה, ומקבל החלטות תחת אי־ודאות, בסביבה של מידע פתוח ודינמי. במשימות רבות, כמו בניית דוחות, מודלים פיננסיים, ניתוח שווקים או ניווט בין ממשקים, הוא מתקרב לרמת ביצוע אנושית, ולעיתים אף עוקף אותה.

כמה באמת אפשר לסמוך על הסוכן?

ככל שהסוכן של ChatGPT הופך לאוטונומי יותר, כך גוברת הדאגה – האם הוא בטוח לשימוש? ב־OpenAI הטמיעו מערך בטיחות מרשים: הסוכן עבר אימון ייעודי נגד “הזרקת הנחיות” (Prompt Injection) עם הצלחה של 99.5%, בודק כל בקשה לסיכונים ביולוגיים או כימיים, ועוצר אוטומטית בביצוע פעולות רגישות, כמו שליחת מיילים או גישה לקבצים, עד לקבלת אישור מפורש מהמשתמש. הוא גם מוגבל פיננסית, ולא מסוגל לבצע העברות כספיות, וגם יפסיק לפעול אם תעזבו את הטאב באתר רגיש כמו בנק.

 

אבל חשוב להדגיש, אין כאן חסינות מלאה. תוקפים עדיין יכולים לנסות להסתיר פקודות זדוניות בטפסים או טוקבקים, ובמקרים נדירים, מידע רגיש עלול לדלוף לאתרים לא בטוחים. הסוכן גם לא שומר מידע בין שיחות, מה שתורם לבטיחות, אבל מגביל את היכולת לעבוד בתהליכים מתמשכים.

סם אלטמן שומר על פרופורציות

כחלק מהשקת ChatGPT Agent, התייחס מנכ”ל OpenAI סם אלטמן לסוכן החדש בחשבון ה־X שלו. בציוץ ארוך וגלוי-לב, הוא הסביר שמדובר בטכנולוגיה ניסיונית אך עוצמתית, שיכולה לבצע משימות מורכבות, אך גם מלווה בסיכונים. לדבריו, הסוכן נועד לפעול בזהירות ובפיקוח, תוך מינימום גישה למידע רגיש. “הייתי ממליץ לבני משפחתי לא להשתמש בו למשימות קריטיות או עם מידע אישי בשלב זה”, כתב, והוסיף: “צריך ללמוד מהשטח, בהדרגה”.

 

הנה הפוסט המלא:

 

הציוץ של אלטמן

אלטמן מבהיר: הסוכן החדש הוא ניסיוני ולא 100% אוטומטי

איך מפעילים את ChatGPT Agent? 

אם יש לכם גישה לשירות בתשלום, תוכלו להתחיל לעבוד עם הסוכן ממש עכשיו (או בימים הקרובים). התהליך פשוט יחסית, אבל דורש תשומת לב לכמה שלבים חשובים:

  1. התחברות לחשבון: התחילו בכניסה לחשבון שלכם ב־ChatGPT

  2. הפעלה ראשונית: תוכלו לבחור את Agent Mode מתוך תפריט הכלים (Tools), או פשוט להקליד agent/ בתחילת השיחה.

  3. תיאור המשימה: תכתבו את הבקשה שלכם כמו שהייתם כותבים לאדם בשפה טבעית וברורה. דוגמה: “תכין לי דוח השוואתי בין 3 פלטפורמות CRM שמתאימות לחברות קטנות.”

  4. בדיקת התוכנית: הסוכן יציע תוכנית פעולה – אילו צעדים הוא עומד לבצע, באילו כלים ישתמש, ומה יקרה קודם. בשלב הזה, תוכלו לעצור, לדייק או להוסיף הנחיות.

  5. צפייה בפעולה והתערבות לפי הצורך: אחד הדברים המרשימים ביותר בסוכן זה שהוא פועל ממש מול עינינו בשקיפות. תראו אותו גולש, לוחץ, מחפש, כותב או מריץ קוד, שלב אחרי שלב. בכל רגע, תוכלו לעצור אותו, לשנות כיוון או לקחת שליטה.

 

מפעילים את הסוכן בלחיצה אחת על Agent בתפריט

הפעלה פשוטה של הסוכן

מעורבות אנושית

למרות שמדובר בכלי אוטונומי, הצלחה בעבודה עם הסוכן תלויה גם בכם. אלה שלוש העצות הכי חשובות למשתמשים חדשים וגם למתקדמים:

  • תנו הוראות מדויקות ככל האפשר: אל תסתפקו ב־“תכין לי דוח על שוק הפינטק”. במקום זאת, כתבו: “תכין דוח מקיף ועדכני בן 10 עמודים על שוק הפינטק בישראל, כולל ניתוח של 5 חברות מובילות ותחזיות לשנתיים הקרובות.”

  • הישארו מעורבים בתהליך: הסוכן אולי עצמאי, אבל הוא לא קורא מחשבות. צפו איך הוא מתקדם, התערבו כשצריך, ותנו הבהרות אם אתם רואים שהוא בוחר כיוון לא מדויק.

  • הגנו על המידע שלכם: אל תשתפו פרטי אשראי, חשבונות בנק או סיסמאות. אם נדרשת פעולה רגישה (כמו הזמנה באינטרנט), בשלב הזה, תוכלו לעצור ולבצע את הפעולה בעצמכם על בסיס ההכנה שביצע הסוכן. זו הדרך לשמור על שליטה מלאה ולהגן על עצמכם.

כמה זה עולה, ולמי זה בכלל זמין?

מבנה התמחור של ChatGPT Agent ממחיש עד כמה מדובר במוצר מתקדם, אך יוקרתי. גישה לסוכן זמינה רק למנויים בתשלום, כשמשתמשי תוכנית Plus משלמים 20 דולר לחודש ומקבלים גישה מיידית, אך מוגבלת מאוד עם 40 שאילתות חודשיות בלבד. לעומתם, מנויי תוכנית Pro נדרשים לשלם 200 דולר בחודש ומקבלים 400 שאילתות בחודש, גישה מלאה לכל יכולות הסוכן, כולל עבודה עם כלים מתקדמים, מספר משימות ביום והשלמה של תהליכים מורכבים מקצה לקצה.

 

חשוב לציין: הסוכן זמין כרגע למנויי Pro באופן מיידי, ולמנויי Plus ו-Team בהשקה הדרגתית. משתמשי Enterprise ו-Edu יקבלו גישה עד סוף החודש.

 

הפער בין המחיר לתועלת יוצר דילמה ברורה. משתמשים סקרנים שמעוניינים לבדוק את הסוכן יגלו במהרה שההקצאה של תוכנית Plus מוגבלת מדי לשימוש יומיומי, מאידך, מי שמעוניין להשתמש בסוכן ככלי עבודה רציני, למשל, לניתוחים, מצגות או משימות מורכבות, יידרש לשלם לא פחות מ־200 דולר בחודש. מדובר בסכום גבוה שרק יועצים עצמאיים, חברות טכנולוגיה או צוותים עם צורך תפעולי ממשי יוכלו להצדיק. נכון להיום, קשה להמליץ עליו למשתמשים מזדמנים או לעסקים קטנים ללא תקציב משמעותי.

למי זה מתאים?

השימוש בסוכן ChatGPT אינו מיועד לכל אחד, אבל עבור קהלים מסוימים, הוא עשוי להיות כלי משנה-משחק. יועצים ועצמאיים שעובדים לפי שכר שעתי גבוה יכולים להפיק ממנו תועלת ממשית: כל שעה שהסוכן חוסך בתחקיר, בניתוח או בבניית מצגת – מתורגמת לרווח מיידי. גם חברות טכנולוגיה שעוסקות במחקר, פיתוח, או ניתוח שווקים עשויות להיעזר בו כדי להוריד עומס משימות ולהאיץ תהליכים מבלי להרחיב צוותים. מנהלי פרויקטים שמפיקים ניתוחים, דוחות ומצגות על בסיס קבוע יגלו שהוא חוסך שעות של עבודה שחוזרת על עצמה. וגם בצד השיווקי, צוותי מכירות שזקוקים לניתוחים תחרותיים או לתחקיר מהיר על לקוח פוטנציאלי, ימצאו בו חבילה אחת שעושה את כל העבודה.

דוגמאות מעשיות מהדמו הרשמי

דוגמה 1: תכנון חתונה בסגנון בוהמייני

הסוכן סרק אתרי אירועים, בדק תחזיות מזג אוויר, בנה לוח זמנים, הציע מתנות, יצר מצגת מסכמת ורשימת קניות מלאה. התוצר הסופי (לאחר כ 7-15 דקות) היה דו”ח מפורט עם כל ההמלצות והקישורים.

דוגמה 2: עיצוב והזמנת מדבקות

הסוכן קיבל בקשה לעצב מדבקות ולהזמין 500 יחידות. הוא שאל שאלות על הסגנון הרצוי, יצר עיצוב באמצעות AI, נכנס לאתר Sticker Mule, העלה את העיצוב, הוסיף לעגלת הקניות וביקש אישור מהמשתמש להמשיך לשלב התשלום.

דוגמה 3: ניתוח ביצועים אישי והצגת ממצאים

הסוכן התבקש למשוך את נתוני הביצועים של עצמו דרך API פנימי של Google, לנתח אותם וליצור מצגת PowerPoint. הוא כתב קוד, יצר גרפים, ואף הוסיף אלמנטים ויזואליים לשקופיות. התוצאה? קובץ PowerPoint אמיתי וניתן להורדה כולל המלצות לשיפור. 

 

המדריכים תמיד חינמיים, אבל אם בא לכם להתמקצע - יש גם קורס מקיף לבינה מלאכותית - GenAI Master
קורס מאסטר בבינה מלאכותית Master GenAI

 

צעד גדול שמחייב גם זהירות ופרופורציה

לסיכום, ChatGPT Agent אינו עוד תוספת שולית, אלא ניסיון שאפתני להפוך את הבינה המלאכותית משחקן פסיבי למבצע אקטיבי. שילוב של שיחה, חיפוש, ניווט, קוד, מסמכים ופעולה רציפה הופך את הסוכן הדיגיטלי של OpenAI לכלי שיכול, לפחות תאורטית, לבצע עבודה של ממש, לא רק לעזור לחשוב. הביצועים טובים, היכולות מתקדמות, והפוטנציאל ברור: חיסכון אדיר בזמן, ייעול תהליכים, ופער גובר מול מי שעדיין תקועים בשלב ההקלדה הידנית.

 

אבל דווקא בגלל העוצמה הזו, צריך לעצור לרגע ולבחון את זה בעיניים פקוחות. מדובר בטכנולוגיה צעירה, עם עלות לא מבוטלת, תלות בתשתית, ואוטונומיה שהיא חלקית בלבד. הסוכן יכול להיתקע, לפרש הוראות לא נכון, או להיתקל באתרים שהוא פשוט לא מצליח להבין. יותר מזה, אין כאן מהפכה מוחלטת. השחקנים הגדולים כולם הולכים באותו כיוון: ה־Computer Use של Anthropic, הדפדפן של Perplexity, הפלטפורמה של Manus, שיכול לבצע פעולות מורכבות, או Genspark שמאפשרת להריץ סוכנים מבוססי תהליך – כולם מציעים וריאציות שונות על אותו רעיון: לאפשר למודל לפעול במקומך, דרך הדפדפן או סביבת עבודה וירטואלית. ההבדלים נמצאים ברמת העטיפה, ממשק המשתמש והאינטגרציה, אבל הרציונל דומה: לצמצם את הפער בין הבנה לפעולה.

 

בשורה התחתונה? ההבטחה אמיתית, אבל צריך לתת לזה זמן. מי שיידע לשלב את הכלי הזה בתוך תהליך עבודה קיים, ויידע גם מתי לעצור אותו – ירוויח. מי שמצפה לקסם אוטומטי שיבצע הכל לבד, צפוי אולי להתאכזב. כמו תמיד בעולם ה-AI: הכלים מתקדמים מהר, אבל המבחן האמיתי הוא איך משתמשים בהם ולא רק מה הם יודעים לעשות לבד.

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

 

 

אפשר גם להרשם לניוזלטר שלנו

 

רוצים הרצאה או ייעוץ של רון גולד?
השאירו פרטים ונשמח לחזור אליכם עם המידע הרלוונטי
אולי יעניין אותך גם...
guest
0 תגובות
Inline Feedbacks
צפה בכל התגובות
Let's update

רוצים לקבל עדכונים על כל מה שחדש ומעניין בעולם ה-AI? הרשמו לניוזלטר שלנו!

אירועי AI קרובים

תפריט נגישות

תוצאות נוספות...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
איך AI, בוטים ואוטומציה - יחסכו לכם זמן וכסף!
28/07/2025 - בשעה 20:00

OpenAI השיקו את הסוכן החדש של ChatGPT