בשקט בשקט אנטרופיק (anthropic) משחררת את המודל החזק ביותר שלה עד כה: claude 3 (קלוד 3) ואנחנו מרוויחים שדרוג ל-LLM (מודל שפה גדול) שכבר היה אהוב בגרסתו החינמית, ועכשיו הופך עוצמתי, חכם, ורסטילי ומדויק אף יותר!
אבל לפני הכל – הישארו מעודכנים! הצטרפו לרשימת התפוצה שלנו ולא תפספסו שום עדכון, חידוש או מידע על כלי חדש שיוצא…
ממליצים לכם להצטרף גם לקהילות ה-AI של LetsAI בוואטסאפ ובטלגרם. רוצים לשמוע על הקורסים וסדנאות ה-AI שלנו? לחצו פה.
מה זה קלוד ומה טוב בו?
למי שלא מכיר, קלוד claude ai הוא צ’אטבוט ג’נרטיבי המבוסס על מודלי שפה גדול (LLM) של חברת אנטרופיק. את החברה הקימו פליטי OpenAI (כן כן, אלה עם ה-ChatGPT וה-Dall-E3) שפחות אהבו את הכיוון שאליו החברה הלכה, ולכן הלכו והקימו חברה מתחרה. מודל השפה שהם שיחררו לציבור היה לא פחות ממדהים. גם בגרסתו החינמית, קלוד2.1 הפגין ביצועים מרשימים, יכולות שפה מדהימות ולא פחות חשוב לנו – צרכנים ישראליים – הוא מצטיין בעברית. כל היכולות הללו הפכו אותו למושלם עבור משימות עיבוד וניתוח טקסט.
כמו כן, בניגוד לגרסה החינמית של ChatGPT, בגרסה החינמית של קלוד הייתה אפשרות להעלות קבצי טקסט ו-PDF ולנתח אותם. פעולות כמו תרגום מהיר לשפות אחרות, אינטגרציה בין טקסטים, תקצור וסיכום טקסטים או דליית מידע מתוך טקסט הפכו לקלות ומהירות במיוחד (ואת כל הטוב הזה קיבלנו בגרסה החינמית). מי שרצה לשלם קצת יותר, קיבל את גרסת פרו (עליה כתבנו בהרחבה במאמר הבא). אם אתם רוצים לקרוא וללמוד קצת יותר על ההיסטוריה של קלוד והחברה שמאחוריו (אנטרופיק), מומלץ לקרוא את המאמר הבא שפרסמנו עם השקת הכלי לציבור הרחב.
איך נרשמים לקלוד?
ההרשמה לקלוד מאוד פשוטה – פשוט עקבו אחר השלבים הבאים:
1) כנסו לאתר של קלוד:
- לינק לאתר: https://claude.ai/
- פתחו חשבון על ידי הזנת דוא”ל או כניסה עם חשבון הגוגל שלכם.
2) אימות טלפוני
הזינו את מספר הטלפון שלכם, אליו ישלח קוד אימות
הזינו את הקוד שקיבלתם ובצעו וריפיקציה לטלפון שלכם. לאחר מכן, סמנו שאתם מאשרים שאתם מעל גיל 18.
3) הזינו שם משתמש
הזינו שם מלא ולאחר מכן רשמו שם המשתמש/הכינוי.
4) אישור התנאים של אנטרופיק
אשרו את מדיניות השימוש והתנאים של חברת אנטרופיק ולחצו “המשך”.
אם ממש מתחשק לכם אתם יכולים לקרוא את הדיסקליימר של אנטרופיק, או פשוט ללחוץ “התחל”.
וזהו – אתם בפנים… התחילו לשוחח עם קלוד.
קלוד 3 – משפחת מודלים חדשה
המעבר לקלוד 3 כולל מספר שינויים והצגה של משפחת מודלים. המשפחה כוללת שלושה מודלים מתקדמים בסדר עולה של יכולת:
- קלוד 3 האיקו (Claude 3 Haiku).
- קלוד 3 סונטה (Claude 3 Sonnet).
- וקלוד 3 אופוס (Claude 3 Opus).
כל מודל מפגין ביצועים חזקים יותר מזה שקודם לו, ומאפשר למשתמשים לבחור את האיזון האופטימלי של בינה, מהירות ועלות עבור השימוש הספציפי הרלוונטי עבורם. אופוס וסונטה כבר זמינים לשימוש באתר החברה וגם בממשק ה-API של קלוד.
משפחת המודלים של קלוד 3 | מקור: www.anthropic.com/news/claude-3-family
זמין גם ב-API
ה-API של קלוד זמין ב-159 מדינות. ונכון לכתיבת שורות אלו גם יש הטבה של 5$ חינם להתנסות במודלים החדשים ב-API.
מודל האיקו יהיה זמין בקרוב, אבל אם ממש בא לכם להתנסות בו, אתם יכולים לפתוח חשבון API ולנצל את 5$ שקיבלתם כדי לשחק עם המודל החדש והמהיר ביותר של אנטרופיק עד כה.
Claude 3 מפגין ביצועים מרשימים ומצטיין במבחנים
אופוס הוא המודל החזק והמרשים ביותר של קלוד. הוא מפגין ביצועים מעולים ומצטיין במבחנים בינלאומיים: undergraduate level expert knowledge (MMLU), graduate level expert reasoning (GPQA), basic mathematics (GSM8K).
עברית מדהימה
הוא מפגין רמות קרובות לאלו של בני אדם ברמת ההבנה וביצוע משימות מורכבות. כל המודלים של קלוד 3 מציגים יכולות משופרות בניתוח וחיזוי, יצירת תוכן מורכב, יצירת קוד, ושיחה בשפות שאינן אנגלית כמו ספרדית, יפנית וצרפתית. וכן – גם העברית שלו מדהימה. למעשה מבחינת כל מודלי השפה הזמינים היום לציבור הרחב, לקלוד יש את יכולת ההבנה והכתיבה הטובה ביותר בעברית!
מהירות ואיכות
המודלים החדשים של קלוד מהירים יותר מקודמיהם. האיקו הוא המודל המהיר והיעיל ביותר מבין המודלים (וגם הזול שבהם). מן בסתם, ככל שהמודל “חכם” יותר, כך הוא איטי יותר. אבל אל תתבלבלו – אמנם האיקו הוא המודל הזול ביותר, אבל הוא לא פחות ממדהים. קלוד2 היה מדהים, והמעבר לקלוד3 (גם בגרסה החינמית) מביא איתו רק שיפורים!
כמה הוא מהיר? הוא יכול לקרוא מאמר בן 10,000 טוקנים שכולל טקסט, גרפים ותרשימים בפחות מ-3 שניות! באנטרופיק טוענים שביצועים אלו אף ישתפרו בהמשך.
המודל הבא של קלוד 3, סונטה, מהיר פי 2 מקלוד 2 ומקלוד 2.1 (וכמובן גם חזק וחכם יותר מקודמיו). אופוס, המודל החזק ביותר, דומה במהירות הניתוח והתגובה שלו לקלוד 2 ו-2.1, אך כאמור חכם וחזר הרבה יותר).
מה חדש בקלוד 3
קלוד 3 מביא איתו חידושים ושידרוגים רבים, גם בגרסה החינמית, כמו למשל חלון הקשר עצום של 200K טוקנים. המודלים החדשים מפגינים יכולות עיבוד נתונים וטקסט מרשימות ומשופרות, יכולות תרגום ועבודה במספר רב של שפות, יכולות קידוד ותכנות בשלל שפות קוד ויכולות עיבוד תמונה.
מה חדש בקלוד3? | מקור: anthropic.com/claude
יכולת ניתוח תמונה
היכולת לנתח תמונה זה לא משהו שלא ראינו בעבר. יש אותה כבר חודשים רבים ב-ChatGPT, ב-Gemini (בארד לשעבר) ועכשיו גם בקלוד. יש שיאמרו שאנטרופיק נרדמו בשמירה או מגיעים אחרונים למרוץ. אני אישית חושב שהם מאוד בטוחים במוצר שלהם (והוא באמת מצוין ועקבי), ולכן לא נופלים במלכודת ההשקות החפוזות והשינויים התדירים (כן כן גוגל – אני מסתכל עליכם).
בקלוד 3 יש אפשרות להעלות תמונות (בנוסף לאופציה להעלות קבצי טקסט וקבצי PDF שכבר הייתה זמינה גם בגרסה החינמית עוד מיום השקתו). משמעות הדבר שהוא יודע לעבד מגוון רחב של פורמטים ויזואליים, לרבות תמונות, תרשימים, גרפים ודיאגרמות טכניות.
באחת מסדנאות ה-AI האחרונות שלנו יצרנו תמונה של איסמעיל הנייה בבריכה. העלאתי את התמונה לקלוד 3 ושאלתי אותו מה הוא חושב שרואים בתמונה. אין ספק שהוא קלע בול. נראה שהנהגת חמאס בהחלט באווירת עבודה ממקום בילוי ונופש.
יכולת עיבוד התמונה של קלוד בולטת גם בהצלחה שלו לצלוח מבחנים מורכבים הדורשים עיבוד תרשימים, גרפים, תמונות, טבלאות ודיאגרמות טכניות (במתמטיקה ומדעים). בטבלה מטה ניתן לראות שהוא משתווה ולעיתים אף מתעלה על מודלים אחרים כמו ג’מיני ו-ChatGPT.
מה אפשר לעשות עם כל הטוב הזה? נסו לבקש מקלוד לייצר מתכון על בסיס תמונה, להמליץ לכם על טיפים לשדרוג עיצוב חלל על בסיס תמונה, לפתור בעיות על בסיס ניתוח תמונה, לשלוף טקסט מתוך תמונה, להפוך כתב יד לטקסט, לפתור משוואות מתמטיות, ועוד…
פחות סירובים
אחד הדברים המעצבנים בקלוד היה שלעיתים הוא סירב לבצע משימות או לענות על שאלות תמימות. אופוס, סונטה והאיקו פחות צפויים לסרב לענות על בקשות שגובלות במגבלות המערכת מאשר הדורות הקודמים של קלוד. כפי שמוצג בתרשים מטה, המודלים החדשים של קלוד 3 מציגים הבנה מורכבת יותר של בקשות, מזהים טוב יותר פוטנציאל לפרומפטים מזיקים או פוגעניים, ומסרבים פחות לענות על בקשות תמימות.
Claude 3 הרבה יותר מדויק
המודלים החדשים של Claude 3 מפגינים פחות “הזיות של המכונה” (או מה שנקרא “נכון לא נכון – חרטט בביטחון”). כאשר הם לא יודעים את התשובה לשאלה קשה, תהיה להם נטייה פחות להמציא תשובה. כתוצאה מכך הם הרבה יותר אמינים ומהימנים גם בשאלות קשות ומורכבות.
חלון הקשר של 200K טוקנים
משפחת המודלים של קלוד 3 מגיעה עם חלון הקשר (Context Window) של 200K טוקנים (גם בגרסה החינמית). רק לשם השוואה וכדי לסבר את האוזן – חלון ההקשר של ChatGPT4 (הגרסה בתשלום) הוא 35K טוקנים, ופה אתם מקבלים בגרסה החינמית 200,000 טוקנים! וזה חברים לא פחות ממדהים! משמעות הדבר שקלוד מצטיין בניתוח טקסטים ועיבודם, ביצירת תוכן כתוב (אבל לא רק), בג’ינרוט תשובות ארוכות יותר ומדויקות יותר, בדליית מידע מטקסטים ארוכים מאוד – כל אלה הופכים אותו למפלצת של ממש ולכלי עבודה ראשון במעלה!
באופן כללי ל-3 המודלים של קלוד3 יש יכולת לקלוט דאטה בהיקף של מיליון (!) טוקנים, אבל אופציה זו לא זמינה בעת הזו (אולי תיפתח בהמשך בחבילות הפרמיום של החברה).
מחט בערמת שחת (NIAH) – השוואה בין קלוד 3, קלוד 2.1 וג’מיני 1.5
כדי לעבד בצורה יעילה בקשות הקשר ארוכות, מודלים דורשים יכולת שחזור איתנה. מבחן “מחט בערמת שחת” (NIAH) או “Needle In A Haystack” בוחן את יכולת המודל לשחזר ולשלוף במדויק מידע מתוך מאגר נתונים עצום. קלוד 3 אופוס לא רק השיג שחזור כמעט מושלם, עם מעל 99% דיוק, אלא שבמקרים מסוימים הוא אף זיהה את מגבלות ההערכה עצמה על ידי זיהוי שה-“מחט” הוכנסה באופן מלאכותי ויזום לטקסט המקורי על ידי בן אנוש. ביצועים אלו קרובים מאוד לביצועים של ג’מיני 1.5 (עליו נרחיב במאמר נפרד), והם ללא ספק טובים הרבה יותר מאלו של קודמו – קלוד 2.1
במבחן ״מחט בערימת שחת״ שבוצע על קלוד 2.1 (עם 200,000 טוקנים) התקשה המודל והפגין כשלים רבים באיחזור מידע נקודתי מתוך הקונטקסט, במיוחד כשהוא מתארך מעל ל-70 אלף טוקנים.
חבילות ומנויים
- כאמור, לקלוד3 יש שלושה מודלים. בחבילה החינמית למרבה ההפתעה אתם לא מקבלים את “קלוד האיקו” – המודל המהיר וה”פשוט” יותר (למרות שהוא ממש לא פשוט – הוא מדהים), אלא את המודל החזק יותר שלה – סונטה.
- כאמור, נכון לכתיבת מאמר זה, אנטרופיק (anthropic) פתחו גישה בחבילה החינמית לקלוד3 סונטה (Sonnet) לכל המשתמשים. כלומר, אתם מקבלים גישה למודל חזק במיוחד ללא עלות נוספת!
- אם תחליטו לשדרג למנוי Pro, זה יעלו לכם 20$ בחודש (ממש כמו במנוי Plus של OpenAI ובמנוי Pro של Copilot). בסופו של יום, כולם מתיישרים לפי המלכה־האם OpenAI. במנוי זה תקבלו גישה למודלים החזקים יותר של קלוד3 ותקבלו גם פי 5 יותר היקף שימוש (יותר פרומפטים שאתם יכולים להזין בצ’אט).