דף הבית » קלוד 3.5 סונטה זמין לכולם ובחינם – האם הוא טוב יותר מ־GPT-4o?

קלוד 3.5 סונטה זמין לכולם ובחינם – האם הוא טוב יותר מ־GPT-4o?

אביתר אדרי

21/06/2024

זמן קריאה: 11 דקות

חברת Anthropic חשפה את קלוד 3.5 סונטה (Claude 3.5 Sonnet), מודל הבינה המלאכותית החדש שלה, שמציג ביצועים יוצאי דופן ומציע יחס עלות־תועלת מרשים ביותר. מדובר במודל האינטליגנטי שלה עד כה (אפילו יותר מ"קלוד אופוס"), מהיר יותר ומצליח להתעלות אפילו על GPT-4o (המדהים כשלעצמו). אנחנו נמצאים בתקופה שבה אנחנו נהנים משפע של מודלים מעולים (וחינמיים), אז לקחת מודל שהיה כבר מצוין, מהיר ואיכותי כמו קלוד 3 סונטה, ולשפר אותו - זו משימה מרשימה. אבל בעיקר - זה פרס אדיר לנו המשתמשים, שמקבלים את כל כוח החישוב והוורסטיליות הזה בעטיפה יפה ונוח, ולא פחות חשוב - בחינם!

הישארו מעודכנים

רוצים לקבל עדכונים בלייב? רוצים מקום בו אתם יכולים להתייעץ עם מומחי AI, לשאול שאלות ולקבל תשובות? רוצים לשמוע על מבצעים והטבות לכלי ה-AI שמשנים את העולם? הצטרפו לקהילות ה-AI שלנו.

אפשר גם להרשם לניוזלטר שלנו

הרשמה ושימוש בקלוד 3.5 סונטה

לפני הכול, פה תמצאו מדריך שיסביר לכם איך נרשמים לקלוד 3 סונטה, ואיך לקבל גישה לחבילה החינמית שלו.

ביצועים ומדדי אינטליגנצייה

המודל החדש מצטיין במגוון מבחנים מקיפים, וביניהם:

ניתוח ברמת תארים מתקדמים (GPQA).
ידע ברמת תואר ראשון (MMLU).
מיומנות קידוד (HumanEval).
מתמטיקה רב־לשונית.
מתמטיקה לבית הספר היסודי.

קלוד 3.5 סונט מפגין שיפור משמעותי בהבנת ניואנסים, הומור והוראות מורכבות ומצטיין בכתיבת תוכן איכותי בטון טבעי ונעים לקריאה. במבחני קידוד פנימיים קלוד 3.5 סונט פתר 64% מהבעיות בהשוואה לקלוד 3 אופוס שפתר 38%. זהו שיפור משמעותי המדגיש את היכולות המתקדמות של המודל החדש בתחום התכנות.

השוואה בין הביצועים של קלוד 3.5 סונטה למודלים מתחרים | Credit: anthropic.com

למי הוא זמין, כמה זה עולה, והאם יש חבילה חינמית?

אחד היתרונות הגדולים של קלוד 3.5 סונטה הוא הנגישות הנרחבת שלו. המודל זמין כעת בחינם לכל המשתמשים באתר Claude.ai ובאפליקציית ה־iOS של קלוד. משתמשים בתוכנית החינמית יכולים ליהנות מיכולות המודל המתקדמות, ואילו מנויי Pro ו־Team נהנים משימוש נרחב בהרבה ומעדיפות בשעות עומס. נוסף על כך, קלוד 3.5 סונט זמין גם דרך מספר פלטפורמות ענן מובילות:

דרך ה־API של Anthropic.
Amazon Bedrock.
Vertex AI של Google Cloud.

זמינות רחבה זו עוזרת למפתחים ולארגונים לשלב את המודל בקלות באפליקציות ובתהליכי העבודה שלהם ולנצל את יכולותיו המתקדמות במגוון רחב של תרחישים.

מהירות, יעילות ועלות

אחד היתרונות הבולטים של קלוד 3.5 סונטה הוא המהירות והיעילות שלו. המודל פועל במהירות כפולה מקלוד 3 אופוס, וזה מאפשר עיבוד מהיר יותר של משימות מורכבות. נוסף על כך, העלות של קלוד 3.5 סונט נמוכה באופן משמעותי - כחמישית מהעלות של קודמו. כאמור, המודל זמין בחינם באתר החברה, אבל גם משתמשים בפלטפורמות המתקדמות (כמו שימוש ב־API) ייהנו מעלויות משתלמות: המודל מתומחר ב־3 דולר למיליון טוקנים של קלט (Input) וב־15 דולר למיליון טוקנים של פלט (Output).

השילוב בין ביצועים משופרים ומהירות גבוהה ובין עלות נמוכה הופך את קלוד 3.5 סונטה לאידיאלי למגוון רחב של משימות מורכבות, כגון:

שירות לקוחות שמצריך גישה לקבצים ושליפת מידע מקונטקסט גדול ויכולת לטפל במשימות מורכבות, מה שיוביל לשיפור משמעותי בחוויית השירות ללקוחות עם מענה מהיר ומדויק יותר לפניות.

עיבוד נתונים מרובה אינפוטים (ניתוח ועיבוד של מספר קבצים במקביל) יכול לסייע לארגונים ולאנשים פרטיים להפיק תובנות עמוקות יותר מהמידע שלהם.

כתיבת קוד ופתרון באגים עם יכולות מתקדמות בקידוד ותרגום קוד, המסייעות למפתחים לייעל את תהליכי העבודה, לשפר את איכות הקוד ולהאיץ פיתוח של פרויקטים.

ניתוח נתונים מתקדם באקדמיה יכול לסייע לחוקרים, לסטודנטים ולמדענים לבצע סקירות ספרות, ניתוח תוצאות ניסויים ופיתוח השערות חדשות.

יצירת טקסטים וכתיבה יצירתית ברמה גבוהה, כולל כתיבה בעברית, פתרון בעיות, ויכולת לעבד ולנתח מסמכים ארוכים ומורכבים.

יצירת תוכן - עם יכולות משופרות בכתיבה יצירתית ובעיבוד שפה טבעית. קלוד 3.5 סונטה יכול לסייע ליוצרי תוכן, לסופרים ולעיתונאים ביצירת תוכן איכותי יותר מהר יותר.

חינוך: בזכות יכולתו לשמש כלי עזר ללמידה, לתת הסברים המותאמים אישית וליצור חומרי לימוד, קלוד הופך לכלי עזר של ממש למורים ולתלמידים כאחד.

יכולות מרשימות של כתיבת קוד וניתוח נתונים עם הפיצ'ר החדש Artifacts

קלוד 3.5 סונטה מפגין יכולות מתקדמות בקידוד, בניתוח נתונים ובכתיבה שמבדילות אותו ממודלים אחרים בשוק.

יכולות קידוד מתקדמות: קלוד 3.5 סונטה מצטיין בכתיבה, בעריכה ובהפעלת קוד באופן עצמאי, ויש לו יכולות מתקדמות של ניתוח ותיקון. המודל מטפל בקלות בתרגום קוד, ולכן הוא אפקטיבי במיוחד בעדכון יישומים מיושנים ובהעברת בסיסי קוד.

עיבוד תמונה מתקדם: יכולות הראייה של המודל החדש בולטות במיוחד במשימות הדורשות ניתוח חזותי, כמו פרשנות של גרפים, תרשימים ותמלול טקסט מתמונות בלתי מושלמות. אפשר אף לבקש ממנו להפוך תמונה סטטית לטבלה אינטראקטיבית בעזרת JS או JSON.

טיפול במסמכים ארוכים: קלוד 3.5 סונט מסוגל לנתח או לכתוב מסמכים ארוכים, תוך כדי שמירה על דיוק במשימות כמו RAG (Retrieval-Augmented Generation), חיפוש ואחזור והשוואת מסמכים ארוכים מרובים.

יכולות ניתוח נתונים משופרות: המודל מציע יכולות ניתוח נתונים מתקדמות המאפשרות למשתמשים להפיק תובנות איכותיות ולהציג תחזיות פעולה.

מה זה Artifacts, ואיך מפעילים תכונה זו?

ארטיפקטים (Artifacts), היא תכונה חדשה המרחיבה את אפשרויות האינטראקצייה של המשתמשים עם יכולות התכנות של קלוד. כאשר משתמשים מבקשים תוכן כגון קטעי קוד, יצירת משחקים אינטראקטיביים או אפילו מצגות, חלונית ה־Artifacts תופיע בחלון ייעודי לצד השיחה. מדובר בסביבת עבודה דינמית שבה אפשר לראות, לערוך ולבנות יחד עם קלוד בזמן אמת.

לא רק למתכנתים - פיצ'ר זה יעיל במיוחד גם לאנשים חסרי ניסיון וידע בכתיבת קוד (כמוני). פשוט שאלו את קלוד שאלה, או בקשו ממנו הנחיות, והוא ילווה אתכם צעד אחר צעד ויסביר לכם איך לבנות את התוצר הסופי שאתם צריכים. כדי להפעיל את הפיצ'ר הזה יהיה עליכם להדליק את הסליידר: עם הכניסה לקלוד יופיע מלבן סגול שמזמין אתכם להפעיל את הכלי. אם אתם לא מוצאים אותו, לחצו על כפתור ההגדרות, ואז על "Feature Preview". הפעילו את האופציה של Artifacts והעבירו את הכפתור מ־Off ל־On.

הפעלת פיצ'ר ה־Artifacts בקלוד

יצירת מצגות וקבצים אינטראקטיביים ללא שום ידע בקידוד

שימו לב לדוגמה הבאה שפרסמה החברה, שבה אפשר לראות איך קלוד מעבד תמונות סטטיות עם נתונים והופך אותן ל־JSON. אחר כך הוא יוצר קובץ אינטראקטיבי שבו אפשר לרחף עם העכבר מעל נתונים כדי להציג את הערכים המספריים, ולבסוף הוא משלים את המהלך ויוצר מצגת אינטראקטיבית, כל זה ללא שום התערבות מצד המשתמש. מדהים!

יצירת משחק מחשב בשניות

בדוגמה נוספת אפשר לראות איך קלוד יוצר בשניות משחק מחשב בסיסי, ובו מככב סרטן העונה לשם ה"הו כה יצירתי" Claw'd (משחק מילים על השם של החברה "קלוד" והמלה "צבת" של סרטן - Claw באנגלית).

עיבוד נתונים ושליפת מידע מקונטקסט גדול

מבחן “מחט בערמת שחת” (NIAH) “Needle In A Haystack” נועד לבדוק את היכולות של מודלי שפה גדולים לשלוף ולאחזר מידע ממאגרי מידע גדולים כמו קבצים ארוכים (אנו מכנים מצב זה: "שליפת מידע מקונטקסט גדול"). קלוד 3.5 סונטה מפגין ביצועים מדהימים שדומים לאלו של קלוד 3 אופוס וג'מיניי 1.5 פרו. מעל 99% דיוק בשליפת מידע מקונטקסט ארוך.

מבחן מחט בערימת שחת: השוואה בין קלוד 3 אופוס, קלוד 3.5 סונטה וג’מיני 1.5 פרו

הצלחה מרשימה בשליפת מידע מקונטקסט גדול מאפשרת לקלוד 3.5 סונטה להפוך למכונה משומנת של ניתוח קובצי טקסט ונתונים, של דליית מידע מתוך טקסט, של עיבוד טקסטים ונתונים ושל סינתזה בין טקסטים. וכל זאת גם על קבצים גדולים (200,000 טוקנים).

שליפת מידע מקונטקסט גדול - קלוד 3.5 סונטה | Credit: anthropic

השוואה למודלים מתחרים - כן כן GPT-4o - אנחנו מסתכלים עליך!

קלוד 3.5 סונטה מציב סטנדרטים חדשים בתעשייה ומציג ביצועים מרשימים ביחס למתחרים מובילים כמו GPT-4o של OpenAI ו־Gemini 1.5 Pro של Google, כמו גם לעומת קלוד 3 אופוס של Anthropic עצמה. לפי Bindo Redi, מנכ"לית Abacus.AI, קלוד 3.5 סונט אכן עולה על GPT-4o כמעט בכל היבט, כולל משימות חשיבה מורכבות, תכנות, שפה ומתמטיקה, ואף מדורג ראשון במדד ה־RAG הפנימי של החברה (היכולת לשלוף מידע מקונטקסט ארוך ומאגרי מידע).

הציוץ של בינדו רדי בחשבון ה-X שלה | Credit: Bindu Reddy @bindureddy

ההשוואה למודלים אחרים מדגישה את היתרונות של קלוד 3.5 סונטה בפרמטרים הבאים:

ביצועים עדיפים במגוון רחב של משימות.
מהירות עיבוד גבוהה יותר.
עלות נמוכה מאוד.
יכולות מתקדמות בתחומים כמו עיבוד תמונה וטיפול במסמכים ארוכים.

התפתחויות עתידיות

אנטרופיק לא נחה על זרי הדפנה ומתכננת להמשיך ולפתח את משפחת המודלים של קלוד 3.5. בעתיד החברה מתכננת להשיק את קלוד 3.5 Haiku וקלוד 3.5 Opus להשלמת משפחת המודלים של קלוד 3.5.

נוסף על כך, החברה מפתחת מודלים ותכונות חדשות כדי לתמוך במגוון רחב יותר של מקרים עסקיים, לרבות אינטגרציות עם יישומים ארגוניים, פיצ'ר חדש של זיכרון שיאפשר לקלוד לזכור העדפות והיסטוריית אינטראקצייה של המשתמשים (נראה שאת ההשראה קיבלו מהמתחרה הגדולה - OpenAI), ושיפורים נוספים ביכולות הקיימות. הפיתוחים הללו צפויים להרחיב עוד יותר את היכולות של קלוד ולהפוך אותו לכלי חזק הרבה יותר ורב־תכליתי למשתמשים ולארגונים.

בטיחות ופרטיות

למרות השיפורים המשמעותיים ביכולות Anthropic מדגישה את מחויבותה לבטיחות ולאתיקה בפיתוח מודלים של בינה מלאכותית. המודלים של החברה, כולל קלוד 3.5 סונטה, עוברים בדיקות קפדניות והוכשרו לצמצם את הסיכון לשימוש לרעה. חשוב לציין כי למרות השיפור המשמעותי באינטליגנצייה קלוד 3.5 סונטה נשאר ברמת ASL-2 (Anthropic Safety Level 2), מה שמעיד על המחויבות של החברה לשמור על סטנדרטים גבוהים של בטיחות.

באופן כללי, המחויבות של החברה הזו לבטיחות ולפיתוח אחראי עומדת בניגוד מוחלט לכל מה שקורה לאחרונה ב־OpenAI. בריחת המוחות מ־OpenAI לנוכח טענות חוזרות ונשנות על התנהלות בעייתית והעדפת מסחור המוצרים על פני קידום תחום הבטיחות היא נורת אזהרה מהבהבת. לעומת זאת, באנטרופיק יש מנטליות אחרת לגמרי. החברה משקיעה בפרויקטים שאפתניים כמו מיפוי ה"מוח" של קלוד 3 כדי לשפר את היכולת לשלוט במודלים אלה, לצמצם סיכונים ולמנוע מבעוד מועד פרצות אבטחה.

נוסף על כך , Anthropic מעסיקה מומחים חיצוניים כדי לבדוק ולשפר את מנגנוני הבטיחות שלה. החברה שיתפה פעולה עם מכון הבטיחות לבינה מלאכותית של בריטניה (UK AISI) לביצוע הערכת בטיחות טרום־פריסה של קלוד 3.5 סונטה. תוצאות הבדיקות שותפו גם עם מכון הבטיחות לבינה מלאכותית של ארה"ב (US AISI) במסגרת שיתוף הפעולה בין שני המכונים. כמו כן, Anthropic פועלת כדי להבטיח שהערכות הבטיחות שלה יהיו מקיפות ומתחשבות במגמות החדשות למניעת שימוש לרעה - למשל, החברה השתמשה במשובים של מומחים לבטיחות ילדים בארגון Thorn כדי לעדכן את המודלים שלה ולכוונן אותם ביעילות רבה יותר (Fine-Tune).

החברה מדגישה כי היא לא מאמנת את המודלים שלה על נתונים שנאספו מהמשתמשים, אלא אם כן המשתמש נתן לה רשות מפורשת לעשות זאת (חשוב לדעת שב־ChatGPT יש אפשרות לכבות את האפשרות של החברה לאמן את המודלים שלה על בסיס היסטוריית השיחות של המשתמשים).

סיכום ומבט לעתיד

בסופו של יום, קלוד 3.5 סונטה הוא, מבחינתי לפחות, קפיצה גדולה קדימה. המצב היה טוב גם לפני, אבל עכשיו קיבלנו מודל טוב בהרב, כזה שמשתווה ולעיתים אף מתעלה על המתחרה הגדול ביותר שלו: GPT-4o. למרות ההשוואה המתבקשת אני לא רוצה להכריע מי יותר טוב (וגם לא חושב שזה נכון). יש פה שני מודלים מובילים ושניהם זמינים בחבילה חינמיים לכולם. שניהם מדהימים, שניהם יודעים לכתוב קוד ולנתח נתונים, שניהם יודעים לעבד תמונות ולנתח אותן, שניהם מקבלים אינפוטים מרובים ויודעים להתמודד בקלות עם קונטקסט רחב מאוד (200K טוקנים גם במודלי קלוד 3 וגם ב־GPT4 אומני). מבחינתי זה כמו להשוות בין סטייק לסושי, או בין סינטה לאנטריקוט. שניהם טעימים ושניהם טובים, הם פשוט שונים, אחרים, מתאימים למצבים ולסיטואציות שונות.

אין ספק שהמודל החדש מהווה צעד משמעותי קדימה בתחום הבינה המלאכותית. השילוב בין ביצועים מתקדמים, מהירות גבוהה ובין עלות נמוכה וזמינות רחבה הופך אותו לכלי רב־עוצמה שעשוי להשפיע על מגוון רחב של תעשיות ותחומים.

רוצים להתמקצע?

בואו ללמוד איתנו בינה מלאכותית בקורס המקיף, העשיר והמבוקש בשוק. הצטרפו לאלפים הרבים שכבר עברו את הקורסים והסדנאות שלנו. פרטים והרשמה באתר.

לקבלת הנחה במחיר הקורסים – הזינו את קוד הקופון LETSAI

הישארו מעודכנים

אפשר גם להרשם לניוזלטר שלנו

אביתר אדרי

שותף-מייסד ב-LetsAI, מרצה ויועץ לבינה מלאכותית. בנוסף מנחה את תוכנית הטלוויזיה “בינה אחרת”, ויוצר סרטי AI מנוסה שיצר קליפים ופרסומות לחברות, ארגונים, מוזיקאים ועוד. בשנים האחרונות מעביר קורסים, סדנאות והרצאות במשרדי פרסום, בתי עסק, חברות, ארגונים, מוסדות אקדמיים וגופי תקשורת בארץ ובעולם.