Anthropic רוצה שתדע שדגם הבינה המלאכותית החדש שלה בהחלט לא מסוכן מדי לשחרור
מפתחי בינה מלאכותית עומדים היום בפני אתגר כפול: לבנות מודלים חדישים שמספקים יתרונות גדולים בעלות הנמוכה ביותר האפשרית, ולעשות זאת באופן שלא ימשוך את זעמה של הממשלה הפדרלית. אנתרופיק – שיודעת שזה טוב יותר מכל חברה אחרת בעמק הסיליקון – ניסתה להשחיל את המחט בעלת שתי העיניים עם הדגם האחרון שלה, קלוד סונט 5.
הדגם החדש, ששוחרר ביום שלישי, נועד לאזן בין יכולת סוכנית לחסכנות. הביצועים שלו על פני חבילת מדדים דומים לאלה החזקים יותר אופוס 4.8אבל עם תג מחיר קטן יותר: כאשר הגישה אליו מתבצעת דרך קלוד קוד, סונט 5 עולה 2 דולר למיליון אסימוני קלט ו-10 דולר למיליון אסימוני פלט – פחות ממחצית המחיר של אופוס 4.8.
סונטה 5 "יכול לתכנן תוכניות, להשתמש בכלים כמו דפדפנים ומסופים, ולרוץ באופן אוטונומי ברמה שלפני מספר חודשים בלבד דרשה דגמים גדולים ויקרים יותר", כתב אנתרופיק הַכרָזָה. Sonnet 5 הוא כעת דגם ברירת המחדל בשכבות החינמיות והפרו של קלוד, וזמין גם למנויי Max, Team ו-Enterprise.
זה מגיע בתקופה שבה היו מפתחי טכנולוגיה מול לחץ גובר לספק ללקוחות כלי AI זולים יותר. זה הונע בעיקר מההתפשטות של סוכני AI ברחבי העולם העסקי, שיכולים להתמודד באופן אוטונומי עם משימות מורכבות על פני אופקים ארוכים יחסית. לכן הם נוטים לזלול הרבה יותר אסימונים– היחידה הבסיסית למדידת שימוש בבינה מלאכותית – מאשר מערכות מוגבלות יותר, כמו צ'טבוט שאומן רק לשאלות שירות לקוחות בשטח, למשל. על פי הדיווחים, גם Anthropic וגם OpenAI היו בהתחשב בהורדת מחירים גדולה על מנת למשוך משתמשים חדשים, ולשמור על הנוכחים.
יכולות אבטחת סייבר מטומטמות
ההכרזה החדשה של אנתרופיק הייתה בולטת, עם זאת, במה שכתוב בה סונטה 5 צְבִיעוּת לַעֲשׂוֹת.
באופן ספציפי, החברה כתבה ש-Sonnet 5 "מראה ביצועים גרועים יותר באופן משמעותי" במשימות הקשורות לאבטחת סייבר מאשר Opus 4.8 ו-Mythos 5, שהאחרון הוא אחד משני הדגמים – יחד עם Fable – שאנתרופיק הוציא לא מקוון מוקדם יותר החודש בעקבות סדר אטום מהממשלה הפדרלית. כשמפתח בינה מלאכותית מדגיש את מה שדגם חדש לא יכול לעשות, זה בדרך כלל מטעמי בטיחות (כמו ב, המודל שלנו לא יגיב לבקשות ליצור תמונות מציאותיות של אנשים אמיתיים, או לספק מתכונים לנשק ביולוגי). זה גם המקרה עם הודעת הדגם החדש של Anthropic – החברה עשתה מאמצים רבים כדי למצב את עצמה כקול הבטיחות המוביל בתעשיית הבינה המלאכותית – אבל זה יותר מסביר גם מסיבות פוליטיות.
דאגות סביב אבטחת סייבר עמדו מאוד בלב הבעיה האחרונה של אנתרופיק עם הממשלה הפדרלית. זה הקו הרשמי של ממשל טראמפ, לפחות, למרות שהרבה אחרים הציפו את הרעיון שגם הבדלים אידיאולוגיים והתנגשויות אישיות בין שתי המפלגות מילאו תפקיד. מודל Mythos של Anthropic, שנחשף לראשונה באפריל, אמר שהוא כל כך טוב במציאת פרצות אבטחת סייבר בתוכנה, עד שהחברה בחרה בהוצאה הדרגתית בקרב שותפים מהימנים. אחד מאלה היה הסוכנות לביטחון לאומי (NSA), שמערכות אבטחת הסייבר שלה לכאורה היו עטויות ברזל אין התאמה ל-Mythos. אולם באופן מכריע, המודל לא עקף את מערכות האבטחה של ה-NSA; זה רק זיהה בהם פגמים.
Fable 5 שוחרר לציבור עם מעקות בטיחות כה מחמירים עד שמשתמשים רבים מצאו שהדגם כמעט בלתי שמיש. אבל לאחר שהוביל להאמין שהדגם עלול להיות נתון לפריצת כלא (כלומר, יתבקש לעקוף את מעקות הבטיחות שלו) על ידי מנכ"ל אמזון, אנדי ג'סי, הממשלה ראתה בכך סיכון ביטחוני לאומי.
נראה שאנתרופיק מתכוון להימנע מעימות נוסף עם הממשלה הפדרלית בעקבות שחרורו של הדגם החדש ביותר שלה. "לא אימנו בכוונה את סונט 5 על משימות אבטחת סייבר", כתבה החברה בהודעתה. החברה הוסיפה כי למרות ש-Sonnet 5 הראתה "הצלחה חלקית" בפיתוח ניצול אבטחת סייבר פועל המכוון לדפדפן פיירפוקס של מוזילה, הדבר "כנראה נובע משיפורים באינטליגנציה הכללית ולא מהדרכה ספציפית".