טכנולוגיה

Anthropic משחררת גרסה בטוחה יותר של ה-Mythos AI 'המסוכן מדי' שלה

נתן בן דוד (Natan Ben-David) 2 חודשים ago 1 min read

עוד באפריל, אנתרופיק הודיעה שהיא בנתה מודל AI חדש, בשם Mythos, בעל יכולת חסרת תקדים למצוא פערים במערכות אבטחת סייבר. מתוך ציטוט הסיכון שהדגם החדש והרב עוצמה ייפול לידיים הלא נכונות, החברה מנעה בתחילה את הפרסום שלה לציבור, ורק לאט לאט העניקה גישה לקבוצה קטנה של בודקים מוקדמים באמצעות פרויקט המכונה Project Glasswing.

היום, Mythos סוף סוף ערך את הופעת הבכורה הפומבית הראשונה שלה – אם כי בצורה מאוד עצבנית.

אנתרופיק הודיעה ביום שלישי כי היא משחררת דגם חדש בשם Claude Fable 5, המתואר בפוסט בבלוג של החברה כ"דגם מסוג Mythos שנעשה בטוח לשימוש כללי". היכולות של המודל החדש על פני משימות כמו קידוד, חזון, שימוש בכלים, ניתוח משפטי ומחקר מדעי "עולות על אלו של כל מודל שאי פעם הפכנו לזמין באופן כללי", כתבה החברה. (המשמעות שם היא שהגרסה החזקה ביותר של Mythos מסוגלת ליותר, אבל היא (עדיין) לא נחשבה מתאימה לזמינות ציבורית.) "ככל שהמשימה ארוכה ומורכבת יותר, כך ההובלה של Fable 5 גדולה יותר על הדגמים האחרים שלנו."

החברה גם השיקה דגם נוסף בשם Mythos 5, בעל יכולות זהות ל-Fable 5, בניכוי חלק מאמצעי ההגנה. עם זאת, המודל הזה זמין לעת עתה רק לקבוצה הקטנה של ארגונים שהם חלק מפרויקט Glasswing, אך אנתרופיק אמרה שהגישה תורחב בקרוב.

אמצעי הגנה

Fable 5 מגיע עם אמצעי הגנה שנועדו למנוע ממנו להגיב לשאלות בנושאים רגישים במיוחד, כמו אבטחת סייבר, ביולוגיה וכימיה. במקרים אלה, הוא יחזור אוטומטית לדגם מוקדם יותר של קלוד, אופוס 4.8כדי להימנע מחשיפת מידע שיכול, למשל, להקל על מחבלים שואפים לבשל נשק ביולוגי.

אנתרופיק אומרת שהיא חיברה את הדגם החדש הזמין באופן כללי, הן פנימית והן בשיתוף פעולה עם בודקים חיצוניים, כדי לשרש פגמי אבטחה שעלולים להוביל לפריצות כלא. (כלומר, מניפולציה של צ'טבוט AI כדי להתעלם ולעקוף את מעקות הבטיחות המובנים שלו).

גם Fable 5 וגם Mythos 5 מאומנים לשחק את זה בטוח, אמר אנתרופיק, מה שעלול להוביל למקרים שבהם שאילתות משתמשים שהם למעשה שפירים מסומנים בטעות כמסוכנים על ידי הדגם. "מכיוון שנתנו עדיפות לבטיחות, כיוונו בכוונה את אמצעי ההגנה כדי להיות זהירים, והם עדיין מחמירים ממה שיהיה אידיאלי", כתבה החברה בפוסט בבלוג. "אנו מכירים בכך שזה יתסכל חלק מהמשתמשים, והמטרה שלנו היא לצמצם תוצאות חיוביות כוזבות כאשר אנו מעדכנים ומשכללים את אמצעי ההגנה לאחר ההשקה." אופוס 4.8 כבר היה מעצבן חלק מהמשתמשים לאחר שאנתרופיק הגבירה את ה"כנות" של הדוגמנית.

עֲלוּת

עם תג מחיר גבוה של 10 דולר למיליון אסימוני קלט ו-50 דולר למיליון אסימוני פלט, Fable 5 ו-Mythos 5 עולים פי שניים מהגרסה הרגילה של Opus 4.8. בתקופה שבה מפתחים וארגונים בודדים רבים מתחילים לדאוג מעלויות השימוש בבינה מלאכותית, סביר להניח שזה ידחוף את המודל החדש של Anthropic מעבר לתקציבים של חלק גדול מבסיס המשתמשים שלה.

אבל אין לזלזל בהילה העוצמתית שנבנתה סביב Mythos במהלך החודשיים האחרונים: אנשים רבים ששמעו שמועות על Mythos האגדי כנראה ישמחו לשלם את החשבון על השימוש באסימונים רק כדי לראות אם Fable עומד בשמועות.

Source link