כמה עולה (באמת) להשתמש ב-Claude Fable, GPT-5.5 ו-Gemini 3.5 Flash?
היו הרבה מלמול חרד לאחרונה על מחיר הבינה המלאכותית שעלה בהרבה. מפתחים מוציאים יותר כסף באימון והפעלת מערכות בינה מלאכותית ככל שהתחרות מתעבה ורשת החשמל נלחצת. לקוחות, בינתיים, מפגיזים יותר כדי לקבל גישה לדגמים העדכניים ביותר.
מוקדם יותר השבוע, אנתרופיק – מתקדם לקראת מה שצפוי להיות הנפקה היסטורית – פורסם אגדה 5גרסה מחויגת של ה-Mythos הסודי והעוצמתי ביותר כביכול. Fable 5 עולה פי שניים מקודמו, Opus 4.8, למרות שחלק מהמשתמשים התלוננו שהראשון מעקות בטיחות רגישים להפוך אותו למעשה לבלתי שמיש בהקשרים מסוימים. ככל הנראה עם האוזן שלה לחרדות הללו, OpenAI שוקל כעת הפחתות משמעותיות במחיר שהם גובים עבור אסימונים (היחידה הבסיסית למדידת שימוש ב-AI), וול סטריט ג'ורנל דיווח ביום חמישי.
לכל מי שלא שקוע עמוק במורכבויות העדינות של מימון AI, כל זה יכול להיות קצת מביך. זה יהיה מאוד נוח אם הייתה איזו שיטה פשוטה להמרת מיליון "אסימוני קלט" למשימה מסוימת, למשל, אבל למרבה הצער, זה לא המקרה. כל משימה מביאה דרישות חישוביות משלה, מה שעבור מודלים של תשלום לפי נסיעה אומר שהמשתמשים יצטרכו לשלם סכומים שונים בהתאם לאופן שבו הם משתמשים בבינה מלאכותית. שכבות המנוי מציעות קצת יותר פשטות, אך התוכניות הללו מגיעות עם תנאים ומחירים משלהן, המשתנים בין חברות ודגמים.
כדי להבהיר את הדברים, הנה מה שאתה צריך לדעת על דגמי התמחור עבור שלושה מהדגמים החזקים ביותר של תעשיית הבינה המלאכותית:
אגדה 5
ראשית, המהדורה האחרונה של Anthropic, Fable 5 האגדי.
מנויים לתוכניות ארגוניות של קלוד מקס, פרו, צוות ומבוססות מושבים יכולים להשתמש ב-Fable 5 עם קצבאות האסימונים הקיימות של התכנית שלהם עד ה-23 ביוני. החל מתאריך זה, החברה מתכננת לחזור למודל של תשלום לפי נסיעה עבור כל משתמשי Fable 5, כלומר ככל שהם משתמשים במודל בצורה אינטנסיבית יותר, כך הלקוחות יצטרכו לשלם יותר—ללא קשר לאיזו רמת מנוי שהם עשויים להיות מנויים.
אנתרופיק מתכוונת להחזיר את קצבאות האסימון הרגילות המבוססות על מנויים עבור Fable "כאשר קיבולת מספקת תאפשר לנו לעשות זאת", על פי פוסט בבלוג שפורסם בתחילת השבוע. עדיין לא ברור מה יעלה בגורל מנויי קלוד בתשלום שלא מיצו את כל הקצבה הסמלית שלהם לפני תאריך הפסקה ב-23 ביוני; פנינו לחברה לקבלת תשובות ונעדכן את הסיפור הזה ברגע שנדע יותר.
הדבר העיקרי שיש לזכור כאן הוא ש-Fable 5 צורך יותר אסימונים מאשר הדגמים הקודמים של Anthropic. אז אם אתה משלם כרגע $100 לחודש עבור תוכנית Max 5x, תמשיך לשלם את אותו הסכום באמצעות Fable, אבל יש סיכוי טוב שתגיע למגבלת האסימון שלך מהר יותר.
החל מה-23, כל המשתמשים יצטרכו לשלם $10 למיליון אסימוני קלט ו-$50 למיליון אסימוני פלט בעת שימוש ב-Fable.
לפי קיצור דרך אריתמטי נפוץ אחד, אסימון אחד מתורגם לארבעה תווים של טקסט בערך; לכן צריך הרבה הנחיות כתובות כדי להגיע למיליון אסימונים, כלומר אתה יכול לקבל הרבה ערך מתוך $10 אם אתה משתמש רק ב-Fable כדי, למשל, לכתוב מיילים לעבודה או ליצור מתכונים לארוחת ערב. אז שוב, אם זה כל מה שאתה צריך בשבילו AI, אתה יכול גם להשתמש בצ'אטבוט חינמי: השימוש ב-Fable כדי להגיב לצ'אטים פשוטים בטקסט זה כמו לנהוג ב-McLaren W1 כדי לנסוע לבית השכן הסמוך.
Fable 5 מתמחה במשימות אוטונומיות ארוכות טווח, כמו כתיבת קוד תוכנה, שדורש הרבה הרבה יותר אסימונים – אנחנו מדברים על מאות אלפים עד מיליונים הן עבור כניסות והן עבור פלטים. לפיכך, החשבון החודשי שלך יהיה גבוה משמעותית ממה שהיה אם רק היית מזין הודעות טקסט פשוטות לדגם. אבל אם אתה כבר משלם, נניח, $200 לחודש עבור תוכנית Max 20x, ייתכן שאתה לא משלם כל כך הרבה יותר עבור זיכוי שימוש ממה שאתה כבר משלם: שימוש ב-10 מיליון אסימוני קלט ו-5 מיליון אסימוני פלט יוביל לחשבון של $350 (($10 x 10) + ($50 x 5)).
המחיר של שימוש ב-Fable 5, במילים אחרות, יהיה תלוי לחלוטין בדרישות של המשימות להן אתה משתמש במודל – זה, כמובן, הבסיס של מודל ה-pay-as-you-go. אם אתם נוהגים להעביר לדגמים משימות מורכבות הדורשות שלבים רבים וטווחי זמן ארוכים, המשיכו בזהירות.
GPT-5.5 Pro
פורסם באפריל, GPT-5.5 Pro הוא הדגם האחרון המספק את ChatGPT. זה זמין דרך תוכנית ה-Pro של OpenAI (שעולה $200 לחודש), וגם בשכבות העסקיות ($30 למשתמש/חודש) ו-Enterprise (תמחור מותאם אישית) של החברה.
מפתחים המשתמשים ב-GPT-5.5 דרך ה-API של OpenAI, לעומת זאת, מחויבים על ידי מודל תשלום לפי דרכו כמו זה שיתחיל להחיל על Fable בהמשך החודש. במחיר של 5$ למיליון אסימוני קלט ו-$30 למיליון אסימוני פלט, הוא זול משמעותית מ-Fable (ורק קצת יותר יקר מהדגם השני הכי זמין לציבור של Anthropic, Opus 4.8) הוא מגיע גם עם אפשרות זולה ב-50% של אסימון אצווה, מה שמאפשר בעצם לשרתים של OpenAI להתמודד עם חבילות בודדות של בקשות דומות, אך גם להגדיל את "חבילות של בקשות" בודדות. זמני תגובה איטיים יותר.
Gemini 3.5 פלאש
גוגל הדגישה את מה שאמרה הוא שילוב ייחודי של מהירות ויכולות סוכניות עם הגרסה החזקה ביותר של Gemini, 3.5 Flash, אשר ירדה בחודש שעבר.
זה זמין בחינם עם מגבלות שימוש, ומפתחים יכולים לבנות את ה-API עבור $1.50 למיליון אסימוני קלט ו-$9 למיליון אסימוני פלט – ללא ספק האפשרות המשתלמת ביותר מבין שלושת הדגמים שבדקנו עד כה.
השורה התחתונה
כשם שאין מודל תמחור סטנדרטי וענף עבור AI, יש גם כמות עצומה של שונות ביתרונות ובחסרונות של כל דגם.
עבור משתמשים רבים שרק צריכים צ'אט בוט כדי לשמש כמנוע חיפוש מהולל, הגרסאות החינמיות של Claude, ChatGPT או Gemini הן כנראה בסדר. כל מי שעבודתו דורשת מודל מתקדם יותר לצורכי קידוד או מחקר, כנראה מתאים יותר לשלם עבור מנוי. רק שימו לב לאותיות הקטנות לפני שאתם בוחרים, והיזהרו אחר ביטויי מפתח כמו "מגבלות שימוש" ו"שלם תוך כדי".