מדענים חושבים שזו הדרך הטובה ביותר לזהות תמונת AI Slop
מדענים חושבים שהם גילו דרך הרבה יותר טובה לקבוע אם תמונה שראית נוצרה בינה מלאכותית, ולא, זה לא באמצעות תוכנת זיהוי בינה מלאכותית.
במחקר שפורסם היום ב-Proceedings of the National Academy of Sciences (PNAS), חוקרים מהאוניברסיטה הלאומית של אוסטרליה טוענים שהם השתמשו בשיטה מיוחדת כדי להכשיר בהצלחה קבוצת משתתפים לזהות פרצופים שנוצרו בינה מלאכותית, במקרים מסוימים עם "דיוק כמעט מושלם".
זיופים עמוקים שנוצרו על ידי AI עלו בפופולריות וביכולות הטכניות במהלך השנה האחרונה. משנת 2023 עד 2025, נפח הזיופים העמוקים באינטרנט התפוצץ, עם צמיחה שנתית של כ-900% ככל שמחוללי תמונות מונעי בינה מלאכותית השתפרו. פַּעַם קל להצחיק לזיהויAI slop נעשה קשה יותר להבדיל מהדבר האמיתי. קוֹדֵם לימודים גילה שהדיוק הכולל של אנשים בזיהוי תוכן שנוצר בינה מלאכותית היה למעשה הטלת מטבע, כשהסיכויים גרועים עוד יותר כאשר מבחינים בין פנים שנוצרו על ידי בינה מלאכותית לבין פנים אנושיות בפועל.
ההשלכות של זה היו מפחידות עבור חלקם, במיוחד אלה שהיו קורבנות של הונאה הקשורה לבינה מלאכותית, דיסאינפורמציה או זיופים מיניים עמוקים שלא בהסכמה.
שיטות קודמות לאיתור זיופים עמוקים שנוצרו בינה מלאכותית יש בעיקר הסתמך על איתור שגיאות ראייה: רקע מעוות, תקלות אנטומיות או טעויות מודיעות כמו אצבעות חסרות. אבל ככל שמחוללי תמונות בינה מלאכותית הפכו מדויקים יותר, הרמזים הללו הפכו להיות הרבה פחות אמינים. גם כלי זיהוי AI מסחריים אינם תחליף מושלם. הם יכולים לייצר תוצאות חיוביות שגויותומכיוון שרבים מהם מונעים בינה מלאכותית בעצמם, ההיגיון מאחורי המסקנות שלהם מוסתר לעתים קרובות מהמשתמש, מה שמקשה לדעת מתי יש לסמוך על התוצאה.
"בהיעדר תשובה של AI לבעיית הזיוף העמוק, אנחנו צריכים בדחיפות לשפר את יכולות זיהוי הבינה המלאכותית האנושית", כותבים החוקרים ממעבדת הרגשות והפנים באוניברסיטה הלאומית של אוסטרליה במאמר PNAS.
הדרך לעשות זאת, לדברי החוקרים, היא להעביר את המיקוד הרחק מפרטים לתמונה הרחבה יותר, למשהו שהם מכנים רשמים גלובליים. באופן ספציפי, החוקרים טוענים שעדיף להתמקד בששת המאפיינים המרכזיים הללו: סימטריה, מידתיות, אטרקטיביות, כושר ביטוי, ייחוד וזכירות.
AI גנרטיבי לא יוצר תמונות יש מאין. הכלים האלה עוברים הכשרה על שלל נתונים אדירים שמזין את הפלט שהם יוצרים. כאשר מחוללי תמונות בינה מלאכותית יוצרים תמונה של פנים, הם מסתמכים על "הממוצע המתמטי של עשרות אלפי הפרצופים עליהם הם מאומנים", אומר המחקר. לכן, כאשר מחוללי התמונות הללו יוצרים פנים אנושיות, ההסתמכות הזו על הממוצע המתמטי גורמת לפנים להיראות "טיפוסים יותר במראה מאשר פנים אנושיות אמיתיות".
על פי המחקר, נראה שלאנשים יש רגישות אינטואיטיבית, לא מודעת להבדלי הפנים הרחבים בין תמונות אמיתיות לתמונות שנוצרו בינה מלאכותית, גם אם הם לא מתרגמים באופן אמין את המודעות הזו לזיהוי מדויק של זיוף עמוק.
"אנשים מזהים אוטומטית את ההבדלים האלה, מדורגים פרצופים של בינה מלאכותית כיותר סימטריים, פרופורציונליים ומושכים יותר מפרצופים אנושיים, אבל פחות ייחודיים, בלתי נשכחים ובעלי הבעה", כותבים החוקרים.
ניתן להשתמש ברגישות זו כדי לאמן בני אדם לזהות טוב יותר זיופים עמוקים של AI, טוענים החוקרים. אבל המפתח הוא לא רק להגיד לאנשים לשים לב לסימטריה או זכירות; זה לאמן אותם להבין זאת בעצמם, וזה מה שהחוקרים ביקשו לעשות במחקר.
בשלב הראשון של המחקר, החוקרים הראו סדרה של פרצופים (חלקם שייכים לבני אדם אמיתיים ואחרים שנוצרו על ידי בינה מלאכותית) ל-45 משתתפים וביקשו מהם לקבוע אם זה נוצר בינה מלאכותית.
ואז, במקום לומר למשתתפים לשים לב לשש התכונות הללו, החוקרים אימנו אותם באמצעות שישה בלוקים אימון, שכל אחד מהם מורכב מ-96 משימות. עבור כל משימה, הוצגו למשתתפים תמונות של פרצופים אנושיים ונאמר להם אם כל אחד מהם אמיתי או שנוצר בינה מלאכותית. לאחר מכן הם התבקשו לדרג כל פנים על סמך קבוצה של איכויות חזותיות רחבות. לדוגמה, המשתתפים שפטו עד כמה מושכים או סימטריים הם חשבו שכל פרצוף נראה. בממוצע, המשתתפים דירגו פרצופים בינה מלאכותית גבוה יותר בסימטריה, מידתיות ואטרקטיביות, בעוד שפנים אנושיות נחשבו יותר אקספרסיביות, מובחנות ובלתי נשכחות.
לאחר סיום האימון, החוקרים ביקשו מהמשתתפים לחזור ולקבוע אם כל פנים נוצרו בינה מלאכותית. הפעם, הדיוק הממוצע של המשתתפים "כמעט הוכפל", כאשר המועמדים בעלי הביצועים הגבוהים ביותר אפילו השיגו "דיוק כמעט מושלם", טוען המחקר.
"אנו משערים כי על ידי הפניית תשומת הלב לרשמים גלובליים, ההכשרה שלנו אפשרה למשתתפים להתכוונן לאופן שבו התכונות ההוליסטיות הללו מבדילות את הבינה המלאכותית מהפנים האנושיות", כותבים החוקרים.
החוקרים טוענים ששיטת האימון מהירה וקלה מספיק כדי להשלים אותה באינטרנט כדי שניתן יהיה לפרוס אותה בהצלחה ליותר אנשים, אם כי סביר להניח שלא מציאותי לצפות שהיא תוגדל באופן אוניברסלי. תוצאות המחקר מוגבלות גם למחוללי תמונות בינה מלאכותית, כך שחבר המושבעים עדיין לא יודע אם האימון יוכל לתרגם בהצלחה לזיהוי של זיופים עמוקים של אודיו או וידאו.