הספרייה הלאומית של קוויבק מתקדמת עם פרויקט מאגר הנתונים התרבותי של AI
הספרייה הלאומית של קוויבק מתקדמת עם תוכניות ליצור מסד נתונים של תוכן תרבותי וממשלתי שיוכל לשמש לאימון מערכות בינה מלאכותית ולשפר את הבנתן את החברה, התרבות והשפות הילידים של קוויבק.
Bibliothèque et Archives nationales du Québec, או BAnQ, הספרייה הלאומית ומוסד הארכיונים של המחוז, השיקה את השלב הניסיוני של מאגר הנתונים הממשלתי והתרבותי המוצע בצרפתית ובשפות ילידיות לאחר השלמת מחקר היתכנות מוקדם יותר השנה.
הפרויקט נועד לתת מענה לחששות שמערכות בינה מלאכותיות גדולות מתקשות לעתים קרובות לספק מידע אמין על החברה, הכלכלה והתרבות של קוויבק בגלל הכמות המוגבלת של נתונים הקשורים לקוויבק העומדים לרשותן.
"כל התרחישים קצת על הפרק כרגע", אמרה בראיון ולרי ד'אמור, שהובילה את בדיקת ההיתכנות. "יש לנו הרבה רעיונות ואנחנו רוצים לאמת את האפשרויות עם בעלי עניין תרבותיים, כמו גם עם בעלי נתונים וספקים, שיהיו מעורבים בדיונים".
BAnQ אומר שהפלטפורמה העתידית לא תשמש כערוץ הפצה ציבורי ליצירות יצירתיות וכי הגישה לנתונים תהיה מבוקרת באופן הדוק.
מארי גרגואר, נשיאה ומנכ"לית BAnQ, אמרה שהמטרה היא להבטיח שמערכות בינה מלאכותית ישקפו טוב יותר את החברה והתרבות של קוויבק.
קבל חדשות לאומיות יומיות
קבל חדשות קנדה יומיות לתיבת הדואר הנכנס שלך, כך שלעולם לא תחמיץ את הסיפורים המובילים של היום.
"זה אומר שיש אזכורים של קוויבק, בין אם בדגמים קטנים ובין אם בדגמים גדולים, בין אם הם מגיעים ממחקר או מהקהילה העסקית", אמרה.
יוזמות דומות הופיעו במקומות אחרים, כולל בשוודיה, שם נאספו אוספים גדולים של טקסטים בשפה הנורדית כדי לסייע בפיתוח מודלים של בינה מלאכותית עבור שפות סקנדינביות.
BAnQ מתכננת להתחיל עם אוספים משלה לפני שתשקול נתונים ממקורות אחרים.
היוזמה נובעת מהמלצה שהועלתה בדוח משנת 2024 של מועצת החדשנות של קוויבק. הדו"ח ייחס את הבעיה בחלקו ל"כמות קטנה מאוד של נתונים על קוויבק" הזמינה במערכי נתונים לאימון בינה מלאכותית.
Destiny Tchéhouali, מחזיקה שותפה בכיסא מחקר בקוויבק המתמקד בבינה מלאכותית וטכנולוגיות דיגיטליות בשפה הצרפתית, אמרה שתרבות קוויבק נותרה "מיוצגת בתת-ייצוג בתאגידים שמסתובבים כיום בעולם הבינה המלאכותית".
"ואנחנו מסתכנים בשכפול הטיות לשוניות והטיות תרבותיות. וכשאנחנו מדברים גם על עמים ילידים, אנחנו מסתכנים אפילו יותר בכל ההטיות האלה", אמר צ'ואלי, פרופסור במחלקה לתקשורת באוניברסיטת קוויבק א מונטריאול.
לדבריו, מסד הנתונים המוצע ייצג "תשתית אסטרטגית" שיכולה לסייע בהקמת קווים מנחים לאופן שבו תוכן מקומי מזוהה, מקוטלג ועוקב אחר מערכות ה-AI של ימינו.
חששות זכויות יוצרים הופיעו כבעיה מרכזית עבור מגזר התרבות כאשר BAnQ מפתחת את מסד הנתונים המוצע.
אבל גרגואר טען שהפלטפורמה המוצעת יכולה להציע ליוצרים הגנה גדולה יותר מהמערכת הנוכחית. "כרגע, זה קצת כמו המערב הפרוע," היא אמרה. "הנתונים נאספים בחינם, וזה לא אמור להיות המקרה."
לדבריה, מסד הנתונים יכול לשמש כשער מרכזי שיקל על פיצוי ליוצרים שהעבודות שלהם נמצאות בשימוש.
גרגואר אמר כי על ידי עבודה קולקטיבית, ארגוני תרבות יהיו ממוקמים טוב יותר להבטיח שיוצרים מקבלים שכר ושהמגזר יישאר בר-קיימא לטווח הארוך.
ובכל זאת, כמה אמנים חוששים שתרומת עבודתם למערכות אימון בינה מלאכותית עלולה בסופו של דבר לערער את פרנסתם.
"הביקורת העיקרית שאנו שומעים בתחום היא שגם אם אמנים מרוויחים מזה הכנסה, הם עדיין מאכילים את החיה שבסופו של דבר תשמש להחלפת חוזים שהם עלולים להפסיד בגלל AI", אמר מקסים הארווי, חוקר פוסט-דוקטורט במכון הלאומי למחקר מדעי וחבר באותו יו"ר מחקר.
מחקר ההיתכנות צופה שהפלטפורמה תהפוך לפעולה עד 2029, אם כי ד'אמור אמר שציר הזמן יוערך מחדש לאחר שלב הניסוי.
המחקר מעריך תקציב לחמש שנים של כמעט 10.5 מיליון דולר עד 2030, כולל עלויות תפעול והון. BAnQ קיבלה 340,000 דולר מממשלת קוויבק עבור מחקר ההיתכנות ו-750,000 דולר נוספים לתמיכה בשלב הניסוי בן 12 החודשים של הפרויקט.
© 2026 העיתונות הקנדית