מודלים של בינה מלאכותית כמו ChatGPT ובארד מאומנים באמצעות נתונים שנוצרו על ידי בני אדם. ככל שהם בולעים יותר נתונים, כך הם הופכים חכמים יותר בחיקוי אינטליגנציה ויצירתיות אנושית. שחקנים גדולים בתעשיית הבינה המלאכותית, כמו OpenAI ומטה, פרסו מודלים של שפות גדולות שהוכשרו על ידי גירוד של טקסט וספרים זמינים באינטרנט כדי לחלץ נתונים.
בגלל האופן שבו מאומנים אנשי LLM, זה היה בלתי נמנע שתהיה התנגשות בין חוק זכויות יוצרים לבין בינה מלאכותית. עכשיו התרנגולות חוזרות הביתה לנוח, כששרה סילברמן ואמנים אחרים תובעים את OpenAI ומטה על הפרת זכויות יוצרים.
ב תביעה ייצוגית [PDF] שהוגשה בקליפורניה, הקומיקאית שרה סילברמן וכותבים אחרים (כריסטופר גולדן וריצ'רד קדרי) מבקשים להחזיר פיצויים נגד OpenAI ומטה בגין הפרת זכויות יוצרים. התביעה טוענת ש-OpenAI ומטה גירדו ספרים המוגנים בזכויות יוצרים מאתרים פיראטיים כדי לאמן את דגמי הבינה המלאכותית שלהם. זה שווה ערך למודל AI המוריד את מערכי ההדרכה שלו מ-Piratebay מבלי לפצות את המחברים.
במקרה, א תביעה ייצוגית נפרדת [PDF] נגד OpenAI טוען שהחברה השתמשה במידע פרטי לא מורשה כדי לאמן את ChatGPT. גוגל גם עומדת בפני תביעה דומה על שימוש לכאורה בנתונים גנובים כדי לאמן את גוגל בארד. זו הסיבה שאתה צריך
הפוך להרגל להגן על המידע האישי שלך, אם כי פרסום עבודה ונתונים אישיים פרטיים אינם זהים.מה הסיכויים ששרה סילברמן תוכל לזכות בתביעה?
סילברמן ואמנים אחרים טוענים ש-ChatGPT יכול לסכם במדויק את הספרים שלהם כאשר תתבקש. התלונה טוענת שזה לא יהיה אפשרי אם למודל הבינה המלאכותית לא הייתה גישה לחומר המוגן בזכויות יוצרים. עם זאת, אם ChatGPT הוכשר באמצעות מיליארדי טקסטים באינטרנט, סביר להניח שהוא נתקל במאמרים, תגובות ופוסטים במדיה חברתית הדנים בספרים.
יתר על כן, Meta חשפה היכן היא רכשה את הספרים שבהם השתמשה כדי לאמן את מודל הבינה המלאכותית שלה - המקור נמצא באתר טורנט של ספרים אלקטרוניים. באופן דומה, התביעה הייצוגית נגד OpenAI מזכירה גם אתרים לא חוקיים שבהם יש חשד ש-OpenAI השיגה את החומרים המוגנים בזכויות יוצרים, אך OpenAI עדיין לא מאשרת את מקורותיה.
אם יוכח ש-OpenAI ומטה השתמשו באתרי טורנט לא חוקיים כדי לרכוש חומרים המוגנים בזכויות יוצרים כדי להכשיר את דגמי הבינה המלאכותית שלה, ייתכן שלסילברמן יש סיכוי לזכות בתביעה. עם זאת, מודלים של בינה מלאכותית הם טריטוריה לא ידועה ללא תקדים לבתי משפט שיסתמכו עליו כדי לקבל פסיקה המבוססת על הפרת זכויות יוצרים בינה מלאכותית. למעשה, זו אחת הסיבות לכך האיחוד האירופי הציע חוק AI.
מהו העתיד של מודלים של AI וחוק זכויות יוצרים?
אנחנו עדיין בתחילת ימי הבינה המלאכותית כדי לדעת איך היא תסתגל לחוקי זכויות יוצרים. זה אפילו יותר מורכב לנסות להבין בעל זכויות היוצרים ליצירת בינה מלאכותית. אבל עבור יוצרים אנושיים, קיימות תקנות כדי להגן עליהם מפני שמישהו אחר ייגש לחומר המוגן בזכויות יוצרים שלהם ללא פיצוי, הסכמה או קרדיט. אם הכללים קיימים עבור בני אדם, האם הם יחולו על מודלים של AI?
הפרלמנט של האיחוד האירופי ניסח את ההצצה הקרובה ביותר לעתיד של האופן שבו מודלים של AI יעמדו בחוק זכויות יוצרים. אם חוק הבינה המלאכותית של האיחוד האירופי יאושר בחוק, מודלים של בינה מלאכותית כמו ChatGPT ו-Bard יידרשו לפרסם את כל מקורות הנתונים שלהם ונתונים המוגנים בזכויות יוצרים המשמשים להדרכה. זה יעזור לנקות כל בלבול אם דגמי הבינה המלאכותית ניגשו לספרים, סרטים, מוזיקה ותמונות המוגנים בזכויות יוצרים להדרכה דרך אתרי פיראטיות לא חוקיים.
פסיקת התביעה הייצוגית של AI תקבע תקדים משפטי
מודלים של שפה גדולים יכולים לגרד את כל פינות האינטרנט עבור נתונים המשמשים באימון. אבל האם הם יהיו אחראים להפרת זכויות יוצרים אם הם ייגשו לאתרי טורנט לא חוקיים כדי לרכוש את הנתונים? ואם כן, האם תוכל להוכיח זאת?
ללא קשר לתוצאה, התביעות הייצוגיות נגד חברות הטכנולוגיה המחזיקות בדגמי ה-AI הפופולריים ביותר יהוו תקדים שיהיה רלוונטי בעתיד.