לפני יותר מ-70 שנה, כאשר הבינה המלאכותית הומשגה, אלן טיורינג פרסם מאמר שתיאר כיצד לזהות אותה. מאוחר יותר הוא נודע בתור מבחן טיורינג, והוא שימש במשך עשרות שנים כדי להבחין בין אדם לבינה מלאכותית.
עם זאת, עם הצגתם של צ'אטבוטים מתקדמים של בינה מלאכותית כמו ChatGPT ו-Google Bard, זה הופך להיות קשה יותר לדעת אם אתה מדבר עם בינה מלאכותית. זה מעלה את השאלה; האם מבחן טיורינג מיושן? ואם כן, מהן האלטרנטיבות?
האם מבחן טיורינג מיושן?
כדי לקבוע אם מבחן טיורינג מיושן, תחילה עליך להבין איך זה עובד. כדי שבינה מלאכותית תעבור את מבחן טיורינג, היא חייבת לשכנע חוקר אנושי שמדובר באדם. אבל יש מלכוד - ה-AI מוערך לצד אדם, והוא חייב להגיב באמצעות טקסט.
תחשוב על זה ככה; אם אתה החוקר, ואתה שואל שאלות לשני משתתפים באינטרנט באמצעות טקסט, אבל אחד מהם הוא מודל בינה מלאכותית - האם היית מבדיל ביניהם לאחר חמש דקות? זכור שמטרת מבחן טיורינג היא לא לזהות את מודל הבינה המלאכותית בהתבסס על התשובות הנכונות אלא להעריך אם הבינה המלאכותית יכולה לחשוב או להתנהג כמו אדם.
הבעיה בגישת מבחן טיורינג של זיהוי רק תגובות דמויות אדם היא שהיא לא מתחשבת בגורמים אחרים. למשל, האינטליגנציה של מודל הבינה המלאכותית או הידע של החוקר. חוץ מזה, מבחן טיורינג מוגבל לטקסט בלבד, ונעשה קשה יותר לזהות AI שמייצר קול אנושי או
סרטונים מזויפים עמוקים המחקים התנהגות אנושית.עם זאת, דגמי הבינה המלאכותית הנוכחית כמו ChatGPT-4 ו-Google Bard עדיין לא התקדמו לנקודה שבה הם יכולים לעבור בעקביות את מבחן טיורינג. למעשה, אם אתה מכיר את AI, אתה יכול לזהות טקסט שנוצר בינה מלאכותית.
5 החלופות הטובות ביותר למבחן טיורינג
זה אפשרי זה דגמי AI עתידיים כמו ChatGPT-5 יכול לעבור את מבחן טיורינג. אם זה יקרה, נצטרך בדיקות שונות בשילוב עם מבחן טיורינג כדי לזהות אם אנחנו מדברים עם AI או אדם. להלן החלופות הטובות ביותר למבחן טיורינג:
1. מבחן מרקוס
גארי מרקוס, מדען קוגניטיבי ידוע וחוקר בינה מלאכותית, הציע חלופה למבחן טיורינג שפורסם ב- ניו יורקר לזהות את היכולת הקוגניטיבית של AI. המבחן הוא פשוט - אתה שופט מודל AI על סמך היכולת שלו לצפות ולהבין סרטוני YouTube ותוכניות טלוויזיה ללא כתוביות או טקסט. כדי שה-AI יעבור את מבחן מרקוס, עליו להבין סרקזם, הומור, אירוניה וקו העלילה בעת צפייה בסרטונים ולהסביר זאת כמו בן אדם.
כרגע, GPT-4 יכול לתאר תמונות, אבל עד כה, אין כרגע מודל AI שיכול להבין סרטונים כמו אדם. רכבים בנהיגה עצמית מתקרבים, אבל הם לא לגמרי אוטונומיים ודורשים חיישנים מכיוון שהם לא יכולים להבין כל דבר בסביבתם הסובבת.
2. מבחן טיורינג חזותי
על פי מאמר מחקר שפורסם ב PNAS, ניתן להשתמש במבחן הטיורינג החזותי כדי לזהות אם אתה מדבר עם אדם או עם AI באמצעות שאלות תמונה. זה עובד כמו מבחן טיורינג, אבל במקום לענות על שאלות באמצעות טקסטים, המשתתפים מוצגים תמונות ומצפים מהם לענות על שאלות פשוטות תוך כדי חשיבה כמו בני אדם. אולם, ה מבחן טיורינג חזותי שונה מ-CAPTCHA מכיוון שכל התשובות נכונות - אבל כדי לעבור את המבחן, ה-AI חייב לעבד את התמונות בדומה לאדם.
מעבר לכך, אם בינה מלאכותית ובן אדם יוצגו מספר תמונות זו לצד זו ויתבקשו לזהות תמונות ריאליסטיות, לאדם תהיה היכולת הקוגניטיבית לעבור את המבחן. הסיבה לכך היא שדגמי AI מתקשים להבחין בתמונות שלא נראות כאילו צולמו בעולם האמיתי. למעשה, זו הסיבה שבגללה אתה יכול לזהות תמונות שנוצרו על ידי AI שימוש בחריגות שאינן הגיוניות.
3. מבחן Lovelace 2.0
התיאוריה שלפיה מחשב אינו יכול ליצור רעיונות מקוריים מעבר למה שהוא תוכנן לעשות, הושגה לראשונה על ידי עדה לאבלייס לפני מבחן טיורינג. עם זאת, אלן טיורינג התנגד לתיאוריה הזו בטענה שבינה מלאכותית עדיין יכולה להפתיע בני אדם. רק בשנת 2001 פותחו הקווים המנחים למבחן Lovelace כדי להבדיל בין AI לאדם - ולפי ה thekurzweillibrary הכללים תוקנו מאוחר יותר ב-2014.
כדי שבינה מלאכותית תעבור את מבחן Lovelace, היא חייבת להוכיח שהוא יכול לייצר רעיונות מקוריים החורגים מההכשרה שלו. לדגמי AI נוכחיים כמו GPT-4 אין את היכולת להמציא המצאות חדשות מעבר לידע הקיים שלנו. למרות זאת, בינה כללית מלאכותית יכול להשיג את היכולת הזו ולעבור את מבחן Lovelace.
4. מבחן טיורינג הפוך
מה דעתך על מבחן טיורינג, אבל נעשה הפוך? במקום לנסות לברר אם אתה מדבר עם אדם, המטרה של ה מבחן טיורינג הפוך זה להערים על הבינה המלאכותית להאמין שאתה בינה מלאכותית. עם זאת, אתה גם צריך מודל AI אחר כדי לענות על אותן שאלות באמצעות טקסט.
לדוגמה, אם ChatGPT-4 הוא החוקר, אתה יכול לרשום את Google Bard ובן אדם אחר כמשתתפים. אם מודל הבינה המלאכותית יכול לזהות נכון את המשתתף האנושי על סמך התשובות, הוא עבר את המבחן.
החיסרון של מבחן טיורינג ההפוך הוא שהוא לא אמין, במיוחד בהתחשב בכך לפעמים AI לא יכול להבדיל AI שנוצר ותוכן שנכתב על ידי אדם.
5. מסגרת סיווג בינה מלאכותית
על פי מסגרת סיווג הבינה המלאכותית שפותחה על ידי כריס סעד, מבחן טיורינג הוא רק שיטת הערכה אחת כדי לדעת אם אתה מדבר עם AI. באופן תמציתי יותר, מסגרת סיווג הבינה המלאכותית מבוססת על התיאוריה של אינטליגנציה מרובה, המחייבת את האינטליגנציה האנושית כדי לעמוד לפחות בשמונה קריטריונים שונים, אשר כוללים: קצב מוזיקלי, אינטליגנציה לוגית-מתמטית, זיהוי חזותי, אינטליגנציה רגשית, אינטליגנציה רפלקטיבית עצמית, יכולת חשיבה קיומית וגוף תְנוּעָה.
מכיוון שה-AI מוערך על פי שמונה פרמטרים שונים, לא סביר שהוא יעבור לאדם גם אם הוא מתפקד טוב מהממוצע במדדים מסוימים. לדוגמה, ChatGPT יכול לפתור בעיות מתמטיות, מתארים תמונות ומשוחחים בשפה טבעית כמו אדם, אבל זה ייכשל בקטגוריות אחרות שהוגדרו במסגרת הסיווג של AI.
מבחן טיורינג אינו סופי
מבחן טיורינג נועד להיות יותר ניסוי מחשבתי מאשר מבחן סופי להבדיל בין בני אדם ובינה מלאכותית. כאשר זה הוצע לראשונה, זה היה המדד המרכזי למדידת אינטליגנציה של מכונות.
עם זאת, עם הפיתוח האחרון של דגמי בינה מלאכותית עם יכולות אינטראקטיביות של דיבור, חזותי ושמיעה, מבחן טיורינג נופל מכיוון שהוא מוגבל לשיחת טקסט. הפתרון היעיל ביותר יהיה להציג חלופות למבחן טיורינג המבדילות עוד יותר מודלים של AI מבני אדם.