לאחר השקת ChatGPT בנובמבר 2022, צ'טבוט ה-AI הפנומנלי התגלה כאחד מכלי הכתיבה המהימנים ביותר באינטרנט. זה פשוט לשימוש; תאר מה אתה צריך להיות כתוב, ו-ChatGPT מדפיס אותו על המסך תוך שניות.
עם זאת, בעידן שבו טקסט שנוצר על ידי בינה מלאכותית מועבר בכתב אנושי ומשמש כדי להשיג יתרון לא הוגן, זיהוי תוכן בינה מלאכותית חשוב מאוד. אבל ChatGPT לא יכול לזהות במדויק תוכן AI, אפילו את העבודה שלו - אבל למה?
האם יש הבדל בין טקסט בינה מלאכותית לכתיבה אנושית?
תנאי מוקדם ל-ChatGPT לזהות את הכתיבה שלו או כל טקסט שנוצר בינה מלאכותית הוא שחייב להיות הבדל בינו לבין טקסט שנכתב על ידי אדם. אז האם יש הבדל משמעותי בין טקסט שנכתב על ידי אדם לבין תוכן שנוצר בינה מלאכותית? אם יש, בוודאי, כלי כמו ChatGPT אמור להיות מסוגל להבחין בו.
כתבנו סיפור קצר ללא כל קלט מכלי AI ואז שאלנו את ChatGPT אם הסיפור הוא תוכן שנכתב בבינה מלאכותית. ChatGPT סימן אותו בביטחון כטקסט שנוצר בינה מלאכותית.
לאחר מכן ביקשנו מ-ChatGPT ליצור סיפור, ובאותו שרשור צ'אט, הדבקנו את הטקסט שנוצר ושאלנו את ChatGPT אם הטקסט נוצר בינה מלאכותית. התגובה של ChatGPT? "לא" בטוח בעצמו.
ChatGPT נכשל בזיהוי טקסט שנכתב על ידי אדם או שנוצר בינה מלאכותית בשני המקרים. אז איך זה ש-ChatGPT לא יכול לזהות טקסט משלו? האם זה אומר שאין הבדל בין AI לטקסט אנושי?
ובכן, יש. נוכל לכתוב ספר שלם על ההבדל בין השניים, אבל זה לא משנה הרבה. אז, אם יש הבדל, מדוע ChatGPT או כל כלי AI אחר אינם מסוגלים לזהות את ההבדלים הללו ולהצביע במדויק על טקסט שנוצר על ידי AI מתוך טקסט שנכתב על ידי אדם? התשובה טמונה ב כיצד ChatGPT עובד וכיצד הוא יוצר טקסט.
כיצד ChatGPT מייצר טקסט
כאשר אתה מבקש מ-ChatGPT ליצור טקסט, הוא מנסה לחקות את תהליך הכתיבה האנושי. ראשית, המודל שמאחורי ChatGPT - Generative Pre-trained Transformer (GPT) - הוכשר על קורפוס גדול של טקסט אנושי. כל דבר, החל מאימיילים, מאמרי בריאות, מאמרים טכניים, מאמרים בתיכון, וכמעט כל טקסט שתוכל למצוא באינטרנט הוזנה למודל במהלך האימון. אז ChatGPT מבין איך כל אחד מסוגי הטקסטים האלה צריך להיכתב.
אם אתה מבקש מ-ChatGPT לכתוב דוא"ל לבוס שלך, הוא יודע איך דוא"ל מסוג זה אמור להיראות כי הוא עבר הכשרה על אימיילים דומים - כנראה אלפי מהם. באופן דומה, אם אתה מבקש ממנו לכתוב חיבור בתיכון, הוא גם יודע איך חיבור תיכון צריך להישמע. ChatGPT ינסה לכתוב כל מה שתרצה שיכתוב בצורה שאדם יכתוב.
אבל יש מלכוד. שלא כמו איך בני אדם כותבים, ChatGPT לא באמת מבין מה הוא כותב בצורה שאדם יבין. במקום זאת, הצ'אטבוט מנסה לחזות מה תהיה המילה הבאה הסבירה ביותר במשפט עד שהוא משלים את הכתיבה.
איך ChatGPT כותב לפי חיזוי
נניח שאתה מבקש מ-ChatGPT לכתוב סיפור על עיר בדיונית בשם Volkra. ישנה אפשרות עצומה שהצ'אט בוט יתחיל את הסיפור במילים "פעם אחת". זה בגלל שהצ'אטבוט לא חושב על עצמו אבל מנסה לחזות מה יכתוב בן אדם על סמך מה שהוא למד מאלפי הסיפורים שהוא ניזון במהלך הַדְרָכָה.
אז, מתוך אמונה שסביר להניח שאדם יתחיל את הסיפור במילים "פעם אחת", ChatGPT ינסה לחזות את המילה ההגיונית הבאה, שתהיה להיות "a" ואחריו "זמן". אז יהיה לך "פעם..." ואחריו המילה ההגיונית הבאה והבאה עד שהסיפור יושלם. ChatGPT כותב בעצם על ידי חיזוי איזו מילה תגיע באופן טבעי (או לפחות בעל ההסתברות הגבוהה ביותר) לבוא אחריה במשפט ולהכניס אותו.
לכן, כאשר כלי בינה מלאכותית מנסה לזהות אם טקסט נוצר בינה מלאכותית, אחד הקריטריונים שהוא מנסה לשקול הוא יכולת הניבוי של הטקסט שכן כלי בינה מלאכותית כותבים לפי חיזוי. מדד זה של חיזוי נקרא תמיהה בלשון AI. כעת, כאשר מוצג טקסט, בין שאר הקריטריונים, כלי בינה מלאכותית כמו ChatGPT מנסה לנתח את הטקסט כדי למדוד עד כמה צפוי רצף המילים או המשפטים בטקסט. חיזוי רב יותר או תמיהה נמוכה פירושו בדרך כלל שהטקסט נוצר כנראה בינה מלאכותית. פחות חיזוי או תמיהה גבוהה יותר פירושו בדרך כלל שהטקסט נכתב על ידי בני אדם.
קריטריונים אלה, יחד עם גורמים נוספים כמו רמת היצירתיות של טקסט, למרבה הצער, אינם מספיקים כדי לוודא בוודאות אם טקסט נכתב על ידי כלי AI או לא. הסיבה לכך היא שבני אדם יכולים לכתוב בשונות גדולה יותר, כמו בטקסט לדוגמה שהשתמשנו בו להדגמה בתחילת מאמר זה.
צ'טבוטים של AI כמו ChatGPT נועדו לחקות שפה אנושית טבעית ככל האפשר. אז בעוד שלטקסט בינה מלאכותית עשויים להיות דפוסים שניתן להבחין בהם, הדפוסים הללו אינם כה ברורים אפילו לכלי רב עוצמה כמו ChatGPT. זו הסיבה ש-ChatGPT לא יכול לזהות את הכתיבה שלו, כמו גם מדוע כלי גלאי טקסט בינה מלאכותית לא עובדים.
האם ChatGPT תזהה את הכתיבה שלו בעתיד?
נכון לעכשיו, כלים כמו ChatGPT אינם יכולים לזהות אם טקסט נכתב בעצמו או כל כלי בינה מלאכותית אחרת מכיוון שאין דפוס ברור וניתן להבחין בתוכן שנוצר בינה מלאכותית. עם זאת, יש סיכוי טוב שזה ישתנה בקרוב. עם מאמצים של חברות כמו ChatGPT להכניס סימני מים דיגיטליים לתוכן שנוצר באמצעות ChatGPT, תהיה דפוס ברור יותר לטקסט שנוצר על ידי הצ'אטבוט.