דגמי שפה גדולים (LLMs) מגיעים בכל הצורות והגדלים, ויסייעו לך בכל דרך שתמצא לנכון. אבל מה הכי טוב? העמדנו את ה-AI הדומיננטיים מאלפבית, OpenAI ומטא למבחן.
מה שאתה צריך לדעת על AI Chatbots
בינה כללית מלאכותית הייתה מטרה של מדעני מחשבים במשך עשרות שנים, ובינה מלאכותית שימשה עמוד התווך עבור סופרי מדע בדיוני ויוצרי סרטים עוד יותר.
AGI מציגה אינטליגנציה דומה ליכולות הקוגניטיביות האנושיות, ו מבחן טיורינג- מבחן של יכולתה של מכונה להפגין התנהגות אינטליגנטית שאין להבחין בה מזו של אדם - נותר כמעט ללא עוררין בשבעת העשורים מאז הוקמה לראשונה.
ההתכנסות האחרונה של מחשוב בקנה מידה גדול במיוחד, כמויות עצומות של כסף ונפח המידע המדהים בחופשיות הזמין באינטרנט הפתוח אפשר לענקיות הטכנולוגיה לאמן דגמים שיכולים לחזות את קטע המילה הבא - או האסימון - ברצף של אסימונים.
בזמן כתיבת שורות אלה, שניהם בארד של גוגל ו ChatGPT של OpenAI זמינים לשימוש ולבדיקה באמצעות ממשקי האינטרנט שלהם.
מודל השפה של Meta, LLaMa, אינו זמין באינטרנט, אבל אתה יכול בקלות הורד והפעל את LLaMa על החומרה שלך והשתמש בו דרך שורת פקודה או הפעל את דלאי במחשב שלך-אחת מכמה אפליקציות עם ממשק ידידותי למשתמש.
למטרות הבדיקה, נריץ את מודל ה-Alpaca 7B של אוניברסיטת סטנפורד - עיבוד של LLaMa - ונציב אותו מול בארד ו-ChatGPT.
ההשוואות והבדיקות הבאות לא אמורות להיות ממצות אלא לתת לך אינדיקציה לגבי נקודות מפתח ויכולות.
מהו דגם השפה הגדול הקל ביותר לשימוש?
גם Bard וגם ChatGPT דורשים חשבון כדי להשתמש בשירות. גם חשבונות Google וגם חשבונות OpenAI קלים וחינמיים ליצירה, ואתה יכול מיד להתחיל לשאול שאלות.
עם זאת, כדי להפעיל את LLaMa באופן מקומי, תצטרך להיות בעל ידע מיוחד או את היכולת לעקוב אחר הדרכה. תצטרך גם כמות משמעותית של שטח אחסון.
מהו מודל השפה הגדולה הפרטית ביותר?
גם לבארד וגם ל-ChatGPT יש מדיניות פרטיות נרחבת, וגוגל מדגישה שוב ושוב במסמכים שלה כי "אין לכלול מידע שניתן להשתמש בו כדי לזהות אותך או אחרים ב-Bard שלך שיחות."
כברירת מחדל, Google אוספת את השיחות שלך ואת המיקום הכללי שלך על סמך כתובת ה-IP שלך, המשוב שלך ופרטי השימוש. מידע זה נשמר בחשבון Google שלך עד 18 חודשים. למרות שאתה יכול להשהות את שמירת הפעילות שלך בארד, עליך להיות מודע לכך ש"כדי לעזור באיכות ולשפר את המוצרים שלנו, סוקרים אנושיים קוראים, מציינים ומעבדים את שיחות בארד שלך."
השימוש ב-Bard כפוף אף הוא לתקן מדיניות הפרטיות של גוגל.
מדיניות הפרטיות של OpenAI דומה במידה רבה ואוספת נתוני כתובת IP ונתוני שימוש. בניגוד לשמירה מוגבלת בזמן של גוגל, OpenAI "תשמור את המידע האישי שלך רק כל עוד אנחנו צריכים כדי לספק את שירות לך, או למטרות עסקיות לגיטימיות אחרות כגון פתרון מחלוקות, סיבות בטיחות ואבטחה, או ציות לחוק שלנו התחייבויות".
לעומת זאת, דגם מקומי במחשב שלך אינו דורש חשבון או שיתוף נתוני משתמש עם אף אחד.
לאיזה LLM יש את הידע הכללי הטוב ביותר?
על מנת לבדוק לאיזה LLM יש את הידע הכללי הטוב ביותר, שאלנו שלוש שאלות.
השאלה הראשונה, "לאיזה דגל לאומי יש חמישה צדדים?" קיבל תשובה נכונה רק על ידי בארד, שזיהה את הדגל הלאומי של נפאל כבעל חמישה צדדים.
ChatGPT טען בביטחון כי "אין דגל לאומי שיש לו חמישה צדדים. דגלים לאומיים הם בדרך כלל מלבניים או מרובעים בצורתם, המאופיינים בצבעים, בדוגמאות ובסמלים המובהקים שלהם".
הדגם המקומי שלנו התקרב וקבע כי "לדגל הלאומי ההודי יש חמישה צדדים והוא תוכנן בשנת 1916 כדי לייצג את הודו של הודו תנועת עצמאות." אמנם הדגל הזה היה קיים והיה לו חמישה צדדים, אבל זה היה הדגל של תנועת שלטון הבית ההודי - לא דגל לאומי.
אף אחד מהמודלים שלנו לא הצליח להגיב שהמונח הנכון לאובייקט בצורת אפונה הוא "פיזיפורמי", כאשר ChatGPT פועל עד כדי להציע שלאפונה יש "צורה גיאומטרית תלת מימדית שהיא עגולה לחלוטין סִימֶטרִי."
כל שלושת הצ'אטבוטים זיהו נכון את פרנקו מלרבה כאסטרונאוט איטלקי וחבר בארגון הפרלמנט האירופי, כאשר בארד נותן תשובה מנוסחת זהה לחלק בוויקיפדיה של מלרבה כְּנִיסָה.
איזה LLM מתאים להוראות טכניות?
כאשר יש לך בעיות טכניות, אתה עלול להתפתות לפנות לצ'אטבוט לעזרה. בעוד שהטכנולוגיה צועדת, חלק מהדברים נשארים אותו הדבר. התקע החשמלי BS 1363 נמצא בשימוש בבריטניה, אירלנד ומדינות רבות אחרות מאז 1947. שאלנו את דגמי השפה כיצד לחבר אותו בצורה נכונה.
לכבלים המחוברים לתקע יש חוט חי (חום), חוט הארקה (צהוב/ירוק) וחוט ניטרלי (כחול). אלה חייבים להיות מחוברים למסופים הנכונים בתוך בית התקע.
יישום הדלאי שלנו זיהה נכון את התקע כ"סגנון אנגלי", ואז סטה מהמסלול ובמקום זאת נתן הוראות לתקע BS 546 עגול פינים ישן יותר יחד עם צבעי חיווט ישנים יותר.
ChatGPT היה מעט יותר מועיל. זה סימן נכון את צבעי החיווט ונתן רשימת חומרים וקבוצה של שמונה הוראות. ChatGPT גם הציע להכניס את החוט החום למסוף שכותרתו "L", את החוט הכחול לתוך "N" מסוף, והחוט הצהוב לתוך "E". זה יהיה נכון אם מסופי BS1363 היו מסומנים, אבל הם אינם.
בארד זיהה את הצבעים הנכונים עבור החוטים והורה לנו לחבר אותם למסופי Live, Neutral ו- Earth. זה לא נתן הוראות כיצד לזהות את אלה.
לדעתנו. אף אחד מהצ'אטבוטים לא נתן הוראות מספיקות כדי לעזור למישהו לחבר כראוי תקע חשמלי BS 1363. תגובה תמציתית ונכונה תהיה "כחול משמאל, חום מימין".
איזה LLM טוב לכתיבת קוד?
Python היא שפת תכנות שימושית שפועל ברוב הפלטפורמות המודרניות. הנחנו את המודלים שלנו להשתמש ב-Python ו"בנה תוכנית מחשבון בסיסית שיכולה לבצע פעולות אריתמטיות כמו חיבור, חיסור, כפל וחילוק. זה צריך לקחת קלט מהמשתמש ולהציג את התוצאה." זה אחד מה פרויקטי התכנות הטובים ביותר למתחילים.
בעוד שגם Bard וגם ChatGPT החזירו באופן מיידי קוד שמיש והגיב ביסודיות, אותו הצלחנו לבדוק ולאמת, אף אחד מהקודים מהמודל המקומי שלנו לא יפעל.
איזה LLM מספר את הבדיחות הטובות ביותר?
הומור הוא אחד היסודות בלהיות אנושי ובוודאי אחת הדרכים הטובות ביותר להבדיל בין אדם למכונה. לכל אחת מהדוגמניות שלנו נתנו את ההנחיה הפשוטה: "צור בדיחה מקורית ומצחיקה".
למרבה המזל של קומיקאים בכל מקום ושל המין האנושי בכלל, אף אחת מהדוגמניות לא הייתה מסוגלת ליצור בדיחה מקורית.
בארד הציג את הקלאסיקה, "למה הדחליל זכה בפרס? הוא היה מצטיין בתחומו".
גם היישום המקומי שלנו וגם ChatGPT הציעו את האנחות הראויות, "למה מדענים לא סומכים על אטומים? כי הם מרכיבים הכל!"
בדיחה נגזרת אך מקורית תהיה, "איך מודלים של שפה גדולה כמו אטומים? שניהם ממציאים דברים!"
אתם קוראים את זה כאן קודם, אנשים.
אף צ'אטבוט אינו מושלם
מצאנו שבעוד שלכל שלושת המודלים של השפה הגדולים יש את היתרונות והחסרונות שלהם, אף אחד מהם לא יכול להחליף את המומחיות האמיתית של בן אדם עם ידע מיוחד.
בעוד שגם בארד וגם ChatGPT נתנו תשובות טובות יותר לשאלת הקידוד שלנו והם קלים מאוד לשימוש, הפעלת מודל שפה גדול באופן מקומי אומר שאתה לא צריך לדאוג לפרטיות או צֶנזוּרָה.
אם אתה רוצה ליצור אמנות AI נהדרת מבלי לדאוג שמישהו מסתכל מעבר לכתף שלך, קל להפעיל מודל AI אמנותי גם במכונה המקומית שלך.