PaLM 2 מביא שדרוגים עצומים ל-LLM של גוגל, אבל האם זה אומר שהוא יכול עכשיו ללכת רגל אל אצבע עם GPT-4 של OpenAI?
גוגל חשפה את הדור הבא של Pathways Language Model (PaLM 2) שלה ב-10 במאי 2023, ב-Google I/O 2023. דגם השפה הגדול (LLM) החדש שלו מתהדר בשיפור רב בהשוואה לקודמו (PaLM) ואולי סוף סוף יהיה מוכן להתמודד עם יריבו הגדול ביותר, GPT-4 של OpenAI.
אבל כמה שיפור עשתה גוגל? האם PaLM 2 הוא יוצר ההבדל שגוגל מקווה שיהיה, וחשוב מכך, עם כל כך הרבה יכולות דומות, במה שונה PaLM 2 מה-GPT-4 של OpenAI?
PaLM 2 לעומת GPT-4: סקירת ביצועים
PaLM 2 עמוס ביכולות חדשות ומשופרות על פני קודמו. אחד היתרונות הייחודיים שיש ל-PaLM 2 על פני GPT-4 הוא העובדה שהוא זמין בגדלים קטנים יותר ספציפיים ליישומים מסוימים שאין להם כוח עיבוד רב כל כך.
לכל הגדלים השונים הללו יש דגמים קטנים משלהם הנקראים Gecko, Otter, Bison, Unicorn, כאשר Gecko הוא הקטן ביותר, ואחריו Otter, Bison, ולבסוף, Unicorn, הדגם הגדול ביותר.
גוגל טוענת גם לשיפור ביכולות החשיבה בהשוואה ל-GPT-4 ב-WinoGrande וב-DROP, כשהראשון מושך שוליים צרים ב-ARC-C. עם זאת, יש שיפור משמעותי בכל הנוגע ל-PaLM ו-SOTA.
PaLM 2 גם טוב יותר במתמטיקה, לפי עמוד 91 של גוגל עבודת מחקר של PaLM 2 [PDF]. עם זאת, האופן שבו גוגל ו-OpenAI בנו את תוצאות הבדיקה שלהן מקשה על השוואה ישירה בין שני המודלים. גוגל גם השמיטה כמה השוואות, כנראה בגלל ש-PaLM 2 לא הצליח כמעט כמו GPT-4.
ב-MMLU, GPT-4 קיבל 86.4, בעוד PaLM 2 קיבל 81.2. אותו דבר לגבי HellaSwag, שם קלע GPT-4 95.3, אבל PaLM 2 יכול היה לגייס רק 86.8, ו-ARC-E, שם GPT-4 ו-PaLM 2 קיבלו 96.3 ו-89.7, בהתאמה.
הדגם הגדול ביותר במשפחת PaLM 2 הוא PaLM 2-L. אמנם איננו יודעים את גודלו המדויק, אך אנו יודעים שהוא קטן משמעותית מדגם ה-PaLM הגדול ביותר אך משתמש יותר במחשוב אימון. לפי גוגל, ל-PaLM יש 540 מיליארד פרמטרים, כך שה"קטן משמעותית" צריך לשים את PaLM 2 בכל מקום בין 10 ל-300 מיליארד פרמטרים. זכור כי המספרים הללו הם רק הנחות המבוססות על מה שגוגל אמרה במאמר PaLM 2.
אם המספר הזה קרוב ל-100 מיליארד ומטה, סביר להניח ש-PaLM 2 קטן יותר מבחינת פרמטרים מאשר GPT-3.5. בהתחשב במודל שפוטנציאל מתחת ל-100 מיליארד יכול ללכת רגל עד אצבע עם GPT-4 ואפילו לנצח אותו בכמה משימות הוא מרשימים. GPT-3.5 הוציא בהתחלה הכל מהמים, כולל PaLM, אבל PaLM 2 הצליח להתאושש.
הבדלים בנתוני אימון GPT-4 ו-PaLM 2
בעוד שגוגל לא חשפה את גודל מערך ההדרכה של PaLM 2, החברה מדווחת במאמר המחקר שלה כי מערך ההדרכה של ה-LLM החדש גדול משמעותית. OpenAI גם נקטה באותה גישה בעת חשיפת GPT-4, ללא טענות לגבי גודל מערך ההדרכה.
עם זאת, גוגל רצתה להתמקד בהבנה מעמיקה יותר של מתמטיקה, לוגיקה, חשיבה ומדעים, כלומר חלק גדול מנתוני ההדרכה של PaLM 2 מתמקדים בנושאים שהוזכרו לעיל. גוגל אומרת במאמר שלה שקורפוס ההכשרה המקדים של PaLM 2 מורכב ממקורות רבים, כולל מסמכי אינטרנט, ספרים, קוד, מתמטיקה ונתוני שיחה, מה שמעניק להם שיפורים בכל הטווח, לפחות בהשוואה ל כַּף הַיָד.
כישורי השיחה של PaLM 2 צריכים להיות גם ברמה אחרת בהתחשב במודל שעבר הכשרה בלמעלה מ-100 שפות כדי לתת לו הבנה קונטקסטואלית טובה יותר ותרגום טוב יותר יכולות.
ככל שאושרו נתוני ההדרכה של GPT-4, OpenAI אמרה לנו שהיא אימנה את המודל באמצעות נתונים זמינים לציבור והנתונים שקיבלה רישיון. עמוד המחקר של GPT-4 קובע, "הנתונים הם קורפוס נתונים בקנה מידה אינטרנט הכולל פתרונות נכונים ושגויים לבעיות מתמטיקה, חלשות ו הגיון חזק, הצהרות סותרות את עצמן ועקביות, ומייצגות מגוון גדול של אידיאולוגיות ו רעיונות."
כאשר שואלים את GPT-4 שאלה, הוא יכול לייצר מגוון רחב של תגובות, שלא כולן עשויות להיות רלוונטיות לשאילתה שלך. כדי ליישר אותו עם כוונת המשתמש, OpenAI כיוונה עדין את התנהגות המודל באמצעות למידת חיזוק עם משוב אנושי.
למרות שאולי איננו יודעים מהם נתוני ההכשרה המדויקים שלשני המודלים הללו אומנו, אנו יודעים שכוונת האימון הייתה שונה מאוד. נצטרך לחכות ולראות איך ההבדל הזה בכוונת האימון מבדיל בין שני הדגמים בפריסה בעולם האמיתי.
צ'אטבוטים ושירותים של PaLM 2 ו-GPT-4
הפורטל הראשון שניגש לשני ה-LLMs הוא באמצעות הצ'אטבוטים שלהם, בארד של PaLM 2 וה-ChatGPT של GPT-4. עם זאת, GPT-4 עומד מאחורי חומת תשלום עם ChatGPT Plus, ומשתמשים בחינם מקבלים גישה רק ל-GPT-3.5. בארד, לעומת זאת, הוא בחינם לכולם וזמין ב-180 מדינות.
זה לא אומר שאתה גם לא יכול לגשת ל-GPT-4 בחינם. Bing AI Chat של מיקרוסופט משתמש ב-GPT-4 והוא חינמי לחלוטין, פתוח לכולם וזמין ממש ליד Bing Search, היריבה הגדולה ביותר של גוגל בתחום.
Google I/O 2023 היה מלא בהכרזות על האופן שבו PaLM 2 ושילוב AI גנרטיבי ישפרו את Google Workspace ניסיון עם תכונות AI שמגיעות ל-Google Docs, Sheets, Slides, Gmail, וכמעט כל שירות שענקית החיפוש מציעה. בנוסף, גוגל אישרה ש-PaLM 2 כבר שולבה בלמעלה מ-25 מוצרי גוגל, כולל אנדרואיד ויוטיוב.
לשם השוואה, מיקרוסופט כבר הביאה תכונות בינה מלאכותית לחבילת התוכניות של Microsoft Office ורבים מהשירותים שלה. נכון לעכשיו, אתה יכול לחוות את שני ה-LLM בגרסאות משלהם של הצעות דומות משתי חברות יריבות שעוברות ראש בראש בקרב AI.
עם זאת, מאז ש-GPT-4 יצא מוקדם והקפיד להימנע רבות מהטעויות שגוגל עשתה עם בארד המקורי, זה היה דה פקטו LLM למפתחי צד שלישי, סטארט-אפים וכמעט כל מי שמחפש לשלב מודל AI מסוגל בשירות שלהם, כך רָחוֹק. יש לנו רשימה של אפליקציות GPT-4 אם ברצונך לבדוק אותן.
זה לא אומר שמפתחים לא יעברו או לפחות ינסו את PaLM 2, אבל גוגל עדיין צריכה להתעדכן ב-OpenAI בחזית הזו. והעובדה ש-PaLM 2 הוא קוד פתוח, במקום להיות נעול מאחורי API בתשלום, פירושה שיש לו פוטנציאל לאימוץ נרחב יותר מאשר GPT-4.
האם PaLM 2 יכול להתמודד עם GPT-4?
PaLM 2 עדיין חדש מאוד, כך שהתשובה לשאלה האם הוא יכול להתמודד עם GPT-4 או לא נותרה להיענות. עם זאת, עם כל מה שגוגל מבטיחה והאופן האגרסיבי שבו היא החליטה להשתמש כדי להפיץ את זה, נראה ש-PaLM 2 יכול לתת ל-GPT-4 את הכסף שלו.
עם זאת, GPT-4 הוא עדיין דגם בעל יכולת וכאמור, מנצח את PaLM 2 בלא מעט השוואות. עם זאת, הדגמים הקטנים המרובים של PaLM 2 נותנים לו יתרון בלתי ניתן להפרכה. שממית עצמה היא כל כך קלה שהיא יכולה לעבוד במכשירים ניידים, גם במצב לא מקוון. המשמעות היא ש-PaLM 2 יכול לתמוך בסוג שונה לחלוטין של מוצרים והתקנים שעלולים להתקשות להשתמש ב-GPT-4.
מרוץ הבינה המלאכותית מתחמם
עם השקת PaLM2, המירוץ אחר דומיננטיות בינה מלאכותית התחמם, מכיוון שזה עשוי להיות רק היריב הראוי הראשון שיצא נגד GPT-4. עם מודל AI רב-מודאלי חדש יותר בשם "ג'מיני" גם הוא בהדרכה, גוגל לא מראה שום סימני האטה כאן.