GPT-4 כאן, ואלה התכונות החדשות שכדאי לכם לבדוק.

OpenAI השיקה סוף סוף את עדכון ה-GPT המיוחל שלה, GPT-4. מודל השפה הגדול (LLM) מגיע עם כמה תכונות ויכולות חדשות ועוצמתיות שכבר זעזעו משתמשים ברחבי העולם.

בנוסף להיותו טוב משמעותית מ-GPT-3.5, ה-LLM הקיים שמניע את הצ'אט בוט הויראלי של OpenAI ChatGPT, GPT-4 יכול להבין תשומות מורכבות יותר, יש לה מגבלת קלט תווים גדולה בהרבה, יש יכולות מולטי-מודאליות, ולפי הדיווחים בטוחה יותר להשתמש.

1. GPT-4 יכול להבין כניסות מורכבות יותר

אחת התכונות החדשות הגדולות ביותר של GPT-4 היא היכולת שלו להבין הנחיות מורכבות וניואנסיות יותר. לפי OpenAI, GPT-4 "מציג ביצועים ברמה אנושית על אמות מידה מקצועיות ואקדמיות שונות."

זה הוכח על ידי העברת GPT-4 לכמה בחינות ברמת האדם ומבחנים סטנדרטיים, כגון SAT, BAR ו-GRE, ללא הכשרה ספציפית. לא רק ש-GTP-4 הבין ופתר את המבחנים הללו עם ציון גבוה יחסית על פני הלוח, אלא שהוא גם גבר על קודמו, GPT-3.5, בכל פעם.

קרדיט תמונה: OpenAI

היכולת להבין הנחיות קלט מגוונות יותר נעזרת גם בעובדה של-GPT-4 יש מגבלת מילים הרבה יותר גדולה. הדגם החדש יכול להתמודד עם הנחיות קלט של עד 25,000 מילים (בהקשר, GPT-3.5 הוגבל ל-8,000 מילים). זה ישפיע ישירות על הפרטים שמשתמשים יכולים לדחוס לתוך ההנחיות שלהם, ומכאן לתת למודל הרבה יותר מידע לעבוד איתו ולייצר פלטים ארוכים יותר.

instagram viewer

GPT-4 תומך גם בלמעלה מ-26 שפות, כולל שפות בעלות משאבים נמוכים כגון לטבית, וולשית וסווהילית. כאשר נמדד על דיוק שלוש זריקות במדד ה-MMLU, GPT-4 ניצח את GPT-3.5 כמו גם LLMs מובילים אחרים כגון PaLM וצ'ינצ'ילה במונחים של ביצועים בשפה האנגלית ב-24 שפות.

2. יכולות מולטי-מודאליות

הגרסה הקודמת של ChatGPT הוגבל להודעות טקסט בלבד. לעומת זאת, אחת התכונות החדשות ביותר של GPT-4 היא היכולות הרב-מודאליות שלו. המודל יכול לקבל הודעות טקסט ותמונה כאחד.

המשמעות היא שה-AI יכול לקבל תמונה כקלט ולפרש ולהבין אותה בדיוק כמו הנחיה טקסט. יכולת זו משתרעת על כל הגדלים והסוגים של תמונות וטקסט, כולל מסמכים המשלבים את השניים, סקיצות מצוירות ביד ואפילו צילומי מסך.

עם זאת, יכולות קריאת התמונות של GPT-4 חורגות מעבר לפירושן. OpenAI הציג זאת בזרם המפתחים שלה (למעלה), שם הם סיפקו ל-GPT-4 דגם מצויר ביד של אתר בדיחות. על המודל הוטל לכתוב קוד HTML ו-JavaScript כדי להפוך את הדגם לאתר אינטרנט תוך החלפת הבדיחות בבדיחות בפועל.

GPT-4 כתב את הקוד תוך שימוש בפריסה שצוינה בדגם. לאחר בדיקה, הקוד יצר אתר עובד עם, כפי שאתה יכול לנחש, בדיחות ממשיות. האם זה אומר התקדמות בינה מלאכותית משמעה את סוף התכנות? לא בדיוק, אבל זו עדיין תכונה שתהיה שימושית בסיוע למתכנתים.

עד כמה שתכונה זו נראית מבטיחה, היא עדיין בתצוגה מקדימה של מחקר ואינה זמינה לציבור. בנוסף, למודל לוקח הרבה זמן לעבד תשומות חזותיות, כאשר OpenAI עצמה מצהירה שיכול לקחת עבודה וזמן כדי להיות מהיר יותר.

3. יכולת היגוי גדולה יותר

OpenAI גם טוענת של-GPT-4 יש רמה גבוהה של כושר היגוי. זה גם מקשה על הבינה המלאכותית לשבור אופי, כלומר יש סיכוי נמוך יותר שהוא ייכשל כאשר הוא מיושם באפליקציה כדי לשחק דמות מסוימת.

מפתחים יכולים לקבוע את הסגנון והמשימה של ה-AI שלהם על ידי תיאור הכיוון בהודעת "מערכת". הודעות אלו מאפשרות למשתמשי API להתאים אישית את חווית המשתמש בגבולות מסוימים. מכיוון שהודעות אלו הן גם הדרך הקלה ביותר "לפרוץ" את המודל, הם גם עובדים על הפיכתן לאבטחה יותר. ההדגמה של GPT-4 תפסה את הנקודה הזו בכך שגרמה למשתמש לנסות למנוע מ-GPT-4 להיות מורה סוקראטי ולענות על השאילתה שלו. עם זאת, הדוגמנית סירבה לשבור אופי.

4. בְּטִיחוּת

OpenAI השקיע שישה חודשים ביצירת GPT-4 בטוח יותר ומיושר יותר. החברה טוענת שיש לה 82% פחות סיכוי להגיב לבקשות לתוכן בלתי הולם או אסור בדרך אחרת, 29% יותר סיכוי להגיב בהתאם למדיניות של OpenAI לבקשות רגישות, וסיכוי של 40% יותר להפיק תגובות עובדתיות בהשוואה ל GPT-3.5.

זה לא מושלם, ועדיין אפשר לצפות שהוא "יזיז" מדי פעם ויכול לטעות בתחזיותיו. בטח, ל-GPT-4 יש תפיסות וכוח חיזוי טובים יותר, אבל אתה עדיין לא צריך לסמוך באופן עיוור על הבינה המלאכותית.

5. שיפורי ביצועים

מלבד הערכת הביצועים של המודל בבחינות אנושיות, OpenAI העריכה את הבוט גם לפי מדדים מסורתיים המיועדים למודלים של למידת מכונה.

היא טוענת ש-GPT-4 "מתעלה באופן ניכר על ביצועי LLM קיימים ו"רוב הדגמים החדישים ביותר". אמות מידה אלה כוללות את MMLU, AI2 Reasoning Challenge (ARC), WinoGrande, HumanEval ו-Drop, כולם בודקים יכולות בודדות.

תמצא תוצאות דומות בעת השוואת ביצועים על מדדי חזון אקדמיים. המבחנים המופעלים כוללים VQAv2, TextVQA, ChartQA, AI2 Diagram (AI2D), DocVQA, Infographic VQA, TVQA ו-LSMDC, שכולם מובילים ב-GPT-4. עם זאת, OpenAI הצהירה כי התוצאות של GPT-4 במבחנים אלו "אינן מייצגות במלואן את היקף היכולות שלה", שכן חוקרים ממשיכים למצוא דברים חדשים ומאתגרים יותר שהמודל יכול להתמודד איתו.

צעד קטן עבור GPT-4, קפיצה ענקית עבור AI

עם יותר דיוק, בטיחות שימוש ויכולות מתקדמות, GPT-4 שוחרר לציבור באמצעות תוכנית המנוי החודשית ChatGPT+ שעולה 20 לחודש. בנוסף, OpenAI שיתפה פעולה עם ארגונים שונים כדי להתחיל לבנות מוצרים פונים לצרכן עם GPT-4. Microsoft Bing, Duolingo, Stripe, Be My Eyes ואקדמיית Khan, בין היתר, כבר הטמיעו GPT-4 במוצרים שלהם.

GPT-4 עשוי להיות עדכון מצטבר על GPT-3.5, אבל זה ניצחון ענק עבור AI בסך הכל. ככל שהמודל נהיה יותר נגיש, הן למשתמש הממוצע והן למפתחים באמצעות ה-API שלו, נראה שהוא יעשה טענה טובה להטמעות LLM בתחומים שונים.