למרות ש-ChatGPT הוא אחד מצ'אטבוטי הבינה המלאכותית הפופולריים ביותר, ייתכן שהוא כבר לא הטוב ביותר. קלוד AI מציע כמה תכונות מכות GPT. אבל מה עדיף?
מאז שחרורו בנובמבר 2022, ChatGPT נשאר הכוח הדומיננטי במרחב הצ'אטבוטים של AI. למרות מאמצים מרחיקי לכת של כמה חברות בינה מלאכותית, אף אחד לא באמת הצליח לבנות צ'טבוט שבאמת מאתגר את ChatGPT באיכות התגובה הכוללת. בארד של גוגל? Bing AI של מיקרוסופט? לא לא ממש.
עם זאת, קלוד AI, צ'אט בוט שנבנה על ידי סטארט-אפ AI Anthropic, מציג איכויות של צ'טבוט שיכול להדיח את ChatGPT. מספר לא מבוטל של משתמשים כבר אומרים שקלוד הוא האפשרות הטובה יותר. אבל האם זה המצב? בואו ניקח את שני הצ'אטבוטים לסיבוב.
ChatGPT לעומת קלוד AI: הגיון בריא והיגיון
יש ניגוד מסקרן בעבודה עם צ'אטבוטים של AI. מצד אחד, הם יכולים לעבור משימות מורכבות שבני אדם עשויים לעמול במשך ימים כדי לפתור. מצד שני, לפעמים הם מתחבטים בבעיות אלמנטריות שדורשות רק קצת הגיון בריא או הגיון. אז, בדקנו גם את ChatGPT וגם את קלוד AI כדי לראות איזה צ'טבוט של AI היה טוב יותר במשימות הגיון והיגיון.
ChatGPT חילק את הבעיה לחלקים ופתר אותה בניסיון הראשון. גם קלוד AI השתדל ופתר גם את הבעיה, אבל בגישה אחרת.
במשימה הראשונה, שני הצ'אטבוטים הצליחו לפצח את הבעיה. אז, עברנו לסוג אחר של בעיה. הטלנו על שני הצ'אטבוטים לענות על שאלת טריק.
ChatGPT הצליח לזהות מיד את הטריק - אתה לא יכול לקבור ניצולים כי הם לא מתים. קלוד AI, לעומת זאת, נראה שהבין שזו שאלת טריק, אבל לא הצליח לזהות את הנושא ההגיוני ביותר שאתה לא קובר ניצולים.
במקום זאת, הוא ניתח יתר על המידה את השאלה והגיע למסקנה ש"לא יהיו ניצולים לקבור" כי התרסקות ממאדים לכדור הארץ תהיה קטלנית. זו לא התשובה שציפינו לה, אבל אם מסתכלים על הדברים מזווית אחרת, יש בזה אמת.
במשימה הזו, אנחנו נותנים אותה ל-ChatGPT, אבל אנחנו לא יכולים לשלול לחלוטין את הגישה של קלוד AI. למשימה האחרונה שלנו במדד זה, שאלנו את שני הצ'אטבוטים כמה תפוחים יישארו על עץ תפוחים לאחר חמישה ו-10 ימים בהתאמה אם התחלנו עם 10 תפוחים וחמישה מהם נחתכו בעודם על העץ. ChatGPT אמר שעדיין יישארו 10 תפוחים.
קלוד AI, לעומת זאת, נתן תגובה הגיונית יותר בכך שהכיר בכך שחמשת התפוחים הפרוסים עשויים להירקב.
קלוד AI קיבל את זה בבירור. ניסינו עוד כמה בעיות מסובכות, ולשני הצ'אטבוטים היה חלק נכבד של הצלחות וכישלונות בהתמודדות איתם. בהתחשב בתוצאה שצפינו, זה יכול להיות הוגן לומר שבעוד של-ChatGPT יש יתרון, שני הצ'אטבוטים אינם רחוקים מדי בהיגיון הישר וביכולות החשיבה ההגיונית.
ChatGPT לעומת קלוד AI: כישורי מתמטיקה
גם אם לעולם אינך מתכוון להשתמש ב-ChatGPT או בקלוד AI כדי לפתור את שיעורי הבית שלך באלגברה, ליכולות המתמטיות שלהם יש השלכות מרחיקות לכת. עבור צ'אטבוטים של AI, מתמטיקה היא המפתח להבנת ההיגיון בעולם האמיתי, זיהוי חשיבה פגומה והודאה בטעויות.
בעיקרו של דבר, מיומנות במתמטיקה היא מדד ליבה של בינה מלאכותית. אז בין ChatGPT לקלוד AI, איזה צ'אט בוט בקיא יותר במתמטיקה? הטלנו על שני הצ'אטבוטים לפתור בעיית פרודוקטיביות מתמטית מפותלת. התחלנו עם קלוד AI, והצ'אטבוט פיצח את הבעיה.
ChatGPT גם פיצח את הבעיה.
בהמשך, ביקשנו משני הצ'אטבוטים לפתור 8/a-1 = 20/3a-1, בעיה מתמטית פשוטה למדי עם שיעור כישלון גבוה באופן מפתיע בקרב צ'אטבוטים של AI. ChatGPT הצליח לפתור את זה, לספק תשובה נכונה של -3 בניסיון הראשון.
קלוד AI נכשל בניסיון הראשון, אבל כשהנחינו אותו לפתור את הבעיה שלב אחר שלב (מה שמאלץ אותו לחשוב על כל שלב בהיגיון שלו) הוא הצליח לפצח אותה.
ניסינו עוד כמה בעיות במתמטיקה. בעוד ששני הצ'אטבוטים הצליחו בניסיון הראשון במקרים מסוימים, בכמה מקרים, קלוד AI נזקק לניסיון שני או שלישי כדי לספק את התגובה הנכונה. מבחינת כישורי מתמטיקה, ניתן את הכתר ל-ChatGPT.
ChatGPT לעומת קלוד AI: יצירתיות
אחד ההייפ הגדולים ביותר של קלוד AI הוא היכולות היצירתיות שלו. אבל האם זה יכול להתאים ליצירתיות של ChatGPT? או, האם זה יכול לעלות על ChatGPT? כדי להעמיד את שני הצ'אטבוטים במבחן, הטלנו עליהם לכתוב מילים לשיר ראפ מתחרז.
בחרנו במבחן ראפ מחורז כי זה משהו שהרבה דוגמניות שפה נאבקות בו. רוב הדגמים בדרך כלל לא יבינו את החרוזים כמו שצריך או יגידו את החריזה כמו שצריך בעוד המילים עצמן אינן הגיוניות. כדי להפוך את הדברים למעניינים יותר, שיר הראפ יעסוק בגידול מלפפונים.
אז ביקשנו גם ChatGPT וגם קלוד AI "לכתוב ראפ מחורז על גידול מלפפונים כחקלאי ולהיות מיליונר מזה." ChatGPT הגיע ראשון, וכצפוי, זה הוליד כמה מרגשים מילים.
לאחר מכן הסענו את אותה הנחיה לקלוד AI, וזה גם נתן לו סיכוי הוגן.
שתי המילים טובות, אבל נראה היה של-ChatGPT יש יתרון כאן. היה יותר טוב לחרוז, והגענו לתוצאה שהיינו צריכים בניסוי הראשון. היינו צריכים לנסות שלוש פעמים לפני שקלוד AI הצליח להפיק מילים מתחרזות. אנו ניתן את זה ל-ChatGPT.
לאחר שניסה עוד כמה משימות יצירתיות, נראה שקלוד AI מצטיין במשימות הקשורות לכתיבה והיה מסוגל לכתוב תוכן בעל צליל טבעי יותר כמו שסופר אנושי היה עושה. למרות ש ChatGPT היה טוב יותר בהתגברות על משימות יצירתיות מורכבות יותר, לפעמים הוא לא הצליח להתנער מתחושת הצ'טבוט של AI בטקסט שהוא יצר. פסק הדין שלנו? גם ChatGPT וגם קלוד AI הם יצירתיים בפני עצמם.
ChatGPT לעומת קלוד AI: כישורי קידוד
בדיוק כמו כישורי מתמטיקה, כישורי קידוד הם עוד מדד חשוב מאוד לשיפוט היכולות של צ'אט בוט בינה מלאכותית. בעוד שרוב המשתמשים כנראה לעולם לא השתמש בצ'אט בוט לקידוד, ישנן השלכות בסיסיות משמעותיות על היכולות של צ'אט בוט לכתוב ולהבין קוד בצורה מיומנת.
בעוד שצ'אטבוטים מתוחכמים כיום, הם רחוקים ממה שהם באמת יכולים להפוך אם וכאשר הם מסוגלים לכתוב קוד בצורה מיומנת. כדי שצ'אטבוטים של AI באמת יתפתחו לעוזרים חזקים של AI שיכולים לעשות יותר מאשר ליצור טקסט, הם צריכים להיות מסוגלים לכתוב קוד שפותר בעיות לפי דרישה. דנו בעבר עד כמה חשובות מיומנויות הקידוד לצ'אטבוטים של AI אצלנו מפרשן קוד ChatGPT.
עם זאת, שמנו את שני הצ'אטבוטים לשתי משימות קידוד. ביקשנו מ-ChatGPT ומקלוד AI לכתוב קוד פונקציונלי עבור אפליקציית רשימת מטלות. החל מ-ChatGPT, צ'טבוט הבינה המלאכותית הצליח לספק אפליקציית רשימת מטלות פונקציונלית בניסיון הראשון. הדבקנו והפעלנו אותו בדפדפן, וזה עבד בצורה מושלמת ללא שגיאות. הנה הפלט בדפדפן.
בהמשך לקלוד AI, הצ'אטבוט כתב קוד מובן בבירור. המבנה וההיגיון כולם נראו בסדר. למרבה הצער, למרות ניסיונות חוזרים ונשנים, קלוד AI המשיך להחמיץ היגיון קריטי כדי לגרום לקוד לפעול בדפדפן. זה כישלון בקטע הזה.
לאחר שקלוד AI נכשל במבחן האחרון, ניסינו סוג אחר של משימת קידוד, כזו שעסקה יותר בניתוח קוד ופחות בכתיבת קוד חדש. העלינו חמישה קבצי PHP שמייצגים את הקצה האחורי המלא של אתר אינטרנט ושאלנו גם את קלוד AI וגם את ChatGPT שבו נצטרך לערוך את כל הקבצים שהועלו כדי להבטיח שנקבל דואר ברגע שמשתמש חדש נרשם ב- אֲתַר.
באופן מפתיע, ChatGPT, למרות שלכאורה יש לו כישורי קידוד מעולים, נכשל בכך למרות ניסיונות חוזרים ונשנים. קלוד AI, לעומת זאת, הצליח לנתח את הקוד במיומנות תוך זיהוי המקומות הנכונים שצריך לערוך כדי להשיג את התוצאות הרצויות.
כמובן, זה לא היה מקרה בודד, חזרנו עליו עם כמה קובצי קוד אחרים, אבל ChatGPT מעד ונתקע ברוב המקרים בעוד קלוד AI המשיך לספק תוצאות מרשימות. מבחינת כישורי קידוד, המנצח אינו פשוט לחלוטין.
ChatGPT בבירור טוב משמעותית בכתיבת קוד חדש ויכול לנהל קוד מורכב במיומנות מרשימה. עם זאת, קלוד AI טוב משמעותית בניתוח בסיסי קוד גדולים. אז אם אתה מחפש לכתוב קוד לרעיון חדש שיש לך, ChatGPT הוא הכלי שאפשר לפנות אליו. אם אתה רוצה לנתח או להבין בסיס קוד עם אלפי שורות על פני מספר קבצים, אז בהחלט נמליץ על קלוד AI.
קלוד AI הוא מתחרה חזק על הבלוק
קלוד AI מייצג תחרות רבת עוצמה עבור ChatGPT - כזו שיכולה להתחרות ב-ChatGPT ולהתגבר עליה מתישהו. בהתחשב בקלוד הוא דגם AI חדש יחסית, מעורר קנאה שהוא יכול להתמודד עם ChatGPT כמו שהוא עושה כרגע. הופעתו של קלוד AI והאיכות שהוא מציע הוכחה שהתחרות מתחממת.