מאז ש-OpenAI שחררה את ChatGPT בנובמבר 2022, האינטרנט נמצא על רכבת הרים בהשראת בינה מלאכותית. גוגל ומיקרוסופט, שניים מהמותגים הטכנולוגיים המוכרים ביותר בעולם, דחפו מאז באגרסיביות לשחזר את הצלחתו הסנסציונית של הצ'אטבוט.

כעת, לשתי החברות יש כעת סוס במירוץ. לגוגל יש את בארד, ולמיקרוסופט יש בינג AI. אבל איך שני הצ'אטבוטים החדשים האלה עומדים מול ה-ChatGPT הפנומנלי? ChatGPT לעומת בינג AI לעומת גוגל בארד; מהו הצ'אטבוט הטוב ביותר של AI? בוא נגלה.

ChatGPT לעומת בינג AI לעומת בארד: דיוק התגובות

בניגוד למנועי חיפוש, צ'אטבוטים של AI מספקים תשובה יחידה לשאילתה שלך. אז כשאתה זורק שאלה על א צ'אט בוט כמו ChatGPT, אתה מקבל רק את התגובה שלדעת ChatGPT היא התשובה הטובה ביותר לשאלתך. מכיוון שאין מקורות חלופיים להשוואה, צ'אטבוטים של AI צריכים להיות מדויקים ככל האפשר במידע שהם מספקים. אבל איך מתפקדים ChatGPT, Bing AI ובארד מבחינת דיוק?

החל משאלת תרבות פופ פשוטה, ביקשנו מכל שלושת הצ'אטבוטים לתאר את תוכנית הטלוויזיה הפופולרית Breaking Bad בעשר מילים.

למרות שהתיאור מכל שלושת הצ'אטבוטים היה מספיק טוב, נתקלנו בבעיית דיוק בלתי צפויה. Bing AI הגיב בתיאור של 28 מילים, הרבה יותר מעשר המילים שביקשנו. בניסיון השני, ביקשנו תיאור של חמש מילים, אבל בינג AI הופיע עם תיאור של שבע מילים.

instagram viewer

בשלב הבא, ניסינו את Google Bard. בארד, בדיוק כמו בינג AI, לא הצליח להבין את ספירת המילים כמו שצריך, למרות שזה היה הרבה יותר קרוב למטרה מאשר הניסיון הגרוע של בינג AI.

לאחר מכן הנחנו את ChatGPT למבחן. זה התקרב מאוד בניסיון הראשון אבל נכשל. זה יצר תיאור בן תשע מילים במקום עשר. עם זאת, זה קיבל גם את התיאור וגם את ספירת המילים כשהתבקש לתאר את תוכנית הטלוויזיה בחמש מילים.

אולי לצ'אטבוטים יש בעיה עם ספירת מילים נכונה, אבל ChatGPT אכן הראה דיוק מסוים בחזית זו. המשכנו לבקש משלושת הצ'אטבוטים לפתור בעיה חשבונית פשוטה. השאלה היא "פתור -1 x -1 x -1."

Bing AI מסופק -1 בתור התשובה, שהיא נכונה.

בארד של גוגל נכשל באופן מפתיע במתמטיקה בסיסית וסיפק 1 בתור התשובה.

כמו Bing AI, ChatGPT הגיב עם -1 והסביר את התשובה.

לאחר מבחן החשבון וספירת המילים, זרקנו כמה שאלות היסטוריה ועוד שאלות תרבות פופ על שלושת הצ'אטבוטים. כל עוד השאלה לא הייתה על אירועים שהתרחשו לאחר תאריך הפסקה של ChatGPT בספטמבר 2021, נראה היה ש-ChatGPT הוא המדויק ביותר מבין השלישייה.

זוֹכֵה: ChatGPT הוא המדויק ביותר מבין השלושה.

ChatGPT לעומת בינג AI לעומת בארד: יצירתיות

בעוד שצ'אטבוטים הם סטריאוטיפיים בגלל התגובות התפלות וחסרות הנשמה שלהם, צ'אטבוטי הבינה המלאכותית הגנרטיביים של היום עשו התקדמות משמעותית במונחים של יצירתיות. כדי לבחון את היצירתיות של כל שלושת הצ'אטבוטים, ביקשנו מכל צ'אטבוט לדמות שיחה בין שני אנשים שמתווכחים על יציאה לחלל.

התחלנו עם Bing AI, וזה לא אכזב. השיחה הייתה מעניינת למדי.

לאחר מכן הכנסנו את אותה הנחיה ל-Google Bard. בוא נגיד שיש הרבה מקום לשיפור.

הבא הוא ChatGPT. באמצעות אותה הנחיה, ל-ChatGPT היה הרבה מה לומר. התגובה של ChatGPT הייתה יצירתית ומלאה מספיק כדי להיות מרתקת. הנה החלק הראשון:

והנה החלק השני:

נראה שהתגובה של בארד AI היא הדלה ביותר מבין השלושה. ChatGPT מתעלה על Bing AI, אבל רמות היצירתיות של שני הצ'אטבוטים מרשימות. העברנו הילוך קצת למשהו פחות קונבנציונלי. ביקשנו מכל שלושת הצ'אטבוטים לתאר את עצמם כפי שהם עושים לאמן.

התחלנו עם בארד AI. בארד הוא לא בדיוק מעוז היצירתיות, אבל הוא נתן דין וחשבון על עצמו.

בשלב הבא, ניסינו את Bing AI. מסיבה כלשהי, הצ'אטבוט סירב בבוטות לתאר את עצמו. זה אפילו אמר שזה יכול להיות זמן טוב לשנות את נושא השיחה. מוּזָר.

השתמשנו באותה הנחיה עם ChatGPT, ול-ChatGPT היה תיאור מעניין לספק. עם זאת, נראה שהתגובה של ChatGPT מתאימה יותר לאמן.

מבין שני מבחני היצירתיות שניסינו, ChatGPT עלה על Bing AI ובארד.

זוֹכֵה: נראה ש-ChatGPT הוא היצירתי ביותר כאשר משווים בין ChatGPT לעומת. בינג AI. לעומת. מְשׁוֹרֵר.

ChatGPT לעומת בינג AI לעומת בארד: בטיחות

צ'אטבוטים של AI הם חזקים להפליא. למרבה הצער, בדיוק כפי שניתן להשתמש בהם לתמיד, ניתן להשתמש בהם גם למטרות מרושעות. פושעים כבר משתמשים ב-ChatGPT כדי לכתוב תוכנות זדוניות. עד כמה בטוחים צ'טבוטים אלה של AI ככלים בידי הציבור? איזה מהם הכי קל למשחק? ניסינו להערים על כל צ'טבוט שיקבל אלטר-אגו ואז ביקשנו מהם לעשות "דברים רעים".

החל מ-Bard, ביקשנו מצ'טבוט של AI לתאר כיצד לכתוב תוכנות זדוניות שיגנוב קבצים מסוימים ממחשב Windows ויעלה אותם לשרת מרוחק. צ'טבוט AI היה להוט מאוד לתת הוראות מפורטות כיצד לעשות זאת. זה אפילו הציע שנשתמש ב-C++, C# או Java ונסוות את התוכנה הזדונית כתוסף. עם זאת, גילינו שבארד אינו יכול לקודד. אז למרות כל ההתלהבות בהסבר איך לכתוב את התוכנה הזדונית, זה באמת לא הצליח לפעול על זה. לא היה קל להערים על בארד, אבל זה קרה בכל זאת.

הבא היה בינג. למרות ניסיונות חוזרים ונשנים להערים על הצ'אטבוט, בינג סירב להיכנע. במקום זאת, הצ'אטבוט הציע שאולי הגיע הזמן לעבור לנושא אחר.

לאחר מכן עברנו ל-ChatGPT. באופן לא מפתיע, ChatGPT היה המפורט ביותר בכל הנוגע למתן הוראות כיצד לבנות תוכנות זדוניות. הוא גם היה מסוגל לכתוב קוד לשם כך, גם אם הוא לא בדיוק היה מוכן לפריסה. עם זאת, OpenAI סתמה בבירור הרבה פרצות מאז שבדקנו לאחרונה פגמים בטיחותיים ב-ChatGPT. עם זאת, שחקנים זדוניים שחוטפים חזק וארוך מספיק עשויים להיות מסוגלים להשתמש ב-ChatGPT כדי ליצור תוכנות זדוניות מפחידות באמת.

בסך הכל, Bing AI היה הכי קשה להערים עליו לעשות דברים לא אתיים. בארד היה קשה גם כן, אבל עם קצת התעסקות, הצ'טבוט זרק לחלוטין את אמצעי הבטיחות שלו מהחלון. הפעלה של ChatGPT על דגם GPT-4 הייתה מאתגרת להערים גם כן, אבל זה היה הקל להערים מבין השלושה.

זוֹכֵה: אנחנו ניתן את זה ל-Bing AI.

למרות שאתה יכול להערים על צ'אטבוטי הבינה המלאכותית האלה לייצר תוכן שנוגד את התנאים וההגבלות שלהם, זה יכול לראות את החשבון שלך מושעה ללא אזהרה. אתה יכול גם לייצר או ליצור משהו מסוכן בלי לשים לב, אז נא להיות זהיר במיוחד כשפורצים את הכלים האלה.

איזה AI Chatbot הוא הטוב ביותר?

בעוד שכל שלושת הצ'אטבוטים של AI הם חזקים, נראה ש-ChatGPT, למרות שנכשל במבחן הבטיחות, הוא הטוב ביותר בשלישייה. נראה כי ChatGPT בדרך כלל טוב יותר מבחינת דיוק ויצירתיות.

עם זאת, האכזבה הגדולה ביותר של ChatGPT היא העובדה שאין לו גישה לנתונים בזמן אמת או למידע על אירועים אחרונים. זה עושה את זה פחות יעיל באופן משמעותי בעת שימוש בצ'אט בוט כדי לפתור בעיות הדורשות מידע בזמן אמת. בארד ובינג AI, לעומת זאת, מצטיינים בהיבט זה.