בינה מלאכותית יכולה להטעות אותנו לטעות באמנות שנוצרה בתמונות אמיתיות. אז למה ידיים הן אתגר כל כך גדול?

מחוללי AI מתפתחים לנגד עינינו בקצב מפחיד, אבל עדיין יש להם פגמים. לזהות פרטים מוזרים בתמונות AI זה למעשה די מצחיק. לכן הידיים של Midjourney הפכו לנושא חם, בעיה נפוצה במנועים רבים.

בואו נפרט מדוע הידיים מאתגרות כל כך את מחוללי תמונות הבינה המלאכותית. המתכנתים שלהם כבר מתקנים את הנושא הראוי למם הזה, אבל מעניין לחשוב איך בינה מלאכותית לומדת, שלא לדבר על מה שעומד בדרכה.

מדוע ידיים שנוצרו על ידי בינה מלאכותית עוררו סערה

כל מי שמשתמש במנועי בינה מלאכותית ליצירת תמונות אולי שם לב שהידיים כמעט ולא יוצאות כמו שצריך, אבל הנושא הפך את הראש כאשר חבורה של "תמונות" הופיעו בטוויטר.

במבט מעמיק יותר, הידיים המוזרות של האנשים מסרו אותם כתמונות שנוצרו על ידי AI. העובדה שזה היה הניסיון של מידג'ורני לידיים הפכה את המצב למעניין יותר.

אחד ממנועי הבינה המלאכותית הטובים ביותר בסביבה לא הצליח להתמודד עם המורכבות של ידיים אנושיות, אז היכולות של מידג'ורני ומתחריה הועמדו למבחן. נכון, אפילו DALL-E נוטה לאצבעות וציפורניים לא מציאותיות.

instagram viewer

ההייפ יצא מפרופורציה, בהתחשב בידיים שנוצרו בינה מלאכותית תמיד היו בעיה, אבל תשומת הלב הנוספת הביאה לשחרור של Midjourney v5 לשיפור ב-v4.

הגרסה החדשה הקפידה לשפר את עיצוב הידיים, אינדיקציה ברורה לכך שמהנדסי בינה מלאכותית שמו לב לסערה המצחיקה והחליטו לשדרג את יכולות התוכנה.

מנועים אחרים איטיים בעקבות הדוגמה של מידג'ורני, אז תיקון אמנות AI עם Photoshop נשאר כישור שלא יסולא בפז. המכשול העיקרי עבור מתכנתים הוא כמה מסובך זה לאמן בינה מלאכותית כדי למשוך ידיים משכנעות.

מדוע מחוללי תמונות AI נאבקים עם ידיים?

מנועי בינה מלאכותית משתמשים ברשתות יריביות (GAN) או בדיפוזיה יציבה כדי לייצר תמונות. שתי הטכנולוגיות דורשות חומרי מקור נרחבים, הדרכה וכוח עיבוד כדי ליצור אפילו את היצירות הבסיסיות ביותר.

מאחר שתמונות קיימות הן מרכזיות באימון של בינה מלאכותית, מתכנתים צריכים להזין את התוכנה שלהם באלפי, אם לא מיליוני, תמונות לצד הנחיות - חזרה על התהליך שוב ושוב עד שהמנוע מבין למה מתייחסת מילה מסוימת וכיצד לייצג אותה לְהִתְנַגֵד.

אבל תמונות המקור ש-AI לומד מהן הן בעיקר דו-ממדיות, שבהן הידיים מתוארות במגוון עמדות. בין אם ישר או מסולסל, מראה חמש אצבעות או שלוש.

בסופו של יום, מכונה לא ממש מבינה את מושג הידיים, והתמונות שהיא לומדת מהן לא תמיד מציגות ידיים בצורה ברורה או עקבית מספיק. זו הסיבה שהידיים של Midjourney יכולות להיות כל כך מכוערות: בלבול בינה מלאכותית.

תקף כמו החששות של אילון מאסק לגבי פיתוח בינה מלאכותית ייתכן, בחלקים מסוימים של הטכנולוגיה עדיין יש הרבה מה ללמוד. והמכשולים שלהם חורגים מדוגמאות לא מספיקות של ידיים.

סיבות אחרות מדוע מחוללי תמונות AI איטיים להשתפר

מסתכל על הדגמים של Midjourney, v5 מציע קוהרנטיות מתקדמת בין הנחיות טקסט ותמונות שהופקו, כמו גם רזולוציה גבוהה יותר וכלים נוספים. אבל הישגים כאלה לא באים בזול.

אימון בינה מלאכותית להשתפר עם הידיים דורש הזנתו בתמונות טובות יותר, במיוחד בתלת מימד. זה אומר שהרבה זמן וכוח אדם מושקעים בתהליכים, החל מרכישת חומרי מקור ועד לשיפור הקידוד וחזרה על ההדרכה עד שה-AI יעשה זאת נכון.

גם אז, התוכנה יכולה לעשות טעויות ביצירות אמנות מדהימות אחרת. מלבד היותה עבודה ענקית ומורכבת, היא יקרה. אז, אל תצפו מחוללי טקסט לתמונה בחינם בינה מלאכותית לעלות לקליבר של מידג'ורני עדיין.

במילים פשוטות, הבעיה עם מנועי AI היא לא רק בחוסר היכולת של תוכנות המחשב הללו להבין לחלוטין איך תכונות אנושיות כמו ידיים ורגליים נראות או עובדות. זה גם מסתכם במה זה עולה, ובגישה של הטכנולוגיה לתמונות תלת-ממד ולטכניקות למידת מכונה שיכולות לעזור למחוללים לקבל תפיסה מציאותית יותר של העולם הסובב אותם.

מחוללי תמונות AI לא ייאבקו לנצח

ידיים הן מושג מסובך לבינה מלאכותית כדי לעטוף את הראש הבינארי שלה, אבל הפתרונות לבעיה כבר פועלים. Midjourney, DALL-E 2 ופלטפורמות אחרות יוכלו בסופו של דבר לשמור על אצבעות מוזרות למינימום, אם לא להעלים אותן לחלוטין.

ההתקדמות בתחומי AI אחרים מבטיחה שהטכנולוגיה מתפתחת כל הזמן, והמפתחים שלה תמיד לומדים דרכים חדשות ליישם ולשפר אותה.