MusicLM של גוגל נראה מבטיח עם היכולת שלו ליצור מוזיקה מהודעות טקסט. אבל אחרי שהעמיד אותו במבחן, זה לא ממש הצליח.

בינואר 2023 הכריזה גוגל על ​​MusicLM, כלי AI ניסיוני שיכול ליצור מוזיקה על סמך תיאורי טקסט. לצד החדשות, גוגל הוציאה מאמר מחקר מדהים עבור MusicLM שהשאיר אנשים רבים מסונוורים מהיכולת להעלות מוזיקה באוויר.

בהינתן הנחיית טקסט, הדוגמנית הבטיחה להפיק מוזיקת ​​נאמנות גבוהה שתספק כל מיני תיאורים מז'אנר לכלי ועד כיתובים מופשטים המתארים יצירות אמנות מפורסמות. כעת, כשMusicLM פתוחה לקהל הרחב, החלטנו להעמיד אותה במבחן.

הניסיון של גוגל ליצור מחולל מוזיקה בינה מלאכותית

הפיכת הנחיית טקסט כמו "ג'אז מרגיע" לרצועה מוכנה לנגינה היא ללא ספק הגביע הקדוש של ניסויים במוזיקת ​​בינה מלאכותית. בדומה למחוללי תמונות בינה מלאכותית מפורסמים כמו Dall-E או Midjourney, אינך צריך להיות בעל שמץ של ידע מוזיקלי כדי להפיק רצועה בעלת מנגינה ומקצב.

במאי 2023, מי שנרשם למטבח AI Test Kitchen של גוגל יוכל לנסות את ההדגמה בפעם הראשונה. בברכה עמוד אינטרנט ידידותי למשתמש ומספר כללים מנחים - אלקטרוניים וקלאסיים הכלים עובדים הכי טוב, ואל תשכחו לציין "אווירה" - הפקת קטע מוזיקה היא קל בצורה בלתי נתפסת.

instagram viewer

מהירות היא אחד הדברים הבודדים ש-MusicLM באמת מספקת, לצד דגימות נאמנות גבוהה יחסית. עם זאת, המבחן האמיתי לא היה להימדד עם שעון עצר בלבד. האם MusicLM יכולה להפיק מוזיקה אמיתית וניתנת להאזנה על סמך כמה מילים? לא בדיוק (עוד מעט נגיע לזה).

כיצד להשתמש ב-MusicLM במטבח הניסוי של AI של גוגל

השימוש ב-MusicLM קל, אתה יכול להירשם לרשימת ההמתנה עבור מטבח AI Test Kitchen של גוגל אם אתה רוצה לנסות.

באפליקציית האינטרנט, תראה תיבת טקסט שבה תוכל לחבר הנחיה מכמה מילים לכמה משפטים המתארים את סוג המוזיקה שאתה רוצה לשמוע. לקבלת התוצאות הטובות ביותר, גוגל ממליצה לכם "להיות מאוד תיאוריים", ומוסיפה שכדאי לכם לנסות לכלול את מצב הרוח והרגש של המוזיקה.

כשתהיה מוכן, הקש אנטר כדי להתחיל בעיבוד. תוך כ-30 שניות, שני קטעי אודיו יהיו זמינים עבורך לאודישן. מבין השניים, יש לך אפשרות להעניק גביע לדגימה הטובה ביותר שתואמת את ההנחיה שלך, מה שבתורו עוזר לגוגל לאמן את הדגם ולשפר את התפוקה שלו.

איך MusicLM נשמע

בני אדם יוצרים מוזיקה מלפני 40,000 שנה לפחות ללא מושג סופי אם המוזיקה באה לפני, אחרי או במקביל להתפתחות השפה. אז במובנים מסוימים, זה לא מפתיע ש-MusicLM לא ממש פיצחה את הקוד על האמנות האוניברסלית העתיקה הזו.

מאמר המחקר MusicLM של גוגל הציע ש-MusicLM תוכל ליצור מוזיקה מכיתובים השייכים ליצירות אמנות מפורסמות, ולעקוב אחריה הוראות כמו שינוי ז'אנר או מצב רוח בצורה חלקה בעקבות רצף של שונות הנחיות.

עם זאת, לפני שהגענו להזמנות כה גבוהות, גילינו של-MusicLM היו כמה בעיות בסיסיות שצריך להתגבר עליהן תחילה.

קושי להיצמד לטמפו

התפקיד הבסיסי ביותר של כל מוזיקאי הוא פשוט לנגן בזמן. במילים אחרות, היצמד לקצב. באופן מפתיע, זה לא משהו ש-MusicLM יכולה לעשות ב-100% מהזמן.

למעשה, באמצעות אותה הנחיה 10 פעמים, מה שמפיק 20 רצועות מוזיקה, רק שלוש היו בזמן. 17 הדגימות הנותרות היו מהירים או איטיים יותר מהקצב שצוין שנכתב ב"פעימות לדקה", מונח בשימוש נרחב לתיאור מוזיקה.

בדוגמה זו, השתמשנו בהנחיה "פסנתר קלאסי סולו מנגן ב-80 פעימות לדקה, שליו ומדיטטיבי". בהאזנה מדוקדקת יותר, לעתים קרובות המוזיקה האיצה או האטה באורך הדגימה הקטן.

גם המוזיקה חסרה פעימה חזקה ונשמעה כאילו מישהו היכה Play באמצע היצירה. אם זה היה בכוונה או לא, זה אכן מקשה לשפוט אם MusicLM באמת יכולה להלחין התחלה או סיום ראויים ליצירה מוסיקלית בנוסף להיצמדות לקצב.

בחירת כלי נגינה אקראית

אולי MusicLM עדיין לא למדה לנגן בתזמון קפדני, אז עברנו לפרמטר מוזיקה נפוץ אחר. רצינו לראות אם זה ייעתר לבקשתנו למכשירים מסוימים.

כתבנו כמה הנחיות שונות שכללו תיאורים כמו "סינתיסייזר סולו" ו"גיטרה בס סולו". אחרים היו הרכבים גדולים יותר כמו "רביעיית מיתרים" או "להקת ג'אז". בסך הכל, זה נראה כמו סיכוי של 50:50 שתקבל את מה שביקשת.

תיאוריה אחת היא שהמודל משייך כמה כלים לז'אנרים מוזיקליים פופולריים. קח, למשל, את ההנחיה "סינתיסייזר סולו, התקדמות אקורד. תוסס ואופטימי". במקום לקבל צליל סינתיסייזר בפני עצמו, MusicLM הפיקה רצועה אלקטרונית עם תופים ובס.

ייתכן שלדגם פשוט לא היו מספיק נתונים ומספיק הכשרה כדי להבין את הבקשה הספציפית למכשיר.

השירה יצאה מהמשוואה

על פי ההגבלות דאז, הדוגמנית לא תפיק מוזיקה המכילה שירה. בעיות זכויות יוצרים קוצניות של MusicLM וקולות באגי הוא גורם סביר לכך ש-Google בחרה לשחק בטוח על ידי הגדרת המגבלה הזו.

אבל לאחר ניסויים ב-MusicLM במשך זמן מה, הבנו שהשליטה של ​​גוגל על ​​הפלט של הדגם לא בדיוק הייתה מכוסה ברזל. באופן מוזר, הנחיה כמו "גיטרה אקוסטית" תפיק רצועה שמכילה ברקע שירה דמוית רוח רפאים שנשמעה עמומה ומרוחקת.

אמנם זה לא תופעה שכיחה, אבל זה משאיר אותך לתהות לגבי היכולת של MusicLM ליצור שירה משכנעת מלכתחילה.

עם תוכנות כמו VOCALOID ו- Synthesizer V המובילות פנימה טכנולוגיית סינתזה קולית בעזרת AI, השמטת שירה מהדגם הנוכחי משאירה אותנו תוהים אם הוא עדיין לא מספיק טוב כדי להתחרות מול הטכנולוגיה הקיימת. ל-MusicLM עשויה להיות דרך ארוכה לעבור לפני שמוזיקאים ישירו את הלל.

העתיד של מחוללי מוזיקה בינה מלאכותית

בעוד ש-MusicLM הזיזה את טכנולוגיית המוזיקה הגנרטיבית של AI קדימה, היא צריכה לחזור לבית הספר וללמוד עוד כמה דברים לפני שהיא יכולה לקחת על עצמה עבודה מעשית בתעשיית המוזיקה.

לפני כן, הניסיון הטוב ביותר ליצירת מוזיקת ​​בינה מלאכותית היה דגם בשם JukeboxAI על ידי OpenAI. זה לא היה בדיוק במצב מוכן לשימוש, ולקח תשע שעות עצומות להפיק דקה אחת בלבד של מוזיקה.

עבור המאמצים שלך, סביר להניח שתקבל בחזרה רצועה אמיתית שנשמעת זר רצופת עיוות אודיו וחפצים. מצד שני, לא התכוונת להשתעמם מקשיבה ליצירות המוזרות ש-Jukebox מעלה באוב.

לאור זאת, MusicLM עשתה כמה התקדמות משמעותית לקראת מחולל מוזיקה בינה מלאכותית ידידותית למשתמש. נוכל כמעט לסלוח למודל על היציאות האקראיות שלו כאשר אתה עוצר לחשוב על כמה מסובך זה ליצור מוזיקה בצורת אודיו גולמית.

עם זאת, לאחר שהפעילה את המודל, MusicLM מרגישה חצי אפויה בהשוואה למה שגוגל פרסמה במאמר המחקר הראשוני שלה. לעתים רחוקות מחולל תמונות בינה מלאכותיות משגה את התמונה של אפל, כמו כן מחולל מוזיקה בינה מלאכותית צריך לקבל כמה יסודות נכונים כמו קצב וכלי נגינה.

MusicLM של גוגל לא עומד בציפיות

כשחברות טכנולוגיה דוהרות להתחרות זו בזו בחזית הבינה המלאכותית, MusicLM מרגישה כאילו היא נכנסה לניסויים ציבוריים לפני שהייתה מוכנה. במקום לקבל את היסודות הנכונים, נראה שהמודל נוקט בגישה הרבה יותר מעורפלת וסובייקטיבית להפקת מוזיקה.

Google עשויה לעודד אותך להיות ספציפי עם ההנחיה שלך, אבל היא לא יכולה להתמודד עם קצב טוב, ולא מובטח לך שתקבל את הכלים שביקשת בכל פעם. MusicLM עשויה להיות מעניינת, והדגמה טובה של התקדמות בינה מלאכותית עוצמתית, אבל אם מוזיקה היא המטרה הסופית, יש לה עוד דרך ארוכה לעבור.