בטח ראית אפליקציות שמתיימרות לתרגם את מה שהחתול שלך אומר. אבל האם הם באמת יכולים לתרגם את מיאו של החתול שלך לאנגלית? התשובה הקצרה היא כן, בערך. זה קשה בגלל עד כמה "שפתו" של כל חתול ייחודית, אך הם יכולים להתקרב למדי עם הטכנולוגיה המודרנית.

אפליקציות תרגום לחתולים כמו MeowTalk משתמשות בצורת זיהוי דיבור המדגישה למידת מכונה. בואו נסתכל מקרוב.

זיהוי דיבור ולמידת מכונה

מרי תרזה מקלין /פיקסביה

זיהוי דיבור פועל על ידי הקלטת דיבור והפיכת האודיו לקובץ נתונים דיגיטלי. הוא מקודד נתונים כגון גובה הצליל ונפח כנקודות נתונים שהאפליקציה יכולה לנתח ולהתאים למשמעויות. מיקרופוני DPA מסביר שנקודות נתונים אלה יכולות להיראות שונות מאוד בהתאם לצלילי הרקע ולאופן הדיבור של מילה.

לפעמים אנחנו לוקחים את ההכרה הקולית כמובנת מאליה, אבל זה הישג מדהים של טכנולוגיה. במיוחד בהתחשב כמה דיבור אנושי מורכב. כפי ש המדען מסביר, כל מילה כוללת מגוון רחב של צלילים או "פונמות" המשתלבים זה בזה. לגרום למחשב להבין דיבור קשה מאוד. הגבול החדש של צלילי החתול יהיה קשה עוד יותר.

אפליקציות המשתמשות בזיהוי דיבור מתוכנתות עם "אוצר מילים" של מילים הנקראות מערך נתונים. לאחר מכן האפליקציה תואמת את הדיבור שלך לאפשרות הקרובה ביותר באוצר המילים שלה.

instagram viewer

כשזה עושה טעות, אתה מתקן את זה, ושומר את הנתונים האלה בפעם הבאה. זה חלק מלימוד מכונה. כך תוכנית לומדת לזהות דיבור גם כאשר זה לא זהה למערך הנתונים שאיתו התחילה.

קָשׁוּר: מהם אלגוריתמים של למידת מכונה? הנה איך הם עובדים

לזיהוי קול עדיין יש בעיות, במיוחד עם מעכבי דיבור ומבטאים. יש חברות שכן שיפור למידת מכונה כדי להתגבר על נושאים אלה, אף על פי כן. לאורך זמן, למידת מכונה יכולה להפוך את זיהוי הדיבור לכלי רב עוצמה.

כך עובד זיהוי דיבור עבור בני אדם. אבל האם זה עובד אצל חתולים?

זיהוי דיבור לעומת הכרה במיאו

אריאנה סוארז /לא מתים

ראשית עלינו להבין מדוע תרגום מיאו מסוג מסוים כ"אני רעב "שונה מניתוח הדיבור האנושי. הבעיה היא בעיקר שתקשורת של חתולים מסתמכת יותר על רמזים לא מילוליים כמו יציבה. בעיה נוספת היא היעדרה של "שפת חתולים" אוניברסאלית.

על פי ASPCA, חתולי בר בוגרים לעולם אינם מתריעים זה על זה, אלא רק על אנשים. מחקר אחר מאת החברה ההומנית מוסיף כי צלילים אלה "אינם מתרחשים בוואקום." עלינו לפרש אותם לצד שפת גוף והקשרים אחרים. במקרים רבים, האותות השקטים הללו הם ההבדל היחיד בין מיאו שפירושו "אני רעב" לאחד שמשמעותו "אני רוצה לשחק".

אם מוסיפים לבעיה זו, אין שני חתולים שפה זהה. חתולים מפתחים "שפות" בהתאמה אישית לבעליהם. אלה מבוססים בחלקם על חיקוי של קול הבעלים ובחלקם על אישיות החתול. אין שני חתולים שנשמעים זהים, גם כאשר מעבירים את אותו הרצון או הצורך. אז איך אוצר מילים בדיבור של אפליקציה אחת יכול לתרגם את כולם?

למידת מכונה גמישה לחתולים

חופשי לשימוש בצלילים /לא מתים

אם כי כמה עוזרים וירטואליים אוהבים אוטו ניסיון להבין טון ורגש, זיהוי הדיבור עדיין נורא בסימנים לא מילוליים. אבל זה לא אומר שאי אפשר לפרש אותם.

MeowTalk משתמשת בסוג גמיש יותר של למידת מכונה כדי לעזור להתגבר על בעיות אלה.

הורד: MeowTalk עבור דְמוּי אָדָם | iOS (חינם)

Meowtalk נוצר על ידי חאבייר סאנצ'ס, שעבד גם בצוות Alexa. הוא דמיין את האפליקציה כצעד לעבר צווארונים חכמים. צווארונים אלה יתרגמו צלילי חתולים לדיבור אנושי, תוך שאיבת אסטרטגיות מורכבות של למידת מכונה כדי לעזור לבני אדם להבין טוב יותר את חתוליהם ולטפל בהם.

צוות MeowTalk פצה על בעיות ייחודיות על ידי יצירת פרופילים ספציפיים יותר עבור כל חתול. באפליקציה אתה רושם כל חתול בנפרד. מדע נורבגיה מדווח כי חתלתולים מתמצים בצורה שונה מחתולים בוגרים, כך שהאפליקציה מבקשת גם את יום הולדת החתול. כל פרופיל מייצר רשת נתונים ייחודית עבור החתול, המשלבת מעט למידה עמוקה בלמידת המכונה.

קָשׁוּר: למידה עמוקה לעומת למידה ממוחשבת לעומת AI: איך הם הולכים ביחד?

עבור אוצר מילים, MeowTalk מתחיל עם 10 פרופילי סאונד במערך הנתונים שלו. לכל אחד מהם יש משמעות שונה, כמו "שמח" או "ציד". כאשר האפליקציה שומעת צליל ומשגיאה, אתה יכול לתקן אותו או ליצור פרשנות חדשה.

נתונים שנאספו מ- CATSOUNDS אקוולון

תיקון אומר לאפליקציה להחליף את אוצר המילים הבסיסי בצליל החדש.

לדוגמא, תוכלו להורות לאפליקציה להתאים את "ציד" לציוצים קצרים במקום לצעוק ארוך. סוג זה של תיקון שימושי יותר מהוספת צלילים מרובים כדי להתאים למשמעות אחת באופן שבו זיהוי הדיבור עושה, וזה יהיה כמו לומר לאפליקציה כי יללה ארוכה וציוצים קצרים. שניהם פירושו "שיחת אם."

למידת מכונה ביישומים לזיהוי דיבור בדרך כלל מתנגדת לסוג זה של החלפה. זה יהיה כמו לנסות ללמד את סירי שכאשר אתה אומר "בלוג טכנולוגי" אתה באמת מתכוון ל"אגס ". אך הצורה הגמישה יותר של למידת מכונה בה משתמש MeowTalk יכולה להתמודד עם תיקון זה יותר בְּקַלוּת.

יצירת פרשנות חדשה מוסיפה משמעות שלא קודנה קודם לכן. למשל, אם לחתול שלך יש שיחה ספציפית כשהיא רוצה את הצעצוע האהוב עליה, תוכל להוסיף "אני רוצה את העכבר שלי" כאופציה. זה דומה להוספת מילה למילון התיקון האוטומטי שלך.

קָשׁוּר: כיצד להגדיר מילים לתיקון אוטומטי משלך באנדרואיד

לאורך זמן, אתה יכול לפתח פרופיל דיבור מותאם אישית מאוד לחתול שלך. בסופו של דבר, זה עשוי אפילו להיות מתוחכם מספיק כדי להיות שימושי ליושבים בחיות מחמד או לפתור בעיות התנהגות. אם שום דבר אחר, זה עוזר לבעלי חתולים להיות קשובים יותר לחיות המחמד שלהם.

פסק הדין: האם יישומי תרגום לחתולים עובדים?

בסופו של דבר, "תרגום חתולים" עדיין מסתמך רבות על המשתמש שילמד את האפליקציה כיצד החתול שלהם מדבר. זה כנראה תמיד יהיה המקרה בגלל הייחודיות של התקשורת של כל חתול.

אבל העובדה שלמידת מכונה הגיעה עד כדי כך שמפתחים יכולים אפילו להצליח בכך באופן חלקי היא מדהימה. לימוד מכונה ו- AI מתקדמים במהירות מסחררת, ואנחנו לא יכולים לחכות לראות לאן הם הולכים אחר כך.

אימייל
נושאים קשורים
  • הסבירו טכנולוגיה
  • למידת שפה
  • למידת מכונה
על הסופר
נטלי סטיוארט (16 מאמרים פורסמו)

נטלי סטיוארט היא סופרת של MakeUseOf. תחילה התעניינה בטכנולוגיה בקולג 'ופיתחה תשוקה לכתיבת מדיה באוניברסיטה. ההתמקדות של נטלי היא בטכנולוגיה נגישה וקלה לשימוש, והיא אוהבת אפליקציות ומכשירים שהופכים את החיים לפשוטים יותר עבור אנשים יומיומיים.

עוד מנטלי סטיוארט

הירשם לניוזלטר שלנו

הצטרף לניוזלטר שלנו לקבלת טיפים טכניים, ביקורות, ספרים אלקטרוניים בחינם ומבצעים בלעדיים!

צעד אחד נוסף !!!

אנא אשר את כתובת הדוא"ל שלך בדוא"ל ששלחנו לך זה עתה.

.