פרסומת
לאחרונה עבדתי על סיפור בו היה מעורב אדם שביצע שיחת טלפון, שהוקלטה. אותו אדם מאוחר יותר סירב להודות שאי פעם ביצעו את השיחה.
עם הקול המוקלט משיחת הטלפון וקליפ של האדם המכחיש את ההאשמה, התחלתי לעבוד בניסיון למצוא דרך להוכיח שהקולות היו זהים.
אני מודה שאני קצת אובססיבי לטכנולוגיות קוליות. זו הסיבה שחיכיתי לה גוגל קול כיצד להשתמש ב- Google Voice לבלוג בטלפון קרא עוד להיות מתקדמת יותר עם טכנולוגיית זיהוי הקולי שלה, וזו הסיבה שאני אוהבת אפליקציות לבקרת קולות למחשב כמו Tazti אפשר שליטת דיבור לטקסט ושליטה על ידי הגדרת זיהוי דיבור ב- Windowsזיהוי דיבור נשאר חזק יותר מקורטנה. זה מניע דיבור לטקסט ושליטה קולית. מאמר זה יראה לכם מה זיהוי דיבור יכול לעשות, כיצד להגדיר אותו, לאמן אותו ולהשתמש בו. קרא עוד . עם זאת, כשמדובר בהשוואה בין קולות דיגיטלית, הייתי אובד עצות. בטח ראית את סרטי הריגול האלה שבהם המחשב יכול לזהות אוטומטית את קולו של פושע ידוע עם ההדפס הקולי בלבד.
אם להיות כנה, ברגע שגיליתי את הדיבור של Sonogram Visible, הבנתי שטכנולוגיית קול ספקטרוגרמה למעשה הוא כיום דרך ברת קיימא לזהות אדם באופן מוצק על ידי הקול שלו בלבד.
הבנת ספקטרוגרמה
אם אתה יודע על איזוטופים כימיים, אתה יודע שעם איזוטופים, כימאים יכולים לזהות את האיפור הכימי של תרכובות על ידי בידוד היסודות הבסיסיים ושימוש בפירוט לזיהוי המרכיבים האישיים של כל אחד מהם תערובת. באותה צורה, ספקטרוגרמה של אודיו מפרקת את השמע לתדרים בסיסיים. הדבר המעניין בקול האנושי הוא שאיש אינו מדבר בתדר אחד. הפה, מעברי האף ומבנה התיבה הקולית שלך קובע את תערובת התדרים שמרכיבים את הקול המיוחד שלך.
Sonogram Visible Speech הוא יישום תוכנת ספקטרוגרמה בחינם שייקח קבצי וידאו או אודיו וישבר במורד רצועת השמע לכל הספקטרום - כל התדרים שלו לאורך כל מסגרת הזמן של ה- מסלול. ספקטרוגרמה שהושלמה נראית כמו התמונה למטה.
כפי שאתה יכול לראות, הרצועה התחתונה נראית כמו גל הקול הבסיסי שאתה יכול לראות בתוכנית כמו חוצפה 3 טיפים נועזות לשיפור הראיונות שהוקלטושמע ברור הוא חיוני לכל פודקאסט או הקלטה שתרצו לפרסם. שפר את איכות השמע שלך עם Audacity בשלושה שלבים פשוטים. קרא עוד עם זאת, החלונית המרכזית מציגה כל קטע של קובץ הקול בכל מערך התדרים שלו. הדבר המדהים בתוכנה זו הוא שיש צורות גל רבות אחרות בהן תוכלו להשתמש בכדי לבחון את קובץ הקול שלכם. אלה מיועדים במיוחד למשתמשים מתקדמים.
באפשרותך להגדיר כיצד כל אחת מצורות הגל הללו מוצגת על ידי כניסה לתפריט "אפשרויות" ובחירה "כללי התאמה." כאן תוכלו להגדיר כיצד הגרפים הלוגריתמיים מחשבים את הפלט ואת הגדרת התצוגה הכללית של כל הזמינים תרשימים.
אם הצליל שקט למדי, או שהקול שאתה מנתח הוא לחישה, מומלץ לשקול להשתמש בתצוגת התדרים הלוגריתמיים. אתה מאפשר זאת מתפריט "אפשרויות" ובחר "תדר לוגריתמי." זה "יגדיל" במקצת את אזורי התדר המשמעותיים בספקטרוגרמה.
זה באמת יכול לעזור בזיהוי דפוסי תדרים ברורים שמזהים מישהו מתוך קול הקול שלו. אם אתה אבוד לחלוטין ואינך יודע מאיפה להתחיל, לחיצה על "עזרה" והעברה ל"עזרה מקוונת "תפתח את הוראות העזרה המקוונת מאוד של Sonogram. זהו מקום נהדר להתחיל בו אם אתה חדש בניתוח אודיו ספקטרוגרמה.
ניסוי בספקטרוגרמות בעזרת ציד רוח
היופי של תוכנה זו היא שהיא טובה לשימושים רבים ושונים. אחד הממצאים המופיעים לעתים קרובות בציד רוחות, עניין אישי שלי, הוא "תופעה קולית אלקטרונית" - שם לכאורה מופיע קולו של הופעה או רוח רפאים בשמע הקלטות. ההקלטות הללו פזורות ברחבי הרשת, ולכן החלטתי להוציא כמה מאתרי צייד הרוחות ולעשות ניתוח ספקטרוגרמה.
הספקטרוגרמה מראה שתדרי הקול בדרך כלל נמוכים, אך כדי לקבל תמונה טובה יותר של הקולות בהקלטה, עליכם לפתוח את צורות הגל הנוספות. תצוגת ההתאמה האוטו מחשבת את "המגרש" במסגרת הזמן בה אתה מרחף את העכבר.
"רוח הרפאים" בעלת תדירות המגרש הממוצעת של כ- 129.0 הרץ. גלילה לסוף ההקלטה בה אתה שומע את קולו של החוקר, המגרש המחושב התדר הוא בערך 208.0 הרץ (וזה הגיוני מכיוון שזה קול נשי וקליטת הרוחות נשמעת זכר.)
פתיחת התצוגה המהירה של פורייה מגלה עוד יותר פירוט לגבי הקולות. תרשים זה מפרק במהירות את התדרים הראשוניים ומציג אותם בקוד צבע.
במקרה זה, התפלגות התדרים נפרדת זו מזו, עם כמה גבוה, אך גם מספר לא מבוטל של תדרים נמוכים בתערובת. עם זאת, החוקר בחדר מדבר בבירור בקול המקובץ בתדירות יותר לעבר הקצה הגבוה של הטווח, כפי שמוצג כאן.
ניתוח מהיר זה הוכיח ששני הקולות שונים בתכלית, אך זו רק דוגמא בסיסית ליכולותיה של תוכנה עוצמתית זו. בעיקרון, כל מצב בו פירוט תדרים של גל קול יכול לעזור - זו התוכנה בשבילכם. זה קל ללמוד, מהיר להתקנה ולהגדרת התצורה, והוא מתפקד טוב יותר או טוב יותר מכל תוכנת ספקטרוגרמה בתשלום שיש בשוק.
יש לך פרויקטים שיכולים להשתמש בספקטרוגרמה? האם ניסית אי פעם דיבור בעל מראה Sonogram? שתף את התובנות שלך בקטע ההערות שלהלן.
לראיין תואר ראשון בהנדסת חשמל. הוא עבד 13 שנה בהנדסת אוטומציה, 5 שנים בתחום ה- IT, וכעת הוא מהנדס אפליקציות. כעורך מנהל לשעבר של MakeUseOf, הוא דיבר בכנסים ארציים להמחשת נתונים והופיע בטלוויזיה וברדיו הארציים.