ליצרני ChatGPT יש כלי נוסף שמטרתו להוריד את העומס מהאצבעות.
אותם אנשים שמאחורי ChatGPT יצרו כלי נוסף מבוסס בינה מלאכותית שתוכל להשתמש בה היום כדי להגביר את הפרודוקטיביות שלך. אנחנו מתכוונים ל-Whisper, פתרון קול-לטקסט שהאפיל על כל הפתרונות הדומים שהגיעו לפניו.
אתה יכול להשתמש ב Whisper בתוכניות שלך או בשורת הפקודה. ובכל זאת, זה מביס את עצם מטרתו: הקלדה ללא מקלדת. אם אתה צריך להקליד כדי להשתמש בו, למה להשתמש בו כדי להימנע מהקלדה? למרבה המזל, כעת אתה יכול להשתמש ב- Whisper דרך ממשק משתמש שולחן עבודה. אפילו יותר טוב, זה יכול גם לתמלל את הקול שלך כמעט בזמן אמת. בוא נראה איך אתה יכול להקליד עם הקול שלך באמצעות Whisper Desktop.
מהי הלחישה של OpenAI?
Whisper של OpenAI היא מערכת לזיהוי דיבור אוטומטי (בקיצור ASR) או, בפשטות, היא פתרון להמרת שפה מדוברת לטקסט.
עם זאת, בניגוד למערכות הכתבה ותמלול ישנות יותר, Whisper הוא פתרון בינה מלאכותית שאומן על למעלה מ-680,000 שעות של דיבור בשפות שונות. Whisper מציע דיוק שאין שני לו, ובאופן מרשים למדי, לא רק שהוא רב לשוני, אלא הוא גם יכול לתרגם בין שפות.
חשוב מכך, זה בחינם וזמין כקוד פתוח. הודות לכך, מפתחים רבים חילצו את הקוד שלו לפרויקטים שלהם או יצרו אפליקציות המסתמכות עליו, כמו Whisper Desktop.
אם אתה מעדיף את גרסת ה"וניל" של Whisper ואת הרבגוניות של הטרמינל במקום ממשקי GUI מגושם, עיין במאמר שלנו בנושא כיצד להפוך את הקול שלך לטקסט עם Whisper של OpenAI עבור Windows.
האם Whisper and Whisper Desktop זהים?
למרות שמו הרשמי, Whisper Desktop הוא GUI של צד שלישי עבור Whisper, המיועד לכל מי שמעדיף ללחוץ על כפתורים במקום להקליד פקודות.
Whisper Desktop הוא פתרון עצמאי שאינו מסתמך על התקנת Whisper קיימת. כבונוס, הוא משתמש בגרסה חלופית ומוטבת של Whisper, כך שהוא אמור לבצע ביצועים טובים יותר מהגרסה העצמאית.
אתה בקצה השני של הספקטרום, ובמקום לחפש דרך קלה יותר להשתמש ב- Whisper מאשר במסוף, אתה מחפש דרכים ליישם אותה בפתרונות שלך? לשמוח, על OpenAI פתחה גישה לממשקי API של ChatGPT ו- Whisper.
הורד והתקן את Whisper Desktop
למרות של Whisper Desktop קל יותר לשימוש מאשר Whisper העצמאי, ההתקנה שלו מפותלת יותר מאשר לחיצה חוזרת ונשנית על הבא באשף.
- לְבַקֵר דף Github הרשמי של Whisper Desktop. הסתכל בצד ימין ולחץ על הגרסה האחרונה מתחת משחרר.
- תַחַת נכסים, לחץ WhisperDesktop.zip ולהוריד אותו למחשב.
- חלץ את הארכיון שהורדת לתיקיה והשתמש במנהל הקבצים שלך כדי לבקר בו. בפנים תמצאו את אפליקציית Whisper Desktop. לחץ עליו פעמיים כדי להפעיל אותו.
- אתה צריך גם מודל של שפת Whisper GCML פורמט בינארי. Whisper Desktop יספק לך שני קישורים לרכישת אחד. דלג על הקישור השני ליצירת מודל משלך מכיוון שזה תהליך מסובך יותר. לחץ על פנים מחבקות כדי לפתוח את הדף הזה בדפדפן ברירת המחדל שלך, ממנו תוכל להוריד קובץ מוכן לשימוש.
- הגרסה של Whisper Desktop בה השתמשנו בזמן כתיבת מאמר זה סיפקה קישור למאגר מיושן ב-Huging Face. אם אתה נתקל באותה בעיה, שימו לב לקישור ל-a מיקום חדש. לחץ עליו כדי לבקר במאגר החדש.
- לחץ על הקישור שיעביר אותך לזמין דגמים.
- מתוך רשימה זו, לחץ על אחת מהאפשרויות ggml-medium.bin אוֹ ggml-medium.en.bin, תלוי אם אתה רוצה תמיכה רב-לשונית או אנגלית בלבד ב- Whisper.
- לבסוף, היית אמור להגיע ליעד שלך. שימו לב לשורה המציינת שהקובץ הזה מאוחסן עם Git LFS והוא גדול מדי להצגה, אבל עדיין אפשר להוריד אותו. לחץ על הורד לעשות בדיוק את זה.
- כאשר ההורדה של הקובץ תסיים, השתמש במנהל הקבצים המועדף עליך (סייר הקבצים יעשה זאת) כדי להעביר את קובץ דגם השפה שהורדת לאותה תיקייה כמו Whisper Desktop.
תמלול עם Whisper Desktop
התמלול באמצעות Whisper Desktop הוא קל, אך ייתכן שעדיין תזדקק ללחיצה אחת או שתיים כדי להשתמש באפליקציה.
הפעל מחדש את Whisper Desktop. האם הוא (עדיין) מחמיץ את הנתיב הנכון למודל השפה שהורדת? הקלק על ה כפתור עם שלוש הנקודות בצד ימין של השדה ובחר ידנית את הקובץ שהורדת מ-Huging Face.
מנקודה זו, תוכל גם להשתמש בתפריט הנפתח שליד יישום מודל כדי לבחור אם ברצונך להפעיל את Whisper ב-GPU שלך (GPU), הן במעבד והן ב-GPU (היברידי), או רק במעבד (התייחסות).
ה מִתקַדֵם כפתור מוביל לאפשרויות נוספות שמשפיעות על האופן שבו Whisper יפעל על החומרה שלך. עם זאת, מכיוון שהכפתור מציין בבירור שהם מתקדמים, אנו מציעים לך לצבוט אותם רק אם אתה פותר בעיות או יודע מה אתה עושה. הגדרת ערכי אפשרויות שגויים כאן עלולה להטיל עונש ביצועים או להפוך את האפליקציה לבלתי שמישה.
לחץ על אישור כדי לעבור לממשק הראשי של האפליקציה.
אם כבר יש לך הקלטה של הקול שלך שאתה רוצה להפוך לטקסט כתוב, לחץ על תמלול קובץ ובחר בו. ובכל זאת, נשתמש ב- Whisper Desktop לתמלול חי עבור מאמר זה.
האפשרויות המוצעות הן פשוטות. אתה יכול לבחור את שפה לחישה תשתמש, בחר אם אתה רוצה לתרגם בין שפות ואפשר את של האפליקציה קונסולת ניפוי באגים.
רוב המשתמשים דוברי האנגלית יכולים לדלג בבטחה על האפשרויות הללו ורק לוודא שהקלט האודיו הנכון נבחר מהתפריט הנפתח שליד מכשיר לכידה.
לוודא שמור לקובץ טקסט ו צרף לקובץ הזה מאפשרים ל-Whisper Desktop לשמור את הפלט שלו לקובץ מבלי לדרוס את התוכן שלו. להשתמש ב כפתור עם שלוש הנקודות בצד ימין של שדה הנתיב של הקובץ כדי להגדיר את קובץ הטקסט האמור.
לחץ על לִלְכּוֹד כדי להתחיל לתמלל את הדיבור שלך לטקסט.
Whisper Desktop יראה לך שלושה אינדיקטורים מתי הוא מזהה פעילות קולית, מתי הוא מתמלל באופן פעיל ומתי התהליך נתקע.
אתה יכול להמשיך לדבר כמה זמן שאתה רוצה, ומדי פעם אתה אמור לראות את שני המחוונים הראשונים מהבהבים בזמן שהאפליקציה הופכת את הקול שלך לטקסט. נְקִישָׁה תפסיק כשנגמר.
קובץ הטקסט שבחרת אמור להיפתח בעורך הטקסט המוגדר כברירת מחדל, שיכיל בצורה כתובה את כל מה שאמרת עד שלחצת תפסיק.
כדאי לשים לב שאתה יכול גם לעשות את ההפך ממה שראינו כאן: להמיר כל טקסט לדיבור. כך תוכלו להאזין לכל דבר כאילו היה פודקאסט במקום לעייף את העיניים לפזול למסכים. למידע נוסף על כך, עיין במאמר שלנו בנושא כמה מהכלים המקוונים החינמיים הטובים ביותר להורדת טקסט לדיבור כשמע MP3.
Whisper Desktop טיפים להקלדת קול
למרות Whisper Desktop יכול להיות מציל חיים, ומאפשר לך לכתוב עם הקול שלך הרבה יותר מהר ממה שאתה יכול להקליד, זה רחוק מלהיות מושלם.
במהלך הבדיקה שלנו, גילינו שהוא עלול לגמגם מדי פעם, לדלג על כמה מילים, לא לתמלל עד שאתה עצור ידנית והתחל מחדש את התהליך, או להיתקע בלולאה ולהמשיך לתמלל מחדש את אותו ביטוי שוב ושוב.
אנו מאמינים שאלו תקלות זמניות שיתוקנו מכיוון שה-Whisper העצמאי לא מציג את אותן בעיות.
מלבד הבליטות הקטנות הללו, הפיכת הקול שלך לטקסט צריכה להיות ללא מאמץ עם Whisper Desktop. ובכל זאת, במהלך הבדיקות שלנו, גילינו שהוא יכול לבצע אפילו טוב יותר אם...
- במקום לבטא רק שתיים או שלוש מילים ואז לעצור, Whisper יכולה להבין אותך טוב יותר אם תמשיך יותר. נסו לתת לו לפחות משפט שלם בכל פעם.
- מאותה סיבה, הימנע מהתחלה והפסקה חוזרת של תהליך התמלול.
- בכל פעם שאתה מבין שעשית טעות, התעלם ממנה והמשיך. נראה שהטעינה והפריקה של מודל השפה הם החלק הגוזל ביותר בתהליך עם המצב הנוכחי של Whisper והחומרה הזמינה שלנו. אז זה מהיר יותר להמשיך לדבר ואז לערוך את הטעויות שלך לאחר מכן.
- כמו בגרסה העצמאית של Whisper, עדיף להשתמש במודל השפה האופטימלי עבור החומרה הזמינה שלך. אתה יכול להשתמש עד בינוני דגם אם ל-GPU שלך יש 8GB של VRAM. עבור פחות VRAM, לכו על הדגמים הקטנים יותר. בחרו רק בקצת יותר מדויק אבל גם הרבה יותר תובעני גָדוֹל דגם אם אתה משתמש ב-GPU עם 16GB של VRAM או יותר.
- זכור שככל שמודל השפה גדול יותר, תהליך התמלול איטי יותר. אל תלך על דגם גדול מהנדרש. סביר להניח שתגלה כי Whisper Desktop כבר יכול "להבין אותך" רוב הזמן עם הדגמים הבינוניים או הקטנים יותר, עם שגיאה אחת או שתיים בלבד בכל פסקה.
אתה עדיין מקליד? השתמש בקול שלך עם לחישה
למרות שנדרש זמן מה להגדרה, כפי שתראה כשתנסה אותו, Whisper Desktop מתפקד הרבה יותר טוב מרוב האלטרנטיבות, עם דיוק הרבה יותר גבוה ומהירות טובה יותר.
לאחר שתתחיל להשתמש בו כדי להקליד עם הקול שלך, המקלדת שלך עשויה להיראות כמו שריד מימי קדם שחלפו מזמן.