אם אתה סטודנט או שהעבודה שלך כוללת עבודה עם הרבה תמונות וקובצי PDF, היית, בשלב מסוים, מרגיש צורך לחלץ טקסט מתמונה או מסמך.
למרבה המזל, חילוץ טקסט מאפשר זאת. ויש כמה כלים שבהם אתה יכול להשתמש כדי לעשות זאת. gImageReader הוא אחד מכלים רבים. זה בחינם לשימוש ועובד גם עם קובצי תמונה וגם עם מסמכי PDF.
בוא נצלול פנימה כדי לבדוק את gImageReader בפירוט ולראות איך אתה יכול להשתמש בו כדי לחלץ טקסט מתמונות וקובצי PDF.
מה זה gImageReader?
gImageReader היא אפליקציה המאפשרת לך לחלץ טקסט מתמונות וקובצי PDF בלינוקס. זה בעצם GUI או חזית קצה מנוע ה-OCR של Tesseract, א קוד פתוח מנוע שפותח על ידי Hewlett-Packard הנחשב לאחד ממנועי ה-OCR הטובים ביותר שיש.
עם gImageReader, אתה יכול בקלות ובדייקנות לחלץ טקסט מתמונות או מסמכי PDF בכמה לחיצות פשוטות. לאחר מכן תוכל לייצא את הטקסט שחולץ לקובץ טקסט או PDF לשימוש נוסף.
תכונות של gImageReader
gImageReader מכיל את התכונות הבאות:
- ייבוא מסמכי PDF ותמונות ממקורות שונים (דיסק, התקני סריקה, לוח וצילום מסך)
- עיבוד תמונות או מסמכים באצוות, כלומר לחלץ טקסט ממספר תמונות או מסמכים בו-זמנית
- זיהוי קטעי טקסט כטקסט רגיל או כמסמכי hOCR
- בודק איות מובנה
- זיהוי אוטומטי של אזורי טקסט
- עריכת תמונה/מסמכים בסיסית
- שמור פלט כקובץ טקסט
כיצד להתקין gImageReader על לינוקס
gImageReader זמין ב- רוב ההפצות הגדולות של לינוקס. אבל לפני שתמשיך בהתקנה שלו, עליך להתקין את מנוע ה-Tesseract OCR במערכת שלך.
כדי לעשות זאת, פתח את ה מנהל תוכנה במערכת שלך וחפש tesseract. כאשר הוא מחזיר רשימה של תוצאות, התקן את tesseract-ocr ו tesseract-ocr-eng חבילות. אתה יכול גם להשתמש במנהלי חבילות בשורת הפקודה כדי להתקין את החבילה אם אתה מרגיש יותר נוח עם הטרמינל.
לאחר מכן, עיין בהוראות ההתקנה בסעיפים הבאים כדי להתקין את gImageReader במחשב שלך.
אם אתה ב-Debian או Ubuntu, פתח את הטרמינל והפעל את הפקודות שלהלן כדי להתקין gImageReader:
sudo add-apt-repository ppa: sandromani/gimagereader
sudo apt-לקבל עדכון
sudo apt להתקין gimagereader
ב-Fedora, CentOS או Red Hat Enterprise Linux (RHEL):
sudo dnf להתקין gimagereader-qt
עַל Arch Linux או מנג'רו:
sudo pacman -S gimagereader
משתמשי openSUSE יכולים להתקין gImageReader באמצעות:
sudo zypper להתקין gimagereader
במקרה שאתה משתמש בכל הפצת לינוקס אחרת, אתה יכול לבנות gImageReader מהמקור על ידי ביצוע ההוראות בכתובת GitHub של gImageReader.
כיצד להשתמש ב-gImageReader בלינוקס
gImageReader הוא די קל לשימוש ועובד עם כל מיני קובצי תמונה כמו גם מסמכי PDF. עקוב אחר ההוראות שלהלן כדי לחלץ טקסט מתמונות או קובצי PDF ב-Linux.
פתח את תפריט היישומים, חפש gImageReader, והפעל את האפליקציה. לחץ על לְהַגדִיל לחצן בחלון gImageReader כדי לפתוח אותו בתצוגת מסך מלא.
כעת, לחץ על הוסף תמונות לחצן בחלונית השמאלית מתחת לסרגל הכלים והשתמש בדפדפן הקבצים כדי לבחור את התמונות או ה-PDF שמהן ברצונך לחלץ טקסט.
נְקִישָׁה בסדר לייבא את התמונות או ה-PDF ל-gImageReader. לחלופין, אם ברצונך לחלץ טקסט ממה שמוצג על המסך, לחץ על התפריט הנפתח לצד הוסף תמונות לחצן ובחר קח צילום מסך. gImageReader יצלם צילום מסך של תוכן המסך.
לאחר שהוספת את התמונה ל-gImageReader, לחץ על החלף חלונית פלט לחצן (אחד עם סמל הפנקס) כדי להעלות את חלונית הפלט. כאן מופיע הטקסט שאתה מחלץ מתמונות או קובצי PDF.
בהתאם לאופן שבו אתה רוצה להמשיך, כעת יש לך אפשרות לזהות את הטקסט בתמונה או ב-PDF באופן אוטומטי או ידני. כדי לעשות זאת באופן אוטומטי, לחץ על פריסה לזיהוי אוטומטי לחצן, והוא ידגיש את כל גושי הטקסט בתמונה או במסמך PDF שנבחרו.
לאחר מכן, הקש על זיהוי בחירה > עמוד נוכחי כדי להתחיל בתהליך חילוץ הטקסט.
לחלופין, כדי לבחור את הטקסט באופן ידני, העבר את העכבר מעל הטקסט שברצונך לחלץ, ובאמצעות הכוונת צייר תיבה מסביב לאזור ממנו ברצונך לחלץ את הטקסט. לאחר מכן, הקש על זיהוי בחירה כפתור כדי להמשיך.
אם זה מסמך PDF, ואתה רוצה לחלץ טקסט מדפים שונים, הקש על ועוד (+) לחצן כדי להפוך דפים.
כדי לחזור אחורה, הקש על מִינוּס (-) כפתור. ולאחר מכן, בחר את הטקסט שברצונך לחלץ ולחץ על זיהוי בחירה כפתור כדי לחלץ אותו.
למרות נדירות, ייתכנו מקרים שבהם gImageReader יחזיר את הטקסט שחולץ בשפה שאינה אנגלית. כאשר זה קורה, פשוט הקש על כפתור התפריט הנפתח לצד זיהוי בחירה לחצן ובחר אחת מהאפשרויות באנגלית.
לבסוף, כדי לשמור את הטקסט שחולץ, לחץ על שמור פלט לַחְצָן. זה יביא את חלון השמירה. כאן, תן שם לקובץ ולחץ בסדר.
מה עוד אתה יכול לעשות עם gImageReader?
כפי שהוזכר קודם לכן, gImageReader נותן לך גם את האפשרות לשנות היבטים מסוימים של התמונות או המסמכים המיובאים, כמו הבהירות, הניגודיות והרזולוציה שלהם. בנוסף, ניתן גם להפוך צבעים או לסובב את התמונות או המסמכים, במידת הצורך.
רוב האפשרויות הללו יכולות להיות שימושיות כאשר הטקסט בתמונה או במסמך אינו קריא ל-gImageReader, ולכן הוא מונע מהכלי לזהות את הטקסט.
כדי לגשת לאחת מאפשרויות העריכה הללו, לחץ על בקרות תמונה לחצן, והוא יחשוף סרגל כלים קטן מתחת לסרגל הכלים הראשי. מכאן, בחר את הכפתורים המתאימים לביצוע פעולת העריכה הרצויה בתמונה או במסמך.
חילוץ טקסט בלינוקס קל עם gImageReader
חילוץ טקסט דורש לעתים קרובות את הכלי הנכון: כזה שמשתמש במנוע OCR אמין ומדויק מאפשר לזהות טקסט בתמונה או במסמך בצורה יעילה, כך שתוכל לחלץ אותו ביעילות ללא כל טִרחָה.
gImageReader משיג זאת בצורה יפה, הודות למנוע ה-Tesseract OCR שהוא משתמש בו ברקע. בהתחשב בנוחות השימוש שלו, gImageReader הוא ללא ספק אחד מכלי חילוץ הטקסט הטובים ביותר הזמינים עבור לינוקס.
לחלופין, אם אתה מחפש פתרון פשוט יותר, אתה יכול לבדוק את TextSnatcher, שהוא מהיר ודי קל לשימוש.