פרסומת

אם ברצונך להמיר טקסט מודפס לטקסט דיגיטלי שתוכל להעתיק, להדביק, לערוך ולחפש, תצטרך להשתמש בסורקי אופי זיהוי תווים אופטי (OCR).

כשתבחרו לסרוק או לצלם תמונה של מסמך, הדבר יישמר בתבנית כמו JPEG או PDF. תוכנת OCR לאחר מכן יכולים לזהות את האותיות והמספרים בתוך המסמכים האלה ולהמיר אותם לסמל PDF לחיפוש 4 שיטות ליצירה ועריכה של קבצי PDF בחינםמבין כל סוגי הקבצים הנפוצים שנמצאים בעולם המחשוב שלנו, PDF הוא כנראה אחד המגבילים ביותר, ובו בזמן הוא זמין לכולם לשימוש (בעיקר לקריאה) ... קרא עוד , או לקובץ שתוכל לערוך בתוכניות כמו Microsoft Word.

הבעיה היא שכמה מסורקי OCR עובדים הרבה יותר טוב מאחרים, כשהטוב ביותר הוא די כבד על הארנק.

למשל, Omnipage18 עולה 150 דולר, אך הוא טוב במיוחד בזיהוי שפות שונות. Adobe Acrobat Pro DC עולה 400 $ להשקיית עיניים אבל יש דיוק מדהים. ABBYY FineReader עולה 150 דולר, אך הוא נהדר בהמרת מסמכים כמו מגזינים ועלונים לטקסט שניתן לחפש. אנו נבדוק את ההצעה המקוונת של ABBYY בהמשך המאמר.

עם זאת, אם אתה מחפש חלופות בחינם שאתה יכול הורד ולהשתמש ב- Windows או OS X, כדאי לך נסה את כלי ה- OCR האלה

instagram viewer
חמשת כלי ה- OCR הטובים ביותר לחילוץ טקסט מתמונותכשיש לך קצוות נייר, איך אתה יכול להמיר את כל הטקסט המודפס הזה למשהו שתוכנית דיגיטלית תוכל לזהות ולהוסיף לאינדקס? שמור על תוכנת OCR טובה בקרבת מקום. קרא עוד . אבל אם אתה מעדיף להשתמש בחינם, באינטרנט כלי OCR, המשך לקרוא, כפי שניסינו את המעטים הראשונים, עם התוצאות שלהלן.

המבחן

נראה שרוב האנשים משתמשים כעת שלהם הסמארטפונים שיעשו עבורם את הסריקה סרוק ונהל את הקבלות שלך, חסוך מקום, נייר וזמןקבלות נייר הולכות לאיבוד וקשה למצוא מתי אתה זקוק להן ביותר. למרבה המזל, מעבר דיגיטלי פותר את שתי הבעיות הללו. קרא עוד החלטתי להשתמש האפליקציה לסריקה של Evernote (חינם במכשירי iOS ו- Android). סרקתי את העמוד הראשון של ריצ'רד דוקין טיפוס על הר בלתי אפשרי, כדי לראות אילו תוצאות נוכל להגיע עם עיצוב בסיסי מאוד. סרקתי גם דף של טים פרריס ' השף בן ארבע השעות לנסות את הסורקים עם עיצוב מעט יותר מסובך. שמרתי כל אחד מהקבצים האלה כ- PDF.

בדיקת מקרי OCR מקוונים

מסמכים אלה הועברו דרך כמה מכלי OCR המקוונים כביכול הטובים ביותר בכדי לראות כמה טוב הם הצליחו.

OCR מקוון חינם [לא ארוך יותר זמין]

למרבה השמחה, אין רישום הנדרש לשימוש ב- OCR מקוון חינם. והתרשמתי כפליים כשראיתי את טענתם לשמור על העיצוב והפריסה של המסמך שלי.

OCR מקוון חינם

האתר טוען שהוא מסוגל לתמוך בקלט PDF, GIF, BMP, JPEG, TIFF ו- PNG. הפלטים יכולים להיות DOC, מסמך טקסט PDF, RTF ו- TXT. לצערי לא יכולתי לגלות אם הייתה להם מגבלת גודל קובץ.

מסמך בסיסי ל- PDF
המרה בצורה מושלמת לחלוטין. אין הרבה יותר מה לומר! אנחנו יוצאים לדרך מאוד התחלה טובה.

מסמך בסיסי ל- DOC
נראה כי המלים האמיתיות התנצרו ללא רבב, מלבד ה"אאוט "מ"הר ראשמור" איכשהו עובר AWOL. אולם העיצוב הוא סיפור אחר. פסיקים רבים הוחלפו בקו תחתון והוכנסו רווחים אקראיים בנקודות לאורך המסמך. כשאתה מאוחר יותר רואה כיצד תוכנת הפרימיום עברה במבחן זה, זה לא מאמץ רע בכלל.

מסמך מורכב ל- PDF
המרת המסמך ארכה 120 שניות! לאחר השלמתו, כל הטקסט הוסב ברמת דיוק של 95% בערך, אם כי הטקסט בתיבה הנפרדת בפינה השמאלית העליונה של הדף לא ניתן היה לחפש. מספר תווים נוספים ברחבי ה- PDF לא היו נכונים.

מסמך מורכב ל- DOC
הפעם המרה ארכה 10 שניות בלבד, כאשר הטקסט שוב ​​הוסב ברמת דיוק של 95% בערך. היו כמה בעיות ריווח מוזרות, והתוכנה התקשתה להמיר את הגופן בפינה השמאלית העליונה של המסמך, ופספסה כמה תווים פה ושם.

פסק דין
אם ברצונך להמיר מסמכים בפורמט פשוט ל- PDF, זהו כלי פנטסטי. מבחינת המרה ל- DOC התוצאות לא היו על מה לכתוב הביתה.

i2OCR טוען כמה טענות מרשימות. הכלי מזהה מעל 60 שפות, יכול להתמודד עם פריסות מרובות עמודות (על ידי הסרת העיצוב), אין לו מגבלות בגודל הקובץ, יכול להמיר קבצים שהועלו ו מכתובות URL. וגם אינך צריך להירשם כדי להשתמש בכלי זה.

השירות פועל על ידי פשוט חילוץ הטקסט מהתמונה שלך ואז הוצאת טקסט לא מעוצב. אתה יכול לתקן במהירות כל טעויות בתצוגה זו לצד זו, לפני שאתה מעתיק את הטקסט לתוכניות אחרות, או מוריד כ- DOC, PDF או HTML.

הערה: כשניסיתי להעלות את מסמכי ה- PDF שלי, אלה נדחו על ידי i2OCR, ולכן הייתי צריך להמיר אותם ל- JPEG (על ידי צילום מסך שלהם ואז העלאת הקבצים).

מסמך בסיסי לטקסט רגילצילום מסך 2016-02-11 בשעה 12.30.28
בשל אופן פעולתו של כלי זה, כל העיצוב אבד, אם כי ההמרה מתמונה לטקסט הייתה כמעט מושלמת. היו כמה טעויות קטנות כמו ריווח פסקאות, וכמה פסיקים הוחלפו בתקופות, אך אלה הם צחצקים קטנים.

מסמך מורכב לטקסט רגילצילום מסך 2016-02-11 בשעה 12.39.48
רוב הטקסט הומר ללא טעויות רבות מדי, מלבד הכותרת והמתכון בצד ימין למעלה, שלא היה קריא לכלי זה. אופן ההמרה של העמודות לטקסט רגיל היה רחוק מלהיות אידיאלי. אם ברצונך להפוך המרה זו למשימה, יידרש הרבה זמן כדי לארגן מחדש את הקווים למשפטים קוהרנטיים.

פסק דין
למסמכים בסיסיים, i2OCR עובד מצוין. היכולת לערוך את הטקסט לפני ההורדה היא גם נגיעה נחמדה מאוד. עם זאת עבור מסמכים מורכבים יותר, ההמרה עדיין די מדויקת, אך אופן הוצאת הטקסט לא יקל על חייכם בהרבה.

OCR מקוון תומך כיום ב 46 שפות שונות ויכול להמיר PDF, JPG, BMP, TIFF ו- GIF לפורמט Word, Excel או Text Plain. האתר טוען כי "מסמכים שהומרו נראים בדיוק כמו המקור - טבלאות, עמודות וגרפיקה".

הגרסה בה תוכלו להשתמש מבלי להירשם מאפשרת להמיר עד 15 תמונות לשעה (מגבלת 5Mb). אם נרשמת לחשבון, תוכל לרכוש דפים נוספים מעל גבול זה, תוך יכולת להמיר גם מסמכים וארכיוני ZIP מרובי עמודים.

תוצאות OCR מקוונות

מסמך בסיסי ל- DOC
המסמך הבסיסי הומר ללא דופי מלבד המספר הרומי אני לא נאספים. כפי שהתחייב האתר, העיצוב היה בדיוק כמו בספר. קודוס לכלי זה.

מסמך מורכב ל- DOC
לאחר שהתאכזבתי מכלי ה- OCR הקודמים בהמרת המסמך המורכב, התרשמתי מאסיבי OCR המקוונים. הפריסה הייתה כמעט מושלמת, כפי שניתן לראות לעיל. עם זאת, שוב, המתכון לא הועלה טוב מדי, אבל כל טעויות קלות אחרות היו זניחות.

פסק דין

תוצאות פנטסטיות לחלוטין מ- OCR המקוון. החיסרון היחיד שאני רואה הוא שאין דרך להוריד את המסמכים שהומרו כקובצי PDF, שכן פורמטי הפלט שהוזכרו כוללים DOCX, XLSX ו- TXT בלבד.

כאמור, ABBYY היא אחת המובילות בשוק בתוכנות OCR, בעלות של כ -150 דולר עבור התוכנית המלאה שלהן להורדה. הם כן מציעים א ניסיון חינם בן 10 עמודים עם זאת, עבור הכלי המקוון שלהם (הרשמה נדרשת). עבור מנוי של $ 5, הכלי המקוון שלהם יאפשר לך להמיר 200 דפים בכל חודש.

ABBYY FineReader ברשת

הקבצים המקובלים יכולים להיות עד 100 מגהבייט, בכל אחד מהפורמטים הבאים: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP ו- PNG. ABBYY מכיר גם כמעט 200 שפות. התפוקות מרשימות במיוחד, עם בחירה בין DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 ו- EPUB.

אתה יכול אפילו לנסות כמה תכונות BETA במהלך תקופת הניסיון שלך. הראשונה היא האפשרות לתרגם את המסמך לשפה אחרת. השני הוא לייצא את המסמך המומר שלך לחשבון האחסון בענן שלך, בין אם זה Dropbox, Google Drive, Evernote, Microsoft OneDrive או Box.

מסמך בסיסי ל- DOCX
התוצאות הכוללות היו טובות, אך לא מדהימות בהתחשב בכך שמדובר במוצר פרימיום. מספר פסיקים ותקופות הוחלפו סביבם, כמה פסיקים הפוכים הוחלפו בכוכבית, כמה אותיות גדולות חסרו, ומילה אחת (ליטרליסט) כתובה לא נכון.

מסמך מורכב ל- DOCX
לאחר ההמרה היו מעט מאוד תקלות בטקסט בתוך המסמך (מלבד ה- OCR שנאבק שוב בגופן של המתכון!), אך העיצוב הותיר הרבה מאוד נחשק.

תוצאה של ABBYY

שלושת העמודות איכשהו תפסו שני עמודים, עם העמודה המרכזית רק מופיע בדף השני. אם רצית לעשות זאת לעשות כל דבר עם המסמך המומר הזה, בסופו של דבר תוציא את השיער.

מסמך בסיסי ל- PDF
תוך כדי סקירת ה- PDF שהומר, לא הצלחתי למצוא שום תקלה. אולי מצאנו איפה ABBYY מצטיינת. תוצאות פנטסטיות.

מסמך מורכב ל- PDF
שוב, לא הצלחתי למצוא שגיאות בקובץ המרה זה. ברור ש- ABBYY יודע להמיר ל- PDF בצורה יוצאת דופן.

פסק דין
אם אתה שמח לשלם כמה דולרים, ההמרה ל- PDF כנראה עובדת בצורה פנומנלית עם השירות הזה מסוגל לסנכרן קבצים שהומרו לאחסון הענן שלך שימושי במיוחד אם אתה סורק נפח גדול של מסמכים. בדומה לאופציות האחרות, ABBYY עדיין לא הבינה כיצד להמיר מסמכים ללא דופי ללא הגבלה לצורך עריכה קלה.

התוצאה הסופית

אם, כמו רוב האנשים, אתה פשוט מחפש לסרוק כמה מאמרים על כתבי-עת וכמה שטרות בית, לא תצטרך לערוך את המסמכים האלה. לכן המרה ישירה למסמך PDF תתאים עבורך, מכיוון שעדיין תוכל לחפש במסמכים אלה. לשם כך, OCR מקוון חינם היה ללא ספק הכלי החינמי הטוב ביותר שבדקנו. עם זאת, אם אתה מוכן לשלם 5 $ לחודש עבור כמעט שלמות, FineReader מקוון של ABBYY היה קצת יותר מדויק.

כשמדובר בהמרת מסמכים ל- DOC, לא הצלחנו למצוא פתרון מושלם, אך ללא ספק התוצאות הטובות ביותר הגיעו OCR מקוון. ההמרה לא הייתה מושלמת, אך שלמות העיצוב נשמרה ברובה על כנה, והטעויות היו זניחות. כאשר אנו משווים תוצאות אלה למציע "הפרמיה" של ABBYY, אינך יכול שלא להתרשם באופן מסיבי.

לא כללנו יכולות ה- OCR של Google Drive בפוסט זה; קצת בגלל שלמותו של גוגל, אלא יותר מכך שרצינו לבדוק כמה שירותי OCR מקוונים אחרים בחינם.

אליך: אילו כלים OCR מקוונים אחרים היית ממליץ לקוראים שלנו? ובאילו ניסית שלעולם לא תשתמש בהם שוב?

רוב ניטינגייל הוא בעל תואר בפילוסופיה מאוניברסיטת יורק, בריטניה. הוא עבד כמנהל ויועץ במדיה חברתית במשך למעלה מחמש שנים, תוך שהוא מעביר סדנאות במספר מדינות. בשנתיים האחרונות רוב היה גם סופר טכנולוגי, והוא מנהל המדיה החברתית של MakeUseOf, ועורך הניוזלטר. בדרך כלל תמצא אותו נוסע...