פרסומת

이 웹사이트에 환영. 이것은 보기 원본이다

איזו שפה זו? סִינִית? יַפָּנִית?

זה קוריאני למעשה. זיהוי זה ידני היה לוקח לי הרבה זמן. למרבה המזל, מצאתי כמה כלים מאוד מדויקים שיכולים לעשות זאת באופן אוטומטי. כולם מפורטים להלן.

הניסוי: בדקתי את האתרים באמצעות טקסט לדוגמה (1-2 משפטים עם 8 מילים) מהשפות הבאות: פורטוגזית, רוסית, קוריאנית, וייטנאמית, איטלקית, טורקית, פולנית, אוקראינית, אזרבייג'נית, סלובנית, מקדונית, הולנדית, פיליפינית (טאגלוג), יוונית, גליצית, צ'כית, ביילורוסית, פינית, טטרית ו נורבגית.

בסך הכל, בדקתי 20 שפות שונות.

3 כלים לזיהוי טקסט בשפה לא ידועה

1. LangId (עבר 18 מתוך 20 מבחנים, לא עבר טטרי ובילרוסית)

lang-id

יתרונות: בסך הכל, כלי מקוון נהדר. הוא מציע פונקציונליות בסיסית של זיהוי טקסט ויש להם גם טוויטר ובוטים לזיהוי דוא"ל לתוצאות מהירות אפילו יותר.

חסרונות: המנוע שלהם מבוסס על Google API אבל נראה שיש להם תוצאות טובות יותר מאשר גלאי גוגל המתואר להלן. נראה שהם יודעים לנצל דברים טוב מאוד. לא אהבתי שאין להם אלגוריתם ייחודי משלהם לזיהוי שפות.

2. Google Language Detector [לא זמין יותר] (עבר 17 מתוך 20 מבחנים, לא עבר פורטוגזית, טאגלוג ובלארוסית)

instagram viewer
איזו שפה זו

יתרונות: לגוגל יש את אחד ממשקי ה-API הטובים בעולם לזיהוי שפות. הדבר הטוב הוא שאתה יכול לראות את ההסתברות שהתוצאה שהם מציגים תהיה נכונה. הם הצליחו לעבור את רוב המבחנים לדוגמה.

חסרונות: די הופתעתי שהם לא עברו את המבחן בפורטוגזית. נראה שיש להם באג (אני מקווה זמני) עם השפה הזו. כמו כן, הם בוודאי יכולים לעשות עבודה טובה יותר בשיפור עיצוב הדף.

3. איזו שפה זו (עבר 11 מתוך 20 מבחנים, לא עבר רוסית, קוריאנית, אוקראינית, אזרבייג'נית, מקדונית, טגלוג, יוונית, גליצית וטטארית)

איזו שפה זו

יתרונות: כמה שפות כמו הדרום סלאביות (סרבית, קרואטית, סלובנית) די דומות. במקרה שתזין טקסט קרואטי, נניח, אתר זה יגיד לך שהטקסט יכול להיות גם סרבי או סלובני.

חסרונות: הם צריכים לעבוד על הפיכת מערכת הזיהוי שלהם למתוחכמת יותר. חשבתי לשים Translated.net (אתר נוסף לזיהוי שפות) במקום זה, אבל Translated הבטיח זיהוי של יותר שפות ולמעשה הצליח גרוע יותר מ-WhatLanguageIsThis.com.

2 כלים לזיהוי אתרים בשפות לא ידועות

4. גוגל תרגום עם איתור שפה כאפשרות הראשונה

עבר: 18 מתוך 20, לא עברו ביילורוסית וטטארית.

יתרונות: הכלי הזה עושה את העבודה שלו טוב מאוד. הדבר שאני אוהב בו גוגל תרגום Google Translate 2.1 מופיע עם מקלדת מקורית של iOS 7 ותמיכה בשפה נוספתעדכן ל-Google Translate 2.1 במכשיר ה-iOS שלך והמשך תמיכה בתרגום ותמיכה בהזנת כתב יד לשפות חדשות. סוף סוף גוגל טרנסלייט מקבל מקלדת iOS 7 חדשה שתעשה את כל... קרא עוד הוא שאם זה לא תומך בשפה ספציפית זה נותן לך את המסך הבא:

זיהוי שפות לא ידועות

זה גלאי שפה נהדר אם אתה שואל אותי!

5. מתרגם Bing של מיקרוסופט עם זיהוי אוטומטי כאפשרות הראשונה.

בינג-מתרגם

עבר: 8 מתוך 20, לא עברו הולנדית, וייטנאמית, טורקית, אוקראינית, אזרבייג'נית, סלובנית, מקדונית, טאגלוגית, יוונית, גליצית, צ'כית ובילרוסית

יתרונות: הוא תומך במספר מוגבל של שפות. עבור שפות אלה, זה עושה את העבודה שלו היטב.

חסרונות: אני מאוד מאוכזב ממיקרוסופט. יש להם מספר מוגבל מאוד של שפות לזיהוי& תִרגוּם תשכחו מ-Google Translate: 3 דרכים להשיג תרגום מדויק ומהירבין אם אתם מתכננים להגיש מועמדות לעבודה או דירה בחו"ל, או מחפשים לתרגם את דף האינטרנט שלכם, אתם צריכים לעשות דברים כמו שצריך גם עם שפה זרה. קרא עוד ותכונת הזיהוי האוטומטי שלהם נוראית. במקרה שתזין שפה שהם לא תומכים, תקבל תוצאה שגויה במקום להגיד לך שהם לא תומכים בשפה הזו.

מחשבות

בסך הכל, דעתי היא שהכלים לעיל הולכים לכיוון טוב. כרגע הם הטובים ביותר לזיהוי שפות מקוונות ועושים את עבודתם די טוב כשמדובר בשפות פופולריות. עם זאת, הם חייבים לעבוד על הוספת שפות לא ברורות יותר (אף אחד מהכלים לא הצליח לזהות טטאר) ואני בטוח שכולן, במיוחד גוגל ילכו בכיוון הזה בעתיד הקרוב.

קרדיט תמונה: קנקו*

שמי דארקו (כינוי דארן.) אני אוהב את Web 2.0, יצירת אתרי נישה (הפרויקט האחרון שלי הוא חיפוש אנשים) וכן הלאה...מה עוד אני יכול להגיד עלי בפרופיל כל כך קצר, עקבו אחרי שלי בטוויטר אם אתם רוצים לגלות עוד :)