ASCII הוא ראשי תיבות שאולי שמעתם ביחס לטקסט המחשב, אך זהו מונח שיוצא במהירות משימוש הודות למצטרף חזק יותר. אבל מהו ASCII, ולמה הוא משמש?
על מה ASCII עומד?
אולי המקום הכי קל להתחיל בו הוא ראשי התיבות עצמה, אז בואו נרחיב אותו:
אמריקן סטנדארד גאודה ל אניnformation אנימחליף
פת הביטוי הזו לא ממש נותנת את התמונה המלאה, אך חלקים מסוימים מציעים מיד כמה רמזים, בעיקר שתי המילים הראשונות. ASCII הוא תקן אמריקאי שמשמעותו בקרוב תתברר.
"קוד למחלף מידע" מציע שאנחנו מדברים על פורמט להעברת נתונים הלוך ושוב. באופן ספציפי, ASCII עוסק בנתונים טקסטואליים: תווים המרכיבים מילים בשפה שקריאה אנושית בדרך כלל.
ASCII פותר את הבעיה כיצד להקצות ערכים לאותיות ולתווים אחרים כך שכאשר הם יהיו המאוחסנים כאחד ואפסים בקובץ, ניתן לתרגם אותם חזרה לאותיות בעת קריאת הקובץ יותר מאוחר. אם מערכות מחשוב שונות מסכימות להשתמש באותו קוד, ניתן להחליף מידע כזה באופן מהימן.
קָשׁוּר: כיצד למצוא סמלים ולבדוק את משמעויותיהם
זקוק לעזרה בזיהוי סמל? כך תוכל למצוא כל סמל לפי תמונה, כיצד לחפש בספריות סמלים ועוד.
ההיסטוריה של ASCII
המכונה לפעמים US-ASCII, ASCII היה חידוש אמריקני שפותח בשנות השישים. התקן עבר שינויים רבים מאז, בעיקר ב- 1977 וב- 1986, אז עודכן לאחרונה ASCII.
הרחבות וריאציות נבנו על ASCII לאורך השנים, בעיקר כדי לספק את העובדה ש- ASCII משמיט תווים רבים המשמשים, או אפילו נדרשים, בשפות שאינן אנגלית אמריקאית. ASCII אפילו לא נותן מענה לסמל המטבע הבריטי ("£"), אם כי הלירה קיימת בלטינית -1, הרחבה של 8 סיביות שפותחה בשנות השמונים, המקודדת גם כמה מטבעות אחרים.
ASCII הורחב מאוד והצליח על ידי יוניקוד, סטנדרט הרבה יותר מקיף ושאפתני, עליו נדון להלן. בשנת 2008 יוניקוד עקפה את ASCII בפופולריות לשימוש מקוון.
אילו דמויות מייצג ASCII?
למחשב, האות "A" לא מוכרת בדיוק כמו הצבע הסגול או תחושת הקנאה. מחשבים עוסקים באפסים ובאפסים, ובבני האדם להחליט כיצד להשתמש באפסים ובאפסים אלה כדי לייצג מספרים, מילים, תמונות וכל דבר אחר.
אתה יכול לחשוב על ASCII כקוד המורס של העולם הדיגיטלי - בכל מקרה הניסיון הראשון. בעוד שקוד מורס משמש לייצוג של 36 תווים שונים בלבד (26 אותיות ועשר ספרות), ASCII תוכנן לייצג עד 128 תווים שונים בשבעה סיביות נתונים.
ASCII תלוי רישיות, כלומר מייצג 52 אותיות גדולות וקטנות מהאלפבית האנגלי. לצד אותן 10 ספרות, זה כמחצית מהשטח ששימש.
סימני פיסוק, סמלים מתמטיים וטיפוגרפיים תופסים את השאר, ואוסף של תווי בקרה, שהם קודים מיוחדים שאינם ניתנים להדפסה עם משמעויות פונקציונליות - ראה להלן עוד.
להלן מספר תווים אופייניים שקודד ASCII:
בינארי | נקודה | דמות |
---|---|---|
010 0001 | 33 | ! |
011 0000 | 48 | 0 |
011 1001 | 57 | 9 |
011 1011 | 59 | ; |
100 0001 | 65 | א |
100 0010 | 66 | ב |
101 1010 | 90 | ז |
101 1011 | 91 | [ |
110 0001 | 97 | א |
110 0010 | 98 | ב |
111 1101 | 125 | } |
שים לב שלערכים שנבחרו יש כמה מאפיינים שימושיים, בפרט:
- ניתן למיין אותיות מאותו מקרה תמיד באופן מספרי מכיוון שהן בסדר. לדוגמא, ל- A ערך נמוך יותר מ- B, בעל ערך נמוך מ- Z.
- מכתבים ממקרים שונים מקוזזים על ידי 32 בדיוק. זה מקל מאוד על התרגום בין אותיות קטנות וקטנות שכן יש צורך להחליף רק סיבית אחת לכל אות, כך או כך.
שליטה על דמויות
מלבד אותיות, פיסוק וספרות, ASCII יכול לייצג מספר תווי בקרה, נקודות קוד מיוחדות שעושות זאת לא לייצר פלט של תווים בודדים אלא לספק משמעויות חלופיות לגבי הנתונים לכל מה שצורך אותם.
לדוגמה, ASCII 000 1001 הוא תו הכרטיסייה האופקי. זה מייצג את המרחב שתקבל כשתלחץ על מקש TAB. בדרך כלל לא תראה תווים כאלה ישירות, אך לעתים קרובות האפקט שלהם יוצג. להלן מספר דוגמאות:
בינארי | נקודה | דמות |
---|---|---|
000 1001 | 9 | כרטיסייה אופקית |
000 1010 | 10 | הזנת שורה |
001 0111 | 23 | סוף חסימת השידור |
מה עם דמויות אחרות?
ASCII הצליח מאוד בימים הראשונים של המחשוב מכיוון שהוא היה פשוט ומאומץ באופן נרחב. עם זאת, בעולם עם השקפה בינלאומית יותר, מערכת כתיבה אחת פשוט לא תקצץ אותה. תקשורת מודרנית צריכה להיות אפשרית בצרפתית, ביפנית - למעשה, בכל שפה שנרצה לאחסן בה טקסט.
ערכת התווים של Unicode יכולה לתת מענה לסך כולל של 1,112,064 תווים שונים, אם כי רק כעשירית מהם מוגדרים כרגע. זה אולי נשמע הרבה, אבל הקידוד נועד לא רק לספק לעשרות אלפי סינים תווים, הוא מכסה גם אימוג'י (כמעט אלף וחצי) ואפילו מערכות כתיבה נכחדות כגון יורכן.
קָשׁוּר: 100 האימוג'ים הפופולריים ביותר שהוסברו
יוניקוד הכירה בדומיננטיות של ASCII בבחירת 128 התווים הראשונים: הם זהים לחלוטין ל- ASCII. זה מאפשר להשתמש בקבצים מקודדים ASCII במצבים בהם צפוי Unicode, ומספק תאימות לאחור.
סיכום
טקסט ASCII מייצג את 26 האותיות של האלף-בית האנגלי, עם ספרות, פיסוק וכמה סמלים אחרים שהושלכו פנימה. היא שימשה את מטרתה טוב מאוד במשך חצי מאה,
כעת הוא הוחלף על ידי יוניקוד, התומכת במספר עצום של שפות וסמלים אחרים, כולל אמוג'י. UTF-8 הוא, לכל המטרות המעשיות, הקידוד שיש להשתמש בו לייצוג תווי Unicode באופן מקוון.
כך תוכל לגשת לאפליקציות נפוצות של פיראטיות בחינם, בהנחה או באמצעות תוכנה חלופית.
- הסבירו טכנולוגיה
- ז'רגון
- תרבות רשת
- יוניקוד
בובי הוא חובב טכנולוגיה שעבד כמפתח תוכנה במשך רוב שני העשורים. הוא נלהב ממשחקים, עובד כעורך ביקורות במגזין Switch Player, והוא שקוע בכל ההיבטים של פרסום מקוון ופיתוח אתרים.
הירשם לניוזלטר שלנו
הצטרף לניוזלטר שלנו לקבלת טיפים טכניים, ביקורות, ספרים אלקטרוניים בחינם ומבצעים בלעדיים!
צעד אחד נוסף !!!
אנא אשר את כתובת הדוא"ל שלך בדוא"ל ששלחנו לך זה עתה.