כאשר אדם מסתכל על סצנה או תמונה, הוא מבין זאת - אילו חפצים נמצאים בו ומה קורה אם מתרחשת פעולה. מחשב, לעומת זאת, מעבד רק נתונים דיגיטליים המתארים את ערך הצבע של כל פיקסל. עבור אדם, הכרה בפיצה על שולחן מבולגן היא ללא מאמץ. אך עד לאחרונה מחשבים לא יוכלו לבצע את אותה משימה.
ראיית מחשב, או קורות חיים, מאפשר למחשב להיות מסוגל לבחור מידע חשוב מהתשומות החזותיות ולחזות והמלצות מדויקות על בסיס מידע זה.
כיצד ראיית המחשב עובדת?
לפני ראיית מחשב, כדי ליצור תוכנית שזיהתה תמונה מסוימת, אדם יצטרך לבצע שעות של עבודת רגליים ידנית. ראשית, יהיה צורך לאסוף מסד נתונים של תמונות דומות.
לאחר מכן, יהיה צורך לנתח תמונות אלה באופן ידני, למדוד אותן ולהביא להן הערות באמצעות נתונים רלוונטיים שהחוקר חשב שיכול לזהות את האובייקט המדובר (כמו צבע, מידות ו צוּרָה). רק אז ניתן היה להשתמש בתוכנה לחיזוי.
מצד שני, ראייה ממוחשבת הופכת את כל התהליך לאוטומטי באמצעות גישה למידת מכונה המכונה למידה עמוקה. למידה עמוקה משתמשת ברשת עצבית רב שכבתית עם מאות שכבות פוטנציאליות. במקרה של תמונות, זו בדרך כלל רשת עצבית קונבולוציה (CNN).
הסבר בפירוט כיצד למידה עמוקה ורשתות עצביות עוברות הרבה מעבר לתחום מאמר זה. בעיקרון, כמויות גדולות של נתונים מוזנות לרשת העצבית. הרשת העצבית מנתחת את הנתונים באופן חוזר ונשנה עד שהיא יכולה ליצור חיזויים מדויקים לגביהם.
במקרה של CNN המשמש למשימה של ראיית מחשב, הרשת העצבית לוקחת את הנתונים במספר שלבים. ראשית, היא מכווצת את התמונה למספר חלקים (פיקסלים בודדים או קבוצות פיקסלים שתויגו מראש).
לאחר מכן, הוא מנבא תחזיות לגבי חלקים שונים בתמונה (כמו קצוות קשים או אובייקטים ספציפיים). זה בודק את דיוק התחזיות הללו שוב ושוב ומשנה חלקים מהאלגוריתם בכל פעם עד שהוא הופך להיות מדויק מאוד.
מחשבים עכשיו הם כל כך חזקים שהם יכולים לנתח תמונה הרבה יותר מהר מהמוח האנושי, במיוחד לאחר שלמדו לזהות דפוסים מסוימים. באופן זה, קל לראות כיצד אלגוריתם למידה עמוקה יכול לעלות על יכולות האדם.
מהם סוגי ראיית המחשב?
ראיית מחשב כוללת ניתוח והבנת תמונות והפקת תחזיות או החלטות רלוונטיות לגבי התמונות. ישנן משימות שונות בהן ראיית המחשב תשתמש כדי להשיג מטרות אלה. חלקם כוללים:
- סיווג תמונות: סוג התמונה מזוהה. למשל, בין אם מדובר בפנים, בנוף או בחפץ של האדם. ניתן להשתמש במשימה מסוג זה כדי לזהות ולסווג תמונות במהירות. שימוש אחד לכך הוא בזיהוי אוטומטי וחסימה של תכנים בלתי הולמים ברשתות החברתיות.
- זיהוי אובייקט: בדומה לסיווג תמונות, זיהוי אובייקטים יכול לזהות אובייקט מסוים בתוך סצנה - כמו פיצה על שולחן עמוס.
- זיהוי קצה: שימוש נפוץ בראיית מחשב, ובדרך כלל השלב הראשון בזיהוי אובייקטים, הוא זיהוי הקצוות הקשים בתמונה.
- זיהוי אובייקט: זוהי הכרה בדוגמאות בודדות של אובייקט או תמונה, כמו זיהוי אדם מסוים, טביעות אצבע או רכב.
- זיהוי אובייקט: איתור הוא זיהוי של תכונה מסוימת בתוך תמונה, כמו עצם שבורה בצילום רנטגן.
- פילוח אובייקט: זהו הזיהוי של איזה פיקסלים בתמונה שייכים לאובייקט המדובר.
- מעקב אחר אובייקטים: ברצף וידאו, לאחר שאובייקט זוהה, ניתן לעקוב אחריו בקלות בכל הסרטון.
- שחזור תמונות: ניתן להסיר טשטוש, רעש וחפצי תמונה אחרים על ידי זיהוי מדויק היכן נמצא האובייקט מול הרקע בתמונה.
דוגמאות לראיית מחשב
בינה מלאכותית היא כבר בשימוש במספר תעשיות עם אפקט מדהים, וזה נכון לראיית מחשב. להלן מספר דוגמאות לקורות חיים שכבר משתמשים בהן כיום.
זיהוי פנים
זיהוי פנים הוא אחת הדרכים העיקריות בהן משתמשים כיום בראיית מחשב. בהשוואה למאגרי מידע של פנים ידועות, אלגוריתמים של ראיית מחשב יכולים לזהות באופן מדויק אנשים בודדים.
- מדיה חברתית מנתחת תמונות ומתייגת באופן אוטומטי משתמשים שיש להם מבחר טוב של תמונות.
- מחשבים ניידים, טלפונים ומכשירי אבטחה יכולים לזהות אנשים המאפשרים גישה.
- אכיפת החוק משתמשת בזיהוי פנים במערכות טלוויזיה במעגל סגור כדי לזהות חשודים.
רפואה
ראיית מחשב משמשת כיום בבריאות כדי לספק אבחנות מהירות ומדויקות יותר מכפי שמומחים יכולים לבצע. יישומים רבים כוללים ניתוח צילומי רנטגן, CT או MRI עבור מצבים מסוימים, כולל מחלות נוירולוגיות, גידולים ועצמות שבורות או שבורות.
מכוניות עם נהיגה עצמית
כלי רכב אוטונומיים צריכים להבין את סביבתם לנהוג בבטחה. המשמעות היא זיהוי כבישים, נתיבים, אותות תנועה, כלי רכב אחרים, הולכי רגל ועוד. כל המשימות הללו משתמשות במערכות ראיית מחשב בזמן אמת כדי למנוע התנגשויות ולנהוג בבטחה.
ראיית המחשב מאתגרת
היישומים הנוכחיים של ראיית מחשב כבר מתחילים לשנות את אופן העבודה שלנו בענפים שונים. מהיכולת לזהות ציוד פגום או שבור ועד לאבחון מדויק של סרטן, לראיית המחשב יש יכולת לשפר מערכות ולהציל חיים.
אבל, זה לא בלי אתגריה. ראיית מחשב עדיין רחוקה מלהיות ראייה אנושית. יש לנו אלפי שנות אבולוציה שמאפשרות לנו לזהות ולהבין כמעט את כל מה שקורה סביבנו בזמן אמת. אבל, אין לנו מושג כיצד מוח אנושי מבצע משימות אלה.
למידה עמוקה היא צעד מסיבי בכיוון הנכון, אך היא עדיין מצריכה כמות מדהימה של עבודה ליצור מערכת שתוכל לבצע משימה שבני אדם יכולים לבצע בקלות רבה, כמו זיהוי מכונית על המכונית כְּבִישׁ. הסיבה לכך היא שמחשבים מבצעים משימות מוגבלות ביעילות רבה. פיתוח מחשב שיכול להבין את המורכבות הכוללת של העולם הוויזואלי הוא משחק כדור אחר לגמרי.
ככל שמחקרים נוספים עוסקים ביישומי AI וגם בביולוגיה אנושית, אנו צפויים לראות פיצוץ של שימושים אפשריים לראיית מחשב בעתיד הקרוב.
אלגוריתמים ללימוד מכונה נועדו להקל על החיים ולשפר מערכות, אך הם יכולים להשתבש עם השלכות רעות.
קרא הבא
- הסבירו טכנולוגיה
- תִכנוּת
- בינה מלאכותית
- רשתות עצביות

ג'ייק הארפילד הוא סופר עצמאי שבסיסו בפרת ', אוסטרליה. כשהוא לא כותב, הוא בדרך כלל בחוץ וצילם חיות בר מקומיות. אתה יכול לבקר אותו בכתובת www.jakeharfield.com
הירשם לניוזלטר שלנו
הצטרף לניוזלטר שלנו לקבלת טיפים טכניים, ביקורות, ספרים אלקטרוניים בחינם ומבצעים בלעדיים!
צעד אחד נוסף !!!
אנא אשר את כתובת הדוא"ל שלך בדוא"ל ששלחנו לך זה עתה.