נתונים הם נושא רגיש, ובאופן טבעי תהיו סביבו הרבה כמדען נתונים. הנה כמה כללים שאתה תמיד צריך לעקוב אחריהם.
נתונים הם בעלי ערך רב, וניצולם הוא בקלות אחת מהשיטות הטובות ביותר עבור רוב הארגונים כיום. אבל הכרת הסטנדרטים של התעשייה לגבי זה נחוצה כדי שמדעני נתונים לא יטעו בנתונים כשאנשים לומדים יותר על ערכם.
ככזה, מדעני נתונים חייבים לאמץ פרקטיקות בטוחות ואתיות ולאמץ פרקטיקות סטנדרטיות. במקום לשקול עד כמה הנתונים הם בעלי ערך בלבד, כדאי להטיל ספק בשיטות ההשגה והעיבוד של הנתונים לכל מטרה. לפיכך, הנה תשעה קודי התנהגות שכל מדען נתונים צריך לעקוב אחריהם.
1. שימו לב לתקנות
מדעני נתונים חייבים להכיר את תקנות הגנת המידע החלות על משרות מסוימות. אחרת, אתה עלול להפר את החוק שלא ביודעין ולסכן את עצמך ואחרים. לכן, ידע זה חיוני כדי להבטיח עבודה אתית ולמנוע נזק לא מכוון.
לפיכך, בדוק את החוקים הרלוונטיים לפני שתתעסק בפעילות כלשהי. יתר על כן, אל תשמור רק על התקנות כדי לציית לכללים; גם לחפש הבנה עמוקה יותר שלהם. כדי לשמור כראוי על התקנות, עליך לדעת מדוע הם הוצבו ומפני מה הם מגנים.
כמה חוקי פרטיות ראויים לציון הם תקנת הגנת המידע הכללית של האיחוד האירופי (
GDPR) וחוק הפרטיות לצרכן בקליפורניה (CCPA). אחרים כוללים HIIPA, DPA, PIPEDA, LGPD ותקנות רבות ספציפיות לתעשייה.2. כבד את הפרטיות
כתובות, אימיילים ומזהות הם מזהים שלא צריכים להיות ציבוריים מכיוון שהם מהווים סיכונים אמיתיים לאנשים. לפיכך, הקפד להפוך את הפרטים האלה לפרטי ככל האפשר.
אם ייחשפו, הקורבנות עלולים לסבול מגניבת זהות או הונאה. הם עלולים גם להיסחט על ידי אנשים המאיימים לשחרר את המידע הסודי שלהם. יתר על כן, אנשי מקצוע עלולים לסבול מנזק מוניטין והטרדה מקוונת ברגע שהעדפותיהם האישיות מתפרסמות ברבים. אלה יכולים להשפיע על מערכות היחסים, הזדמנויות הקריירה והמעמד החברתי שלהם.
אז עם זה בחשבון, חקור ובחר דרכים יעילות לשיפור זהויות מקוונות מאובטחות ולבטל זיהוי נתונים. לדוגמה, תוכל להחליף תווים, להסיר מזהים ישירים או להכליל. פעולה זו מגינה על נתונים רגישים מפני פושעי סייבר תוך סיוע לארגונים עם הממצאים שלך.
3. הסר הטיה
מדעני נתונים מסתמכים על סטטיסטיקה כדי להיות אובייקטיבית ככל האפשר. עם זאת, למרות המאמצים הללו, ההטיה נמשכת מכיוון שהרעיון שנתונים גדולים יותר מדויקים יותר היא אחת האפשרויות מיתוסים נפוצים של מדעי הנתונים.
יש בזה אמת מסוימת, אבל למרבה הצער, נתונים גדולים מכילים לפעמים אלמנטים וסטטיסטיקה מיותרים או מזויפים. לכן, במקום להתמקד במספרים בלבד, ודא שהנתונים שלך נקיים ומייצגים.
ניקוי או סינון נתונים לפני השימוש הם שיטות מצוינות למאבק בהטיות. לדוגמה, אתה יכול לבדוק אם יש שגיאות או להשתמש בדגימה מרובדת כדי להבטיח נתונים מייצגים.
4. אל תמציא או תמציא תוצאות
הפקה היא סוג של התנהלות לא נכונה של נתונים והונאת מחקר הכרוכה בהמצאת ממצאים ודיווח עליהם כנכונים.
לדוגמה, מדען נתונים עשוי לדווח שלתרופה נמצאה ללא תופעות לוואי עבור רוב בני קבוצת גיל מסוימת. הממצאים הללו היו מפוברקים אם לא היו ניסויים רפואיים ראשוניים ואיסוף נתונים כדי לגבות אותם.
לייצור השלכות חמורות ושליליות על מדעני נתונים ועל אלה המסתמכים על עבודתם. זה עלול להרוס את האמינות שלך, להכתים את המוניטין של הארגון שלך, לפגוע בציבור או לחשוף אותך לסיכונים משפטיים.
5. אין לזייף או לבצע מניפולציות של ראיות
זיוף הוא מניפולציה של המציאות, נתונים שנאספו כדי להתאים לאג'נדה. בעוד המפיקים ממציאים תוצאות מנתונים לא קיימים כדי לתמוך בטענותיהם, מזייפים פועלים כדי להפריך נתונים אמיתיים וקיימים מסיבות אישיות. כדי להשיג זאת, הם עשויים להתעסק בציוד מחקר, לשנות או להשמיט נתונים לחלוטין.
זיוף עלול לפגוע בציבור על ידי מסירת מידע כוזב המשפיע על קבלת החלטות במגזרים שונים. לדוגמה, מחקר תרופות מזויף עלול לחשוף אנשים לסיכונים מיותרים, טיפולים לא יעילים או תופעות לוואי מזיקות. זה גם עלול לגרום לאובדן כסף, זמן או חומרים שיכלו לשמש למטרות אחרות.
הפקה וזיוף הם פרקטיקות חסרות מצפון עם השפעות שליליות וסנקציות רבות. אלה עשויים לכלול קנסות, שלילת אישורים, אובדן מימון מחקר או מאסר.
6. הצג שקיפות
שקיפות עבור מדעני נתונים פירושה להיות כנים לגבי השיטות המיושמות לאיסוף, ניתוח והצגה של נתונים. מדעני נתונים צריכים להיות פתוחים ומוכנים לחלוק את שיטות העבודה שלהם עם מדעני נתונים אחרים ומשתתפי מחקר.
יתרה מכך, עליך לקבל את הסכמת משתתפי המחקר מכיוון שפרסום תוצאות ללא הסכמה מדעת עלול לזלזל או לפגוע במשתתפים בדרכים שונות. הם עלולים לפגוע בכבודם, בפרטיותם ובאוטונומיה שלהם או לחשוף אותם לסיכונים מזיקים ומיותרים הנובעים מהמחקר.
שקיפות בונה אמון עם מי שמסתמך על הנתונים שלך לתובנות. זה גם מבטיח איכות נתונים בכך שהוא מאפשר לאחרים לסקור את התוצאות שלך.
בנוסף, פתיחות בקרב מדעני נתונים מקדמת שיתוף פעולה ולמידה. אתה יכול לעזור לטפח חדשנות על ידי שיתוף התהליך שלך ותקשורת שיטות הדמיית הנתונים הטובות ביותר וטכניקות מדעי נתונים לעמיתים תוך למידה מהן.
7. איסוף נתונים בצורה מאובטחת
מדעני נתונים חייבים לאשר את הבטיחות של השיטות המשמשות לאיסוף, ניתוח ואחסון נתונים. פעולה זו מונעת פרצות מידע פוטנציאליות שיכולות להשפיע על מדעני הנתונים ומשתתפי המחקר.
הפרות נתונים מסכנות את הבטיחות האישית, מערערות את אמון הציבור וחושפות חוסר יכולת ארגונית וכתוצאה מכך הפסדים כספיים מדהימים עבור החברה. הפסדים אלו עשויים להיות תביעות של קורבנות פרצות מידע, פחות לקוחות ועוד.
לאור זאת, עליך לבצע מחקר כדי למצוא את פתרונות אבטחת המידע היעילים ביותר וליישם אותם. לדוגמה, אתה יכול לאבטח חיבורים עם הצפנת TLS/SSL או להשתמש בפרוקסי מסתובבים. כמו כן, תוכל לאכוף אמצעי בקרת גישה וליצור גיבויים במקרה של התקפה. כאשר אתה מוצא פתרונות, אל תשכח לשתף אותם עם אחרים כדי להבטיח אבטחה מקסימלית.
8. השתמש באלגוריתמים באחריות
אלגוריתמים הם לא רק כלים לניתוח נתונים. הם מהווים השפעות עוצמתיות על חייהם, התנהגויותיהם והזדמנויותיהם של אנשים. עם זאת, למרות שהם עוזרים לפתור בעיות ולבצע תחזיות חדשניות, הם גם לא מושלמים.
אם לא מתוכננים, נבדקים או נפרסים בקפידה, לאלגוריתמים יש השפעות חברתיות ואתיות שעלולות להזיק לקבוצות מסוימות של אנשים. הם גם מציגים הטיה אם הם מאומנים על נתונים המשקפים דעות קדומות קיימות ויכולים להיות בלתי צפויים. לפיכך, מדעני נתונים חייבים לתכנן אותם ולהשתמש בהם באחריות.
בחר תמיד באלגוריתמים מתאימים, בדוק את הביצועים שלהם והסביר כיצד הם פועלים. כמו כן, ודא שאתה מזהה מקורות פוטנציאליים להטיה ויישום מנגנונים שמתעדכנים או מתקנים במידת הצורך.
9. שקול את ההשלכות ארוכות הטווח של העבודה שלך
עבודתך כמדען נתונים תשפיע באופן משמעותי על היבטים רבים של החברה. אז, תמיד שקול כיצד המודלים שלך משפיעים על אנשים.
למשל, השתדלו לשאול אם העבודה שלכם יכולה להנציח דעות קדומות ואי שוויון או לסכן את הפרטיות בעתיד. לאחר מכן, התייחס כראוי לחששות אלה.
שימו לב שהשקפה מכוונת עתיד חשובה יותר מכל שיטה מתקנת, וחשיבה על הימים הבאים היא אחת הדרכים היעילות ביותר לקבל החלטות מוסריות.
אתה חייב להיות אתי כמדען נתונים
כמדען נתונים, אתה מקבל כוח שמגיע עם אחריות מידתית. הכישורים שלך נדירים, אז אתה יושב בחזית קבלת ההחלטות הארגונית.
ההחלטות שלך משפיעות על כל דבר, החל מתוכניות עסקיות של החברה ועד למערכות משפט פלילי. אז, אתה לא צריך לעשות אותם בקלות. היה תמיד ישר, אתי וקפדן בעבודתך כדי להגן על אנשים מפני דילמות אתיות קיימות בתעשייה שלך ובתחומי טכנולוגיה אחרים.