הטכנולוגיה נמצאת בכל מקום. תלוי כמה גבוה ההשקעות בענף שלך, כישלון של מוצר או מערכת טכנולוגית יכול ליפול בכל מקום בין זניח לחלוטין לסוף החיים כפי שאתה מכיר אותו.

מרכזיות בית חולים? סוג של חשוב. הגמישות של אפליקציית Candy Crush בטלפון הסלולרי שלך? כנראה שקצת יותר נמוך ברשימת העדיפויות הכוללת.

במערכת רשתות מבוזרת, כישלון הוא בלתי נמנע. מניעת אסון מתחילה בתכנון אבטחה יציב ואטום למים. אולם מעבר לכך, מה עוד אפשר לעשות?

מהי הנדסת כאוס של נטפליקס?

20 בספטמבר 2015.

הכל שקט בחזית המערבית, כשלפתע כמה שרתי חברות אמזון שירותי אינטרנט חשובים יורדים בלי מילה.

חברות ענק רבות לא הצליחו לספק את לקוחותיהן במשך מספר שעות. נטפליקס, לעומת זאת, חזרה על רגליה תוך מספר דקות. אֵיך? תרבות החברות הפנימית של נטפליקס התפתחה וכללה שיטות רבות "גורמות כישלונות" המיושמות בזמן אמת להכנת מערכות וגם מהנדסים כאחד לקראת אסון.

הנהגת החברה ביצעה בכוונה הפסקות שרתים מדומות בחלקים כלולים של המערכת כדי ללמוד ולהתכונן לאירועים מסוג זה. זה עזר להם לזהות חורים במערכת ולבנות יתירות שאפשרו להמשיך בשירות ללא הפרעה, גם במקרה של תקלה גדולה כמו זו שהוזכרה קודם לכן.

instagram viewer

תרגילי "הנדסת כאוס" מכוונים אלה העניקו למהנדסים שלהם יתרון תחרותי בכדי לראות את עצמם דרך הפיאסקו, בין השאר בזכות התשתית המונעת שבנו עם אירוע יום הדין הזה בראש.

איש אחר לא היה מוכן כשהגל הגדול פגע. מערכת נטפליקס הייתה חזקה מספיק כדי להסתדר עם עצמה. סיכום? המוח הכאוטי האלה עשויים להיות קשורים למשהו כאן.

בכוונה להשמיד את מי שאוהב אותך

"הנדסת כאוס היא המשמעת להתנסות במערכת במטרה לבנות אמון ביכולתה של המערכת לעמוד בתנאים סוערים בייצור."

עקרונות מניפסט הכאוס

זהו לב הנדסת הכאוס - למעשה, "תרגיל כיבוי אש" המוטל על המערכת בשעות העבודה כאשר יש עיניים וידיים פנויות להתמודד עם האתגר שהוצג. יכולת מערכת נתונה לסבול כישלון עומדת במבחן מכיוון שנחשפות כל פגיעות.

בהקשר המקורי לשנת 2011, הנדסת הכאוס נגעה למחלקת ה- IT של נטפליקס. הנהגתם רצתה לבדוק עד כמה מאמצי הצוות היו עמידים כאשר אחד או יותר מהמחשבים שלהם הושבתו בכוונה. נסיגות אלה אפשרו לצוות ה- IT לזהות חולשות מרכזיות לפני שהפכו לנושאים כלל-מערכתיים וניתן יהיה לנצל אותם מבחוץ.

כישלון אמיתי? זה יכול להיות יקר כמו לעזאזל, וזה חורג מההשלכות הכספיות. אפילו תקופות של זמן השבתה, ללא הפסקה אמיתית באבטחה, יניבו ככל הנראה שפע של הזדמנויות שהוחמצו להרוויח הכנסות. למה לחכות לשעת חירום שתעוור את עיניך?

הקופים מאחורי הטירוף

יש חברות שיאמצו מודל "צוות אדום" שמציב צוותי מפתחים נגד אחיהם בכל קווי המחלקה. הדוגמה הקלאסית שנטפליקס הקימה, לעומת זאת, עושה שימוש ב"צבא סימיאן ". הרובוטים האלה מבצעים את העבודה המלוכלכת עבורם באופן הוגן ואקראי לחלוטין.

מטורף? להדיוט, אולי. כלשונו של סופר "קופי הכאוס" אנטוניו גרסיה מרטינז:

"תאר לעצמך קוף שנכנס ל'מרכז נתונים ',' חוות 'אלה של שרתים שמארחים את כל הפונקציות הקריטיות של הפעילות המקוונת שלנו. הקוף קורע באקראי כבלים ומשמיד מכשירים. האתגר הוא לתכנן את מערכת המידע שעליה הם אחראים כך שתוכל לעבוד למרות הקופים האלה, שאיש לא יודע אי פעם מתי הם מגיעים ומה הם יהרסו. "

אנלוגיה צבעונית. לא כל הסימיאנים אכזריים, עם זאת: דוקטור קוף עוקב אחר ביצועי המערכת, למשל. אולם כאשר כאוס קונג עוצר לביקור, כל ההימורים אינם פעילים; דמות זו תוריד אזור זמינות AWS שלם.

קָשׁוּר: כיצד מעריכים פגיעויות ביטחוניות?

הנדסת כאוס והשיטה המדעית

הנדסת תוהו ובוהו משמשת מקור רב ערך לתובנה מערכתית עבור מי שמבצע את הניסויים. לא רק המפתחים עומדים כאן למבחן; זו המערכת כפי שהיא קיימת גם באופן אוטונומי.

לפני השלכת חבית הקופים לשולחן, הנדסת תוהו ובוהו דורשת להניח מעט עבודות יסוד.

  1. ראשית עליך לזהות מה אתה מחשיב כמצב "יציב", בריא ותפקודי עבור המערכת שלך. זה יהיה ה"בקרה "שתמדוד כל תוצאות מוחשיות.
  2. התחל לחשוב כיצד מצב זה יוצג מאיזון על ידי חדירת כישלון מתוזמר. תכנן את התוכנה הזדונית שלך לחיפוש כך שתשפיע רק על אזור מכיל ושולט במערכת שלך.
  3. הציגו את ה"פולש "ואפשרו למערכת להגיב.
  4. התבונן ופרש כל הבדל בין המערכת כפי שהיא קיימת כעת ואיך שהיא התנהגה בעבר, בזמן שהייתה בהומאוסטזיס. הגדל את "רדיוס הפיצוץ" של ההשפעה שלך עד שתגלה פגיעות או תגיע לקנה המידה המלא, המוקדם מבין השניים.

הרעיון הוא שככל שקשה יותר לשבש מערכת פונקציונלית, כך אתה יכול לקבל יותר ביטחון בחוסן שלה לשינויים ולהפצצות. גישה זו מראה כיצד היבטים שונים במערכת יפצו על כשלים זה בזה במקרה של הפסקת חשמל.

"מכיוון שאף רכיב בודד אינו יכול להבטיח זמן עבודה של 100% (ואפילו החומרה היקרה ביותר בסופו של דבר נכשלת), עלינו לעשות זאת תכנן ארכיטקטורת ענן בה רכיבים בודדים עלולים להיכשל מבלי להשפיע על זמינות המכלול מערכת."

ה נטפליקס בלוג

לפעמים, השעשוע במערכת בצורה כזו אפילו לא מתקרב להשפיע על חוויית הלקוח. פעמים אחרות יתגלה פגמים ביטחוניים קשים. כעת, במיוחד בנטפליקס, מגירה שנועדה להסוות כשל במערכת ברמת המשתמש מובנית בבסיס המערכת.

קָשׁוּר: מהי ניצול אפס-יום?

האם הנדסת כאוס שווה את זה?

אם אתה רוצה להבין מערכת מורכבת - תפריע לה

- פרחאן תוואר (@fnthawar) 26 במאי 2021

המבקרים יאמרו כי אין משחק אחורי שכדאי להשפיע על חוויית הלקוח, ולו בקצרה ובמקרה. עם זאת, מי שמצדדים בהנדסת תוהו ובוהו יתנגדו בכך ש"הפסקות המתוכננות "הללו אמורות להיות קטנות בהרבה ממה שחוות AWS בשנת 2015. אם בעיה קטנה ומתוכננת מעמידה אתכם במצב למנוע מבעיה הרבה יותר גדולה להציג את עצמה אי פעם, תכנון האירוע הראשוני עשוי להיות הדרך הטובה ביותר להתכונן. פחות משתמשים יושפעו בסך הכל. המתמטיקה מסתדרת.

מהסוף האנושי של העניין, המנטליות היא שכעת, המהנדסים האלה שעברו שרת מתנגשים מולם ו להתמודד עם זה בצורה מיומנת יהיה גם ערני יותר בעתיד וגם יותר מצויד אינטלקטואלית לטפל בכל מה שמגיע להם דֶרֶך. המערכת החזקה יותר שמביאה, במקרים רבים, מדברת בעד עצמה.

עמק הסיליקון: לאן חלומות הולכים למות

הם אומרים שאם אתה רוצה לעשות את זה גדול, אתה צריך להיות מוכן להרוג את יקיריך, או, במקרה זה, להיות מוכן לתת לאחרים להרוג אותם בשבילך. כאשר האבטחה נמצאת בחזית כבר מתחילת הפיתוח, סביר להניח שהצוות שלך יקבל משהו בלתי חדיר ובטוח ללקוחות לשימוש חופשי.

משחק בהתנסות בחוויית מקום העבודה הופך את הסיכוי להצלחה בתחום זה למרגש; כאשר התוצאה הסופית היא איכותית, כולם יכולים לעלות מדרגה. הנטפליקס שלי עובד בסדר גמור, ויש לנו רק המשוגעים מאחורי הכאוס להודות על כך.

כעת, כשיש לך מושג על הנדסת כאוס, מדוע לא להרחיב את הידע שלך באמצעות מתודולוגיה אחרת לפיתוח תוכנה? Agile היא מערכת מצוינת שתוכל לשלב כדי לאחד את כוח האדם ולייצר קוד נקי ויעיל.

אימייל
מהי מתודולוגיית התכנות הזריז?

בין אם אתם מגישים מועמדות למשרות תכנות ובין אם אתם רוצים דרך עבודה יעילה יותר, עליכם לדעת על Agile.

קרא הבא

נושאים קשורים
  • תִכנוּת
  • תִכנוּת
על הסופר
אמה גרופאלו (25 מאמרים פורסמו)

אמה גרופאלו היא סופרת השוכנת כיום בפיטסבורג, פנסילבניה. כשלא מתאמלת ליד שולחנה מתוך רצון שיהיה מחר טוב יותר, בדרך כלל ניתן למצוא אותה מאחורי המצלמה או במטבח.

עוד מאמה גארופאלו

הירשם לניוזלטר שלנו

הצטרף לניוזלטר שלנו לקבלת טיפים, ביקורות, ספרים אלקטרוניים בחינם ומבצעים בלעדיים!

צעד אחד נוסף !!!

אנא אשר את כתובת הדוא"ל שלך בדוא"ל ששלחנו לך זה עתה.

.