בזמן השימוש ב-Google Sheets לעבודה עם שני מערכי נתונים, ייתכן שתרצה להשוות בין השניים על ידי קביעת המידה שבה האחד משפיע על השני.

מתאמים יכולים להציע תובנה האם יש קשר ניבוי בין מישורי x ו-y, אבל הם לא בהכרח מצביעים על סיבתיות. כך תוכל להשתמש ב-Google Sheets כדי לזהות קורלציות בנתונים שלך.

מהי מתאם, ולמה אתה יכול להשתמש בו?

כאשר שני משתנים נמצאים בקורלציה, אחד יכול לקבוע כיצד משתנה משפיע על השני. אבל, חשוב לזכור שמתאם אינו מרמז על הסתמכות במקרה זה; זה רק מראה באיזו מידה ובמהירות שני משתנים משתווים או קשורים.

מדדים סטטיסטיים מסייעים בהבנת המגמות הבסיסיות בניתוח נתונים. מתאם הוא בין המדדים הסטטיסטיים הנפוצים ביותר, והוא קובע עד כמה קשורים או תלויים שני משתנים.

הבנת מקדם המתאם ב-Google Sheets

ב-Google Sheets, מקדם מתאם מחושב באמצעות הפונקציה CORREL. מקדם המתאם משמש כמדד למידת הקשר הדוק בין קבוצות הנתונים. ניתן להשתמש בו כדי לקבל את מקדם המתאם של מוצר-רגע של פירסון (r) אם יש לך שתי קבוצות משתנות של נתונים. אם תרצה ללמוד עוד על מקדם זה, תוכל לקרוא עוד במדריך זה מאת סטטיסטיקה ב-Leard.

אפשר להיתקל באחד משלושה מדדי מתאם. כל מדידה מגדירה את הקשרים בין משתנים בצורה שונה. הערך שלו הוא בין -1 ל-+1:

instagram viewer
  • -1 מציין מתאם שלילי מושלם: כאשר למתאם אכן יש מקדם מתאם השווה או מתחת ל-0.9, הוא נאמר כשליל מאוד. זה אינדיקציה לכך שהנתונים מתואמים. עם זאת, המשתנה x ממשיך לגדול, ואילו המשתנה y ממשיך לרדת.
  • 0 מציין שאין קשר: משתנים נחשבים לא מתואמים אם מקדם המתאם גדול מ-0.01 אך קטן מ-0.1 מכיוון שאין קשר מובחן בין כל משתנה. הם בלתי תלויים אחד בשני.
  • +1 מציין מתאם חיובי מושלם: כאשר מקדם המתאם נופל בין 0.9 ל-1, הוא נחשב חיובי ביותר. זה מצביע על עלייה בשתי קבוצות המשתנים.

ייתכן שהערך הגבוה ביותר של מקדם היה מקדם מתאם של 1. כאשר ערך המתאם הוא 1, זה מרמז שאם היית גרף את הנתונים, הם יהיו מיושרים לחלוטין כדי ליצור קו ישר.

אם אתה עדיין קצת אבוד, אל תדאג. נסביר את התחביר של הפונקציה CORREL ולאחר מכן נצלול לכמה דוגמאות מהעולם האמיתי כדי לעזור לך להבין אותה טוב יותר. הבנת קווים של התאמה מיטבית ו כיצד ליצור קווי מגמה ב-Google Sheets יעזור לך עם זה.

תחביר פונקציית CORREL ב-Google Sheets

=CORREL(data_y, data_x) 

בואו נחלק את זה לחלקים שלו ונבין טוב יותר מה המשמעות של כל ביטוי:

  • =CORREL: זוהי פונקציית ה-Google Sheet שקובעת את r, (מקדם המתאם של מוצר-רגע פירסון של מערך הנתונים).
  • data_y: זה מתייחס לקבוצת התאים המכילה את הנתונים התלויים או את טווח הערכים עבור אותם תאים.
  • נתונים x: זוהי הפניה אל מערך התאים עם הנתונים הבלתי תלויים או טווח הערכים עבור אותם תאים.

אם היית מתווה את נקודות הנתונים, data_y יהיה ציר Y ו-data_x ציר X. תבחין שיש שתי דרכים שונות להזין את טווח הנתונים. טווח תאי ייחוס או הזנת נתונים ישרה בפונקציה הן אפשרויות.

ברוב המקרים, השימוש בטווח תאי ייחוס עדיף. הסיבה לכך היא שסביר להניח שהגיליון האלקטרוני כבר מכיל את הנתונים שלך. שימוש בטווח תאי ייחוס יכול למנוע הקלדה מוגזמת שעלולה לגרום לשגיאת משתמש.

דוגמאות לפונקציות CORREL ב-Google Sheets

בואו נבדוק כמה דוגמאות כדי להבין כיצד להשתמש בפונקציית CORREL ב-Google Sheets.

דוגמה 1: מתאם חיובי חזק

עבור הדוגמה הראשונה הזו, בואו נניח שאנחנו עובדים בענף הנדל"ן. בגיליון האלקטרוני למטה, יש לנו מחיצות של דונם של קרקע שאתה מוכר ואת מספר היחידות שנמכרו של נתוני הקרקעות השונות האלה בגיליון Google שלך.

  1. אם אתה עוקב אחר גיליון, תתחיל בהקלדת הנתונים של המשתנים בגיליון האלקטרוני שלך, כפי שמוצג להלן:
  2. לחץ על תא C2
  3. סוּג =CORREL(
  4. לאחר מכן תמשיך להקליד data_y, שבמקרה שלנו הוא טווח התאים שאליו מתייחסים A2:A6, ואז הזן פסיק.
  5. המשך להקליד data_x, שבמקרה שלנו, הכוונה B2:B6.
  6. סיים עם סוגר סוגר, כפי שמוצג להלן:
  7. לבסוף, לחץ להיכנס כדי להחזיר את מקדם המתאם של שני פיסות הנתונים בתא C2.

באמצעות הדוגמה שהוצגה לעיל, השגת מקדם מתאם של 0.90, שהוא מתאם חיובי חזק מכיוון שערכו נופל בין 0.9 ל-1. לכן, זה מצביע על כך שככל ש-y משתנה, גם x משתנה בצורה דומה באופן מהותי.

להלן ייצוג של נתוני הדוגמה שלנו על גרף פיזור XY. כפי שאתה יכול לראות, קו ההתאמה הטוב ביותר קרוב לנקודות הנתונים בגרף, מה שתומך ברעיון שהנתונים נמצאים בקורלציה רבה.

אתה יכול ללמוד עוד על יצירת גרפי פיזור XY ב-Google Sheets במאמר אחר שלנו.

דוגמה 2: מתאם שלילי חלש

הפעם, נשתמש בדוגמה כללית יותר של "משתנים x ו-y" בגיליון האלקטרוני שלנו. כללנו בכוונה נתונים כדי להדגים מתאם שלילי, שפונקציית CORREL מדגימה להלן:

אין קשר חזק בין משתנים y ו-x, ולכן התוצאה שנקבל היא מקדם מתאם פחות משמעותי מאשר בדוגמה הקודמת. התוצאה שהשגנו היא -0.47. עם זאת, אין זה אומר שאין מתאם כלל. בואו נסתכל שוב על קו ההתאמה הטובה ביותר כדי להבין את זה.

כפי שניתן לראות לפי עלילת הפיזור, נקודות הנתונים רחוקות יותר מקו ההתאמה הטובה ביותר. יש, אם כן, פחות מתאם מאשר בדוגמה הראשונה, אבל לא אף אחד. אתה גם תבחין שקו ההתאמה הטובה ביותר הולך ופוחת. זה מראה מתאם שלילי, ערך אחד יורד ככל שהשני עולה.

דוגמה 3: אין חיבור

כאן יש לנו קבוצה של מספרים אקראיים לחלוטין. בואו ניגע במהירות כיצד להשתמש שוב בפונקציית CORREL:

  1. הקלד בתא C2 נוסחת CORREL
  2. הטיעונים שלנו הם A2:A10 ו B2:B10
  3. לחץ על Enter

הערך המוחזר ב-C2 הוא 0.02. אם מקדם מתאם נופל בין 0.01 ל-0.1, נקבע שהמשתנים המדוברים אינם מתואמים שכן אין קשר מובחן ביניהם. הקשרים בין משתנים הם בלתי תלויים לחלוטין.

להלן ייצוג של אותו על גרף פיזור. קו ההתאמה הטוב ביותר הוא כמעט שטוח, מה שמעיד על מתאם מועט בין שני מערכי הנתונים.

קשר בקלות את הנתונים שלך ב-Google Sheets

מתאם יכול להיות נושא מאתגר אם לא עבדת איתו הרבה בתיכון. מדריך זה כיסה את כל היסודות, אך תצטרך להמשיך להשתמש בפונקציית CORREL ב-Google Sheets כדי לשמור על רעננות בראש.

זוהי פונקציה רבת עוצמה מכיוון שהיא עוזרת להימנע מבניית גרפי פיזור ויכולה למצוא במהירות מגמות בנתונים שלך. ובכל זאת, אל תפחד להוסיף תרשימים כדי לעזור למשתמשים אחרים להבין טוב יותר את הנתונים בגיליונות האלקטרוניים שלך.