נתונים מותאמים בסטטיסטיקה, המכונים לעתים קרובות זוגות מסודרים, מתייחסים לשני משתנים אצל אנשים באוכלוסיה המקושרים זה לזה בכדי לקבוע את המתאם ביניהם. על מנת שמערך נתונים ייחשב לנתונים מקושרים, יש לחבר את שני ערכי הנתונים האלה או לקשר זה לזה ולא להיחשב בנפרד.
הרעיון של נתונים מזווגים מנוגד לחיבור הרגיל של מספר אחד לכל נקודת נתונים כמו באחר מידע כמותי קובע כי כל נקודת נתונים פרטנית קשורה לשני מספרים, ומספקת גרף המאפשר לסטטיסטיקאים לצפות בקשר בין משתנים אלה באוכלוסייה.
שיטה זו של נתונים מזווגים משמשת כאשר מחקר מקווה להשוות בין שני משתנים אצל אנשים באוכלוסייה כדי להסיק מסקנה כלשהי לגבי המתאם שנצפה. כשמתבוננים בנקודות נתונים אלה, סדר ההתאמה הוא חשוב מכיוון שהמספר הראשון הוא מדד של דבר אחד ואילו השני הוא מדד למשהו אחר לגמרי.
דוגמה לנתונים מותאמים
כדי לראות דוגמא לנתונים מזווגים, נניח שמורה יספר את מספר משימות הבית שכל תלמיד נכנס עבור יחידה מסוימת ואז מזדווג את המספר הזה עם האחוז של כל תלמיד במבחן היחידה. הזוגות הם כדלקמן:
- אדם שסיים 10 משימות הרוויח 95% במבחן שלו. (10, 95%)
- אדם שסיים 5 מטלות הרוויח 80% במבחן שלו. (5, 80%)
- אדם שסיים 9 מטלות הרוויח 85% במבחן שלו. (9, 85%)
- אדם שסיים 2 מטלות הרוויח 50% במבחן שלו. (2, 50%)
- אדם שסיים 5 משימות הרוויח 60% במבחן שלו. (5, 60%)
- אדם שסיים 3 משימות הרוויח 70% במבחן שלו. (3, 70%)
בכל אחת מאותן קבוצות נתונים מזוודות, אנו יכולים לראות שמספר המשימות תמיד מגיע למקום הראשון זוג מסודר בעוד שהאחוז שהרוויח במבחן מגיע למקום השני, כפי שניתן לראות בערכאה הראשונה של (10, 95%).
אמנם ניתן להשתמש בניתוח סטטיסטי של נתונים אלה גם לחישוב המספר הממוצע של משימות שיעורי בית שהושלמו או ציון הבדיקה הממוצע, יתכנו שאלות נוספות עליהן ניתן לשאול הנתונים. במקרה זה המורה רוצה לדעת אם יש קשר כלשהו בין מספר שיעורי הבית נכנס והביצוע במבחן והמורה יצטרך לשמור את הנתונים בזיווג כדי לענות על כך שאלה.
ניתוח נתונים מותאמים
ה טכניקות סטטיסטיות של מתאם רגרסיה משמשים לניתוח נתונים מזווג בהם מקדם התאמה מכמת עד כמה הנתונים שוכבים לאורך קו ישר ומודדים את חוזק הקשר הקווי.
לעומת זאת, רגרסיה משמשת למספר יישומים כולל קביעת קו המתאים ביותר למערך הנתונים שלנו. לאחר מכן ניתן להשתמש בשורה זו כדי להעריך או לחזות y ערכים לערכים של איקס שלא היו חלק ממערך הנתונים המקורי שלנו.
יש סוג מיוחד של גרף שמתאים במיוחד לנתונים מזווגים הנקראים פיזור מגרש. בזה סוג הגרף, ציר קואורדינטות אחד מייצג כמות אחת של הנתונים המזווגים ואילו ציר הקואורדינטות האחר מייצג את הכמות השנייה של הנתונים המזווגים.
במגרש פיזור של הנתונים לעיל היה ציר ה- x מציין את מספר המטלות שהוגדרו בעוד ציר ה- Y יציין את הציונים במבחן היחידה.