יש מגוון סטטיסטיקות תיאוריות. מספרים כמו הממוצע, חציון, מצב, שיפוט, קורטוזיס, סטיית תקן, הרבעון הראשון והרביעון השלישי, אם להזכיר כמה, כל אחד יגיד לנו משהו על הנתונים שלנו. במקום להסתכל על אלה סטטיסטיקה תיאורית באופן אינדיבידואלי, לפעמים שילוב ביניהם עוזר לתת לנו תמונה מלאה. מתוך נקודה זו, סיכום חמש המספרים הוא דרך נוחה לשלב חמש סטטיסטיקות תיאוריות.
איזה חמישה מספרים?
ברור שיהיו חמישה מספרים בסיכום שלנו, אבל אילו חמישה? המספרים שנבחרו הם כדי לעזור לנו לדעת את מרכז הנתונים שלנו, כמו גם את מידת הפיזור של נקודות הנתונים. עם זאת בחשבון, הסיכום בן חמש המספרים מורכב מהבאים:
- המינימום - זה הערך הקטן ביותר במערך הנתונים שלנו.
- הרבעון הראשון - מספר זה מסומן ש1 ו 25% מהנתונים שלנו נופלים מתחת לרבעון הראשון.
- החציון - זו נקודת אמצע הדרך של הנתונים. 50% מכל הנתונים נופלים מתחת לחציון.
- הרבעון השלישי - מספר זה מסומן ש3 ו- 75% מהנתונים שלנו נופלים מתחת לרבעון השלישי.
- המקסימום - זהו הערך הגדול ביותר במערך הנתונים שלנו.
ניתן להשתמש בינונית וסטיית התקן יחד להעברת המרכז והפצת מערך נתונים. עם זאת, שתי הסטטיסטיקות הללו רגישות למחיצות. החציון, הרביעון הראשון והרביעון השלישי אינם מושפעים מאוד מהמחשבים.
דוגמה
בהינתן מערכת הנתונים הבאה, נדווח על סיכום חמשת המספרים:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
במערך הנתונים יש בסך הכל עשרים נקודות. החציון הוא אפוא הממוצע של ערכי הנתונים העשיריים והאחד-עשר או:
(7 + 8)/2 = 7.5.
החציון של המחצית התחתונה של הנתונים הוא הרבעון הראשון. המחצית התחתונה היא:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
כך אנו מחשביםש1= (4 + 6)/2 = 5.
החציון של המחצית העליונה של מערך הנתונים המקורי הוא הרבעון השלישי. עלינו למצוא את החציון של:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
כך אנו מחשביםש3= (15 + 15)/2 = 15.
אנו מרכיבים את כל התוצאות לעיל יחד ומדווחים כי סיכום המספר של חמשת הנתונים עבור מערך הנתונים לעיל הוא 1, 5, 7.5, 12, 20.
ייצוג גרפי
ניתן להשוות חמש סיכומי מספר זה לזה. נגלה כי לשתי מערכות עם אמצעים דומים וסטיות תקן עשויים להיות חמש סיכומי מספר שונים מאוד. כדי להשוות בקלות שני סיכומי מספר חמישה במבט מהיר, אנו יכולים להשתמש ב מגרש קופסא, או גרף קופסא ופאות.