מה החציון בסטטיסטיקה?

זו הצגת חצות של הסרט הלהיט החדש ביותר. אנשים עומדים בשורה מחוץ לתיאטרון ומחכים להיכנס. נניח שאתה מתבקש למצוא את מרכז הקו. איך היית עושה את זה?

ישנן כמה דרכים שונות בפתרון בעיה זו. בסוף תצטרכו להבין כמה אנשים היו בתור ואז לקחת מחצית מהמספר הזה. אם המספר הכולל שווה, מרכז הקו יהיה בין שני אנשים. אם המספר הכולל הוא מוזר, המרכז יהיה אדם יחיד.

אתם עשויים לשאול, "מה הקשר למציאת מרכז הקו נתונים סטטיסטיים? "רעיון זה של מציאת המרכז הוא בדיוק מה שמשתמשים בו בעת חישוב החציון של קבוצת נתונים.

מה החציון?

החציון הוא אחת משלוש הדרכים העיקריות למצוא את הממוצע של מידע סטטיסטי. קשה יותר לחשב מהמצב, אך לא אינטנסיבי עבודה כמו חישוב הממוצע. זה המרכז בדיוק באותו אופן כמו למצוא את מרכז קו האנשים. לאחר רישום ערכי הנתונים בסדר עולה, החציון הוא ערך הנתונים עם אותו מספר ערכי נתונים מעליו ומתחתיו.

מקרה ראשון: מספר ערכים מוזר

11 סוללות נבדקות כדי לבדוק כמה זמן הן מחזיקות מעמד. תקופות החיים שלהם, בשעות, ניתנות על ידי 10, 99, 100, 103, 103, 105, 110, 111, 115, 130, 131. מה אורך החיים החציוני? מכיוון שיש מספר אי-ערכי של נתונים, הדבר תואם קו עם מספר אי-זוגי של אנשים. המרכז יהיה הערך האמצעי.

instagram viewer

ישנם אחד עשר ערכי נתונים, כך שהשישי נמצא במרכז. לכן חיי הסוללה החציוניים הם הערך השישי ברשימה זו, או 105 שעות. שים לב שהחציון הוא אחד מערכי הנתונים.

מקרה שני: מספר אחיד של ערכים

עשרים חתולים נשקלים. משקולותיהם, בקילוגרמים, ניתנים על ידי 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 8, 8, 9, 10, 10, 10, 11, 12, 12, 13. מה המשקל החציוני של החתול? מכיוון שיש מספר שווה של ערכי נתונים, הדבר תואם את השורה עם מספר שווה של אנשים. המרכז הוא בין שני הערכים האמצעיים.

במקרה זה המרכז הוא בין ערכי הנתונים העשיריים והאחד-עשר. כדי למצוא את החציון אנו מחשבים את הממוצע של שני ערכים אלה, ומקבלים (7 + 8) / 2 = 7.5. כאן החציון אינו אחד מערכי הנתונים.

מקרים אחרים?

שתי האפשרויות היחידות הן לקבל מספר אחיד או אי זוגי של ערכי נתונים. כך ששתי הדוגמאות לעיל הן הדרכים האפשריות היחידות לחישוב חציון. החציון יהיה הערך האמצעי, או שהחציון יהיה הערך האמצעי הממוצע של השניים ערכי אמצע. בדרך כלל מערכי נתונים גדולים בהרבה מאלו שעייננו בהם לעיל, אך תהליך מציאת החציון זהה לשתי הדוגמאות הללו.

השפעת המוצאים

הממוצע והמצב רגישים מאוד למחשבים. משמעות הדבר היא כי נוכחותו של מקורב ישפיע באופן דרמטי על שני האמצעים הללו של המרכז. אחד היתרונות של החציון הוא שהוא לא מושפע ככל האפשר על ידי גורם אחר.

כדי לראות זאת, שקול את מערך הנתונים 3, 4, 5, 5, 6. הממוצע הוא (3 + 4 + 5 + 5 + 6) / 5 = 4.6, והחציון הוא 5. כעת שמור על אותה מערך נתונים, אך הוסף את הערך 100: 3, 4, 5, 5, 6, 100. ברור ש- 100 הוא חלון גדול יותר, מכיוון שהוא גדול בהרבה מכל הערכים האחרים. הממוצע של הסט החדש הוא עכשיו (3 + 4 + 5 + 5 + 6 + 100) / 6 = 20.5. אולם, ה החציון של הסט החדש הוא 5. למרות ש

יישום המדיון

בגלל מה שראינו לעיל, החציון הוא המדד המועדף על הממוצע כאשר הנתונים מכילים מחזורים. כאשר מדווחים הכנסות, גישה אופיינית היא לדווח על ההכנסה החציונית. זה נעשה מכיוון שההכנסה הממוצעת מוטה על ידי מספר קטן של אנשים עם הכנסות גבוהות מאוד (חשבו ביל גייטס ו אופרה).