בתוך נתונים סטטיסטיים, ישנם מונחים רבים שיש להם הבחנות עדינות ביניהם. דוגמא אחת לכך היא ההבדל בין תדירות ותדירות יחסית. למרות שיש שימושים רבים בתדרים יחסית, יש אחד במיוחד שכרוך בהיסטוגרמה יחסית של תדרים. זהו סוג של גרף שיש לו קשרים לנושאים אחרים בסטטיסטיקה וסטטיסטיקה מתמטית.
הגדרה
היסטוגרמות הן גרפים סטטיסטיים שנראים כמו גרפי עמודות. אולם בדרך כלל המונח היסטוגרמה שמור ל כמותי משתנים. הציר האופקי של היסטוגרמה הוא שורת מספרים המכילה שיעורים או פחים באורך אחיד. פחים אלה הם מרווחים של קו מספר שבו הנתונים יכולים ליפול ויכולים להיות מורכבים ממספר יחיד (בדרך כלל עבור בדידים מערכי נתונים שהם יחסית קטנים) או טווח ערכים (עבור מערכי נתונים נפרדים גדולים יותר רציף נתונים).
לדוגמה, אנו עשויים להיות מעוניינים לשקול את חלוקת הציונים בחידון של 50 נקודות עבור כיתת סטודנטים. אחת הדרכים האפשריות לבנות את הפחים תהיה להיות פח שונה לכל 10 נקודות.
הציר האנכי של היסטוגרמה מייצג את הספירה או התדר שנקבע ערך נתונים בכל אחד מהפחים. ככל שהסרגל גבוה יותר כך ערכי נתונים נופלים לטווח זה של ערכי סל. כדי לחזור לדוגמה שלנו, אם יש לנו חמישה סטודנטים שקלעו יותר מ- 40 נקודות בחידון, הרף המתאים לסל 40-50 יהיה גובה חמש יחידות.
השוואה בין תדירות היסטוגרמה
היסטוגרמת תדרים יחסית היא שינוי מינורי של היסטוגרמת תדרים טיפוסית. במקום להשתמש בציר אנכי לספירת ערכי נתונים שנפלים לפח נתון, אנו משתמשים בציר זה כדי לייצג את החלק הכולל של ערכי נתונים שנפלים לפח זה. מכיוון 100% = 1, כל הסורגים חייבים להיות בגובה 0 ל -1. יתר על כן, גובה כל הסורגים בהיסטוגרמת התדרים היחסית שלנו חייב להסתכם ב -1.
אם כך, בדוגמה המוצלחת עליה בדקנו, נניח שיש בכיתה 25 תלמידים וחמישה קלעו יותר מ- 40 נקודות. במקום לבנות סרגל בגובה חמש לפח זה, יהיה לנו סרגל בגובה 5/25 = 0.2.
בהשוואת היסטוגרמה להיסטוגרמה בתדירות יחסית, כל אחד עם אותם פחים, נבחין במשהו. הצורה הכללית של ההיסטוגרמות תהיה זהה. היסטוגרמת תדרים יחסית אינה מדגישה את הספירות הכוללות בכל סל. במקום זאת, גרף מסוג זה מתמקד באופן שבו מספר ערכי הנתונים בפח מתייחס לשאר הפחים. הדרך בה היא מראה קשר זה היא באחוזים מכלל ערכי הנתונים.
פונקציות מסת מסתברות
אנו עשויים לתהות מה הטעם בהגדרת היסטוגרמת תדרים יחסית. יישום מפתח אחד נוגע למשתנים אקראיים נפרדים שבהם הפחים שלנו הם ברוחב אחד והם מרוכזים סביב כל מספר שלם לא שלילי. במקרה זה, אנו יכולים להגדיר פונקציה פיסתית עם ערכים התואמים לגבהים האנכיים של הסורגים בהיסטוגרמת התדרים היחסית שלנו.
סוג זה של פונקציה נקרא פונקציה מסת מסתית. הסיבה לבניית הפונקציה בצורה זו היא שלעיקול שמוגדר על ידי הפונקציה יש קשר ישיר אליו הסתברות. האזור שמתחת לעיקול מהערכים א ל ב היא ההסתברות שיש למשתנה האקראי ערך מ א ל ב.
הקשר בין ההסתברות לאזור שמתחת לעיקול הוא זה שמופיע שוב ושוב בסטטיסטיקה המתמטית. שימוש בפונקציה מסת מסתית כדי לדגמן היסטוגרמת תדרים יחסית היא חיבור נוסף כזה.