היסטוגרמה היא סוג של גרף שיש לו יישומים רחבים בסטטיסטיקה. היסטוגרמות מספקות פרשנות חזותית של נתונים מספריים על ידי ציון מספר נקודות הנתונים שנמצאות בטווח ערכים. טווחי ערכים אלה נקראים מחלקות או פחים. תדירות הנתונים הנופלים בכל כיתה מתוארת על ידי שימוש בסרגל. ככל שהסר גבוה יותר, כך התדירות של ערכי נתונים בסל ההוא עולה.
היסטוגרמות לעומת תרשימי עמודות
במבט ראשון ההיסטוגרמות נראות דומות מאוד גרפי עמודות. בשני הגרפים יש סרגלים אנכיים לייצוג נתונים. גובה סרגל תואם לגובה תדירות יחסית מכמות הנתונים בכיתה. ככל שהסר גבוה יותר, כך תדירות הנתונים גבוהה יותר. ככל שהסר נמוך יותר, כך תדירות הנתונים נמוכה יותר. אבל מבטים יכולים להונות. כאן מסתיימים קווי הדמיון בין שני סוגי הגרפים.
הסיבה שגרפים מסוג זה שונים זה מזה קשור לסימנים רמת המדידה של הנתונים. מצד אחד, תרשימי עמודות משמשים לנתונים ברמת המדידה הנומינלית. תרשימי עמודות מודדים את התדירות של נתונים קטגוריים, והכיתות עבור תרשים עמודות הן קטגוריות אלה. מצד שני, היסטוגרמות משמשות לנתונים הנמצאים לפחות ב רמה סדירה של מדידה. השיעורים להיסטוגרמה הם טווחי ערכים.
הבדל מפתח נוסף בין גרפי עמודות והיסטוגרמות קשור לסדר הסורגים. בתרשים עמודות, מקובל לארגן מחדש את הסורגים לפי סדר גובה הירידה. עם זאת, לא ניתן לסדר מחדש את הסורגים בהיסטוגרמה. הם חייבים להיות מוצגים בסדר בו מופיעים הכיתות.
דוגמה להיסטוגרמה
התרשים למעלה מראה לנו היסטוגרמה. נניח שמוטבעים ארבעה מטבעות והתוצאות נרשמות. השימוש במתאים טבלת חלוקה בינומית או חישובים ישירים עם הנוסחה הבינומית מראים את ההסתברות שאף ראשים לא מראים היא 1/16, ההסתברות שראש אחד מראה הוא 4/16. ההסתברות לשני ראשים היא 6/16. ההסתברות לשלושה ראשים היא 4/16. ההסתברות לארבעה ראשים היא 1/16.
אנו בונים סך הכל חמש שיעורים, כל אחד ברוחב אחד. שיעורים אלה תואמים למספר הראשים האפשריים: אפס, אחד, שניים, שלושה או ארבעה. מעל כל כיתה אנו מציירים מוט או מלבן אנכי. גבהי הסורגים הללו תואמים את ההסתברויות שהוזכרו בניסוי ההסתברות שלנו להעיף ארבעה מטבעות ולספור את הראשים.
היסטוגרמות והסתברויות
הדוגמה שלעיל לא רק ממחישה את הבנייה של היסטוגרמה, אלא גם מראה את זה התפלגויות הסתברות בדידות ניתן לייצג בעזרת היסטוגרמה. אכן, ואת חלוקת ההסתברות הנבדלת ניתן לייצג על ידי היסטוגרמה.
כדי לבנות היסטוגרמה המייצגת חלוקת הסתברות, נתחיל בבחירת המחלקות. אלה אמורים להיות התוצאות של ניסוי הסתברות. רוחב כל אחת מהכיתות הללו צריך להיות יחידה אחת. גובה סרגלי ההיסטוגרמה הם ההסתברות לכל אחת מהתוצאות. כאשר היסטוגרמה בנויה בצורה כזו, אזורי הסורגים הם גם הסתברויות.
מכיוון שהיסטוגרמה מסוג זה מעניקה לנו הסתברויות, הוא כפוף לכמה תנאים. תניה אחת היא שרק מספרים לא-נגטיביים יכולים לשמש לסולם המעניק לנו את הגובה של סרגל נתון של ההיסטוגרמה. תנאי שני הוא שמכיוון שההסתברות שווה לשטח, כל אזורי הסורגים חייבים להסתכם בסך הכל אחד, שווה ערך ל 100%.
היסטוגרמות ויישומים אחרים
הסורגים בהיסטוגרמה אינם צריכים להיות הסתברויות. היסטוגרמות מועילות בתחומים שאינם הסתברות. בכל עת שאנו רוצים להשוות את תדירות התרחשותם של נתונים כמותיים בהיסטוגרמה ניתן להשתמש כדי לתאר את מערך הנתונים שלנו.