אין באמת כלל לכמה שיעורים צריך להיות. ישנם כמה דברים שצריך לקחת בחשבון לגבי מספר השיעורים. אם הייתה רק כיתה אחת, כל הנתונים היו נופלים בכיתה זו. ההיסטוגרמה שלנו תהיה פשוט מלבן יחיד שגובהו ניתן על ידי מספר האלמנטים בקבוצת הנתונים שלנו. זה לא יעזור מאוד או היסטוגרמה שימושית.
בקצה השני, יכולנו להיות המון שיעורים. זה יביא להרבה סורגים, שאף אחד מהם כנראה לא יהיה גבוה מאוד. יהיה קשה מאוד לקבוע מאפייני הבחנה כלשהם מהנתונים באמצעות היסטוגרמה מסוג זה.
כדי להגן על שני הקצוות הללו יש לנו כלל אצבע בו אנו משתמשים כדי לקבוע את מספר הכיתות עבור היסטוגרמה. כשיש לנו קבוצה קטנה יחסית של נתונים, אנו משתמשים בדרך כלל בסביבות חמש כיתות. אם מערך הנתונים גדול יחסית, אנו משתמשים בערך 20 שיעורים.
שוב, נדגיש כי זהו כלל אצבע ולא עיקרון סטטיסטי מוחלט. יכולות להיות סיבות טובות למספר נתונים שונה של שיעורים. נראה דוגמא לכך להלן.
לפני שנבחן כמה דוגמאות, נראה כיצד ניתן לקבוע מהן המעמדות בפועל. אנו מתחילים בתהליך זה במציאת טווח מהנתונים שלנו. במילים אחרות, אנו מחסירים את ערך הנתונים הנמוך ביותר מערך הנתונים הגבוה ביותר.
כאשר מערך הנתונים קטן יחסית, אנו מחלקים את הטווח בחמישה. המנה היא רוחב המחלקות להיסטוגרמה שלנו. ככל הנראה נצטרך לבצע קצת עיגול בתהליך זה, מה שאומר שמספר הכיתות הכולל עשוי שלא להגיע לחמישה.
כאשר מערך הנתונים גדול יחסית, אנו מחלקים את הטווח ב 20. בדיוק כמו קודם, בעיית החלוקה הזו נותנת לנו את רוחב המחלקות להיסטוגרמה שלנו. כמו כן, כפי שראינו בעבר, העיגול שלנו עשוי לגרום למעט יותר או מעט פחות מ 20 שיעורים.
בשני המקרים של מערך הנתונים הגדול או הקטן, אנו גורמים למחלקה הראשונה להתחיל בנקודה מעט פחות מערך הנתונים הקטן ביותר. עלינו לעשות זאת באופן שערך הנתונים הראשון ייפול למחלקה הראשונה. מחלקות עוקבות אחרות נקבעות לפי הרוחב שנקבע כאשר חילקנו את הטווח. אנו יודעים שאנחנו במחלקה האחרונה כאשר ערך הנתונים הגבוה ביותר שלנו מכיל כיתה זו.
לדוגמא נקבע רוחב מחלקות מתאים ומעמדות עבור מערך הנתונים: 1.1, 1.9, 2.3, 3.0, 3.2, 4.1, 4.2, 4.4, 5.5, 5.5, 5.6, 5.7, 5.9, 6.2, 7.1, 7.9, 8.3, 9.0, 9.2, 11.1, 11.2, 14.4, 15.5, 15.5, 16.7, 18.9, 19.2.
אנו רואים שיש בקבוצה 27 נקודות נתונים. זהו סט קטן יחסית וכך נחלק את הטווח בחמש. הטווח הוא 19.2 - 1.1 = 18.1. אנו מחלקים 18.1 / 5 = 3.62. משמעות הדבר היא שרוחב כיתה של 4 יהיה מתאים. ערך הנתונים הקטן ביותר שלנו הוא 1.1, אז אנחנו מתחילים את המחלקה הראשונה בנקודה פחות מזו. מכיוון שהנתונים שלנו מורכבים ממספרים חיוביים, יהיה זה הגיוני לגרום לשיעור הראשון לעבור מ- 0 ל- 4.
לדוגמה אחת לכך, נניח שיש מבחן רב-ברירה עם 35 שאלות עליו, ו -1,000 תלמידים בבית ספר תיכון ניגשים למבחן. אנו מעוניינים ליצור היסטוגרמה המציגה את מספר התלמידים שהגיעו לציונים מסוימים במבחן. אנו רואים כי 35/5 = 7 וכי 35/20 = 1.75. למרות שלטון האצבע שלנו נותן לנו את הבחירות של שיעורים ברוחב 2 או 7 להשתמש בהיסטוגרמה שלנו, עדיף שיהיו שיעורים ברוחב 1. שיעורים אלו יתאימו לכל שאלה שתלמיד ענה נכון במבחן. הראשון מהם יתרכז ב -0 והאחרון יהיה במרכז 35.