בסטטיסטיקה, נתונים כמותיים הם מספריים ונרכשים באמצעות ספירה או מדידה וניגוד נתונים איכותיים קבוצות, המתארות תכונות של אובייקטים אך אינן מכילות מספרים. ישנן מגוון דרכים בהן נתונים כמותיים עולים בסטטיסטיקה. כל אחד מהדברים הבאים הוא דוגמא לנתונים כמותיים:
- הגבהים של שחקנים בקבוצת כדורגל
- מספר המכוניות בכל שורה של מגרש חניה
- אחוז כיתת התלמידים בכיתה
- ערכים של בתים בשכונה
- אורך חיי אצווה של רכיב אלקטרוני מסוים.
- זמן ההמתנה בתור לקונים בסופרמרקט.
- מספר השנים בבית הספר ליחידים במקום מסוים.
- משקל הביצים שנלקחו מלול ביום מסוים בשבוע.
בנוסף, ניתן לחלק ולנתח נתונים כמותיים בהתאם לרמת המדידה המעורבת כולל מדידות נומינליות, סדירות, מרווח ויחס של מדידה, בין אם מערכי הנתונים הם רציפים או לא בדידים.
רמות מדידה
בסטטיסטיקה ישנם מגוון דרכים בהן ניתן למדוד ולחשב כמויות או תכונות של אובייקטים, וכולן כוללות מספרים במערכות נתונים כמותיות. מערכי נתונים אלה אינם כוללים תמיד מספרים שניתן לחשב, אשר נקבע על ידי כל מערכי הנתונים. רמת המדידה:
- נומינלי: אין להתייחס לערכים מספריים ברמת המדידה הנומינלית כאל משתנה כמותי. דוגמה לכך יכולה להיות מספר הג'רזי או מספר תעודת זהות של התלמיד. לא הגיוני לבצע שום חישוב על סוגים אלה של מספרים.
- רגיל: ניתן להזמין נתונים כמותיים ברמת המדידה, אולם ההבדלים בין הערכים הם חסרי משמעות. דוגמה לנתונים ברמת מדידה זו היא כל סוג של דירוג.
- מרווח: ניתן להזמין נתונים ברמת המרווח וניתן לחשב באופן משמעותי את ההבדלים. עם זאת, נתונים ברמה זו חסרים בדרך כלל נקודת התחלה. יתר על כן, יחסים בין ערכי נתונים הם חסרי משמעות. לדוגמה, 90 מעלות פרנהייט אינה חמה פי שלוש מכפי שהיא 30 מעלות.
- יחס: לא ניתן להזמין ולהפחית נתונים ברמת היחס, אלא גם לחלק אותם. הסיבה לכך היא שלנתונים אלה יש ערך אפס או נקודת התחלה. לדוגמה, בסולם הטמפרטורות של קלווין יש א אפס מוחלט.
קביעה לאילו מרמות מדידה אלה מערך נתונים נופל תועיל לסטטיסטיקאים קבע אם הנתונים מועילים לערוך חישובים או התבוננות במערכת נתונים עומד.
דיסקרטי ורציף
דרך נוספת בה ניתן לסווג נתונים כמותיים היא האם מערכי הנתונים הם בדידים או רציפה - לכל אחד מהמונחים הללו יש תחומי משנה שלמים של מתמטיקה המוקדשים ללימודם; חשוב להבדיל בין נתונים דיסקרטיים לרציפים מכיוון שמשתמשים בטכניקות שונות.
ערכת נתונים נפרדת אם ניתן להפריד בין הערכים זה לזה. הדוגמה העיקרית לכך היא הסט של מספרים טבעיים. אין מצב שערך יכול להיות שבריר או בין כל המספרים השלמים. סט זה באופן טבעי מאוד מתעורר כאשר אנו סופרים חפצים שימושיים רק כאשר הם שלמים כמו כסאות או ספרים.
נתונים רציפים נוצרים כאשר אנשים המיוצגים במערך הנתונים יכולים לקחת על עצמם כל אחד מהם מספר ממשי במגוון ערכים. לדוגמה, ניתן לדווח על משקולות לא רק בקילוגרמים, אלא גם בגרמים, ובמיליגרם, מיקרוגרם וכן הלאה. הנתונים שלנו מוגבלים רק על ידי דיוק מכשירי המדידה שלנו.