לא כל הנתונים נוצרים באופן שווה. כדאי לסווג מערכי נתונים לפי קריטריונים שונים. יש כאלה כמותי, ויש כאלה איכותי. כמה מערכי נתונים הם רציפים וחלקם נפרדים.
דרך נוספת להפריד נתונים היא לסווג אותם לארבע רמות מדידה: נומינליות, סדירות, מרווח ויחס. רמות מדידה שונות דורשות טכניקות סטטיסטיות שונות. אנו מסתכלים על כל אחת מרמות המדידה הללו.
רמת מדידה נומינלית
רמת המדידה הנומינלית היא הנמוכה מבין ארבע הדרכים לאפיון נתונים. פירושו של nominal הוא "בשם בלבד" וזה אמור לעזור לזכור במה מדובר ברמה זו. נתונים נומינליים עוסקים בשמות, קטגוריות או תוויות.
הנתונים ברמה הנומינלית הם איכותיים. צבעי עיניים, תגובות כן או לא על סקר, ודגני בוקר אהובים כולם עוסקים ברמת המדידה הנומינלית. אפילו כמה דברים עם מספרים המשויכים אליהם, כמו מספר בגבו של מכנסי כדורגל, הם nominal מכיוון שהוא משמש ל"שם "של שחקן בודד על המגרש.
לא ניתן להזמין נתונים ברמה זו בצורה משמעותית, ואין זה הגיוני לחשב דברים כמו אמצעים ו סטיות תקן.
רמת מדידה רגילה
הרמה הבאה נקראת רמת המדידה הרגילה. ניתן להזמין נתונים ברמה זו, אך אין לבצע הבדלים בין הנתונים המשמעותיים.
כאן כדאי לחשוב על דברים כמו רשימה של עשר הערים המובילות לחיות. הנתונים, כאן עשר ערים, מדורגים מאחד לעשר, אך ההבדלים בין הערים אינם הגיוניים במיוחד. אין דרך להסתכל רק על הדירוגים ולדעת כמה חיים טובים יותר בעיר מספר 1 מאשר בעיר מספר 2.
דוגמא נוספת לכך הן ציוני אותיות. אתה יכול להזמין דברים כך ש- A יהיה גבוה מ- B, אך ללא שום מידע אחר, אין דרך לדעת כמה A טובה יותר מ- B.
כמו עם רמה נומינלית, אין להשתמש בנתונים ברמה הסופית בחישובים.
רמת מדידת מרווח
רמת המרווח של המדידה עוסקת בנתונים שניתן להזמין, ובהם ההבדל בין הנתונים אכן הגיוני. לנתונים ברמה זו אין נקודת התחלה.
ה מאזני פרנהייט וצלזיוס טמפרטורות הן שתי דוגמאות לנתונים במתחם רמת מדידת מרווח. אתה יכול לדבר על 30 מעלות להיות 60 מעלות פחות מ 90 מעלות, כך שההבדלים אכן הגיוניים. עם זאת, 0 מעלות (בשני המאזניים) קרים ככל שיהיו אינם מייצגים את ההיעדר המוחלט של הטמפרטורה.
ניתן להשתמש בנתונים ברמת המרווח בחישובים. עם זאת, נתונים ברמה זו חסרים סוג השוואה אחד. אף על פי ש 3 x 30 = 90, לא נכון לומר ש 90 מעלות צלזיוס חם פי שלוש מ 30 מעלות צלזיוס.
רמת המדידה
רמת המדידה הרביעית והגבוהה ביותר היא רמת היחס. נתונים ברמת היחס הם בעלי כל התכונות של רמת המרווח, בנוסף לערך אפס. בשל נוכחותו של אפס, כעת הגיוני להשוות בין יחסי המדידות. ביטויים כמו "ארבע פעמים" ו"פעמיים "הם בעלי משמעות ברמת היחס.
מרחקים, בכל מערכת מדידה, מספקים לנו נתונים ברמת היחס. מדידה כמו 0 מטר אכן הגיונית, מכיוון שהיא אינה מייצגת אורך. יתרה מזאת, מטר של מטר הוא כפול ממטר. כך שניתן ליצור יחסים בין הנתונים.
ברמת המדידה, לא רק שניתן לחשב סכומים והבדלים, אלא גם יחסים. ניתן לחלק מדידה אחת על ידי כל מדידה שאינה מועילה, ותביא מספר משמעותי.
חשוב לפני שאתה מחשב
בהינתן רשימה של מספרי ביטוח לאומי, ניתן לבצע איתם כל מיני חישובים, אך אף אחד מהחישובים הללו לא נותן שום דבר משמעותי. מה מספר ביטוח לאומי אחד מחולק למספר אחר? בזבוז מוחלט של זמנך, מכיוון שמספרי הביטוח הלאומי נמצאים ברמה הממוצעת של המדידה.
כשמספקים לך נתונים, חשוב לפני אתה מחשב. רמת המדידה שאתה עובד איתה תקבע מה הגיוני לעשות.