הבנת הכמויות: הגדרות ושימושים

סטטיסטיקות סיכום כמו החציון, הרבעון הראשון והרביעייה השלישית הן מדידות מיקום. הסיבה לכך היא שמספרים אלה מציינים היכן שוכן חלק מוגדר של חלוקת הנתונים. למשל החציון הוא המיקום האמצעי של הנתונים הנחקרים. למחצית מהנתונים יש ערכים פחות מהחציון. באופן דומה, ל- 25% מהנתונים יש ערכים הנמוכים מהרבעון הראשון ו- 75% מהנתונים ערכים הנמוכים מהרבעון השלישי.

ניתן להכליל מושג זה. אחת הדרכים לעשות זאת היא לקחת בחשבון אחוזונים. האחוזון ה -90 מציין את הנקודה בה 90% אחוז מהנתונים הם בעלי ערכים הנמוכים ממספר זה. באופן כללי יותר, עהאחוזון הוא המספר n לאיזה ע% מהנתונים פחות מ- n.

משתנים אקראיים רציפים

אם כי בדרך כלל מוצגים סטטיסטיקות הסדר של חציון, רביעייה ראשונה ורביעית שלישית הגדרה עם סט נתונים נפרד, ניתן להגדיר סטטיסטיקות אלה גם לאקראי רציף משתנה. מכיוון שאנו עובדים עם תפוצה רציפה אנו משתמשים באינטגרל. ה עהאחוזון ה 'הוא מספר n כך ש:

-₶nו ( איקס ) dx = ע/100.

כאן ו ( איקס ) היא פונקצית צפיפות הסתברות. כך אנו יכולים להשיג כל אחוזון שאנו רוצים עבורו רציף הפצה.

כמויות

הכללה נוספת היא לציין כי סטטיסטיקת ההזמנות שלנו מפצלת את התפוצה שאנו עובדים איתה. החציון מפצל את מערך הנתונים לחצי, והחציון, או האחוזון 50th של התפלגות רציפה, מפצל את ההתפלגות לחצי מבחינת שטח. הרביעון הראשון,

instagram viewer
חציון והרבעון השלישי מחלק את הנתונים שלנו לארבעה חלקים עם ספירה זהה בכל אחד מהם. אנו יכולים להשתמש באינטגרל שלעיל כדי להשיג את האחוזון ה -25, ה -50 וה -75, ולפצל חלוקה רציפה לארבע חלקים של שטח שווה.

אנו יכולים להכליל הליך זה. השאלה בה אנו יכולים להתחיל ניתנת במספר טבעי n, כיצד ניתן לפצל את חלוקת המשתנה לתוכו n חתיכות בגודל שווה? זה מדבר ישירות לרעיון הכמויות.

ה n כמויות עבור מערך נתונים נמצאות בערך על ידי דירוג הנתונים בסדר ואז חלוקת דירוג זה n - 1 נקודות במרווחים שווים על המרווח.

אם יש לנו פונקציית צפיפות הסתברות למשתנה אקראי רציף, אנו משתמשים באינטגרל שלעיל כדי למצוא את הכמויות. ל n כמויות, אנו רוצים:

  • הראשון שיש לו 1 /n של שטח החלוקה משמאל לו.
  • השני שיש 2 /n של שטח החלוקה משמאל לו.
  • ה rיש לי r/n של שטח החלוקה משמאל לו.
  • האחרון שהיה (n - 1)/n של שטח החלוקה משמאל לו.

אנו רואים זאת עבור כל מספר טבעי n, ה n הכמויות מתאימות ל 100r/nאחוזונים אלה, איפה r יכול להיות כל מספר טבעי מ- 1 עד n - 1.

כמויות נפוצות

סוגים מסוימים של קוונטים משמשים בדרך כלל מספיק כדי לקבל שמות ספציפיים. להלן רשימה של אלה:

  • הקוונטיליה 2 נקראת החציון
  • שלושת הכמויות נקראות טרנסילים
  • ארבעת הכמויות נקראות רביעיות
  • חמשת הכמויות נקראות חמישונים
  • 6 הכמויות נקראות sextiles
  • 7 הכמויות נקראות ספיגה
  • 8 הכמויות נקראות אוקטילים
  • 10 הכמויות נקראות עשירונים
  • 12 הכמויות נקראות duodeciles
  • 20 הכמויות נקראות משמרות
  • 100 הכמויות נקראות אחוזונים
  • 1000 הכמויות נקראות פרמילים

כמובן שקוונטים אחרים קיימים מעבר לאלו ברשימה שלמעלה. פעמים רבות הכמות הספציפית בה נעשה שימוש תואמת את גודל המדגם מהרציף הפצה.

שימוש בכמויות

מלבד ציון המיקום של סט נתונים, הכמויות מועילות בדרכים אחרות. נניח שיש לנו מדגם אקראי פשוט מאוכלוסייה, והתפלגות האוכלוסייה אינה ידועה. כדי לעזור לקבוע אם מודל, כגון חלוקה נורמלית או חלוקת Weibull, מתאים לאוכלוסייה שדגמנו ממנה, נוכל להסתכל על הכמויות של הנתונים שלנו והמודל.

על ידי התאמת הכמויות מהנתונים המדגמים שלנו לכמויות מהספציפית חלוקת הסתברויות, התוצאה היא אוסף נתונים מותאם. אנו מגלים את הנתונים הללו במגרש פיזור, המכונה עלילה קוונטית-קוונטית או עלילת q-q. אם המגרש המתקבל הוא ליניארי בערך, המודל מתאים היטב לנתונים שלנו.

instagram story viewer