סטטיסטיקה היא נושא עם מספר התפלגויות הסתברות ונוסחאות. מבחינה היסטורית רבים מהחישובים שעסקו בנוסחאות אלה היו מייגעים למדי. טבלאות ערכים נוצרו עבור כמה מההפצות הנפוצות יותר ורוב ספרי הלימוד עדיין מדפיסים קטעים מטבלאות אלה בנספחים. למרות שחשוב להבין את המסגרת הרעיונית שעובדת מאחורי הקלעים עבור טבלת ערכים מסוימת, תוצאות מהירות ומדויקות דורשות שימוש בתוכנה סטטיסטית.
יש מספר חבילות תוכנה סטטיסטיות. אחד המשמש בדרך כלל לחישובים במבוא הוא Microsoft Excel. הפצות רבות מתוכנות ל- Excel. אחד מאלה הוא חלוקת הצ'י-ריבוע. ישנן מספר פונקציות Excel שמשתמשות בהפצה chi-square.
פרטי צ'י-ריבוע
לפני שנראה מה Excel יכול לעשות, בואו להזכיר לעצמנו כמה פרטים הנוגעים להתפלגות הצ'י-ריבוע. זוהי חלוקת הסתברות שהיא א-סימטרית ומאוד גבוהה מוטה לימין. הערכים להפצה הם תמיד לא שליליים. יש למעשה מספר אינסופי של התפלגויות צ'י ריבועיות. זה במיוחד בו אנו מעוניינים נקבע על ידי מספר ה- דרגות חופש שיש לנו ביישום שלנו. ככל שמספר דרגות החופש גדול יותר, כך תפוצת הצ'י-ריבועית פחות תפויה.
שימוש בכיכר צ'י
א חלוקת צ'י-ריבוע משמש למספר יישומים. אלו כוללים:
- מבחן צ'י-ריבוע - כדי לקבוע אם הרמות של שני משתנים קטגוריים אינם תלויים זה בזה.
- מבחן כושר טוב- כדי לקבוע עד כמה ערכים נצפים של משתנה קטגורי יחיד תואמים לערכים הצפויים על ידי מודל תיאורטי.
- ניסוי רב-לאומי—זהו שימוש ספציפי במבחן צ'י-מרובע.
כל היישומים הללו מחייבים אותנו להשתמש בהפצה צ'י-מרובעת. תוכנה הכרחית לחישובים הנוגעים להפצה זו.
CHISQ.DIST ו- CHISQ.DIST.RT באקסל
ישנן מספר פונקציות ב- Excel בהן אנו יכולים להשתמש כאשר אנו מתמודדים עם חלוקת צ'י-ריבוע. הראשון שבהם הוא CHISQ.DIST (). פונקציה זו מחזירה את ההסתברות השמאלית לפיזור הריבוע הצ'י המצוין. הטענה הראשונה של הפונקציה היא הערך הנצפה של נתון הצ'י-ריבוע. הטיעון השני הוא מספר ה- דרגות חופש. הטיעון השלישי משמש להשגת חלוקה מצטברת.
קשור באופן הדוק ל- CHISQ.DIST הוא CHISQ.DIST.RT (). פונקציה זו מחזירה את ההסתברות הימנית של התפוצה שנבחרה בריבוע צ'י. הטיעון הראשון הוא הערך הנצפה של הנתון הצ'י-ריבועי, והטיעון השני הוא מספר דרגות החופש.
לדוגמה, הזנת = CHISQ.DIST (3, 4, true) לתא תפוק 0.442175. משמעות הדבר היא כי עבור חלוקת הצ'י-ריבוע עם ארבע דרגות חופש, 44.2175% מהשטח מתחת לעיקול נמצא משמאל ל -3. הזנת = CHISQ.DIST.RT (3, 4) לתא תפוק 0.557825. משמעות הדבר היא כי עבור חלוקת הצ'י-ריבוע עם ארבע דרגות חופש, 55.7825% מהשטח מתחת לעיקול נמצא מימין ל -3.
עבור כל ערכים של טיעונים, CHISQ.DIST.RT (x, r) = 1 - CHISQ.DIST (x, r, true). הסיבה לכך היא שחלק החלוקה אינו שוכן משמאל לערך איקס חייב לשקר לימין.
CHISQ.INV
לפעמים אנו מתחילים עם שטח להתפלגות צ'י-ריבועית מסוימת. אנו רוצים לדעת איזה ערך של נתון היינו זקוקים בכדי שיהיה אזור זה משמאל או מימין לנתון. מדובר בבעיה צ'י-ריבועית הפוכה והיא מועילה כאשר אנו רוצים לדעת את הערך הקריטי לרמת משמעות מסוימת. Excel מטפל בבעיות מסוג זה באמצעות פונקציה הפוכה של צ'י ריבוע.
הפונקציה CHISQ.INV מחזירה את ההיפוך של ההסתברות הזנב השמאלי לפיזור צ'י-מרובע עם דרגות חופש מוגדרות. הטענה הראשונה של פונקציה זו היא ההסתברות משמאל לערך הלא ידוע. הטענה השנייה היא מספר דרגות החופש.
כך, למשל, הזנת = CHISQ.INV (0.442175, 4) לתא תתן תפוקה של 3. שימו לב איך זה ההיפוך של החישוב שבדקנו קודם בנוגע לפונקציה CHISQ.DIST. באופן כללי, אם ע = CHISQ.DIST (איקס, r), לאחר מכן איקס = CHISQ.INV ( ע, r).
קשר הדוק לכך הוא פונקציית CHISQ.INV.RT. זהה ל- CHISQ.INV, למעט שהוא עוסק בהסתברויות עם זנב ימני. פונקציה זו מועילה במיוחד בקביעת הערך הקריטי למבחן צ'י-ריבוע נתון. כל שעלינו לעשות הוא להיכנס לרמת המשמעות כהסתברות הזנב שלנו, ולמספר דרגות החופש.
Excel 2007 ומוקדם יותר
גרסאות קודמות של Excel משתמשות בפונקציות שונות במקצת כדי לעבוד עם צ'י-ריבוע. לגירסאות קודמות של Excel הייתה רק פונקציה לחישוב ישיר של הסתברויות עם זנב ימני. כך CHIDIST תואם את CHISQ.DIST.RT החדש יותר, באופן דומה CHIINV תואם ל- CHI.INV.RT.