תחום הסטטיסטיקה מחולק לשתי חטיבות עיקריות: תיאורי והרגש. כל אחד מהפלחים הללו חשוב, ומציע טכניקות שונות שמשיגות יעדים שונים. סטטיסטיקות תיאוריות מתארות את המתרחש בסעיף א אוכלוסייה או מערך נתונים. לעומת זאת, סטטיסטיקות הסברה מאפשרות למדענים לקחת ממצאים מקבוצת מדגמים ולהכליל אותם לאוכלוסייה גדולה יותר. לשני סוגי הנתונים הסטטיסטיים ישנם כמה הבדלים חשובים.
סטטיסטיקה תיאורית
סטטיסטיקה תיאורית היא סוג הסטטיסטיקות שכנראה מתעוררת בראשם של רוב האנשים כאשר הם שומעים את המילה "סטטיסטיקה". בענף הסטטיסטיקות הזה המטרה היא לתאר. אמצעים מספריים משמשים כדי לספר על תכונות של סט נתונים. ישנם מספר פריטים ששייכים לחלק זה של נתונים סטטיסטיים, כגון:
- ה ממוצע, או מדד של מרכז מערך נתונים, המורכב מממוצע, חציון, מצב או בינוני
- התפשטות של מערך נתונים, שניתן למדוד בעזרת ה- טווח או סטיית תקן
- תיאורים כלליים של נתונים כגון סיכום חמישה מספרים
- מדידות כמו שיפוט ו קורטוזיס
- חקר מערכות יחסים ו מתאם בין נתונים מקושרים
- הצגת תוצאות סטטיסטיות בשנת 2007 גרפי טופס
מדדים אלה חשובים ושימושיים מכיוון שהם מאפשרים למדענים לראות דפוסים בין נתונים, וכך להבין מהם הנתונים. ניתן להשתמש בסטטיסטיקה תיאורית רק לתיאור האוכלוסייה או הנתונים שנקבעו במחקר: לא ניתן להכליל את התוצאות לקבוצה או אוכלוסייה אחרת.
סוגי סטטיסטיקה תיאורית
ישנם שני סוגים של נתונים סטטיסטיים תיאוריים בהם מדענים חברתיים משתמשים:
מדדים של נטייה מרכזית ללכוד מגמות כלליות בתוך הנתונים ומחושבות ובאות לידי ביטוי כממוצע, חציון ומצב. ממוצע אומר למדענים את הממוצע המתמטי של כל מערך הנתונים, כמו הגיל הממוצע בנישואין ראשונים; החציון מייצג את אמצע חלוקת הנתונים, כמו הגיל שיושב באמצע טווח הגילאים בו אנשים מתחתנים לראשונה; וייתכן שהמצב הוא הגיל השכיח ביותר בו אנשים מתחתנים לראשונה.
מדדי התפשטות מתארים כיצד הנתונים מופצים ומתייחסים זה לזה, כולל:
- הטווח, כל טווח הערכים הקיים במערך נתונים
- התפלגות התדרים, המגדירה כמה פעמים מתרחש ערך מסוים בתוך מערך נתונים
- רביעיות, תת קבוצות הנוצרות בתוך מערך נתונים כאשר כל הערכים מחולקים לארבעה חלקים שווים על פני הטווח
- פירושו סטייה מוחלטת, הממוצע לכמות שכל סטייה חורגת מהממוצע
- שונות, שממחיש עד כמה התפשטות קיימת בנתונים
- סטיית תקן, המדגימה את התפשטות הנתונים ביחס לממוצע
מדידות התפשטות מיוצגות לרוב באופן חזותי בטבלאות, בתרשימי עוגה וברשימה, ובהיסטוגרמות כדי לעזור להבנת המגמות בתוך הנתונים.
סטטיסטיקה היסקית
סטטיסטיקות הסקה מופקות באמצעות חישובים מתמטיים מורכבים המאפשרים למדענים להסיק מגמות לגבי אוכלוסייה גדולה יותר על סמך מחקר של מדגם שנלקח ממנה. מדענים משתמשים בסטטיסטיקות הסקה כדי לבחון את הקשר בין משתנים בתוך מדגם ואז ערכו הכללות או תחזיות לגבי האופן בו המשתנים האלה יתייחסו לגדולה יותר אוכלוסייה.
בדרך כלל אי אפשר לבחון כל אחד מהאוכלוסייה בנפרד. אז מדענים בוחרים תת קבוצה מייצגת של האוכלוסייה, המכונה מדגם סטטיסטי, ומתוך ניתוח זה הם מסוגלים לומר משהו על האוכלוסייה שממנה הגיע המדגם. ישנן שתי חלוקות עיקריות של סטטיסטיקות הסבר:
- מרווח ביטחון נותן טווח ערכים לפרמטר לא ידוע של האוכלוסייה על ידי מדידת מדגם סטטיסטי. זה בא לידי ביטוי במונחים של מרווח ומידת הביטחון שהפרמטר נמצא בתוך המרווח.
- בדיקות בעלות משמעות או בדיקת השערה שם מדענים טוענים לגבי האוכלוסייה על ידי ניתוח מדגם סטטיסטי. בתכנון, קיימת אי וודאות בתהליך זה. זה יכול לבוא לידי ביטוי במונחים של רמת משמעות.
טכניקות בהן מדענים חברתיים משתמשים בכדי לבחון את היחסים בין משתנים, ובכך ליצור סטטיסטיקות הסבר, כוללות ניתוח רגרסיה לינארית, ניתוחי רגרסיה לוגיסטית, ANOVA, ניתוחי מתאם, דוגמנות משוואה מבניתוניתוח הישרדות. בעת עריכת מחקרים באמצעות סטטיסטיקות סקרניות, מדענים מבצעים בדיקת חשיבות כדי לקבוע אם הם יכולים להכליל את תוצאותיהם לאוכלוסייה גדולה יותר. בדיקות נפוצות של משמעות כוללות את צ'י-מרובע ו מבחן t. אלה מראים למדענים את ההסתברות שתוצאות ניתוחם של המדגם מייצגים את האוכלוסייה בכללותה.
תיאורי לעומת סטטיסטיקה היסקית
אף על פי שהסטטיסטיקה התיאורית מועילה בלימוד דברים כמו התפשטות ומרכז הנתונים, לא ניתן להשתמש בנתונים הסטטיסטיים התיאוריים כדי ליצור הכללות כלשהן. בסטטיסטיקה התיאורית, מדידות כמו ממוצע וסטיית תקן מוצגות כמספרים מדויקים.
אף על פי שהסטטיסטיקה ההסברתית משתמשת בכמה חישובים דומים - כגון ממוצע וסטיית תקן - המיקוד שונה לסטטיסטיקה הסקתית. סטטיסטיקות הסבר מתחילות במדגם ואז מתכללות לאוכלוסייה. מידע זה על אוכלוסייה אינו מצוין כמספר. במקום זאת, מדענים מבטאים פרמטרים אלה כמגוון של מספרים פוטנציאליים, יחד עם מידת ביטחון.