רגרסיה לינארית היא טכניקה סטטיסטית המשמשת למידע נוסף על הקשר בין משתנה עצמאי (מנבא) לבין משתנה תלוי (קריטריון). כאשר יש לך יותר ממשתנה עצמאי אחד בניתוח שלך, זה נקרא רגרסיה לינארית מרובה. באופן כללי, רגרסיה מאפשרת לחוקר לשאול את השאלה הכללית "מהו המנבא הטוב ביותר ל ???"
לדוגמה, נניח שבחנו את הסיבות ל השמנת יתרנמדד על ידי מדד מסת גוף (BMI). בפרט, רצינו לבדוק אם המשתנים הבאים הם מנבאים משמעותיים ל- BMI של אדם: מספר המזון המהיר ארוחות שנאכלו בשבוע, מספר שעות הטלוויזיה שנצפו בשבוע, מספר הדקות שבוצעו באימונים בשבוע וההורים BMI. רגרסיה לינארית תהיה מתודולוגיה טובה לניתוח זה.
משוואת הרגרסיה
כאשר אתה מבצע ניתוח רגרסיה עם משתנה עצמאי אחד, משוואת הרגרסיה היא Y = a + b * X כאשר Y הוא המשתנה התלוי, X הוא המשתנה הבלתי תלוי, a הוא הקבוע (או היירוט) ו- b הוא ה שיפוע קו הרגרסיה. לדוגמה, נניח כי GPA ניבא בצורה הטובה ביותר על ידי משוואת הרגרסיה 1 + 0.02 * מנת משכל. אם לסטודנט היה מנת משכל של 130, אז ה- GPA שלו או שלה היה 3.6 (1 + 0.02 * 130 = 3.6).
כאשר אתה מבצע ניתוח רגרסיה בו יש לך יותר ממשתנה עצמאי אחד, משוואת הרגרסיה היא Y = a + b1 * X1 + b2 * X2 +... + bp * XP. לדוגמה, אם היינו רוצים לכלול יותר משתנים לניתוח ה- GPA שלנו, כמו מדדי מוטיבציה ומשמעת עצמית, היינו משתמשים בזה משוואה.
כיכר R
ריבוע R, הידוע גם בשם מקדם של נחישות, הוא נתון נפוץ כדי להעריך את התאמת המודל של משוואת רגרסיה. כלומר, כמה טובים כל המשתנים העצמאיים שלך בחיזוי המשתנה התלוי שלך? הערך של ריבוע R נע בין 0.0 ל 1.0 וניתן להכפיל אותו ב 100 לקבלת אחוז של שונות הסביר. לדוגמה, לחזור למשוואת הרגרסיה של ה- GPA שלנו עם משתנה עצמאי אחד בלבד (IQ)... בואו נגיד שהשלנו ריבוע R למשוואה היה 0.4. אנו יכולים לפרש זאת בכך ש- 40% מהשונות ב- GPA מוסברים על ידי מנת משכל. אם נוסיף את שני המשתנים האחרים שלנו (מוטיבציה ומשמעת עצמית) וכיכר ה- R גדלה ל 0.6, משמעות הדבר היא ש- IQ, מוטיבציה ומשמעת עצמית יחד מסבירים 60% מהשונות ב- GPA ציונים.
ניתוחי רגרסיה נעשים בדרך כלל באמצעות תוכנה סטטיסטית, כגון SPSS או SAS ולכן ריבוע ה- R מחושב עבורך.
פרשנות מקדמי הרגרסיה (ב)
מקדמי b מהמשוואות לעיל מייצגים את חוזק וכיוון הקשר בין המשתנים העצמאיים והתלויים. אם אנו מסתכלים על משוואת ה- GPA וה- IQ, 1 + 0.02 * 130 = 3.6, 0.02 הוא מקדם הרגרסיה עבור IQ המשתנה. זה אומר לנו כי כיוון הקשר הוא חיובי כך שככל שעולה מנת המשכל, גם ה- GPA גדל. אם המשוואה הייתה 1 - 0.02 * 130 = Y, פירוש הדבר שהקשר בין IQ ל- GPA היה שלילי.
הנחות
ישנן מספר הנחות לגבי הנתונים שיש לעמוד בהן כדי לבצע ניתוח רגרסיה לינארי:
- לינאריות: ההנחה היא שהקשר בין המשתנים העצמאיים והתלויים הוא לינארי. אם כי לעולם לא ניתן לאשר הנחה זו במלואה, אך מסתכלים על א גרף פיזור מהמשתנים שלך יכולים לעזור לקבוע קביעה זו. אם קיימת עקמומיות במערכת היחסים, תוכלו לשקול לשנות את המשתנים או לאפשר במפורש רכיבים לא לינאריים.
- נורמליות: ההנחה היא כי שאריות מהמשתנים שלך מופצים בדרך כלל. כלומר, השגיאות בחיזוי הערך של Y (המשתנה התלוי) מופצות באופן שמתקרב לעיקול הרגיל. אתה יכול להסתכל היסטוגרמות או עלילות הסתברות רגילה לבדיקת התפלגות המשתנים שלך וערכי השארית שלהם.
- עצמאות: ההנחה היא שהטעויות בחיזוי הערך של Y אינן תלויות זו בזו (לא מתואמות).
- הומוסקטסטיות: ההנחה היא שהשונות סביב קו הרגרסיה זהה לכל הערכים של המשתנים הבלתי תלויים.
מקור
- StatSoft: ספר לימוד לסטטיסטיקה אלקטרונית. (2011). http://www.statsoft.com/textbook/basic-statistics/#Crosstabulationb.