רגרסיה לינארית הוא כלי סטטיסטי שקובע עד כמה קו ישר מתאים לסט של נתונים מזוודים. הקו הישר המתאים ביותר לנתונים נקרא קו הרגרסיה הכי פחות ריבועים. ניתן להשתמש בשורה זו במספר דרכים. אחד השימושים הללו הוא להעריך את ערכו של משתנה תגובה לערך נתון של משתנה מסביר. קשור לרעיון זה הוא של שארית.
(1, 2), (2, 3), (3, 7), (3, 6), (4, 9), (5, 9)
לחישוב השארית בנקודות איקס = 5, אנו מחסירים את הערך החזוי מערך הנצפה. מאז y הקואורדינטה של נקודת הנתונים שלנו הייתה 9, זה נותן שאריות של 9 - 10 = -1.
ישנם מספר שימושים עבור שאריות. שימוש אחד הוא לעזור לנו לקבוע אם יש לנו מערך נתונים שיש לו מגמה לינארית כוללת, או אם עלינו לשקול מודל אחר. הסיבה לכך היא ששיירים עוזרים להגביר כל תבנית לא לינארית בנתונים שלנו. את מה שקשה לראות על ידי התבוננות במגרש פיזור ניתן לראות ביתר קלות על ידי בחינת השאריות, ועלילה שיורית מקבילה.
סיבה נוספת לשקול שאריות היא לבדוק אם מתקיימים תנאי ההסקה לרגרסיה לינארית. לאחר אימות של מגמה לינארית (על ידי בדיקת שאריות) אנו בודקים גם את התפלגות השאריות. על מנת שנוכל לבצע הסקת רגרסיה, אנו רוצים שהשאריות בקו הרגרסיה שלנו יהיו מופצות באופן רגיל. א
היסטוגרמה או סטפלוט מהשאריות יעזרו לוודא כי תנאי זה התקיים.