יחידה 10: רגרסיה וניבוי לינארי >> 10.3: תופעת התכווצות המתאם |
||||||
תופעת התכווצות המתאם (Adjusted R2)
תזכורת: למה שווה המתאם בין y ל-y', ? y’ הוא טרנספורמציה לינארית של x ולכן במקום y' ניתן לכתוב x:
כאשר מיישמים מודל רגרסיה שנבנה על מדגם אחד במדגם אחר, סך הטעויות אשר נקבל יהיו בהכרח יותר גדולות מאשר הטעויות שהיינו מקבלים אילו היינו בונים מודל למדגם השני. זאת מאחר שהקו שמצאנו עונה על קריטריון מינימום הריבועים עבור המדגם הראשון אך לא עבור השני. אילו היינו בונים קו עבור המדגם השני ,היינו בונים קו אחר. כאשר מיישמים את הנוסחא עבור מדגם אחר, ממוצע הטעויות לא יהיה שווה לאפס. |
||||||
|
||||||
מכיוון שהמתאם קטן, תופעה זו מכונה התכווצות המתאם. אנו מעוניינים לאמוד את מידת ההתכווצות. תופעת ההתכווצות היא פונקציה של n. ככל ש-n גדל כך התופעה קטנה. לא ניתן למנוע את התופעה אך ניתן להעריך את גודלה על ידי: 1. תיקוף מצליב – חלוקת המדגם לשניים, וחישוב קו הרגרסיה על חצי מהנבדקים. יישום הקו על החצי השני, ובדיקה אמפירית של מידת ההתכווצות. 2. אומדן סטטיסטי – קיימת נוסחא לחישוב ה- |
||||||
השפעתם של ערכים קיצוניים (outliers) על המתאם
|
||||||
המתאם נובע מתצפית אחת קיצונית שאם נוריד אותה נגלה שאין מתאם. |
||||||
מתאם "מזויף" (spurious)
|
||||||
משתנה ממתן
|
||||||
עבודה ב-EXCEL
|
||||||
|