שאלות נפוצות - מבחני t לשני מדגמים |
||
1. שאלה: האם ניתן לעשות מבחן t לבלתי תלויים אם לא שתי הקבוצות מעל 30? |
||
פתרון: אם גודל לפחות אחד מהמדגמים קטן משלושים והאוכלוסיות המקוריות לא מתפלגות נורמלית, אי אפשר לעשות t לב"ת (בהמשך נלמד מבחנים א-פרמטריים שיתנו פתרון לבעיה זו). כלומר, כל אחד מהמדגמים חייב לבוא מאוכלוסייה המתפלגת נורמלית או להכיל לפחות 30 נבדקים בכדי שנוכל לבצע את המבחן. |
||
|
||
2. שאלה: האם האלפא במבחן F תהיה זהה לזו שמבקשים בשאלה, כלומר אם צריך מבחן t עם מובהקות 0.025 (חד צדדית למשל) האם הבדיקה של F תהיה גם היא על אלפא של 0.025 (רק דו צדדית, כי F תמיד דו"צ)? |
||
|
||
פתרון:
בעיקרון – כן. |
||
|
||
3. שאלה: בנוסחה של Spooled, זה S או Sn? וכשאי אפשר לעשות Spooled? ומה עם מבחן F לשיווין שונויות? Stdev או Stdevp? |
||
|
||
פתרון: כמו שכתוב, זה S (ולא Sn). כשאי אפשר לעשות Spooled משתמשים פשוט בנוסחא של Sx1-x2 מבלי להניח שוויון שונויות, כלומר מבלי לחשב Spooled, אלא תוך שימוש בשונות של כל קבוצה בנפרד. גם כאן משתמשים ב- S. החלק הבעייתי עם זה הוא מציאת דרגות החופש של המבחן, אבל כאן לפעמים אפשר לעשות את קיצור הדרך המשתמש בגבול התחתון והעליון של הערכים האפשריים לדרגות החופש. לבסוף, גם ב- F משתמשים ב- Sn-1 (ולא Sn). הסיבה שמשתמשים באומד בכל המקרים היא שאנחנו מעוניינים לאמוד את השונות המשותפת באוכלוסייה (ולא במדגם). למען האמת, אין משמעות לבדיקת שוויון שונויות בתוך המדגם כי אנחנו יכולים לחשב את השונויות בדיוק ולדעת אם הן שוות או לא. כל פעם שאנחנו אומדים שונות על פי מדגם (ולא מחשבים שונות בתוך מדגם) נשתמש באומד לשונות (n-1) ולא ב- Sn. |
||
|
||
4. שאלה: לגבי הנושא של 'df ב-t לב"ת ללא הנחת שוויון שונויות, לא כ"כ הבנתי למה ה- df בטוח גדול מ-min n-1. |
||
|
||
פתרון: 'df הוא סוג של ממוצע בין דרגות החופש של כל קבוצה. הגבול העליון ברור- זה מה שהיינו מקבלים אם היה שוויון שונויות. הגבול התחתון הוא מה שהיינו מקבלים אם היינו מתייחסים רק לקבוצה הקטנה ביותר (שדרגות החופש שלה הן n-1 כאשר n זה גודל הקבוצה הקטנה). כלומר, הדרגות חופש האמיתיות הן איפשהו בין המצב הכי גרוע (ה df הכי קטן, כלומר של הקבוצה הקטנה מבין השתיים) לבין הכי טוב (שוויון שונויות). זה כמו שהממוצע בין 2 ל- 3 בטוח יהיה קטן מ- 3 וגדול מ- 2. |
||
|
||
5. שאלה: כאשר אני מקבלת את ערך ה- p value מפקודת TDIST או FDIST האם אני משווה אותו לאלפא או חצי אלפא? |
||
|
||
פתרון: ב- TDIST נשווה לאלפא, כי הנוסחא כבר מגלמת בתוכה את מספר הזנבות וב-FDIST לחצי אלפא כי הפקודה באקסל היא חד צדדית וההשערה שלנו היא תמיד דו-צדדית. |
||
|
||
6. שאלה: מה זה שונות משותפת (Sp)? לפי מה משקללים אותה? מתי בכלל משתמשים בה? |
||
|
||
פתרון:
Sp היא למעשה שקלול של שתי השונויות- השונות של S1
והשונות של S2. השקלול נראה כנוסחא מורכבת ומעצבנת אבל אם תסתכלי טוב-
זהו ממוצע משוקלל רגיל: S1 תורם את דרגות החופש שלו, S2 תורם את שלו,
וסכומן נמצא במכנה. עלינו לכפול כל שונות בסכום דרגות החופש שהיא תרמה. |
||
|
||
7. שאלה: מישהו מבין איך מחשבים עוצמה במבחני t השונים? |
||
|
||
פתרון: באותה דרך שחישבנו עוצמה עד עכשיו, פשוט בכל מקרה משתמשים בסטטיסטים ובס"ת המתאימים. למשל, אם מחשבים עבור ממוצעי הפרשים, משתמשים ב"מיו די" וב-Sd, שכשל התהליך זהה. שאלה 2ג בשאלות לדוגמא על מבחן F מתרגלת את הנושא הזה. כמו כן, בקורס המקוון יש הסבר בנושא. |
||
|
||
8. שאלה: לא כל כך הבנתי מדוע ב- t לתלויים אנו מחשבים הפרשים ועובדים עם d ובבלתי תלויים אנו מחשבים הפרשי ממוצעים. הרי גם ב-t לתלויים במדגמים מזווגים מדובר בשתי אוכלוסיות שונות אז מדוע ההבדל? |
||
|
||
פתרון:
זה לא מדויק שבמבחן t למבחנים תלויים מדובר בשתי
אוכלוסיות שונות. יש תלות, אולי גדולה מאוד, בין התכונות של "שתי
האוכלוסיות". אם תנסה לעשות בדיקת השערות רגילה לכל אחת מהאוכלוסיות,
בדומה למבחן t לב"ת, תגלה שאחת ההנחות הבסיסיות אינה מתקיימת: אין
דגימה מקרית לכל אוכלוסייה. |
||
|
||
9. שאלה: מישהו יודע למה לפני t לבלתי תלויים תמיד עושים F דו צדדי ולא חד צדדי? |
||
|
||
פתרון: כשאנו בודקים שוויון שונויות לפני מבחן t אנו שואלים שאלה דו-צדדית ולא חד-צדדית. אנו שואלים האם השונויות שוות או שונות. |
||
|
||
10. שאלה: מה אני מפסידה אם אני עושה t לב"ת במקום t לתלויים? למשל אם הייתי צריכה לזווג ולא זיווגתי? |
||
|
||
פתרון:
אם היית צריכה לזווג - זאת אומרת אם היה לך בסיס
ממשי לזיווג ובכל זאת השתמשת בב"ת - אז הפסדת חלק מהעוצמה, כי מדגם
תלוי מקטין את השונות שבין זוגות הנבדקים (השונות הפנימית), וזה מה
שמגדיל את העוצמה במבחן תלוי מזווג. לעומת זאת, הקטנת את דרגות החופש
בכך שהשתמשת בתלוי, אולם זה פחות משמעותי ביחס להקטנת השונות. ולכן
תלוי עדיין עדיף. |
||
|