תארו לכם שנתקלתם במחקר שמגיע למסקנה לא אפשרית, כגון "המגורים בפתח תקווה גורמים לתחושת אושר", האם זה יכול להיות נכון? ואיך זה קשור לשחקן כדורגל אנגלי שהרג מעל עשרים מפורסמים?
בוודאי נתקלתם לא פעם בכותרות מוזרות באתרי אינטרנט מובילים כגון "מחקר: הגן היהודי מונע אלכוהוליזם" וחשבתם לעצמכם "איזו מסקנה מוזרה, היא לא נראית סבירה" [1]. בהמשך למאמר שלנו על הטיות [2], יש מקרים בהם מחקר מתבצע כהלכה אך עדיין מציג תוצאות מוטעות. יכולות להיות לכך סיבות רבות, בפוסט זה נתמקד באחת מהן שנובעת מהסקת מסקנות שגויה מהמתאם (קורלציה).
נדגים זאת בעזרת מחקר שהשערתו "אכילת וופל לימון גורמת לתחושת אושר אצל אנשים" [3]. אנו מבצעים את המחקר ומוצאים שאכן אוכלי וופל לימון מאושרים יותר, כלומר שיש קשר בין אכילת הוופל לתחושת אושר, דבר שאנו יודעים שמנוגד להיגיון . כיצד זה יכול לקרות? הסיבה היא פרשנות שגויה של המתאם
מתאם הוא הקשר הסטטיסטי בין שני משתנים, והוא יכול להיות חיובי או שלילי. לעיתים מתרחשים שינויים הנראים קשורים למשתנה שמדדנו אבל הם למעשה נגרמים על ידי משתנה אחר לגמרי. המחקר "לא יעלה על זה" מכיוון שהוא מראה לנו את הקשר בלבד, ולא בודק למעשה מהי הסיבה לקשר הזה. גם אם המחקר מבוצע בצורה תקינה על פי כל ההנחיות: בחירת מדגם מייצג, הקפדה על סמיות כפולה, אקראיות וכו'. כאשר נבצע השוואה בין שני המשתנים הכמותיים שאת ערכיהם קיבלנו במדגם, אכן נמצא מתאם ולכן נסיק שמשתנה אחד משפיע על משתנה שני. אם נחזור לדוגמא של מחקר הוופל, אכן נגלה שתחושת האושר גדלה ככל שאנשים אוכלים יותר וופל לימון ולכן נניח שזה נגרם בעקבות הטעם הלימוני הנפלא של הוופל, אבל יכול להיות שהגורם לאושר הוא בגלל משתנה אחר לגמרי שלא נמדד בניסוי או בגלל היפוך של סיבה ותוצאה.
שגיאה זו עלולה לנבוע מהתעלמות ממשתנה משמעותי. נדגים בעזרת מחקר מעניין שנעשה בעבר שהראה מתאם חיובי בין השארת אור דלוק במשך הלילה לקוצר ראייה. מסקנת המחקר הייתה שעוצמת התאורה של הסביבה בלילה משפיעה על ראיית הילדים, כלומר "ילדים שישנו עם אור נטו להרכיב משקפיים" [4]. לאחר כמה שנים נערך מחקר דומה בשינוי אחד: החוקרים הכניסו משתנה נוסף "האם אחד מההורים חובשים משקפיים". תוצאות המחקר הראו מתאם בין הורים בעלי משקפיים לילדים עם משקפיים, כלומר הסיבה לא קשורה לתאורה בלילה אלא כנראה קשורה לגנטיקה, יתכן שבגלל שההורים ראו פחות טוב הם השאירו אור דלוק בלילה. כלומר, נוסף כאן משתנה גנטי שלא נבדק כלל במחקר הראשון.
אפשרות נוספת הוא שאכן ישנו מתאם, אבל ישנה החלפה של סיבה ותוצאה. לדוגמה, מחקר דמיוני שמניח כי אנשים הסובלים מדיכאון נוהגים להתגורר בעיר פתח תקווה. אך כמו שכולם יודעים, אנשים הגרים בפתח יסבלו מדיכאון בגלל המגורים בעיר ולא להיפך.
מקור נוסף לשגיאה הוא מציאת קשר בין משתנים אבל לא סיבתיות, או בשפה פשוטה: "אל תבלבל אותי עם העובדות", שאותו נדגים בעזרת המקרה הידוע בתור "קללת ארון ראמזי" #ramseycurse. קללת ארון ראמזי אומרת כי בכל פעם ששחקן הכדורגל הוולשי ארון ראמזי מבקיע גול במשחק כדורגל, מישהו מפורסם מת לאחר זמן קצר [5]. במרץ 2019, כיומיים לאחר שראמזי הבקיע גול במשחק, מתו כוכב הסדרה בוורלי הילס 90210 לוק פרי וסולן להקת פרודיג'י קיט' פלינט. כמובן שאין קשר אמיתי בין ביצועי השחקן למקרי המוות, אבל תמיד יהיה מי שיתאמץ וימצא קשר מאולץ.
לסיכום, מומלץ להפעיל חשיבה ביקורתית בגישתנו אל מחקרים המציגים מתאמים ללא הוכחת סיבתיות, בייחוד אם יש התייחסות חיובית למגורים בפתח תקווה ולצריכת וופלימון. אנחנו מזמינים אתכם לבזבז כמה שעות מהחיים ולהיכנס לאתר משעשע שמרכז גרפים שונים עם מתאמים בדויים, כמו המתאם ההפוך בין כמות הפיראטים להתחממות גלובלית, הקשר בין סרטים בכיכובו של ניקולס קייג לכמות אנשים שטבעו בבריכות באותה שנה ועוד [6].
מקורות
-
כותרת של מחקר מטופש בטמקא - Ynet
-
בין ופל לימון ואילומינטי
-
פוסט וופל לימון
-
מחקר משקפיים
-
הקללה של ארון ראמזי
-
אתר המרכז מתאמים מטופשים