בעזרת חישוב סטטיסטי פשוט נדגים כי מספרים עשויים להטעות אם אין אנו בקיאים מספיק במתמטיקה שמאחוריהם.
בשבועות האחרונים מתפשט בישראל זן דלתא של וירוס הקורונה. בניגוד לווריאנטים קודמים, נראה כי וריאנט זה מדביק בשיעור לא מבוטל גם מחוסנים (אף כי נראה שמחלתם קלה מזו של לא-מחוסנים). מה המשמעות של תחלואה זו? האם הפך החיסון לחסר ערך?
כפי שננסה להדגים, חשוב לשים לב לדקויות החישוב כדי להבין מהי משמעות המספרים. נדון בחישובים המתמטיים, לא בחיסונים עצמם.
תחילה נחלק את האוכלוסייה לשתי קבוצות, המחוסנים והלא-מחוסנים, ונניח שלכל האנשים בקבוצה מסוימת יש אותו סיכוי להידבק – סיכויים שווים לכל המחוסנים וסיכויים שווים לכל הלא-מחוסנים. נשים לב כי במציאות יש שתי הסתברויות שונות: ההסתברות להיחשף וההסתברות להידבק בהינתן חשיפה. לשם הפשטות נתעלם מההסתברות לחשיפה, ונתמקד בהסתברות להידבק.
ניקח כמקרה בוחן טענה שהופיעה באחד העיתונים [1], ולפיה 40% מהנדבקים הם מחוסנים. לצורך החישוב נניח שמדובר ב-50%, וננסה להסיק מכך מהי יעילות החיסון.
בשלב הראשון נניח שגודל שתי הקבוצות זהה, מאה איש בכל קבוצה. נניח שיש 60 חולים: 30 חולים מחוסנים ו-30 שאינם מחוסנים. המשמעות היא שנדבקו 30% מהמחוסנים (30 מתוך 100) ו-30% מבין הלא-מחוסנים. החישוב שלנו מראה כי יעילות החיסון היא אפסית.
נתבונן כעת בדוגמה שונה מעט, שבה כל המספרים זהים, אבל הפעם יש 1000 מחוסנים (במקום 100), ומספר הלא-מחוסנים הוא 100, כבדוגמה הקודמת. עתה מראים החישובים ששיעור הנדבקים מבין המחוסנים הוא 3% בלבד, ומבין הלא-מחוסנים נדבקו 30%, כמו קודם. יעילות החיסון גבוהה מאוד כנראה.
ראינו אם כן שתי דוגמאות שונות, שבשתיהן 50% מהחולים הם מחוסנים, אך באחת מצאנו כי יעילות החיסון נמוכה, ואילו בשנייה היא גבוהה מאוד.
אז איך מחשבים את יעילות החיסון?
אנחנו צריכים לקשר בין מה שאנחנו יודעים לבין מה שלא ידוע לנו. משפט מתמטי חשוב בשם חוק בייס [2] נותן לנו דרך פשוטה (יחסית) לעשות זאת.
חוק בייס משתמש בכך שהסיכוי להתרחשות אירוע א׳ וגם אירוע ב׳ שווה לסיכוי להתרחשות אירוע ב׳ וגם אירוע א׳. מהמשפט נובע כי הסיכוי שאירוע א׳ יקרה בהינתן שאירוע ב׳ קרה, שווה לסיכוי שאירוע ב׳ יקרה בהינתן שאירוע א׳ קרה. למשפט יש כמה תוצאות מעניינות, שהזכרנו בעבר [3]. נשים לב שהנחות המשפט פשוטות מאוד, מה שמאפשר להשתמש בו במקרים רבים.
נחזור לחיסונים. מה שמעניין אותנו הוא יעילות החיסון, כלומר אנו מבקשים לדעת מהו הסיכוי של נדבק פוטנציאלי לחלות בהינתן שהוא מחוסן. ניתן לרשום במקרה זה את חוק בייס כך:
(להיות מחוסן אם האדם נדבק)p * (להיות מחוסן)p = (להידבק אם האדם מחוסן)p * (להידבק)p
ההסתברות להידבק היא מספר החולים חלקי גודל האוכלוסייה במדגם, כלומר 50/1100 או 0.05.
ההסתברות לכך שאדם שנדבק הוא מחוסן היא 0.5, שכן 50% מהחולים הם מחוסנים.
לבסוף, הסיכוי לכך שאדם הוא מחוסן שווה לאחוז המחוסנים באוכלוסייה הזו, שהוא 1000 מתוך 1100, או 0.909.
כל שנותר הוא להציב בנוסחה שרשמנו ולקבל כי הסיכוי של אדם להידבק אם הוא מחוסן הוא 0.0909. במילים אחרות, יעילות החיסון היא 0.9091=1-0.0909, 91% בערך.
בעזרת חישוב די פשוט הראינו כי נתונים חלקיים עלולים להיות מטעים מאוד, וכי חשוב לשים לב לפרטים כדי להבין את התמונה המלאה. הנתון של 50% מחוסנים מבין החולים יכול ללמד על הרבה דברים שונים, והוא חסר משמעות ללא שאר הנתונים.
מקור הבלבול הוא בכך שאותנו מעניינת ההסתברות של אדם להידבק אם הוא מחוסן, מה שקרוי ההסתברות האפריורית – שלפני המעשה (כלומר אנחנו רוצים לנבא את העתיד ולדעת מה יהיה הסיכוי להידבק), ואילו הנתון המוצג לנו הוא ההסתברות להיותנו מחוסנים אם כבר נדבקנו – ההסתברות האפוסטריורית, שלאחר מעשה.
לבסוף, נציין כי החלוקה למחוסנים ולא-מחוסנים היא קירוב פשטני, שכן החיסון אינו יעיל באותה מידה עבור כל האוכלוסייה מחד גיסא, ומאידך גיסא הסיכוי להידבק כנראה אינו זהה עבור כל הלא-מחוסנים. קירוב מדויק יותר היה מניח כי ישנן שתי התפלגויות המתארות את הסיכוי להידבק, אחת עבור מחוסנים והשנייה עבור לא-מחוסנים, והיה לוקח בחשבון גם את ההסתברות להיחשף לנגיף, לא רק את ההסתברות להידבק. עם זאת, לצורך ההסבר הקירוב הפשטני הוא מספיק. ניתן לראות דרך שונה מעט להגיע לתוצאות דומות בקישור [4].
תודה לתומר מלכוב על יצירת הסרטון.
עריכה: סמדר רבן
מקורות והרחבות:
[1] על שיעור המחוסנים מבין החולים
[2] על חוק בייס
[4] חישוב שונה מעט המגיע לתוצאה דומה לזו שהצגנו