"גבירותיי ורבותיי, מהפך" הכריז השדרן המיתולוגי חיים יבין על ניצחון מפלגת הליכוד על מערך מפלגות השמאל עם סיום יום הבחירות לכנסת התשיעית, 1977. אם עוצרים רגע לחשוב על זה, בעצם, כיצד בכלל ידע יבין על המהפך מיד עם סיום יום הבוחר? הרי לא יתכן שקולותיהם של מיליוני בוחרים נספרו בדקות ספורות, נכון? ובכן, התשובה שאולי תפתיע אתכם היא שהיה מדובר בניחוש. ניחוש מושכל שנעשה בשום שכל, אולי, אבל בסך הכל ניחוש. לאחרונה החלו סקרים טרם הבחירות וגם הניחוש הזה, המכונה "מדגם", לנפק תוצאות לא כל כך מדויקות ולהביך בשידור חי את כל מהדורות החדשות. למה זה קורה? בחזרה אליך, יונית.
כדי לחזות את תוצאות הבחירות לפני ספירת קולות האמת, מוצבת בקלפיות מסוימות תיבת הצבעה נוספת אליה הבוחר משלשל (חח) מעטפה זהה לזו ששלשל (חח) לתיבת הצבעת קול האמת. בסוף יום הבוחר נספרים הקולות שנאספו בתיבות הסקר, אותם קל בהרבה לספור, ותוצאותיו מוצגות לעיני כל באמצעי התקשורת. ההנחה הבסיסית ביותר במדגם היא שהבוחר או הבוחרת לא ישקרו; כלומר, לא ישימו פתק אחד בקלפי המדגם ופתק שני בקלפי האמת. הנחה נוספת היא, ובכן - שזה עובד. כלומר, שאם נדגום מספר קטן של קלפיות נוכל להסיק מסקנות לגבי האוכלוסייה הכללית. אבל איך אנחנו יודעים זאת?
בסקר סטטיסטי מנסים לחזות כיצד תתנהג קבוצה מסוימת על ידי בחינת ההתנהגות של חלק ממנה שנבחר באופן אקראי. למשל, במאמר שפורסם לאחרונה נמצא שמכתשים על הירח הופכים שטוחים יותר קרוב לקוטב הדרומי [1]. האם במחקר נבדק כל מכתש ומכתש? לא. החוקרים בחרו מדגם של מכתשים ומדדו את העומק הממוצע שלהם כדי להסיק מסקנות על התנהגות כל המכתשים על הירח. דוגמה נוספת היא האופן בו בודקים שבבים אלקטרוניים בפס ייצור. כמובן שאין אפשרות לערוך בדיקות מקיפות לכל שבב ושבב; במקום, דוגמים עובדי המפעל אוכלוסיה מייצגת מתוך אוכלוסיית השבבים המיוצרת כדי לקבל מושג על אחוז השבבים המקולקלים.
להצלחתן של שיטות אלו יש בסיס הגיוני; אם למשל תיקחו קבוצה של מאה תלמידים ותחשבו את הציון הממוצע של 99 מתוכם, תקבלו תשובה קרובה מאוד לציון הממוצע של כל המאה - כי כמה כבר יכול לשנות את הממוצע ציון של תלמיד אחד, נמוך או גבוה ככל שיהיה. משפט זה יהיה כנראה נכון גם אם תקחו מדגם של 95 או 90 תלמידים - אבל כנראה שהשיטה תפסיק לעבוד תדגמו רק תלמיד אחד. כלומר, גודל המדגם משפיע מאוד על יכולת החיזוי שלנו של הציון הממוצע. מעבר לבסיס ההגיוני, ממחישה דוגמה זו חוק יסודי בתורת ההסתברות שנקרא "משפט הגבול המרכזי" [2]. לפי משפט זה, סדרת הממוצעים של משתנים שנבחרו באקראי תיטה להתפלג נורמלית. כלומר, אם נבחר באקראי קבוצה של, למשל, עשרה תלמידים מתוך המאה ונחשב את הממוצע שלה, ואז נבחר קבוצה אחרת ונחשב את הממוצע שלה ונחזור על הפעולה פעמים רבות, סדרת הממוצעים הזו תתפלג נורמלית. אוקיי, אז איך זה עוזר לנו? ובכן, כדי להעריך עד כמה רחוק ממוצע המדגם מהממוצע של כלל התלמידים, משתמשים במדד שנקרא "מרווח השגיאה" [3]. מדד זה של שגיאה יחסית מתבסס על סטיית התקן - שהוא, במילים פשוטות, הערכה למרחק הממוצע של כל הדגימות מממוצע הדגימות. עבור התפלגות נורמלית הוא תלוי באחד חלקי שורש מספר המדידות. כלומר, ככל שמשתמשים במדגם גדול יותר, כך קטנה השגיאה היחסית: עבור מאה דגימות השגיאה תהיה עשרה אחוזים (שורש המספר 100 הוא 10) ועבור מיליון דגימות, השגיאה תהיה 0.1 אחוזים בלבד (שורש המספר מיליון הוא אלף).
בבחירות לכנסת אין כל כך משמעות לממוצע, אבל כן יש משמעות להתפלגות ההצבעות; כלומר, כמות המצביעים למפלגה מסויימת לעומת מפלגה אחרת. מסתבר שגם כאן, באופן דומה לדוגמה עם התלמידים, באה המתמטיקה לעזרתנו בשלל שיטות חישוביות המאפשרות לנחש את ההתפלגות הכוללת של האוכלוסייה מתוך ההתפלגות של חלק ממנה [4]. בעריכת סקרי בחירות, מעבר לגודל המדגם, יש לשים לב להטיות סטטיסטיות שכן דעה פוליטית יכולה להיות מושפעת מגיל, מקום מגורים. אמונה דתית ועוד.
בחירת המדגם, אפוא, היא קריטית להצלחת הסקר; על המדגם להיות גדול (אך לא גדול מדי, שכן אז לא חסכנו עבודה) ואקראי, כדי שהוא ישקף נאמנה את כלל אוכלוסיית ישראל. לדוגמה, בעיה מוכרת אחת שמתרחשת דווקא לפני יום הבוחר היא שסקרים טלפוניים אינם יעילים עבור קבוצות אוכלוסיה מסוימות שכן הן נוטות לעשות שימוש פחות בטלפון ביחס לקבוצות אחרות. כדי לתקן הטיה זו משתמשים הסוקרים בידע מוקדם; למשל, אחוז בעלי הטלפונים בקבוצה לעומת שאר האוכלוסייה ומשקללים את חלקה במדגם בהתאם. לדוגמה, אם ידוע שרק חצי מאוכלוסיית הג'ינג'ים בישראל הם בעלי טלפון וג'ינג'ים נוטים יותר להצביע למפלגת "החשיש הלאומי - ביטחון בשבילי", יש לתת משקל גבוה יותר לקולם של ג'ינג'ים שנדגמו במהלך סקר טלפוני לעומת שאר האוכלוסיה כדי לסקור את המפלגה בה הם נוטים לבחור באופן מדויק יותר. בקלפיות מדגם יש הטיות אחרות בנות-תיקון הקשורות למיקום הקלפי או למזג האוויר שלעיתים מונע מאנשים להצביע.
ובכל זאת - זה לא תמיד עובד. מדוע? ובכן, כמו שכבר אמרנו - סטטיסטיקה היא ניחוש; ניחוש מושכל, אולי, אבל עדיין ניחוש. בכל סקר סטטיסטי יש מרווח טעות. בבחירות בישראל יש גורמים רבים שמקשים על חיזוי התוצאות, ביניהם אחוז החסימה. למשל, הבחירות האחרונות לא הגיעו להכרעה סופית מאחר ומפלגת "הימין החדש" חסרה כ-1,500 קולות על מנת לעבור את אחוז החסימה. 1,500 קולות הן כ-0.02 אחוזים מאוכלוסיית ישראל. כלומר, גם אם ניקח מדגם גדול במיוחד של 50,000 איש ואישה, תנודה של עשרה אנשים (0.02 אחוזים) מתוך המדגם לכאן או לכאן יכולה להשפיע דרמטית על התוצאות. אם זה לא מספיק, בבחירות האחרונות אף התפארו חברי מפלגה מסויימת בכך ששיקרו בקלפיות המדגם כדי להביך את מגישי החדשות בכוונה תחילה. נראה שעם סקרים ומדגמים, כמו עם פוליטיקאים, חשוב לדבוק בכלל אחד בלבד: כבדהו וחשדהו.
מקורות:
[3] מרווח השגיאה
[4] על שיטות סטטיסטיות לחישוב התפלגויות