זה משהו שקורה לא מעט. אנשים מאוד אוהבים להשתמש בטיעונים הנראים כאילו יש להם תוקף מחקרי או תיאורטי. זה נותן לטיעון שלהם סמכות ומשקל "בחינם", ולרוב הקוראים אין את הכלים לקבוע אם הטיעון המדעי מדוייק או מוצדק.
דוגמה מרגיזה במיוחד לתופעה הזאת היא הטור המשונה שהתפרסם בעיתון "הארץ" אתמול, ומתיימר לחשב את הסיכוי שנתניהו יזוכה בשלושת המשפטים.
בחישוב שערך, כותב הטור דורון שולצינר בדק ומצא שמתוך 33 כתבי האישום שהוגשו נגד נבחרי ציבור משנת 1978 ועד היום, רק שישה הסתיימו ללא הרשעה. לכן, קובע שולצינר, הסיכוי שלא לצאת אשם עומד על כ-0.17, ולכן הסיכוי לא לצאת אשם שלוש פעמים הוא 0.17 בשלישית, או קצת פחות מאחד למאתיים.
משכנע? לא ממש. הטיעון הקטן והלכאורה תמים הזה מכיל כשלים רציניים.
הכשל הראשון הוא הכשל האפריורי - ההנחה שבכלל הגיוני להסתכל על משפט כמו על הטלת מטבע, כאילו שכשאנחנו נכנסים למשפט ישנה איזו הסתברות מסוימת שנזכה, שאינה תלויה בנאשם או בפרטי המשפט. שולצינר מתייחס לבית המשפט כמעין מכונה שמקבלת נבחר ציבור ומחזירה "זכאי" בהסתברות של 17%. כאילו פרטי המקרה, גוף הראיות בידי כל צד, השיח הציבורי בנושא, הרכב השופטים, או ההבדלים במצבת החוק משנת 1978 ועד היום, הם כולם חסרי משמעות. יש כאן הנחות לא מוצדקות על ההסתברות ששולצינר מנסה לחשב.
הכשל השני הוא בחירה בפינצטה של הנתון שמצדיק את דעתו. האם זה נכון להסתכל על כל המשפטים של נבחרי ציבור? אולי נכון דווקא להסתכל על כל המשפטים של המואשמים בשוחד? או רק על משפטים עם הרכב שופטים דומה? או רק על משפטים עם מואשמים גברים? כל חתך יתן מספרים אחרים. אז אילו נתונים ינבאו הכי טוב את הסיכויים של נתניהו? האם הנתונים האלו קיימים בכלל? שולצינר פשוט בחר נתון אחד שנראה דרמטי והכתיר אותו בתור "הסיכוי של נתניהו לנצח". [1]
הכשל שלישי הוא הנחת הדיוק. אם נטיל מטבע הוגן מאה פעמים, רוב הסיכויים שלא בדיוק בחצי מההטלות יפול המטבע על עץ. בהחלט אפשרי שרק 46 מהפעמים נקבל עץ. ככל שנטיל את המטבע יותר פעמים, כך נקבל הערכה טובה יותר של ההסתברות שהוא ייפול על עץ, אבל עדיין יש טווח טעות. תמיד יש טווח טעות. אז גם אם נהיה מאוד נדיבים ונחליק את ההנחה שבתי משפט מתנהלים כמו הטלת מטבע, האם 33 הטלות מספיקות כדי להגיד לנו מה ההסתברות של המטבע ליפול על "אשם" בדיוק גבוה? לא יודע, וגם שולצינר לא.
הכשל האחרון, הוא כשל התלות. הקביעה שההסתברות לכך ששני מאורעות קורים הוא מכפלת ההסתברויות שלהם. זה נכון לפעמים. אם אני מטיל שני מטבעות הוגנים, אז התוצאה של ההטלה הראשונה לא משפיעה על התוצאה של ההטלה השניה בשום צורה. הסיכוי שמטבע ספציפי יצא עץ היא חצי, וההסתברות ששניהם יצאו עץ היא חצי כפול חצי שזה רבע. בשביל לראות מה שוכן בצד השני של הרצף הזה נדמיין מטבע קסם ש"זוכר" את התוצאה של ההטלה הראשונה ואז חוזר עליה. בהטלה הראשונה אכן יש סיכוי שווה לקבל עץ או פלי, ומכאן הוא פשוט יחזור על עצמו. אם נטיל את המטבע הזה פעמיים, מה הסיכוי שבשתיהן יצא עץ? ובכן, אם בראשון יצא עץ אז בוודאות גם בשני יצא עץ, ולכן ההסתברות לכך היא חצי. התוצאה של ההטלה הראשונה מכתיבה לחלוטין את התוצאה של ההטלה השניה. אנחנו יכולים גם לדמיין "מקרי ביניים" שבהם התוצאה של ההטלה הראשונה משפיעה על ההטלה השניה אבל לא קובעת אותה לחלוטין. כאשר שולצינר טוען שהוא יכול פשוט להכפיל את ההסתברויות לזכות בכל אחד מהמשפטים כדי לקבל את ההסתברות לזכות בשלושתם ביחד, הוא בעצם טוען שכל אחד מהמשפטים הנ"ל מתקיים בריק. שהתוצאה של כל משפט לא תלויה בשום צורה במשפטים האחרים, שאם נתניהו יזוכה במשפט הראשון, זה לא משנה בשום צורה את הסיכוי שלו לצאת זכאי גם במשפט השני. האם זה נכון? הרי כל העבירות עליהן נשפט נתניהו עומדות סביב סוגיות סבוכות שיש ביניהן קשר הדוק ואף בסיס ראייתי משותף. להכניס הנחה כל כך משמעותית בדלת האחורית (או יותר גרוע, להשתמש בה בלי לשים לב בכלל) זאת דרך בטוחה להגיע למסקנות אבסורדיות.
לסיכום נאמר שהסתברות, ובפרט החלה שלה על המציאות שבה קשה לקבוע אילו היבטים משפיעים על התוצאות והאם אירועים שונים הם בלתי תלויים, רצופה במכשלות אפשריות. האינטואיציה של רובנו בנויה באופן שנוח להכשיל אותנו, וכבר קרה בעבר שאנשים חפים מפשע מצאו את עצמם בכלא בגלל כשלים סטטיסטיים מהותיים שקל מאוד לפספס [2]. לכן, אנחנו מבקשים בכל לשון של בקשה, לא רק משולצינר אלא מכל מי שיש לו קהל - אם אתם מתעקשים להשתמש בטיעונים סטטיסטיים, תדאגו שאתם עושים את זה בזהירות הרצויה. או, אתם יודעים, תתייעצו עם איש מקצוע. אנחנו תמיד כאן. אחרת, בזדון או בשוגג, תטעו את הציבור.
לקריאה נוספת:
[1] - רנדל מונרו הנהדר מדגים איך לא עושים סטטיסטיקה
[2] - על הכשל הבייסיאני באתר מדע גדול, בקטנה