"למה דווקא האוטובוס שלי מתעכב?" "למה דווקא הטיסה שלי תמיד מלאה?" "למה לאחרים יש יותר חברים בפייסבוק?" אלו מחשבות שרבים מאיתנו נתקלו בהן. האם אלו רק קיטורים, או שמא יש ממש בתחושות אלו?
מאת דורון אורנשטיין, מתמחה בצוות מטעם קורס "התנסות בתקשורת המדע" של הטכניון
כדי לנסות לענות על שאלת האוטובוס, נבחן מקרה רגיל למדי: נניח כי אנו מגיעים בזמן אקראי לתחנה בה עובר אוטובוס בערך כל 10 דקות ועוצר בה לדקה. ההיגיון אומר כי זמן ההמתנה הוא בין 0 ל-9 דקות, ולכן בממוצע נחכה 4.5 דקות. בכל זאת, נדמה שזמן ההמתנה הוא לרוב ארוך יותר. אם נבדוק את המצב לאורך זמן, יסתבר שהממוצע הוא יותר מ- 4.5 דקות. מה משמעות הדבר? האם היקום נגדנו? התשובה לשאלה זו היא דרמטית פחות מהצפוי, וניתנת להסבר בעזרת תופעה מתמטית הנקראת "פרדוקס הצופה" [1] (Inspection Paradox). פרדוקס הצופה מופיע בתחומים שונים בחיים, ולמרות חוסר האינטואיטיביות שלו, מוסבר באמצעות כלים מתמטיים פשוטים שנלמדים בתיכון.
כדי להבין את התופעה, נניח כי נוסעים מגיעים לתחנה בכל דקה עגולה במשך 20 דקות (נסמן את הזמנים במספרים מ-0 עד 19). כאמור, האוטובוסים מגיעים בדיוק בזמנים 0, 10, 20. כתוצאה מכך, הנוסעים שמגיעים בדקה ה-0 או בדקה ה-10 לא יצטרכו לחכות. נוסעים שמגיעים בדקה ה-1 או ה-11 יצטרכו לחכות 9 דקות, נוסעים שמגיעים בזמן 9 או 19 יחכו דקה וכו'. קל לבדוק שסכום זמני ההמתנה הוא 90 וזמן ההמתנה הממוצע הוא 90/20= 4.5. לכן, נראה שלא טעינו והממוצע הוא אכן 4.5 דקות. אז מהיכן מגיע הפרדוקס?
בניגוד לבעיות מתמטיות אידאליות, החיים הם מורכבים ובמציאות האוטובוסים לא מגיעים "על הדקה". אז מה קורה כשהאוטובוסים מקדימים או מאחרים? נניח שהאוטובוס שאמור להגיע בדקה ה-10 מאחר ב-4 דקות ומגיע בדקה ה-14. חלק מהנוסעים (אלו שהגיעו בין 11 ל-14) יהיו מרוצים. לעומתם, נוסעים שהגיעו מוקדם יותר יהיו מרוצים הרבה פחות. חישוב פשוט יראה שזמן ההמתנה הממוצע עלה ל -5.3 דקות. מה יקרה אם האוטובוס של הדקה ה-10 יקדים ב-4 דקות ויגיע לאחר 6 דקות בלבד? שוב, חלק מהנוסעים יהיו מרוצים. היתר יהיו פחות מרוצים וזמן ההמתנה הממוצע יעלה שוב ל-5.3 דקות (ציור להמחשה בתגובות).
אז מה בעצם התרחש כאן? אי הדיוק בהגעת האוטובוסים יצר קטעי זמן קצרים שבהם זמן ההמתנה מתקצר ולעומתם קטעי זמן ארוכים, שבהם זמן ההמתנה דווקא מתארך. הקטעים הארוכים הם המשמעותיים יותר (כי הם ארוכים יותר) ולכן ויש סיכוי גדול להיות דווקא בתוכם. תופעה זו, הנקראת "דגימת יתר" [2] (over-sampling) היא נפוצה מאוד, אף שאנו לא תמיד מודעים לה (לקריאה נוספת [3] [4]).
כדוגמה שנייה, נבחן אדם שטס לעתים תכופות, ושם לב שבמקרים רבים הטיסות כמעט מלאות. הוא מתקשר לחברת התעופה להתלונן ונענה כי טיסות החברה הן חצי ריקות. אז מי בעצם צודק?
נניח שהחברה מפעילה 22 טיסות יומיות, באחת יש נוסע בודד ואילו השנייה מלאה. בממוצע, הטיסות הן אכן חצי ריקות. אולם, אם נערוך מדגם בקרב נוסעי החברה, נגיע למסקנה שהטיסות מלאות. זו למעשה דוגמה קיצונית של דגימת יתר.
דגימת יתר היא דוגמה מצוינת לכך שמתמטיקה יכולה להסביר אירועים שמרגישים לנו כאילו הם סותרים את השכל הישר, וכי לעתים ניתן להסביר אירועים מורכבים דווקא בכלים מתמטיים פשוטים.
מאת דורון אורנשטיין, מתמחה בצוות מטעם קורס "התנסות בתקשורת המדע" של הטכניון
כדי לנסות לענות על שאלת האוטובוס, נבחן מקרה רגיל למדי: נניח כי אנו מגיעים בזמן אקראי לתחנה בה עובר אוטובוס בערך כל 10 דקות ועוצר בה לדקה. ההיגיון אומר כי זמן ההמתנה הוא בין 0 ל-9 דקות, ולכן בממוצע נחכה 4.5 דקות. בכל זאת, נדמה שזמן ההמתנה הוא לרוב ארוך יותר. אם נבדוק את המצב לאורך זמן, יסתבר שהממוצע הוא יותר מ- 4.5 דקות. מה משמעות הדבר? האם היקום נגדנו? התשובה לשאלה זו היא דרמטית פחות מהצפוי, וניתנת להסבר בעזרת תופעה מתמטית הנקראת "פרדוקס הצופה" [1] (Inspection Paradox). פרדוקס הצופה מופיע בתחומים שונים בחיים, ולמרות חוסר האינטואיטיביות שלו, מוסבר באמצעות כלים מתמטיים פשוטים שנלמדים בתיכון.
כדי להבין את התופעה, נניח כי נוסעים מגיעים לתחנה בכל דקה עגולה במשך 20 דקות (נסמן את הזמנים במספרים מ-0 עד 19). כאמור, האוטובוסים מגיעים בדיוק בזמנים 0, 10, 20. כתוצאה מכך, הנוסעים שמגיעים בדקה ה-0 או בדקה ה-10 לא יצטרכו לחכות. נוסעים שמגיעים בדקה ה-1 או ה-11 יצטרכו לחכות 9 דקות, נוסעים שמגיעים בזמן 9 או 19 יחכו דקה וכו'. קל לבדוק שסכום זמני ההמתנה הוא 90 וזמן ההמתנה הממוצע הוא 90/20= 4.5. לכן, נראה שלא טעינו והממוצע הוא אכן 4.5 דקות. אז מהיכן מגיע הפרדוקס?
בניגוד לבעיות מתמטיות אידאליות, החיים הם מורכבים ובמציאות האוטובוסים לא מגיעים "על הדקה". אז מה קורה כשהאוטובוסים מקדימים או מאחרים? נניח שהאוטובוס שאמור להגיע בדקה ה-10 מאחר ב-4 דקות ומגיע בדקה ה-14. חלק מהנוסעים (אלו שהגיעו בין 11 ל-14) יהיו מרוצים. לעומתם, נוסעים שהגיעו מוקדם יותר יהיו מרוצים הרבה פחות. חישוב פשוט יראה שזמן ההמתנה הממוצע עלה ל -5.3 דקות. מה יקרה אם האוטובוס של הדקה ה-10 יקדים ב-4 דקות ויגיע לאחר 6 דקות בלבד? שוב, חלק מהנוסעים יהיו מרוצים. היתר יהיו פחות מרוצים וזמן ההמתנה הממוצע יעלה שוב ל-5.3 דקות (ציור להמחשה בתגובות).
אז מה בעצם התרחש כאן? אי הדיוק בהגעת האוטובוסים יצר קטעי זמן קצרים שבהם זמן ההמתנה מתקצר ולעומתם קטעי זמן ארוכים, שבהם זמן ההמתנה דווקא מתארך. הקטעים הארוכים הם המשמעותיים יותר (כי הם ארוכים יותר) ולכן ויש סיכוי גדול להיות דווקא בתוכם. תופעה זו, הנקראת "דגימת יתר" [2] (over-sampling) היא נפוצה מאוד, אף שאנו לא תמיד מודעים לה (לקריאה נוספת [3] [4]).
כדוגמה שנייה, נבחן אדם שטס לעתים תכופות, ושם לב שבמקרים רבים הטיסות כמעט מלאות. הוא מתקשר לחברת התעופה להתלונן ונענה כי טיסות החברה הן חצי ריקות. אז מי בעצם צודק?
נניח שהחברה מפעילה 22 טיסות יומיות, באחת יש נוסע בודד ואילו השנייה מלאה. בממוצע, הטיסות הן אכן חצי ריקות. אולם, אם נערוך מדגם בקרב נוסעי החברה, נגיע למסקנה שהטיסות מלאות. זו למעשה דוגמה קיצונית של דגימת יתר.
דגימת יתר היא דוגמה מצוינת לכך שמתמטיקה יכולה להסביר אירועים שמרגישים לנו כאילו הם סותרים את השכל הישר, וכי לעתים ניתן להסביר אירועים מורכבים דווקא בכלים מתמטיים פשוטים.