לעקומות בצורת האות S יש שימושים רבים. נתאר כיצד משתמשים בפונקציה הקרויה "פונקציה לוגיסטית" לצורך סיווג נתונים לשני סוגים, כדי להעריך, למשל, אם סטודנט יסיים את לימודיו בהצלחה.
זאטוט התיישב בראש המגלשה גבוהה והחל לגלוש. בהתחלה השיפוע היה מתון, אולם מהר מאוד הפך לתלול, והילד טס במהירות. בהמשך, השיפוע קטן בהדרגה, המהירות פחתה, ויכולנו לתפוס ולהניף אותו באוויר כשהוא צוהל, לפני שרגליו נגעו בקרקע.
הצורה העגלגלה של מגלשה המתחילה בשיפוע מתון, הופכת בהדרגה לתלולה, ואז חוזרת לשיפוע מתון, הזכירה לנו צורת עקומה המופיעה בשלל מצבים בחיים וביישומי מדע וטכנולוגיה. מכיוון שהיא דומה לאות S שנכתבת באלכסון, השם המקובל הוא "עקומת S" או "עקומת סיגמואיד" [1].
דוגמה לשימושיות של הפונקציה [2] היא באנימציה ממוחשבת: כדי שתנועה של מכונית על מסך המחשב תיראה אמיתית, המכונית צריכה להתחיל לנוע לאיטה, להאיץ בהדרגה ולבסוף להאט בהדרגה עד לעצירה, כל זאת בצורה שתיראה חלקה בעיני הצופה. פיתחנו מיני-אפליקציה הממחישה את אפקט התנועה באמצעות פונקציות שונות [3]. מוזמנים להתנסות.
ישנן פונקציות רבות המתארות עקומת S. אחת הפונקציות הבולטות, פונקציה לוגיסטית [4], זכתה ליישומים בשלל תחומים. נראה שתי דוגמאות לשימושיה בתחום למידת מכונה. נספר כאן כיצד משתמשים בה לצורך סיווג (קלסיפיקציה), ובפוסט עתידי נתאר כיצד משתמשים בה ב"למידה עמוקה".
נדמיין שאנו נמצאים מול בניין שיורדים ממנו שני מרזבים. אנחנו עומדים על השביל בין שני המרזבים ומבחינים שהם מטפטפים, מאחד זורמים מים נקיים, ומהאחר מה שנראה כמי ספונג'ה מלכולכים. אבוי, לפתע נחתה על ראשנו טיפה! אנחנו מגרדים בפדחת וחושבים: מה הסיכוי שהטיפה הגיעה מהמרזב עם מי הספונג'ה? זוהי בעיה של סיווג בינארי, שבה יש תשובה אחת נכונה מתוך שתיים - מים נקיים או מים דלוחים? או בדוגמה מתחום המחשבים - האם תמונה שהועלתה לרשת זוהתה כתמונה של כלב?
רוב המים המטפטפים ממרזבים נוחתים על הקרקע בקרבת המרזב, אך יש פיזור מסוים והם יכולים להתיז גם לצדדים. נניח שהתפלגות מיקום טיפה שנפלה ממרזב היא התפלגות נורמלית. התפלגות נורמלית מתארת תופעות רבות בעולם האמיתי וניתן לצייר אותה בצורת פעמון, הקרוי פעמון גאוסי. ההסתברות שטיפה תיפול במקום מסוים מיוצגת באיור כגובה עקומת הפעמון בנקודה זו. אם עמדנו ישירות מתחת למרזב, ההסתברות לפגיעה בנו מיוצגת כגובה העקומה והיא מרבית. ככל שאנו מתרחקים מהמרזב, הסיכוי לפגיעה, כלומר גובה העקומה, הולך וקטן.
בדוגמה שלנו יש שני מרזבים, ולכן נצייר שתי עקומות פעמון זו לצד זו. שימו לב כי ייתכן שאנו עומדים בכלל במקום שבו הסיכוי להיפגע מטיפה כלשהי קטן מאוד, ולכן גם גובה שתי העקומות בנקודה זו נמוך, אבל אנחנו איננו מתעניינים בהסתברות להיפגע, אלא בסיכוי שהטיפה שנחתה עלינו מקורה במי הספונג'ה. (למתמטיקאים: זו הדגמה מאוד חווייתית למושג "הסתברות מותנית"). לכן, הסיכוי שהטיפה מגיעה מהמרזב עם המים המלוכלכים הוא גובה העקומה עבור מרזב זה חלקי סכום הגבהים של שתי העקומות בנקודה זו. דהיינו, סכום ההסתברויות של שתי האפשרויות.
בהנחה שצורת ההתפלגות של שני המרזבים זהה, אם עמדנו בדיוק באמצע בין שני המרזבים, ההסתברות שהטיפה שנחתה על ראשנו היא של מי הספונג'ה היא 50 אחוז. אם עמדנו מתחת למרזב שמזרים מים נקיים ההסתברות קרובה ל-0, ואם עמדנו מתחת למרזב המפוקפק, ההסתברות קרובה ל-100 אחוז. אולם, מה קורה בתחום שביניהם? נדמיין שאנו פוסעים על השביל ביניהם פסיעה קטנה. אם אנחנו נמצאים ליד אחד משני המרזבים, אין לכך כמעט השפעה על ההסתברויות. לעומת זאת, כשאנו עומדים באמצע, כל תזוזה קלה משנה במידה רבה את ערך פונקצית ההסתברות: צעד לכיוון המרזב החשוד מגדיל את הסיכוי שטיפה שעתידה לנחות על ראשנו תהיה של מי ספונג'ה, וצעד לכיוון מרזב המים הנקיים מקטין את הסיכוי לכך.
מה שקיבלנו הוא פונקציה המתארת עקומת S בדומה לצורת המגלשה, כך שהשיפוע (בלשון מתמטית: הנגזרת) נמוך בקצוות ומרבי בנקודת האמצע, שהיא כנראה גם נקודת שיא הכיף בגלישה מהמגלשה.
חישוב פונקציית הסתברות בדוגמה שלנו כתלות במיקום מבוסס על היחס בין משתנים המתפלגים התפלגות נורמלית. אם נציב זאת במשוואות מתאימות [5, 6], נקבל את משוואת הפונקציה הלוגיסטית הידועה, שאכן נראית כמו עקומת S.
כיצד נוכל להשתמש בידע זה?
בפוסט על למידת מכונה [7], סיפרנו על מרצים שטענו כי לפי הציון בקורס שלהם, ניתן לחזות מי מהסטודנטים עתיד לנשור מהלימודים. זוהי דוגמה של סיווג בינארי, ויש מבחר שיטות שערוך. נציג כאן שיטה המשתמשת בפונקציה הלוגיסטית: נניח שגילינו שהציון הממוצע של סטודנטים, שינשרו בהמשך הדרך מהלימודים היה x=65, שאנלוגי בסיפור שלנו למיקום המרזב (x) המטפטף מי שטיפת רצפה; והציון הממוצע של הסטודנטים, שיסיימו בהמשך את התואר היה x=80, שאנלוגי למיקום המרזב שמזרים מים נקיים. אם נסתכל, למשל, על הסטודנטים שקיבלו ציונים בין 60 ל-70, נראה שיש ביניהם שיעור גבוה של נושרים. לפי האנלוגיה: רוב הסיכויים שטיפה שתנחת על ראשנו כשאנו נמצאים בתחום זה תהיה של מי הספונג'ה. הנקודות על הגרף יוצרות קירוב מסוים לעקומת S של הפונקציה הלוגיסטית. כדי למצוא את הפונקציה המתאימה ביותר לנתונים, משתמשים בשיטה בשם "רגרסיה לוגיסטית" [8]. כאשר הפונקציה המתאימה בידינו, נוכל להעריך את עתידו של סטודנט מסוים באמצעות הצבה במשוואה.
סיווג בינארי משמש בדרך כלל לקבלת החלטות, ולכן צריך לקבוע הסתברות סף, שמעליה נוקטים פעולה. למשל: אם ההסתברות שתמונת האדם המצולם בשדה התעופה תואמת לתמונת מבוקש גבוהה מ-70 אחוז - נבקש לתחקר אותו, אם הסיכוי של סטודנט לנשור הוא גבוה מ-80 אחוז - נציע לו לקבל עזרה, וכולי.
מה בדבר סיפור המרזבים שלנו? עבור איזו הסתברות סף שהטיפה שנחתה עליכם היא של מי ספונג'ה מלוכלכים, תרוצו מייד לחפוף את הראש?
עריכה: גליה הלוי שדה
עיצוב תמונה: מירי אורנשטיין, בעזרת תוכנת האינטליגנציה המלאכותית Midjourney (התמונה הופקה בהזנת מילות החיפוש: playground slide robot, 35mm photography)
-------------------------------------------------------------------------------------------------
מקורות והרחבות:
[1] עקומת סיגמואיד
[2] על אנימציה במחשב
[3] אפליקציה לתיאור תנועת מכונית באנימציה
[4] פונקציה לוגיסטית
[5] הקשר בין התפלגות נורמלית לפונקציה לוגסטית (סרטון)
[6] הקשר בין התפלגות נורמלית לפונקציה לוגסטית (אפליקציה)
[8] רגרסיה לוגיסטית