כשמשתמשים במצלמה דיגיטלית מגלים לעיתים בצילום טעויות, עיוותים ורעשים אקראיים. כדי לתקן זאת נעזרים לעתים בשיטות הלקוחות מעולמם של הסטטיסטיקאים: ממוצע, חציון - ומסנן גאוסי, שעליו נספר הפעם.
ניקח פיקסל אחד בתוך סנסור של מצלמה, החלק שקולט את האור מהעדשה והופך אותו לערך מספרי. בזמן פעולת המצלמה נורים עליו "כדורי צבע" מכיוון העדשה, ועל הפיקסל לדווח מה ערך הצבע שנורה עליו. לעיתים יש בעיות בזיהוי, למשל עקב עיוותים, לכלוכים, או שסתם נוצר בלבול רגעי בשל "רעש אקראי", ולכן הדיווח עלול להיות שגוי. מה עושים? אם נניח שכדורים באותו צבע נורים גם לפיקסלים השכנים, נוכל לגשת ולשאול את שמונת השכנים הצמודים מה הצבע שראו, לעשות ממוצע בין תשעת הערכים ולקבל ערך ממוצע שרגיש פחות לטעויות אקראיות. כאשר עושים חישוב כזה על כל פיקסל, במצלמה או בתוכנת העריכה, אזי בסיום הפעולה שנקראת "מסנן ממצע" מתקבלת תמונה נקייה יותר מרעשים [1]. ניתן להרחיב ולהשתמש במיצוע גם בשכנים מדרגה שנייה, ולכלול בחישוב למשל את שני השכנים מימין והשניים משמאל וכדומה. בשיטה זו, עבור כל פיקסל, ערך היציאה של המסנן תהיה ממוצע בין 25 ערכים, הערך של הפיקסל ושל 24 שכניו.
אולם יש בעיה: כיוון שבדרך כלל הצבע בתמונה אינו אחיד, והתמונה מכילה אינפורמציה שמשתנה מאזור לאזור, חישוב הממוצע עשוי לכלול פיקסלים המייצגים גופים שונים, ועלול לפיכך למרוח את התמונה. לכן יש צורך לאזן בין הצורך בסינון רעשים לחשש מעיוותים [2]. השיטה המקובלת היא לעשות ממוצע משוקלל, ולתת משקל רב יותר בחישוב לפיקסל הנוכחי ולשכנים הקרובים לו, לעומת אלו שרחוקים, שסביר יותר שהם מייצגים בכלל עצמים אחרים. כיצד ייקבעו המשקלים? יש שיקולים שונים בהתאם להנחות על התפלגות הרעש ותוכן התמונה. השיטה המקובלת היא להשתמש במקדמי בינום [3], וההרחבה שלהם: המקדמים של ההתפלגות הגאוסית [4].
כדי להדגים את המוטיבציה למסנן כזה נראה דוגמה דמיונית של שגיאה עקב עיוותים בעדשה. נניח שהצלף שיורה כדורי צבע דרך העדשה סובל לפני כל ירייה מרעידות בידיים, נניח ארבע רעידות, וכל רעידה מסיטה את רובה הצבע שלו בחצי פיקסל ימינה או שמאלה. לתרחיש זה יש 16 התרחשויות אפשרויות (למשל: ימינה, ימינה, שמאלה, ימינה) בהסתברות שווה. יש אפשרות אחת שכל ארבע הרעידות יהיו לשמאל, הכדור יזוז במינוס חצי פיקסל ארבע פעמים ויפגע לפיכך בשכן השני משמאל, וההסתברות לכך 1/16. בדומה לכך, אותה הסתברות קיימת לפגיעה בשכן השני מימין. יש ארבע אפשרויות שבהן אחת הרעידות היא ימינה והשאר שמאלה. לכן הכדור יפגע בשכן הקרוב משמאל בהסתברות 4/16, וכך גם ההסתברות לפגיעה בשכן מימין. לבסוף, יש שש אפשרויות שיהיו שתי רעידות ימינה ושתיים שמאלה שיקזזו אחת את השנייה, והכדור יפגע במטרה, כלומר בפיקסל שלנו, בהסתברות 6/16. מי שלמד פעם הסתברות ודאי זוכר שזאת התפלגות בינומית, התפלגות המתארת את הסיכוי להצלחות בסדרת ניסויים בלתי תלויים, אבל מה לעשות עם האינפורמציה הזאת?
כיוון שכדורי הצבע שיועדו לפגוע בפיקסל מתפזרים בינו לבין ארבעת שכניו, הדרך היעילה לשערך את הצבע הנכון היא לשאול את השכנים הללו מה ערכי הצבע שהם חושבים שראו, ולעשות ממוצע משוקלל תוך הכפלת ערכי הצבעים במשקלים המתאימים בהתאם להתפלגות הבינומית: (1/16, 4/16, 6/16, 1/16,4/16). למשל, אם רק הפיקסל ראה בטעות צבע שערכו "1" והשכנים "0", הערך שנדווח עליו יהיה נמוך (6/16), והשגיאה לפיכך קטנה.
כאשר כל אחד מהפיקסלים בתמונה יעשה חישוב דומה נקבל את המימוש של פילטר הנקרא פילטר בינומי. אפשר להרחיב אותו גם לדו-ממד ולהשתמש ביותר פיקסלים שכנים. כשמספר הפיקסלים שמשתמשים בהם בפילטר גדול, משתמשים לצורך החישובים במקום במקדמי בינום במקדמי ההתפלגות הגאוסית ("ההתפלגות הנורמלית" הידועה שצורתה דמוית פעמון), שכן התפלגות זו היא קירוב להתפלגות בינומית במספר רב של דגימות. המסנן נקרא לפיכך "מסנן גאוסי" [5].
ככל שמספר הפיקסלים שמשתמשים בהם לחישוב המסנן הגאוסי הולך וגדל, כך גדלה ההשפעה של המסנן על התמונה שמתקבלת: במקום מעברים חדים בין צבעים קטֵנה הניגודיות בתמונה והיא נראית יותר מרוחה. לכן המסננים הללו משמשים גם לעידון התמונה, בנוסף לסינון הרעשים, והמסנן נקרא גם gaussian-blur. (ראו דוגמאות באפליקציה)
לפעמים משתמשים עורכי תמונות במסנן זה כדי לטשטש בכוונה את הרקע: נניח שהצטלמתם במצלמה פשוטה על רקע נוף ואתם רוצים ליצור אפקט של צילום עם עדשת SLR איכותית שמתמקדת בכם ומטשטשת את הנוף. לצורך זה תוכלו להשתמש בפוטושופ, לבחור רק את הרקע ולטשטש אותו באמצעות מסנן גאוסי. אגב, טלפונים מודרניים עושים זאת אוטומטית, במצב שנקרא "פורטרט".
שימוש חשוב יותר במסנן גאוסי נעשה בשלב הראשוני של אלגוריתמים לזיהוי צורות בתמונות [6]. בשלב זה יש צורך לזהות שפות (edges) המפרידות בין עצמים בתמונה. אולם כאשר יש רעשים ניתן לטעות ולזהות אותם כשפות, ולכן משתמשים במסנן גאוסי שמקטין את הרעשים.
ראינו מספר שימושים של מסנן גאוסי: הקטנת חלק מהרעשים שבתמונה, שיפור המראה של תמונות על ידי הקטנת ניגודיות באמצעות טשטוש מעברים, וסינון שפות שגויות בשלב הראשון של אלגוריתמים לזיהוי צורות. זוהי דוגמה נאה לשילוב בין נושא מתמטי מעולם הסטטיסטיקה לעולם ההנדסה.
עברו לאפליקציה להמחשה: http://lbscience.org/apps/gauss/
קישורים:
[1] הסבר נוסף לגבי שימוש במסננים בתמונות
[2] הסבר נוסף על עיבוד אותות דיגיטליים
[3] הסבר נוסף לגבי הבינום של ניוטון
[4] הסבר נוסף לגבי התפלגות גאוסית
[5] הסבר נוסף לגבי מסנן גאוסי וטשטוש תמונות
[6] לשים גבולות בתמונות, מתוך מדע גדול בקטנה