על הבינה המלאכותית שמזהה גידולים שיהפכו לסרטן
במחקר שהתבצע בחברת ״נובולוס״ ע"י ליאור צימרמן וצוותו, הצליחו ללמד תוכנה לזהות מוטציה העלולה להתפתח לסרטן, באמצעות תמונה.
איך זה עובד? כאשר מאתרים אצל אדם גידול החשוד כסרטני, לוקחים ממנו דגימת תאים בתהליך הנקרא ביופסיה. לאחר שהביופסיה נלקחת ממטופל, ניתן לקבל את הריצוף הגנטי של התאים. אנליזה של הריצוף חושפת שקיימות בו גם מעט שגיאות, מוטציות. מוטציות כאלה יכולות להגיע בתורשה מההורים או להיווצר מסיבות שונות, למשל חשיפה לקרינה או שגיאה במהלך חלוקת התא. המידע הגנטי מאפשר לכל תא, ובסך הכל לכל האורגניזם, לייצר את החלבונים הנחוצים לו כאשר הוראות הייצור של כל חלבון שמורות ומקודדות בגן מסויים.
מוטציה בגן עשויה להוביל לייצור חלבון שגוי על ידי הגן או לחלופין למניעת ייצור חלבון. ידוע כיום ששרשרת של מוטציות עשויה להוביל לפגיעה שגורמת להתפתחות סרטן. למשל אם החלבון שהיה אמור לשלוט ולפקח על התחלקות התא, נפגע, התא עשוי להמשיך ולהתחלק, כלומר להתרבות, ללא מעצור. תהליך התרבות כזה נקרא תהליך סרטני. החומרה של מצב זה הינה השיבוש שנוצר בתוך הגוף בשל ייצור מוגבר מאד של תאים מעבר לנדרש. יחד עם זאת, רק 33-50% מהמוטציות ידועות ככאלה הנוטלות חלק בתהליך סרטני. כך שהאתגר הוא לנבא ולחזות אילו מוטציות חשובות לריפוי ואילו אינן רלוונטיות ואפשר להתעלם מהן.
צריך לציין שהמחקר הביו-רפואי בשנים האחרונות הראה שישנן מוטציות שהן משותפות למספר סוגי סרטן, כך שהאפשרות לחזות היתכנות של סרטן באופן רחב, ולא רק לחזות סוג מסויים של סרטן היא משמעותית. אגב, ה-FDA אישר לראשונה ב-2018 תרופה פורצת דרך, כללית, לא לסרטן מסויים, [1], [2]. הייחוד של התרופה בכך שהיא תוכננה לרפא מספר מוטציות, ללא תלות בסוג הסרטן (או האיבר שבו הסרטן) שנגרם מהמוטציות. בהמשך לכך גם האישור הרגולטורי של ה-FDA הינו לריפוי כללי ללא תלות בסוג המסויים של סרטן.
כדי להתמודד עם אתגר החיזוי השתמשו החוקרים בלמידת מכונה מבוססת רשת נוירונים עמוקה. המטרה בלמידת מכונה הינה לבנות פונקציה מתימטית שתדע לחשב לכל דוגמה את תשובתה. על עקרונות למידת מכונה כתבנו בעבר [3]. במקרה הזה, אנו מעוניינים בפונקציה שתקבל תמונה של מוטציה ותדע לענות האם היא פרו-סרטנית - גורמת להתפתחות סרטן - ואם כן, באיזה סיכוי. התמונות בהן משתמשים הינן תמונות פלואורסונציה במיקרוסקופ. בשיטה זאת מחדירים לתאים גנים שהוסיפו להם רכיבים פלורוסנטיים בעלי צבע מסויים ומוגדר. על פי הצבעים בתמונה ניתן לאמוד את הביטוי של כל האחד מהגנים הנבדקים בתמונה [4].
כדי לבנות מערכת למידת מכונה מחלקים את כלל הדוגמאות לשלוש קבוצות זרות, לא חופפות, קבוצת אימון, קבוצת אימות וקבוצת בחינה. בשלב האימון לומדים את הפונקציה המתימטית על סמך דוגמאות מקבוצת האימון ומבצעים אימות ראשוני על כל הדוגמאות בקבוצת האימות. במידה והאימות הראשוני טוב אנו יודעים ששלב האימון הושלם בהצלחה. במקרה זה, ניתן להמשיך לשלב הבחינה שבו בוחנים את המערכת על כל הדוגמאות בקבוצת הבחינה. במידה וגם שלב הבחינה הושלם בהצלחה, ניתן לעבור לשלב השימוש שבו מפעילים את המערכת על דוגמאות חדשות אמיתיות.
הפונקציה המתימטית שבה מקובל להשתמש בשנים האחרונות הינה רשת נוירונים עמוקה. בוחרים מראש את מבנה הרשת ובהמשך, בתהליך האימון, לומדים את המשקולות האופטימליים כדי לחבר בין הצמתים של הרשת. משקולות אופטימליים אלה משיגים את התוצאות המיטביות.
בשלב האימון, משתמשים בתמונות, של מוטציות פרו-סרטניות ולא סרטניות כאשר לכל תמונה ישנה תשובת אמת האם המוטציה פרו-סרטנית. במהלך האימון בודקים מהי התשובה המתקבלת מהרשת עבור קבוצות קטנות של דוגמאות ומשווים לתשובת האמת. אם התקבלה תשובה שגוייה מתקנים את משקולות הרשת כדי להתקרב לתשובת האמת.
לאחר שהסתיים שלב האימון, עוברים לשלב הבחינה שבו מזינים לרשת תמונות חדשות של מוטציות ומודדים את רמת ההצלחה שלה. במידה ורמת ההצלחה טובה אפשר להשתמש ברשת כדי לחזות לגבי מוטציות האם הן פרו-סרטניות.
משתמשים בתמונות של שלוש רזולוציות שונות. תמונות בעלות מספר גדול של פיקסלים נחתכות למספר חתיכות קטנות כך שגודל כל חתיכה קטנה הוא 256*256. לכל חתיכה חושבו 64 מאפיינים. בסך הכל נגזרו 20 חתיכות תמונה קטנות. המאפיינים של כל חתיכות התמונה חוברו כדי לקבל ייצוג הכולל (1280) 20x64 מאפיינים. השכבה האחרונה של הרשת אומנה כדי לחזות את רמת ההשפעה על התפתחות סרטן. המערכת משיגה ביצועים של 94% רגישות (sensitivity) למציאת המקרים המסרטנים [5], כלומר המערכת מחמיצה רק 6% מהמקרים ומכריזה עליהם בטעות כשליליים, מקרים אלה מכונים false negatives. מנגד, המערכת משיגה93% דיוק (specificity) במקרים המדווחים כמסרטנים, כלומר המערכת מדווחת בטעות רק על 7% מהמקרים השליליים, לא מסרטנים, ומכריזה עליהם בטעות כחיוביים, מקרים אלה מכונים false positives . ביצועים אלה הינם תואמים או אף גבוהים יותר מהמדווח בספרות [6].
המשמעות היא שבאמצעות התמונות, הצליחו החוקרים לזהות ברמת וודאות גבוהה מאוד, האם תתפתחנה מוטציות סרטניות אצל אותו אדם, בשלב בו לא התפתח גידול סרטני!
בנוסף, המערכת הצליחה לגלות מהו הגן המוטציוני מתוך קבוצה קטנה של שבע מוטציות, עם ביצועים של 44-84% רגישות (sensitivity) עבור הגן הדומיננטי. זהו מידע משמעותי לצורך בחירת שיטת הריפוי. נדבך נוסף של המחקר הוביל לגילוי וחשיפה של מוטציות שעד כה לא היה ידוע מהו החלק שלהם בתהליכים סרטניים.
בהמשך המחקר הצליחו החוקרים לחזות את סיכוי התגובה לתרופה עבור המוטציות הטרום סרטניות. החוקרים הצליחו לחזות מהי התרופה בעלת סיכוי הריפוי הגבוה ביותר ולחזות את סיכוי הריפוי. הישג זה פותח אפשרויות טיפוליות חדשות שלא היו בידינו בעבר. בזכות החיזוי לגבי מוטציה האם היא מסרטנת יכול הרופא לקבל כלי עשיר יותר לניבוי האפשרות של הסרטן. בנוסף, בזכות האפשרות לנבא סיכוי ריפוי של מוטציה על ידי תרופות שונות, ניתן לבחור טיפול בעל סיכויי הצלחה גבוהים. בחלק מהמקרים מדובר על טיפול שלא היה ידוע בעבר [7].
המחקר הוצג במפגש בנושא למידת מכונה ורפואה [8], [9], [10].
מאת ידידי העמותה חן ברסטל ועמית עובד.
חן ברסטל הוא ד"ר למדעי המחשב ומתימטיקה שימושית ממכון ויצמן למדע, רחובות [11].
לעמית עובד תואר שני בפיסיקה מהטכניון, חיפה.
שניהם חוקרים בכירים ללמידה חישובית ועובדים בזברה מדיקל ויז'ן, שפיים [12].
[1] https://en.wikipedia.org/wiki/Larotrectinib
[2] https://www.fda.gov/drugs/fda-approves-larotrectinib-solid-tumors-ntrk-gene-fusions-0
[3] https://lbscience.org/2017/11/15/%D7%92%D7%93%D7%A8-%D7%94%D7%94%D7%A4%D7%A8%D7%93%D7%94/
[4] https://en.wikipedia.org/wiki/Fluorescence_microscope
[5] https://en.wikipedia.org/wiki/Sensitivity_and_specificity
[6] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6029450/
[7] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5928387/
[8] https://www.meetup.com/MDML-medical-machine-learning-israel/
[9] https://youtu.be/TCWk4Ufs2b8
[11] chen.brestel@gmail.com; instagram.com/chen.brestel
[12] zebra-med.com