מחלת הקורונה החדשה (COVID-19) מתפשטת במהירות. למרות ששיתוף ידע היא אחת הדרכים החשובות לייעל את צעדי המניעה, האבחנה והטיפול במחלה, לצוותים הרפואיים אין את היכולת לקרוא את כמות המאמרים האדירה שנכתבה בנושא. חברות שונות מציעות מנגנונים לפתרון בעיה זו, על ידי שיתוף ידע בצורה יעילה. בפוסט הנוכחי נספר על אחת מהחברות האלו, חברת סטארטאפ ישראלית המציעה מנגנון שיתוף ידע חינמי המבוסס על אינטליגנציה מלאכותית.
הפוסט נכתב בשיתוף ד״ר עמוס קאהן, ראש תחום מחקר, קאהון
שיתוף יעיל של מידע בין אנשי מקצוע הוא יעד חשוב, ועם זאת מאתגר. בולט במיוחד הוא התחום הרפואי, בו שיתוף מידע יכול לסייע בזיהוי מהיר ומדויק של מחלות ובמציאת טיפול מתאים. לפיכך, ישנם לא מעט ניסיונות לפתח טכניקות כאלו, בתחומים שונים. מחלת הקורונה החדשה (COVID-19), שמשנה את חיינו בצורה דרמטית, היא מטרה חשובה לפיתוח כזה.
מספר הנדבקים המאומתים במחלה הוא כבר בסדרי גודל של מיליוני בני אדם. הפגיעה הקשה בחיי אדם, יחד עם הנזק הכלכלי, מניעים מחקרים רבים בתחום, כשהמספר המוערך של מחקרים כאלו נכון להיום הוא אלפים. מאמרים אלו כוללים מידע בעל ערך רב לגבי דרכי ההעברה של הנגיף מחולל המחלה, הביטויים הקליניים שלה, מהלכה בזמן, הטיפול בה וכן דרכים למנוע אותה. העברת מידע בין צוותי הרפואה שכבר פגשו את המחלה לאלו שטרם התמודדו עימה היא קריטית, ויכולה למנוע חזרה על טעויות ולהכווין להתערבויות שנמצאו מועילות. בנוסף, סקירת כמויות גדולות של ידע מאפשרות לא פעם להבחין בתופעות ותסמינים לא מוכרים.
אל מול הצורך הרב, עומס העבודה [1] מגביל משמעותית את היכולת של הצוותים להעביר מידע ולקרוא מאמרים בצורה משמעותית. מגפת הקורונה מחמירה בצורה משמעותית את המצב.
איור 1: המידע בספרות הרפואית לגבי COVID-19 מוצג לפי קטגוריות. עבור כל ביטוי של המחלה (לדוגמה, סימפטום),הקשרים הישירים והעקיפים למחלה מוצגים בצורה גרפית . הקלקה על חץ מאפשרת להציג את המקורות (כולל קישור).
ישנן גישות שונות לפתרון בעיה כזו. פתרון אפשרי אחד הוא למפות ידע רפואי מטקסטים מדעיים (שהם הדרך המקובלת לשתף ולצרוך ידע רפואי) לתוך מאגר ידע מובנה המכיל את שלל המושגים הרפואיים והקשרים ביניהם. דוגמא לפתרון כזה מוצעת על ידי חברה בשם Kahun', שהיא חברת סטארטאפ ישראלית צעירה. במקרה זה, מאגר הידע הנ"ל - נשמר כ"גרף ידע", מאגר מידע מובנה, כלומר, מאגר מידע במבנה קבוע ומסודר כך שמחשב יכול "להבין" אותו.
אחסון מידע בצורה סדורה דורש שני דברים עיקריים - מבנה אחיד שבו המידע נשמר, וטכניקה הממירה את המידע ממבנה כלשהו למבנה האחיד. במקרה זה, המבנה מאגר הידע נקבע על בסיס אונטולוגיות רפואיות מקובלות, כלומר רשת של עשרות ומאות אלפי מונחים רפואיים והקשרים המילוניים ביניהם. האונטולוגיות בהן נעשה שימוש נוצרו על ידי גופים בינלאומיים על מנת לייצר סטנדרטיזציה בתחום והן אלו שעומדות בבסיסן של מערכות ניהול תיקים רפואיים.
אז איך זה עובד?
המאגר מתעדכן בצורה רציפה מפרסומים מדעיים כמו הנחיות קליניות, מחקרים קליניים, סקירות ומטה-אנליזות (סקירות הבוחנות מספר רב של מחקרים ומסכמות את תוצאותיהם) העוסקות באלפי מחלות. הידע הרלוונטי לרופאים מתוך פרסומים אלה "מזוקק" ומשמש להעשרת גרף הידע הרפואי (knowledge graph).
עדכון גרף הידע דורש למעשה תרגום של מידע משפת בני אדם (אם אפשר לקרוא למאמרים מדעיים "שפת בני אדם") למבנה שעימו יכול המחשב לעבוד. תחום זה נקרא עיבוד שפה טבעית או (Natural Language Processing) והוא למעשה אוסף של טכניקות שונות מבוססות למידת מכונה.
טכניקות אלו הן מורכבות מאוד, ופיתוח מאפס של מערכות כאלו הוא לרוב נחלתם של ארגוני ענק או מדינות בלבד. בשביל להתגבר על הגבלה הטכנולוגית הזו, גרף הידע מחולץ מהמאמרים על ידי שילוב בין תרגום מבוסס NLP לסיכום ידני שנעשה על ידי קהילה של מומחי רפואה.
כמויות הידע בהן מדובר הינן עצומות, כשכבר כיום מדובר על מיליוני הקשרים עבור אלפי מחלות וממצאים. לכן, בשלב השני אלגוריתמים של למידת מכונה סורקים את המונחים והקשרים שבגרף הידע, ומחשבים מתאמים בין גורמי סיכון למחלות, בין סימפטומים לאבחנות ובין אבחנות לדרכי טיפול.
בשלב זה, יכולים הרופאים להפיק את הידע הדרוש להם בעזרת הגרף. את הממשק ניתן לראות בתמונה מספר 2. לדוגמה, רופא שמקבל חולה עם סימפטומים הקשורים למחלות בדרכי הנשימה, יכול להזין את הסימפטומים לממשק, ולהשתמש בכלי כדי להעריך את הסיכון של החולה לפתח מחלת ריאות קשה, יחד עם הסיכוי לצורך בהנשמה מלאכותית. הרופא יכול לבחור בסיבוך ולקבל את טווח שיעור החולים שפיתחו אותו בסיכומי סדרות חולים שפורסמו.
כדוגמה נוספת, בהקשר של חולה החשוד כסובל מ- COVID-19 ושאין אצלו ממצאים אופייניים ב- CT של חזה, רופא יכול לבדוק עד כמה היעדר הממצאים שולל את החשד. סיבוכים שתוארו לעתים קרובות במאושפזים ביחידה לטיפול נמרץ צפויים להיות שכיחים הרבה פחות במאושפזים שמחלתם קלה יותר ואולי אפילו נדירים במי שחלה אך לא נזקק לאשפוז. גם מועד הפרסום והאזור הגיאוגרפי שבו נאסף המידע חשובים כדי להבין את הקשר המידע (למשל, באיטליה שיעורי התמותה המדווחים גבוהים משמעותית מבגרמניה), וגם אלה מצויינים לצד כל קשר. רופא המעוניין להתעמק בנתונים יכול לפתוח את המאמרים הרלוונטים לו בקליק.
למרות שהטכניקה לא פותחה עבור מחלת הCOVID-19 בלבד, שטף המאמרים (עד כה הוכנסו למאגר מעל 500 מאמרים ומטה אנליזות הקשורים לקורונה) בתחום הפך את השימוש בו בהקשר למחלה זו לנפוץ.
הכלי זמין ברשת ובטלפון חכם, והמטרה היא שהידע, שיונגש לשימוש הכלל בכלי חינמי, יסייע לרופאים בטיפול בחולים ויהווה מקור למידע אמין על מחלה הקורונה. לפני פרוץ מגפת הקורונה, האפליקציה הייתה בשלבי פיילוט ראשוניים במחלקות פנימיות של בתי חולים בישראל.
מקורות:
[1] משרד הבריאות: דו"ח הוועדה לשיפור הטיפול במערך האשפוז הפנימי במדינת ישראל, 2019
[2] אתר Kahun העוסק במחלת הקורונה COVID-19