בשנה האחרונה נכבשה פסגה נוספת על ידי בינה מלאכותית, עם היכולת ליצור יש מאין ציורים ותמונות (Dall-E), טקסטים (ChatGPT, AI21-Studio) ואפילו חלבונים! הושגה יכולת מלהיבה במיוחד ליצור חלבונים חדשניים ולפענח את המבנה התלת־ממדי ואת מאפייני הפעולה של חלבונים. בזכות חידושים אלו נוכל להאיץ משמעותית את שיפור עולמנו במגוון תחומים: ברפואה, בייצור המזון, באיכות הסביבה, בהפקת אנרגיה ועוד.
מאת ד"ר חן ברסטל ואביעד ברסטל
החלבונים הם מולקולות ביולוגיות, מכונות קטנטנות שיכולות להרכיב ולפרק חומרים. החלבונים הם 'סוסי העבודה' של הביולוגיה ולכן חשיבותם רבה. בדומה לשפה הטבעית שלנו שכוללת מילים ומהן מורכב טקסט בעל משמעות, גם בשפת החלבונים יש 'מילים' - חומצות אמינו - שמהן מורכבת מולקולה בעלת משמעות. החלבונים הידועים לנו בטבע בנויים מעשרים סוגים של חומצות אמינו. אורך החלבון (מספר חומצות האמינו) נע בין עשרות לאלפים. המבנה התלת־ממדי של החלבון נגזר מחומצות האמינו שמרכיבות אותו - הוא נקבע על ידי הכוחות ההדדיים (האינטראקציה) בין רכיביו וגורמים נוספים.
המבנה התלת־ממדי חשוב מאוד, משום שהוא קובע את אופן פעולתו של החלבון - את החומרים שהחלבון יפרק או ירכיב, את מקור האנרגיה והחומרים הנוספים שיידרשו לו לצורך פעולתו, את קצב העבודה שלו, מידת יעילותו וכן את סוג התווך והטמפרטורות שבהם הוא יפעל או יתפרק. פענוח מוצלח של מבנה החלבון מאפשר זיהוי של מאפייני הפעולה השונים שלו, וכך לדעת כיצד להשתמש בו, וכן לתכנן תרופות שישבשו את פעילותו.
הבנת אופי הפעולה של חלבון אפשרה ליצור תחום מלהיב חדש שמתפתח לאחרונה: המצאת חלבונים חדשים. האפשרות לתכנן בעצמנו תכונות לחלבון המומצא ולשלוט בהן מאפשרת ליצור מגוון מכונות קטנטנות שיכולות להרכיב ולפרק חומרים כרצוננו. בזכות זה נוכל להאיץ משמעותית את שיפור עולמנו במגוון תחומים. לדוגמה, ידוע שחלב אם הוא בעל תכונות מיטביות לתינוק, אולם ישנן אימהות שנבצר מהן להניק. מספר חברות עוסקות בייצור חלב אם בשיטות סינתטיות. כדי לייעל את תהליך הייצור הסינתטי אפשר להנדס אנזים חדשני שהוא בעל תכונות מיטביות בהיבטים של איכות חלב האם הסינתטי המיוצר, של עלויות הייצור ושל גורמים נוספים [1]. דוגמה נוספת מעולם הרפואה היא היכולת להמציא חלבון שיודע להתחבר אל מטרה ידועה ולנטרל אותה, כמו למשל וירוס, או להתחבר אל מטרה ולהפעיל אותה, כמו למשל חלבון האחראי לסיום חיי התא שבאמצעותו אפשר לסיים חייו של תא סרטני למשל [2].
פענוח מבנה תלת־ממדי של חלבון היה עד לאחרונה משימה מדעית מאתגרת, שדורשת ניסוי וטעייה, זמן רב ועבודה מרובה, ונחשבה לגביע הקדוש במשך כיובל שנים. ברמה האטומית ניתן, במאמץ גדול, למדוד מבנה תלת-ממדי של מוצק רק במקרה שהינו גביש, כלומר בעל סדר פנימי מחזורי. המדע הניסויי העוסק בכך נקרא קריסטלוגרפיה. כדי לפענח מבנה של חלבון שאינו מוצק וודאי שאינו גביש, נדרש תהליך מעבדתי מאתגר שמתחיל בהמסת החלבון ומסתיים, אם הוא מצליח, בגביש מפוענח [3]. עד לפני כשנה היו ידועים לנו רצפי חומצות האמינו (שרשרת הרכיבים) של 200 מיליון חלבונים, אך המבנה התלת-ממדי פוענח רק עבור פחות מאלפית מהם.
עידן חדש נפתח בשנת תשפ"א 2021 עם פיתוח מכונת בינה מלאכותית בשם אלפא־פולד־2 (AlphaFold2) על ידי חברת דיפ־מיינד (DeepMind). אלפא־פולד־2 [4] הוא כלי חינמי ופתוח לכל, המסוגל לנבא את המבנה התלת־ממדי של חלבונים בהינתן רצף חומצות האמינו שלהם בלבד. במהלך האימון למד המודל לנבא את הכוחות - האינטראקציות - בין חומצות האמינו של החלבון על פי סדרת חומצות האמינו שמרכיבות אותו. בהמשך, בשנת תשפ"ב 2022 השלימה החברה פענוח מבנה תלת-ממד של 200 מיליון חלבונים, כלומר של רוב החלבונים הידועים לנו. מדובר בהישג כביר, משום שבשנה אחת הוכפל פי 200 מספר החלבונים בעלי מבנה מפוענח [5].
גישה נוספת אשר הוצגה לאחרונה על ידי זמינג לין ושותפיו (חברת מטא) [6], מסתפקת בקלט פשוט יותר ומשיגה ביצועים משופרים. החידוש הוא שימוש במודל שפה של חלבונים שאומן על רצפי חומצות אמינו, כך שהוא מייתר את הצורך במידע על שכנויות בין זוגות חומצות אמינו כפי שנעשה באלפא-פולד-2.
גישה חלופית יוצרת חלבון חדש עם התכונות המבוקשות בלי שימוש במבנה התלת־ממדי. במאמר משנת תש"פ 2020 של ד"ר עלי מדני ושותפיו (סיילספורס, סטנפורד), מוצגת מכונת בינה מלאכותית יוצרת ליצירת חלבונים חדשים בשם פרוג'ן [7].
מכונת בינה מלאכותית רגילה מקבלת קלט ויודעת לחזות בסבירות גבוהה את הפלט המבוקש. למשל בהינתן תמונה היא יודעת לומר אם קיים בה מטוס. לעומת זאת, מכונת בינה מלאכותית יוצרת ממציאה פלט חדש שמיוצר בהשראת אוסף הנתונים ששימשו ללימוד ובאמצעות שאילתא. לדוגמה המכונה Dall-E [8] מקבלת משפט שאילתא ומייצרת תמונה חדשה בהשראת התמונות שהתאמנה עליהן ומשפט השאילתא [9].
במקרה של ייצור חלבונים חדשים המכונה מקבלת כשאילתא רצף חלקי של חלבון ואוסף של תגיות, המתארות את תכונות החלבון החדש המבוקש. דוגמאות לתגיות: אורגניזם, פעולה מולקולרית, רכיב בתא, תהליך ביולוגי וכו'. הפלט של המכונה הוא רצף מלא של חלבון חדש העונה לכל אותם מאפיינים.
עבור אימון (לימוד) המכונה, השתמשו החוקרים ב־280 מיליון רצפים של חלבונים ממגוון אורגניזמים ומשפחות ביולוגיות. במהלך צעדי האימון מוצגים למכונה מגוון רצפים של חלבונים תוך הסתרת חומצת אמינו (בדומה להסתרת מילה במשפט) אחת בכל רצף. המשימה של המכונה היא לזהות איזו חומצה חסרה. תהליך אימון דומה מתבצע גם עבור מכונות של עיבוד שפה טבעית כמו [10] AI21-Studio ו־[11] ChatGPT שהוזכרו לעיל.
במאמר המשך שהתפרסם לאחרונה מראים המחברים כיצד הצליחו ליצור שלושה אנזימים שאינם קיימים בטבע [12]. זה מלהיב מאוד, כי אנזים הוא חלבון המתפקד כזרז של תגובה כימית, ועל כן הוכחת ההיתכנות הזאת תוכל לסייע לנו לייעל תגובות כימיות שאולי לא התאפשרו עד כה. זהו פתח לפתרונות חדשניים לבעיות שהיו חסרות פתרון עד כה, כמו למשל ייצור חלב אם באופן סינתטי, תקיפת וירוס והשמדת תא סרטני שהוזכרו לעיל.
חידושי השנים האחרונות בפענוח שפת החלבונים יאפשרו לאנושות להאיץ באופן משמעותי יצירת חלבונים חדשים ולשפר את העולם בתחומים מגוונים רבים. ההאצה המשמעותית מושגת בסיוע כלי בינה מלאכותית שמאפשרים לבצע במאמץ קטן מאוד, בזמן קצר מאוד ובמשאבים זולים מאוד, מגוון גדול של ניסויים סינתטיים שעל בסיסם ניתן לבנות מספר קטן וממוקד של ניסויים אמיתיים במעבדה, וחוזר חלילה.
תודה רבה לצוות מדע גדול, בקטנה על הדיון המחכים ושלל הרעיונות בהכנת הרשומה. 🌹 🧬
ד"ר חן ברסטל הוא מדען בינה מלאכותית.
אביעד ברסטל הוא תלמיד בישיבת הר עציון.
מקורות לקריאה נוספת
[1] כיצד ליצור חלבונים שהטבע לא יצר? אריאל גרוסמן באתר nocamels
[2] כיצד ליצור חלבונים שיתחברו אל מטרה ידועה? ד"ר פאבלו גיינצה ושותפיו בכתב העת Nature
[3] מהי קריסטלוגרפיה וכיצד היא קשורה למציאת מבנה הריבוזום? מאיר ברק באתר דוידסון
[4] כיצד לפענח את המבנה התלת-ממדי של חלבון? פלג בר ספיר במדע גדול, בקטנה
[5] כיצד פוענחו 200 מיליון מבנים של חלבונים בעזרת אלפא-פולד-2? בלוג של חברת דיפ-מיינד
[6] כיצד פוענח המבנה התלת-ממדי של חלבונים בעזרת מודל שפה של חלבונים? מאמר של חברת מטא
[7] כיצד ליצור חלבונים חדשים בעזרת פרוג'ן - מכונת בינה מלאכותית יוצרת? חברת SalesForce בבלוג ובמאמר
[8] Dall-E - כלי ליצירת תמונות מבוסס בינה מלאכותית יוצרת של חברת OpenAI
[9] מהי בינה מלאכותית יוצרת? בלוג של ד"ר יונתן לזרסון
[10] AI21-Sudio - כלי ליצירת טקסט של חברת AI21
[11] ChatGPT - כלי ליצירת טקסט של חברת OpenAI
[13] מהי למידה עמוקה? דורון אורנשטיין במדע גדול, בקטנה