29 березня 2024 року в Інституті біохімії ім. О.В. Палладіна НАН України відбудеться чергове засідання міждисциплінарного загальноакадемічного семінару у галузі природничих наук «Актуальні питання фізико-хімічної та математичної біології».
Доповідь «Штучний інтелект і моделювання просторової структури білків» виголосить завідувач відділу білкової інженерії та біоінформатики Інституту молекулярної біології та генетики НАН України член-кореспондент НАН України Олександр Корнелюк.
Член-кореспондент НАН України Олександр Корнелюк (фото пресслужби НАН України) |
Початок заходу – о 10:30 (орієнтовна тривалість – 2 години).
Адреса: Київ, вул. Леонтовича, 9, актова зала Інституту біохімії ім. О.В. Палладіна НАН України.
Посилання для дистанційного долучення до семінару:
https://meet.google.com/kgw-sjpb-ypn УВАГА! У разі повітряної тривоги працює укриття в будівлі Президії НАН України (вул. Володимирська, 54).
Ілюстрація: iStockphoto.com |
Авторські тези доповіді
Визначення просторової структури білків – необхідний етап для з’ясування взаємозв’язку між структурою та функцією білків. Значні успіхи у секвенуванні геномів організмів спричинили постійне зростання потоку даних про первинні структури білків. Однак лише приблизно для 10% відомих послідовностей доступні структурні дані, тому для аналізу більшості білків стають дедалі важливішими комп’ютерні методи передбачення їхньої просторової структури, які належать до методів біології in silico. Дані про 3D-структури білків, експериментально визначені методами рентгеноструктурного аналізу та ЯМР-спектроскопії, депонуються і зберігаються у банках даних просторових структур.
Методи теоретичного передбачення структури білків можна поділити за повнотою фізичного підходу до їхнього опису: це методи розрахунку ab initio, що базуються на вихідних фізичних принципах, і методи класичної молекулярної механіки, які використовують статистично встановлені правила у вигляді силових полей. Для побудови структурної моделі білка використовують найефективніший серед емпіричних підходів метод моделювання за гомологією (порівняльного моделювання), який ґрунтується на фундаментальному принципі залежності між рівнем гомології амінокислотних послідовністей білків і схожістю їхньою просторової структури. Модель структури білка, побудована на основі матриці з гомологією понад 90%, має такі ж малі похибки, як і кристалографічно визначена структура. Моделювання за гомологією можна безпосередньо здійснювати в Інтернеті за допомогою моделювальних систем на зразок Swiss-Model, Modeller, I-TASSER, CPHmodels, SDSC1, FAMS, 3D-JIGSAW та інших. У відділі білкової інженерії та біоінформатики Інституту молекулярної біології і генетики НАН України виконано комп’ютерне моделювання просторової структури білків апарату трансляції евкаріотів: тирозил-тРНК-синтетази та білка АІМР1/р43, просторові структури яких експериментально не визначено.
Від 2018 року для моделювання просторової структури білків успішно застосовують метод штучного інтелекту. В експерименті CASP14 метод штучного інтелекту AlphaFold2, розроблений компанією DeepMind, продемонстрував найкращий результат не лише порівняно з іншими групами, а й в абсолютній точності моделей. Дві третини моделей збігалися з експериментальними даними на 90%. AlphaFold2 змогла спрогнозувати майбутню структуру білків із похибкою лише в 1,6 ангстрема, що відповідає точності експериментальних методів ЯМР або рентгенівської кристалографії. База даних
AlphaFold Protein Structure Database, створена в партнерстві з Європейським інститутом біоінформатики EMBL, містить понад 200 мільйонів моделей структури білків, вільно доступних для світової наукової спільноти. Проте моделювання структури білків за допомогою AlphaFold2 має певні обмеження. Передусім – відсутність моделювання повної четвертинної структури білків, яка визначає їхню функціональну активність. Слід зазначити, що за цим напрямом досліджень є певний прогрес. Інша складна проблема – неможливість на нинішньому етапі моделювати структури внутрішньо невпорядкованих білків (IDP). Кристалографічний аналіз зазвичай не дає інформації про неструктуровані ділянки, а лише вказує на їхню можливу наявність через відсутність електронної густини у картинах рентгенівської дифракції кристалів білків. Для встановлення неструктурованих ділянок білка розроблено низку біоінформатичних сервісів, що користуються різними методами передбачення, а також мета-сервери (MetaDisorder). Науковці Інституту молекулярної біології і генетики НАН України використовують комплексний підхід для дослідження структури внутрішньо невпорядкованих білків, який передбачає біоінформатичний аналіз і експериментальне дослідження білків методами ЯМР-спектроскопії, флуоресценції та кругового дихроїзму.
Порівняння отриманих моделей із даними моделювання програмою штучного інтелекту виявило проблему моделювання структури IDP програмою AlphaFold2, оскільки ця програма базується лише на кристалографічних структурах. Моделювання просторової структури внутрішньо невпорядкованого білка АІМР1/p43, здійснене в Інституті молекулярної біології і генетики НАН України, вказує на компактну структуру мономера, здатного формувати димер і потенційний тРНК-зв’язувальний сайт на поверхні димера. Проте модель структури білка АІМР1/p43, створена штучним інтелектом у базі даних AlphaFold2, принципово відрізняється та не здатна формувати функціональний димер і зв’язувати тРНК. Щоб розв’язати цю проблему, необхідно створити нову базу даних просторових структур внутрішньо невпорядкованих білків на основі даних ЯМР-спектроскопії та комп’ютерного моделювання. А це вже задача для майбутніх досліджень.
Однак, попри зазначені проблеми, моделювання структури білків методом штучного інтелекту за допомогою AlphaFold2 швидко прогресує, дає дослідникам миттєвий доступ до прогнозованих моделей білків, а отже, прискорює експериментальну роботу. AlphaFold уже забезпечив прогрес у розв’язанні деяких глобальних проблем, зокрема створення нових лікарських препаратів і вакцин. І це лише початок впливу, який спостерігатиметься протягом наступних років.
Довідково
Міждисциплінарний загальноакадемічний семінар у галузі природничих наук «Актуальні питання фізико-хімічної та математичної біології» започатковано на базі Інституту біохімії ім. О.В. Палладіна НАН України відповідно до Постанови Президії НАН України № 134 від 22 березня 2023 р.
Мета семінару – періодичне заслуховування й обговорення наукових доповідей, присвячених застосуванню сучасних експериментальних і теоретичних методів хімії, фізики й математики для розв’язання нагальних проблем сучасної біології, зокрема у галузі біохімії, біофізики, молекулярної та клітинної біології, біоенергетики, геноміки, медичної біології, фармакології, нанобіотехнології, системної та синтетичної біології.
Семінар унеобхіднений прогресом таких «перехресних» наук і наукових напрямів, як біофізична хімія, фізична біохімія, хімічна біофізика, біохімічна фізика, фізико-хімічна біологія, фізика живого, математична біофізика, теоретична біологія, біоінформатика, штучний інтелект в біології та медицині тощо.
Засідання семінару щомісяця відбуваються в Актовій залі Інституту біохімії ім. О.В. Палладіна НАН України (Київ, вул. Леонтовича, 9). Долучитися до семінару можна також в онлайн-режимі. «Двері» семінару відкриті не лише для науковців Національної академії наук України та працівників і студентів українських закладів вищої освіти, а й для всіх охочих.
Наступне засідання семінару заплановано на квітень 2024 року.
Пропозиції щодо виступів із доповідями (обсяг тез доповіді – 1–2 сторінки) надсилайте, будь ласка, на електронні скриньки керівника семінару – заступника директора з наукової роботи Інституту біохімії ім. О.В. Палладіна НАН України, завідувача відділу біохімії м’язів цього Інституту академіка Сергія Олексійовича Костеріна: kinet@biochem.kiev.ua ; kosterin.serg@gmail.com
За анонсами засідань семінару стежте також
на сайті Інституту біохімії ім. О.В. Палладіна НАН України.
За інформацією Інституту біохімії ім. О.В. Палладіна НАН України
Ілюстрація на обкладинці: Karen Arnott/EMBL-EBI (джерело: cluster.foldseek.com)