“Pomocí strojového učení dokážeme předpovídat biosyntetické reakce,” říká laureát Roman Bushuiev
Jelikož chemická syntéza specializovaných metabolitů je velmi náročná, bude v blízké budoucnosti nejudržitelnějším způsobem produkce takových molekul jejich biosyntéza v upravených mikroorganismech. Laureát ceny Via Chimica pro rok 2022 Roman Bushuiev ve své studentské práci navrhl a otestoval algoritmus, který dokáže biosyntetické reakce předpovídat. “V naší práci jsme studovali terpeny, nejrozsáhlejší skupinu specializovaných metabolitů rostlin. Porozumění procesu biosyntézy terpenů je logickým krokem směrem k nové éře designu léčiv,” vysvětluje čerstvý laureát ceny Via Chimica, který svoji práci zpracovával na Katedře aplikované matematiky FIT ČVUT ve spolupráci s Ústavem organické chemie a biochemie AV ČR.
Romane, jak jste se jako student informatiky ČVUT v Praze dostal k výzkumu biosyntézy?
Vždy mě lákala věda a výzkum. Asi před třemi lety, když jsem hledal ke studiu informatiky nějakou práci na poloviční úvazek, jsem uviděl inzerát Tomáše Pluskala (juniorního vedoucího výzkumné skupiny na ÚOCHB AV ČR zabývající se analýzou biosyntetických drah specializovaných metabolitů v rostlinách, pozn. aut.) Už při pohovoru jsem zjistil, že ačkoliv se jedná o pozici programátora, bude to hodně vědecká práce. Okamžitě jsem zatoužil dozvědět se víc. Spolupráce probíhala skvěle a začali jsme se bavit o mé bakalářské práci. Řekl jsem Tomášovi, že bych chtěl udělat něco ohromně zajímavého, něco, co nikdo přede mnou nedělal a on mi nabídl projekt předpovídání biosyntézy terpenů (těkavých vonných látek obsažených v listech, plodech, květech, oddencích i kořenech rostlin, pozn. aut.)
K čemu je předpovídání biosyntézy terpenů užitečné?
Přibližně čtvrtina všech v současnosti vyráběných léčiv pochází z rostlin. Základním zdrojem chemických látek pro vývoj nových léků jsou specializované metabolity, které rostliny produkují, aby zvýšily svoji plodnost nebo se chránily proti predátorům. Jelikož chemická syntéza specializovaných metabolitů je velmi náročná, bude v blízké budoucnosti nejudržitelnějším způsobem produkce takových molekul právě biosyntéza v upravených mikroorganismech. V naší práci jsme studovali terpeny, nejrozsáhlejší skupinu specializovaných metabolitů rostlin. Porozumění reakcím biosyntézy terpenů je logickým krokem směrem k nové éře designu léčiv.
Bylo pro vás jako pro informatika těžké do tématu proniknout?
Měl jsem velkou výhodu v tom, že můj školitel dokáže vysvětlit složité věci jednoduchými slovy. Abych do tématu pronikl, začal jsem si číst knížky z organické chemie a z buněčné biologie, prostudoval jsem si nějaké články a pochopil jsem základní mechanismy. Téma predikce biosyntézy mě velice zaujalo. Do biologie i chemie jsem se díky tomu zamiloval.
Na jakém principu predikce za pomoci strojového učení funguje?
Obecně strojové učení potřebuje nějaká data, najde v nich určité vzorce a zákonitosti a na základě toho potom může dělat predikce. Náš algoritmus jsme navrhli tak, že jsme sjednotili tři neuronové sítě. Nejprve dvě nezávislé neuronové sítě převedou malé molekuly a enzymy do dvou vektorových prostorů. Následně třetí neuronová síť se učí přiřazovat vektory malých molekul vektorům enzymů tak, aby takové přiřazení odpovídalo skutečným biosyntézám specializovaných metabolitů, a to znamená, že dokáže potom předpovídat i jejich reakce.
Jak byla predikce umělé inteligence v oblasti biosyntézy úspěšná?
Námi navržená neuronová síť dokázala přesně predikovat každou třetí biosyntetickou reakci s vysokou jistotou a většina zbývajících predikcí celkově odpovídala skutečné struktuře produktů reakcí.
Kam by váš výzkum mohl dále směřovat?
V budoucnu plánujeme s predikcemi biosyntéz pokračovat. Věřím, že jednoho dne sjednotíme oblasti biochemie, matematiky a strojového učení do takové míry, že budeme vnímat biosyntézy (a jiné přírodní procesy) jako jasně definované operace ve formálních matematických prostorech.
Jak vnímáte fakt, že jste za svůj výzkum dostal cenu za obor chemie?
Mám z toho velice dobrý pocit. Je to mnohem zajímavější, než kdybych dostal cenu za obor informatika. Jednak jsem si opravdu užil spolupráci v rámci interdisciplinárního výzkumného týmu. Navíc, vědy jako chemie a biologie jsou jedny z nejlepších, možná úplně nejlepší aplikační oblastí informatiky. To, že dostávám cenu za chemii, znamená, že do nějaké míry dokážeme skrze informatiku luštit tajemství přírody. To mi přijde absolutně fascinující!
Roman Bushuiev
se narodil v roce 2000 v ukrajinském Doněcku. Po absolvování gymnázia v Kyjevě odešel studovat do Prahy. Je studentem prvního ročníku magisterského studia informatiky na ČVUT v Praze, obor znalostní inženýrství. Zároveň pracuje na ÚOCHB AV ČR ve výzkumné skupině Tomáš Pluskala a podílí se na výzkumu analýzy biosyntetických drah specializovaných metabolitů v rostlinách.
Téma bakalářské práce: Machine-learning prediction of terpene biosynthesis
Působiště: Katedra aplikované matematiky FIT ČVUT ve spolupráci s Ústavem organické chemie a bioochemie AV ČR