POEM@home

 

Základní informace o projektu a popis oblasti výzkumu, kterou se projekt POEM@home zabývá.

POEM (Protein Optimization with free Energy Methods) – optimalizace proteinů metodou volné energie

POEM je strategie pro reprodukování „in-silico“, předpovídání skládání bílkovin a předpovídání terciární struktury bílkovin na základě termodynamické hypotézy. Nepoužívá ji jen projekt POEM@Home, ale i jiné projekty zabývající se biologií (i mimo systém BOINC). Projekt je provozován výzkumným centrem v Karlsruhe.

Od roku 1999 POEM vyvinul strategii „all-atom biophysical forcefields“ (tedy všeatomárních biofyzikálních silových polí - PFF01, PFF02) a efektivní stochastické metody pro skládání proteinů, předpovídání struktur bílkovin, interakci bílkoviny s bílkovinou a interakci bílkoviny v nefyzikálním prostředí. O těchto metodách však později. Teď si vysvětlíme, co to bílkovina je.

Co je to bílkovina a k čemu může sloužit

Bílkoviny, odborně proteiny, patří mezi biopolymery. Jedná se o vysokomolekulární přírodní látky čítající až stovky tisíc atomů, které jsou složeny do jedinečných třídimenzionálních struktur, ve kterých fungují.

Bílkoviny jsou podstatou všech živých organismů, jsou jako nanometrické stroje fungující ve všech známých buňkách živých organismů. Mezi jejich funkce patří buněčný metabolismus, přeměna energie (fotosyntéza), doprava chemických prvků (například kyslíku), zpracovávání signálů v mozku (neurony), imunitní odpovědi a mnohé další často efektivitou nesrovnatelné s jakýmkoliv člověkem vytvořeným procesem. Špatně fungující bílkovina je často spojena se souvisejícím onemocněním. Mnohé však mají stále neznámou strukturu.

Chcete-li pochopit, kontrolovat, nebo dokonce vytvářet bílkoviny, potřebujete studovat jejich struktury, což je experimentálně mnohem těžší než získávat informace o chemickém složení (sekvenci) specifické bílkoviny.

POEM@Home implementuje nový přístup k pochopení biologicky aktivní struktury v bílkovinách, mechanismů signálů při interakci bílkoviny s okolím a nemocí souvisejících se špatně fungujícími a nahromaděnými bílkovinami. Dává impuls k vývoji nových léků na základě třídimenzionální struktury biologicky významných bílkovin. Výzkum všech těchto aspektů se sám o sobě velice dobře uplatňuje v mnoha dalších distribuovaných výpočtech. Vědecký přístup projektu POEM@Home je výpočetní realizací termodynamické hypotézy, za kterou dostal C. B. Anfinsen roku 1972 Nobelovu Cenu za chemii.

Termodynamická hypotéza C. B. Anfinsena

Hypotéza uvádí, že alespoň u malých kulových proteinů je nativní struktura bílkovin určena pouze sekvencí aminokyselin. V podmínkách prostředí, ve kterých dochází ke sdružování, je původní struktura jedinečná, stabilní a kineticky s minimální volnou energií. K tomu se vztahují tři podmínky:

  • Jedinečnost - vyžaduje, aby sekvence neměla žádné další možnosti srovnatelné volné energie. Z tohoto důvodu musí být volná energie jedinečná.
  • Stabilita - malé změny v okolním prostředí nemohou vést ke změnám v modelu s minimální možnou volnou energií.
  • Kinetická dostupnost - znamená, že vazba na povrchu s volnou energií od nesdruženého ke sdruženému musí být dostatečně vyrovnaná. Jinými slovy – při sdružování nesmí docházet ke komplexním změnám tvaru.

 

Jak bílkovina dosahuje této struktury je předmětem oboru skládání proteinů, který se odkazuje na Levinthalův paradox. Tento paradox uvádí, že počet možných struktur určitého proteinu je astronomicky velký.

Některé bílkoviny také potřebují pomoc jiné bílkoviny, zvané chaperon (gardedáma), aby se správně složily. Bylo řečeno, že to vyvrací Anfinsenovovu hypotézu. Nicméně se zdá, že chaperony nemají na konečný stav bílkoviny vliv. Na druhou stranu se ale zdá, že pokud vliv mají, brání agregaci několika bílkovinných molekul před jejich sdružením.

Vraťme se ale ke stochastickým optimalizačním metodám

Stochastické optimalizační metody jsou v současnosti používány v mnoha aplikacích, od obvodů na křemíkovém waferu až po letové řády leteckých společností.

V těchto a mnoha dalších aplikacích je cílem minimalizovat náklady, které závisí na velkém počtu diskrétních nebo kontinuálních proměnných. Analogicky k fyzikálním problémům popisuje nákladová funkce energii plochy v parametru prostoru a jeho globální minimum k optimalizaci kýženého cíle. Stochastické optimalizační metody se využívají, pokud by prozkoumání všech možností konfigurace bylo příliš výpočetně náročné. To je obecný problém v mnohadimenzionálních optimalizačních problémech, kde celkový počet možných konfigurací roste exponenciálně s počtem proměnných.

Stochastické optimalizační metody postupně zlepšují jednu nebo několik konfigurací základního modelu s cílem přiblížit se globálnímu minimu. To dosahují optimalizací procesu, tedy mapováním na fiktivních dynamických procesech s jednou nebo několika konfiguracemi, které se pohybují v konfiguračním poli. Tento proces se zastaví v případě, že bylo dosaženo určité předem definované množství výpočetních zdrojů nebo když je dynamický proces ukončen ve stabilní konfiguraci. V každém případě neexistuje žádná záruka, že stochastický proces zjistil, že výsledek je globální minimum. S ohledem na stochastický charakter procesu nelze zaručit nalezení celkového minima.

Při absenci dokonalosti je důležité rozlišovat dva možné cíle ve stochastické optimalizaci. V případě obvodu kvality výsledného řešení je to měření jejího energetického rozdílu v celkovém minimu. Přičemž rozdíl od konfigurace získaný globálním minimem je zcela irelevantní. Ve druhém případě (jako je například předpovídání proteinové struktury nebo léčiv) je objevení rozdílu rozhodující. Nechceme optimalizovat energii skládání, ale je možné vyvodit užitečné informace ze třídimenzionální struktury získané níže ležícím metastabilním stavem, který má velké RMSD (relative mean square deviation; střední relativní odchylka vzdáleností čtverců ukazuje, jak je současná přijatá struktura blízko správné odpovědi) ve správné míře, nemusí ale obsahovat žádné užitečné informace.

Vzhledem k tomu, že skládání proteinů patří mezi nejnáročnější výpočetní problémy dneška, pro usnadnění jejich řešení je žádoucí použití co možná nejvíce výkonných počítačových architektur.

Příklad počítaných jednotek

V době psaní tohoto článku se zpracovávaly výsledky ze série jednotek zabývajících se systémem III. typu vylučování (T3SS) bakterií. Tento systém je zásadním faktorem virulence druhu, jako jsou:

  • Druh Shigella - kontaminuje potraviny a způsobuje bakteriální úplavice neboli těžká průjmová onemocnění. Odhaduje se více než 165 milionů případů ročně, což vede k více než 1 milionu úmrtí.
  • E. coli - způsobuje otravu jídel a průjem. Jeden druh E. coli infikuje 200 milionů lidí ročně, což má za následek 380 000 mrtvých, hlavně v rozvojových zemích.
  • Druh Salmonella - způsobuje nemoci, jako je tyfus a paratyfová horečka.
  • Yersinia pestis - příčina moru, včetně černé smrti, která vyústila v úmrtí 30 % evropské populace v 13. století.
  • Druhy Chlamydia - jsou odpovědné za závažné, nejčastěji sexuálně přenosné choroby. Jsou také hlavní příčinou globální infekční slepoty.

 

T3SS se skládá z jakési injekční stříkačky podobné molekulárnímu stroji, který vstřikuje specifickou bílkovinu (tzv. efektor) do buňky hostitelského organismu, aby podpořil virulenci. Například při použití Salmonelly k T3SS vstříkneme aktin přeskupující efektory do buněk epitelu, které mění strukturu membrány buněk a umožňují Salmonelle vstup do buněk.

Náš zvláštní zájem je o vylučovací signál T3SS - strukturální námět, který mechanismus T3SS využívá k rozpoznání a posílení efektorových proteinů pro vylučování. Máme zájem o tyto interakce, protože se jedná o klíčovou událost v procesu infekce a protože narušení této interakce by hypoteticky mohlo oslabit schopnost invaze bakterie do hostitelských buněk. Charakter vylučovacího signálu není znám. Není moc známo ani o trojrozměrném složení T3SS signálu a v literatuře jsou protichůdné teorie. Pochopení vylučovacího signálu bude představovat významný pokrok ve studiu bakteriální patogeneze, a jak bylo uvedeno výše, mohlo by otevřít cestu k novým typům antibiotik. Skládáním navrhovaných cílových a jiných bezkontaktních bílkovin formou testů chceme získat strukturální vhled do mechanismu podporujícího vylučování.

Bakterie, které používají III. typ vylučovacího systému pro infekci mohou způsobit závažné onemocnění stovkám milionů lidí ročně a vést ke značným ztrátám na životech. Většina těchto případů jsou děti v rozvojových zemích a jedinci s oslabeným imunitním systémem, například vlivem AIDS. Alarmující nárůst antibiotické rezistence bakterií vytváří naléhavou situaci, která vyžaduje nové metody pro boj s těmito bakteriemi. Světová zdravotnická organizace označila průjmová onemocnění, jako velkou výzvu globálního zdraví a bude požadovat okamžitý vývoji nových intervenčních strategií. Výsledky projektu POEM@HOME mohou odhalit nové horizonty pro rozvoj antibiotik.

Pomocí projektu POEM@Home se podařilo mimo jiné identifikovat v lidské populaci gen zodpovědný za pozdní vývojovou poruchu plodu v matce. Je to 1 z 10 000 porodů, ale i tak jsou tvůrci POEM@Home na výsledek pyšní a budou dále rozvíjet analytické nástroje pro skutečnou pomoc lidem.

Zdroje:
Oficiální stránky projekt POEM at home
http://iwrwww1.fzk.de/biostruct/
Wikipedie

Autor:
Petr Nekvinda (petnek) - Czech National Team

Korektura:
Dušan Vykouřil (forest) - Czech National Team
Tomáš Pazderka (Zelvuska) - Czech National Team
Jaroslav Mikšovský (JardaM) - Czech National Team

Svůj komentář na tento článek, co by mělo být opraveno, či doplněno můžete napsat do této sekce na našem týmovém fóru. Téma s komentářem k tomuto konkrétnímu článku, by mělo nést stejný název, jako článek na webu.

Rubrika:


Nahoru