Cvičení k druhé půli přednášky PB051 -- analýza biologických sítí

Cvičení 1.1 (statická analýza, intergace dat) [5b]

Stáhněte si soubor obsahující data genové interakční sítě E. Coli. Uzly odpovídají jednotlivým genům a orientované hrany signalizují vazbu proteinu zdrojového genu na cílový gen. (Zdrojem je regulondb, soubor byl využíván na přednáškách v 7.týdnu.) Ze sítě vyberte gen flhCflhD a vytvořte podsíť zahrnující tento uzel, jeho sousední uzly a všechny jejich sousedy. S touto podsítí budete dále pracovat.

Z Gene Ontology (GO) stáhněte aktuální soubor anotačních dat specifických pro E. coli. Tyto soubory jsou k disposici zde. Jedná se o anotační mapu prověřenou v relevanci k příslušnému živočišnému druhu. Soubor použijte jako interface k importu GO anotačních atributů k uzlům sítě E. Coli.

Pomocí pluginu BINGO (kategorie Functional enrichment) zjistěte statistickou míru nadreprezentace jednotlivých anotačních GO termů typu "GO_Biological_Process" v analyzované síti. Nejprve jako referenční množinu statistického testu zvolte kompletní anotační strom. Test opakujte s omezením na relevantní anotační podstrom jako referenční množinu, výsledky porovnejte. Vytvořte tabulku shrnující výsledky obou testů pro každý zahrnutý GO proces (výsledky lze vhodně vizualizovat koláčovým grafem).

Hint: Tutoriál Cytoscape.

Analýzu opakujte pro síť vytvořenou z genu crp a všech jím bezprostředně regulovaných genů.