Integration of multiple omics datasets

From Wiki FKKT
Jump to navigationJump to search

ČLANEK: http://www.plosgenetics.org/article/info%3Adoi%2F10.1371%2Fjournal.pgen.1003485

The Genome Organization of Thermotoga maritima Reflects Its Lifestyle


UVOD

V zadnjem času, se pri identificiranju genomskih lasnosti, kot so npr. genske anotacije, v večjem obsegu uporabljajo sekvence organizmov in bioinformatična orodja. Vendar, nam in silico predikcije ne detektirajo vseh genomskih značilnosti. V ta namen je bila razvita metodologija, ki združuje podatke posameznih organizacijskih stopenj (genomike, transkriptomike in proteomike) z bioinformatičnimi orodji. Tako imenovana multi-omska analiza nam omogoča z veliko natančnostjo določiti genomske lasnosti kot so promotorji, neprevedene regije (UTR), ribosom vezavna mesta (RBS) in nekodirajoče RNA. Te metodologije so se posluževali tudi pri določitvi organizacije genoma bakterije Thermotoga maritima. Posebnost te hipertermofilne bakterije je v dejstvu, da posreduje lasnosti zgodnjih mikroorganizmov in tako predstavlja dober organizem za študij evolucijske preteklosti.


METODE

Genom T. maritima so sekvencirali z uporabo Illumina sekvenatorja. Osnovni princip Illumina tehnologije je sledeč: Priprava knjižnjice fragmentov DNA, na konce katerih se ligira dvoje adaptorjev. Enoverižni fragmenti se nato vežejo na neko trdno podlago, na kateri so že predhodno ligirani oligonukleotidi. Ti oligonukleotidi so komplementarni adaptorjem na DNA, zato se ta upogne in tvori tako imenovane "mostove". V reakcijsko komoro dodamo reagente, fluorescentne nukleotide in polimerazo. S ponavljajočo denaturacijo in podaljševanjem se zgodi lokalna amplifikacija, pri čemer detektiramo ustrezen signal.

Začetna mesta transkripcije (TSS) so določili s modificirano obliko 5'-RACE metode. Tu se preko reverzne transkripcije mRNA pretvori v cDNA, čemur sledi PCR amplifikacija. Dobljene kopije se nato sekvencira, podatke pa karitra na genomske koordinate. 5'-konci branj so bili definirani kot potencialna začetna mesta transkripcije.

Transkriptom so določili z dUTP metodo RNA sekvenciranja (RNA-seq). Pri tej metodi se pri sintezi druge cDNA verige, timin zamenja s uracilom. Sledi fragmentacija DNA in ligacija adaptorjev v obliki Y. Uracil DNA glikozilaza razgradi uracil vsebujočo verigo. Zaradi Y oblike adaptorjev so vse molekule sekvencirane v isti smeri, kar pomeni, da se informacija o polarnosti RNA molekule ohrani.

Proteom so določili s tekočinsko kromatografijo sklopljeno s tandemsko masno spektroskopijo (LC-MS/MS).


REZULTATI

Genom T. maritima je sestavljen iz 1,869,612 bp. Po primeravi anotacij iz te multi-omske analize z anotacijami iz podobne predhodne raziskave, v kateri so uspeli anotirati 1858 genov, so dobili končno število in sicer 1893 protein-kodirajočih genov. Obstajale so tudi razlike v dolžini genov, saj se je v primerjavi s prejšnimi podatki, kar 370 genov razlikovalo v dolžini. Te razlike v dolžini genov, so večinoma bile zaradi napak v določitvi start kodona. Določili so 748 transkripcijskih enot s 676 TSS. Večina transkripcijskih enot je vsebovalo zapis za več genov s povprečjem 3.3 gena na transkripcijsko enoto. Identificirali so tudi 46 tRNA, 3rRNA in 8 CRISPR kaset. Pri iskanju promotorskih motivov so identificirali zelo ohranjeno konsenzno sekvenco za hišni sigma faktor RpoD. RpoD motiv ima 3 značilne promotorske elemente: (-10) heksamer, (-35) heksamer in 5’TGn element navzgor od (-10) heksamera. Razdalja med TSS in 3’-koncem (-10) elementa je 7 bp, kar je podobno kot pri E. coli. Ugotovili so tudi, da ima T. maritima med 7 drugimi mikroorganizmi najbolj ohranjene promotorje s povprečjem 10.2 bita informacije. To pa tudi pomeni, da ima najmočnejše promotorje. Identificirali so tudi ribosom vezavna mesta z močno vezavno prosto energijo, ki so v skladu z iniciacijo translacije pri 80°C. Ugotovili so, da ima T. maritima dvo-modelno porazdelitev 5’-UTR regij. Večina transkripcijskih enot ima 5’-UTR regije dolge 26-32 nt ter 11-17 nt. Prav tako je bilo ugotovljeno, da večina T. maritima PIR (promoter-containing intergenic region) regij ne vsebuje dovolj prostora za vezavo transkripcijskega faktorja. Transkritomski podatki so pokazali, da je genom T.maritima izjemo aktiven, neodvisno od pogojev rasti. Več kot 90% vseh genov je vedno izraženih, kar je v primerjavi z drugimi bakterijami veliko. Našli so tudi tesno povezavo med količino mRNA in količino proteinov. Ta korelacija je močnejša kot tista v podobnih študijah drugih bakterij.


ZAKLJUČEK

Multi-omska raziskava hipertermofilne bakerijeT. maritima je razkrila značilnosti življenja pri visokih temperaturah. Primer je visoka ohranjenost sekvence promotorjev in RBS, kar lahko pripišemo potrebi po ohranitvi visoke ekspresije genov pri ekstremnih pogojih. Vendar so nadalnje raziskave še vedno potrebne, še posebaj pričakovane so študije evolucijske poti mikrobnega življenja.


VIRI

1. Haythem Latif et al. “The genome organization of thermotoga maritima reflects its lifestyle”, PLOS Genetics, Vol. 9, Issue 4, e1003485, (2013)