Klasifikacija plazmidov
Uvod
Potreba po klasifikaciji se je pojavila že pred vpeljavo pojma plazmid. Takrat imenovani »episomi« so bili razporejeni v tri skupine: F-plazmidi, plazmidi, ki nosijo zapis za kolicin, in tisti, ki nosijo zapis za rezistenco. Tak način klasifikacije se je hitro izkazal kot nezadosten, zato so se sproti, ob odkrivanju plazmidov različnih bakterij, razvijali novi načini razvrščanja. Klasifikacije so najprej temeljile na fenotipskih značilnostih, kot so zmožnost konjugativnega prenosa in obstoja različnih plazmidov v isti gostiteljski celici, nato na podlagi zaporedij replikonov in najnovejše na podlagi celotnih genomov plazmidov. Ob primerjavi zaporedij plazmidov se pojavi potreba po definiciji »vrst« plazmidov, ki razkriva njihove biološke značilnosti.
Postopki klasifikacije
Klasifikacija po nezdružljivosti
Klasifikacija plazmidov v različne nezdružljivostne skupine (angl. Incompatibility groups, Inc groups) temelji na eksperimentalnih opažanjih, da plazmidi s podobnim replikonom pogosto ne morejo stabilno obstajati v isti gostiteljski celici. Takšna plazmida se ob delitvi bakterije porazdelita med hčerinski celici namesto, da bi se v hčerinskih celicah njuno število ohranilo. To je posledica nerazlikovanja med replikonoma plazmidov med njuno rastjo, zato se en izmed plazmidov množi hitreje kot drug. Nezdružljivost se je določevalo na podlagi stabilnosti plazmidov, ki sta bila v bakterijo vstavljena s konjugacijo, po obdobju rasti. Eksperimentalna določitev združljivosti ni vedno jasna, saj so lahko plazmidi le delno združljivi. Prav tako ni nujno, da se bosta združljiva plazmida še vedno podvojevala in razdvojevala enako, če se en izmed njiju vstavi v bakterijski kromosom. Z lažjim dostopom do sekvenciranja in prenehanjem testiranja združjivosti zaradi zahtevnosti se je uveljavil en izmed trenutnih načinov klasifikacije; klasifikacija po replikonih ali replikonska tipizacija.
Klasifikacija po replikonih
Vsak plazmid ima vsaj eno mesto ori, zato plazmide pri replikonski tipizaciji razporejamo v skupine glede na analizo sekvence replikonov. Replikon je območje DNA ali RNA, ki se podvojuje iz enega samega mesta replikacije in ima zase značilne podvojevalne in razdvojevalne proteine. Njegovo sekvenco lahko analiziramo z orodji kot je PlasmidFinder, ki vsebuje 471 sekvenc replikonov družin Enterobacteriaceae, Staphylococcaceae, Enterococcaceae, Bacillaceae, Clostridiaceae in Lactobacillaceae. Orodje temelji na urejeni podatkovni zbirki replikonov plazmidov, namenjeni prepoznavanju plazmidov v genomskih zaporedjih bakterij. PlasmidFinder ob prepoznavanju replikonov dodeli še preučevane plazmide v skupine in poveže značilnosti skupin z obstoječimi informacijami o Inc skupinah. Uporaba baze je omejena predvsem na epidemiološko uporabo, za zaznavanje zaporedij plazmidov, ki nosijo zapise za odpornost proti antibiotikom, saj v bazo ni vključeno veliko rodov in celo nekaterih debel bakterij. Pri večreplikonskih plazmidih je zanimivo, da takšni plazmidi redko nosijo več kot en zapis za relaksazo, ki je edini skupen element pri podvajanju kompatibilnih plazmidov, kar predstavlja dobro izhodišče za klasifikacijo plazmidov po zapisu gena za relaksazo. Takšno razporejanje je ponovno omejeno in ne vključuje plazmidov, ki konjugativnega prenosa niso sposobni. Opisani klasifikaciji imata svoje omejitve, zato stremimo k boljšemu, bolj univerzalnemu načinu razporejanja plazmidov v skupine.
Genska klasifikacija
Klasifikacijo plazmidov lahko izvajamo tudi s pomočjo uporabe dendrogramov oziroma omrežij, s čimer prikažemo povezave med plazmidi, ki si delijo določene gene. Omrežja so lahko pri tem enodelna oziroma dvodelna, oboje pa opisujemo s pomočjo vozlišč in pripadajočih povezav med njimi (robov). V enodelnem sistemu, lahko z debelino povezave med vozliščema ponazorimo število skupnih genov, kar imenujemo uteženo omrežje. Med tem pa je posebnost dvodelnega omrežja dodatna skupina vozlišč, ki predstavljajo homologne proteinske skupine. V tem primeru robovi povezujejo tako vozlišča plazmidov, kot vozlišča homolognih proteinskih družin, če plazmid vsebuje gen, ki pripada obema.
Slabost opisane metode je, da temelji le na primerjavah posameznih genov in ne celotnega plazmidnega genoma. Hkrati zato ne odgovori na vprašanje ali plazmidi sploh tvorijo vrste ali zaradi visoke stopnje rekombinacije mej med plazmidi ni.
Genomska klasifikacija
Razvili so se postopki, ki temeljijo na oceni parnih razdalj med genomi tako, da zaporedja DNA najprej po dolžini razdelimo na krajša podzaporedja dolžine k, imenovana k-mer, in na podlagi teh izračunamo Jaccardov indeks (JI) oziroma unijo množice podzaporedij. Primera takih metod sta Mash in BinDash. Dobljene matrike lahko ponovno ponazorimo kot omrežja z vožlišči in robovi, pri čemer lahko vozlišča tokrat uvrščamo v skupine. Tista, ki imajo gostejše povezave znotraj skupine kot zunaj nje, opredelimo kot omrežno skupnost. Skupnosti se naprej delijo v ‘tolpe’ in ‘paratolpe’ glede na število povezav med člani v omrežju. Znotraj tolpe je značilno, da so med seboj povezani vsi plazmidi, med tem ko pri paratolpah to ni nujno.
Metode in algoritmi
pATLAS
Procesi za razvrščanje plazmidov so pomembni, saj si običajno le-ti znotraj skupnosti delijo tudi določene lastnosti. V ta namen so razvili številne metode za klasifikacijo plazmidov, med njimi tudi javno dostopen pATLAS, z vizualnimi analitičnimi orodji za raziskovanje povezav med plazmidi. Po podatkovni zbirki je omogočeno iskanje po imenu plazmida, bakterijskem sevu, prisotnosti rezistence na antibiotike, virulenci, dolžini zaporedja in podobnosti. Podatki za metodo so vzeti iz zbirke NCBI RefSeq, ki temelji na uporabi že omenjenega postopka Mash. Njegova pomanjkljivost je, da se ne ukvarja z razvrščanjem plazmidov v skupnosti oziroma kakršnokoli podrobnejšo klasifikacijo.
Plazmidne tolpe
S pomočjo postopka BinDash in algoritma OSLOM (angl. Ordered Statistics Local Optimization Method) so se nato lotili preiskovanja plazmidnih skupnosti. Plazmide so lahko uvrstili v skupaj 566 tolp, od katerih je 561 skupin vsebovalo tri ali več plazmide. 88 plazmidov je pri tem pripadalo več skupinam tolp. Tolpe so si v večini primerov delile enako bakterijsko družino in podobne gene. Rezultati so omogočili predvidevanja o horizontalnem prenosu genov (HGT) preko interakcij med posamenimi tolpami, hkrati pa so pokazali, da se tudi skupine tolp skladajo s filogenetsko hierarhijo bakterijskih gostiteljev.
MOB-suite
Eno izmed pomembnejših bioinformacijskih orodij za klasifikacijo in analizo mobilnih bakterijskih proteinov (MOB) oziroma plazmidov je MOB-suite. Temelji na postopku Mash in sestoji iz treh metod za združevanje (MOB-cluster), rekonstrukcijo (MOB-recon) in tipizacijo plazmidov (MOB-typer). MOB-recon rekonstruira posamezna zaporedja plazmidov iz genoma, ki ga zagotavlja orodje MOB-cluster. Slednji izračuna vse parne genomske razdalje za plazmide, s čimer tvori skupine plazmidov (klastre), informacije pa dobi s pomočjo orodja MOB-typer, ki ima vlogo indetifikatorja različnih tipov plazmidov.
Klasifikacija PTU
Na podlagi do sedaj omenjenih načinov klasifikacij so razvili še klasifikacijo plazmidov s pomočjo PTU (angl. plasmid taxonomy units). PTU so plazmidne taksonomske enote, skupine, ki jih tvorijo posamezni plazmidi glede na skupno povprečno identičnost nukleotidov oz. ANI (angl. average nucleotide identity). ANI je merilo za genomsko podobnost na ravni nukleotidov med kodirajočimi območji dveh genomov. Omogoča torej primerjavo celotnih genomov in ne le posameznih genov. Izračun ANI vključuje fragmentacijo dveh zaporedij genoma, ki ju primerjamo, in iskanje najboljših dvosmernih ujemanj med fragmenti. Ti morajo imeti vsaj 70-odstotno identičnost nukleotidov in 70-odstotno pokritost krajšega izmed zaporedij. V PTU so prisotni plazmidi brez nezdružljivostne skupine (Inc) ali dodelitve replikona v PlasmidFinder-ju, v kolikor jih ta ne zazna. Posledično je znotraj posamezne PTU pogosta variabilnost replikonskih zaporedij. Replikonska zaporedja, ki jih lahko najdemo v PlasmidFinder-ju, so namreč lahko omejena na eno PTU z značilnim replikonom, lahko se isti replikon nahaja v različnih PTU ali pa PTU vsebuje replikon, ki ga v PlasmidFinder-ju sploh ni. To pomeni, da isti replikon v PlasmidFinder-ju ni nujen pogoj za ohranjanje visoke splošne genomske identičnosti.
Med plazmidi je pričakovana združljivost, če so pripadniki iste PTU, čeprav imajo različne replikone. Če imajo plazmidi, ki so pripadniki iste PTU, isto zgradbo replikona, se uporabi strožji prag pokritosti oz. ujemanja, da ne pride do večkratnih poravnav na različnih zaporedjih replikona. Če imajo plazmidi različne replikone, a pripadajo istemu PTU, pomeni, da lahko plazmidi iste PTU sobivajo v istem gostitelju. Nastanek novih PTU omogočajo prehodi plazmidov glede na njihovo mobilnost, npr. iz konjugativnih plazmidov v mobilne, saj so povezani s spremembami v naboru genov. Te spremembe vključujejo izgubo mesta konjugacije in zamenjavo vrste replikacije. V določeni PTU so plazmidi, ki imajo drugačno vrsto mobilnosti, bolj ohlapno povezani z drugimi plazmidi te PTU, kar pomeni, da so v omrežju vzpostavili manj povezav.
Gostiteljska območja
Na podlagi klasifikacije PTU in podatkov o bakterijskih gostiteljih plazmidov PTU, je bila uvedena šeststopenjska lestvica gostiteljskega območja. Ta temelji na znanstveni klasifikaciji živih bitij v vrsto, rod, družino, red, razred, deblo, kraljestvo in domeno. Kot omenjeno je lestvica razdeljena na šest razredov, kjer razred I predstavlja PTU, katerih pripadniki so prisotni le v izolatih iste bakterije, razred VI pa pripadnike, ki so lahko prisotni v različnih razredih pripadajočega taksonomskega debla bakterije. Večina mobilnih in konjugativnih PTU je razdeljenih v razred III, saj so se pripadniki sposobni nahajati v bakterijah različnih rodov iste taksonomske družine. Večina nemobilnih PTU pa je omejenih na razreda I ali II, saj so prisotni v isti vrsti ali rodu. Ko je vsaki PTU dodeljena stopnja gostiteljskega območja, je mogoče odkriti potencialne poti izmenjave plazmidov glede na bakterijsko taksonomijo.
PTU imajo torej značilne gostitelje in pogosto posebne genetske determinante, kot so dejavniki virulence ali geni za odpornost proti antibiotikom. To s pomočjo genomskega sekvenciranja omogoča sledenje širjenju plazmidov v bakterijskih populacijah.
Zaključek
Od prvih poskusov razvrščanja do sodobnih genomskih analiz se je razvilo veliko novih metod, algoritmov in programov za klasifikacijo plazmidov. Zaradi njihove kompleksnosti in variabilnosti razvrščanje še ni popolnoma dokončano. Nadaljnje raziskave na tem področju so zato bistvenega pomena za izboljšanje razumevanja plazmidov, njihovih medsebojnih povezav in vlog v različnih bioloških procesih.
Viri
[1] M. P. Garcillán-Barcia, S. Redondo-Salvo, in F. De La Cruz, “Plasmid classifications,” Plasmid, let. 126, str. 102684, maj 2023, doi: 10.1016/j.plasmid.2023.102684.
[2] A. Carattoli idr., “In Silico Detection and Typing of Plasmids using PlasmidFinder and Plasmid Multilocus Sequence Typing,” Antimicrob Agents Chemother, let. 58, št. 7, str. 3895–3903, jul. 2014, doi: 10.1128/AAC.02412-14.
[3] T. S. Jesus, B. Ribeiro-Gonçalves, D. N. Silva, V. Bortolaia, M. Ramirez, in J. A. Carriço, “Plasmid ATLAS: plasmid visual analytics and identification in high-throughput sequencing data,” Nucleic Acids Research, let. 47, št. D1, št. D188–D194, nov. 2018, doi: 10.1093/nar/gky1073.
[4] J. A. Robertson in J. H. E. Nash, “MOB-suite: software tools for clustering, reconstruction and typing of plasmids from draft assemblies,” Microbial Genomics, let. 4, št. 8, aug. 2018, doi: 10.1099/mgen.0.000206.
[5] S. Redondo-Salvo idr., „COPLA, a taxonomic classifier of plasmids“, BMC Bioinformatics, let. 22, št. 1, str. 390, dec. 2021, doi: 10.1186/s12859-021-04299-x.