Struktura in delovanje sistema CRISPR/Cas pri bakteriji Streptococcus pyogenes
UVOD
Mnoge bakterije in arheje vsebujejo mehanizem, ki jim omogoča zaščito pred tujo DNA. Služi jim kot imunski sistem, s katerim po okužbi z virusom ali plazmidom pridobijo imunost zanj tako, da tujo DNA vstavijo v svoj genom. Ob ponovni okužbi lahko bakterija uporabi to pridobljeno imunost, da uniči tujo DNA. Ta mehanizem omogočajo območje CRISPR (clustered regularly interspaces short palindromic repeats) in Cas (CRISPR associated) proteini [1].
Streptococcus pyogenes
Streptococcus pyogenes je grampozitivna patogena bakterija, ki okuži človeka. Patogenost se razlikuje med posameznimi sevi – povzročajo različne bolezni, nekateri pa sploh niso patogeni. Patogenost je namreč odvisna od virulentnih faktorjev, ki jih bakterija vsebuje. Nekatere virulentne faktorje (npr. eksotoksine) so določeni sevi pridobili s horizontalnim prenosom ob okužbi z bakteriofagom. Evolucijski razvoj te bakterije je torej močno povezan z bakteriofagi [2].
Lizogeni bakteriofagi bakterijo lahko okužijo, saj le-ta v svojem lokusu CRISPR/Cas ne vsebuje vmesnikov, ki bi se ujemali z DNA teh bakteriofagov. Virus torej lahko integrira svojo DNA v bakterijski genom. Tako bakterija pridobi nove gene, med katerimi so lahko tudi virulentni faktorji. S tem pa pridobi oziroma poveča svojo patogenost [2].
Proti litičnim bakteriofagom pa bakterija ima ustrezne vmesnike. Ko bo torej tak bakteriofag okužil bakterijo, bo le-ta s pomočjo mehanizma CRISPR/Cas9 uničila tujo DNA in preprečila lizo celice [2].
SISTEM CRISPR/Cas TIPA II-A
Poznamo tri glavne tipe CRISPR/Cas sistema – tip I, II in III, ki pa se delijo še na več podtipov. Streptococcus pyogenes vsebuje gene sistemov tipa I-C in tipa II-A. Mehanizem tipa II-A v tej bakteriji je eden najbolj raziskanih CRISPR/Cas mehanizmov, za mehanizem tipa I-C pa ni znano, ali se v tej bakteriji sploh izraža [2].
Za delovanje CRISPR/Cas sistema v Streptococcus pyogenes je ključen lokus CRISPR/Cas II-A, ki vsebuje zapis za transaktivirajočo CRISPR RNA (tracrRNA), operon cas in območje CRISPR [2].
Operon cas zapisuje za štiri strukturne gene. Prvi v operonu v smeri od 5' proti 3' je gen za Cas9, to je multiencimska endonukleaza, ki velja za prepoznavno značilnost sistemov tipa II. Sledijo še trije geni za Cas1, Cas2 ter Csn2 [2].
Navzdol od operona cas (proti 3'-koncu kodirajoče verige) je območje CRISPR (pogosto tudi imenovano »repeat-spacer array«). Slednje vsebuje več kratkih ponovitvev (angl. repeat), med katerimi so interkalirana kratka zaporedja imenovana vmesniki (angl. spacer), ki izvirajo iz tuje DNA. Le nekatere ponovitve so palindromne. Različni sevi Streptococcus pyogenes imajo različno število ponovitev in vmesnikov, v splošnem pa jih imajo manj kot ostale bakterije iz istega rodu (npr. sev SF370 vsebuje sedem ponovitev in šest vmesnikov). Med sevi variiajo tudi sekvence vmesnikov, iz tega lahko sklepamo, da se stari vmesniki izbrišejo. Območje CRISPR ima en z AT baznimi pari bogat promotor, ki ga imenujemo vodeče zaporedje (angl. leader). Območje CRISPR se prepiše v eno prekurzorsko CRISPR RNA molekulo (pre-crRNA) [2], [3].
Navzgor od operona cas (proti 5'-koncu kodirajoče verige) je nekodirajoči tracrRNA gen, ki se prepisuje v nasprotni smeri kot operon cas in območje CRISPR. Dva primarna transkripta lahko nastaneta s prepisovanjem tega gena (vsebuje dva promotorja s skupnim terminatorskim mestom), in sicer 171 nukleotidov dolga tracrRNA ali 89 nukleotidov dolga tracrRNA. Obe vsebujeta na 25 nukleotidov dolgo komplemantarno zaporedje s ponovitvami na pre-crRNA. Ostali del tracrRNA tvori sekundarno strukturo (lasnične zanke), ki interagira s Cas9 [4].
MEHANIZEM
Mehanizem CRISPR/Cas9 tipa II-A lahko razdelimo na tri stopnje: adaptacijo, biogenezo crRNA in interferenco. Najpomembnejši protein tega mehanizma je protein Cas9, ki tudi sodeluje v vseh treh stopnjah [2].
ADAPTACIJA
Adaptacija se prične, ko pride bakterija v stik z bakteriofagom, ki se nanjo adsorbira in vanjo injicira svojo fagno DNA. Bakterija nato na njej prepozna določeno zaporedje, ki mu pravimo protovmesnik, ga izreže iz fagne DNA (od tu naprej se to zaporedje imenuje le še vmesnik) ter vstavi v območje CRISPR. Ta proces ni naključen, saj se izrežejo le tisti protovmesniki, katerim navzdol po verigi sledi evolucijsko zelo ohranjeno zaporedje. To zaporedje se imenuje PAM (angl. protospacer adjacent motif), njegovo zaporedje v Streptococcus pyogenes pa je 5'-NGG-3', kjer N predstavlja poljubni nukleotid [5].
Bakterija je za ta proces specifične selekcije razvila poseben mehanizem, kjer sodeluje pet makromolekul, in sicer proteini Cas9, Cas1, Cas2 in Csn2 ter ribonukleinska kislina tracrRNA. Cas9 je pomemben za selekcijo pravilnih protovmesnikov, saj vsebuje vezavno mesto za zaporedje PAM, Cas1 deluje kot endonukleaza, tracrRNA pa se veže na Cas9 ter ga pretvori iz neaktivne apo oblike v aktivno holo obliko. Specifična funckija proteinov Cas2 in Csn2 še ni znana, vendar sta tudi ključnega pomena, saj brez njiju vstavljanje novih vmesnikov ne poteka [5].
Ko pride bakterija v stik s tujo DNA, se tvori kompleks Cas9–Cas1–Cas2–Csn2, v katerem je dimeriziran Cas1 povezan s Cas9, dvema Cas2 ter tertamerno obliko Csn2. Kompleks nato pripotuje do tuje DNA in se nanjo pritrdi s Cas9, ki prične z iskanjem zaporedja PAM. Ko ga najde, pošlje signal do Cas1 in mu sporoči, kje naj prične z izrezovanjem novega vmesnika. Cas1 tako z endonukleazno aktivnostjo iz tuje DNA izreže nov vmesnik, ki se za konec preko še neznanega mehanizma vgradi na 5' konec območja CRISPR [5].
Trenutno obstajata dva modela adaptacije. Prvi se imenuje »cut and paste« in temelji na zgoraj opisanem postopku, drugi pa se imenuje »copy and paste«. Pri slednjem je Cas1 odgovoren za procese, ki se nahajajo navzdol od protovmesnika, medtem ko Cas9 s pomočjo zaporedja PAM označi mesto, kjer se prične translacija protovmesnika v vmesnik [5].
BIOGENEZA crRNA
Za prepoznavanje in nato uničenje tuje DNA Cas9 potrebuje RNA, ki vsebuje vmesnik na 5'-koncu in ponovitev na 3'-koncu, rečemo ji CRISPR RNA (crRNA). Pri biogenezi crRNA sodelujejo Cas9, tracrRNA in RNaza III [4].
Ponovitve in vmesniki se prepišejo v eno 511 nukleotidov dolgo pre-crRNA. Na vsako ponovitev se s parjenjem komplementarnih baz veže eden izmed primarnih transkriptov tracrRNA, tvori se kratek del dvoverižne RNA. Cas9 tvori interakcije z lasničnimi zankami tracrRNA, nastane kompleks Cas9–tracrRNA–pre-crRNA. Cas9 pri tem stabilizira dvoverižno RNA [1].
Deltcheva in sod. so opazili, da procesirani crRNA in tracrRNA kompleksi vsebujejo za RNazo III značilen previs na 3'-koncu, noben od proteinov Cas pa ne vsebuje ustrezne domene za tako cepitev. Nadaljnji poskusi so pokazali, da nastali kompleks Cas9–tracrRNA–pre-crRNA prepozna endogeno prisotna RNaza III in nato cepi pre-crRNA ter tracrRNa v predelu, kjer tvorita dvoverižno RNA. S to cepitvijo se sprostijo posamezni crRNA vezani na Cas9 preko tracrRNA. Gre torej za koprocesiranje, pri katerem nastane 75 nukleotidov dolga tracrRNA in 66 nukleotidov dolga crRNA. Sledi še krajšanje 5'-konca crRNA, ni pa še znano, kateri encimi so odgovorni za to. Zrela crRNA je dolga 39-42 nukleotidov. Nastali ribonukleoproteinski kompleks je pripravljen za naslednjo fazo – interferenco [4].
INTERFERENCA
Pred vezavo kompleksa crRNA–tracrRNA je Cas9 v apo stanju in ima takšno konformacijo, da ne more specifično prepoznati sekvence na tuji DNA – je neaktiven. Vezava tega kompleksa pa povzroči veliko konformacijsko spremembo proteina, ki mu omogoči, da lahko specifično prepozna sekvenco PAM [1].
Proces interference se začne z iskanjem sekvence PAM na tuji DNA. V genomu bakterije te sekvence ni in tako se bakterija obvaruje pred tem, da bi Cas9 razcepil bakterijsko lastno DNA. Holo-Cas9 torej najprej poišče sekvenco PAM, ki se veže v PAM-vezavno domeno proteina. Dva arginina iz PAM-vezavnega mesta se vežeta na dva gvanina iz sekvence PAM. Ob tem pride do še ene konformacijske spremembe, ki omogoči denaturacijo DNA. Dvojna vijačnica se razklene takoj za sekvenco PAM na 5'-koncu, tarčna veriga (to je veriga ki ne vsebuje sekvence PAM) pa se zarotira proti crRNA. Zdaj lahko pride do komplementarnega parjenja baz med crRNA in protovmesnikom. Če ti dve zaporedji nista komplementarni, se ribonukloproteinski kompleks sprosti z DNA in poišče novo sekvenco PAM ter nato preveri komplementarnost med crRNA in protovmesnikom. To se ponavlja, dokler ne pride do protovmesnika, ki je komplementaren crRNA. Takrat nastane hibrid RNA:DNA iz crRNA in tarčne sekvence na tuji DNA, ostane pa prosta ne-tarčna veriga DNA. Tej strukturi rečemo R-zanka in je signal za cepitev tuje DNA [2].
Za cepitev tuje DNA sta pomembni dve domeni proteina Cas9 – domeni HNH in RuvC. To sta endonukleazni domeni, ki prerežeta vsaka eno verigo DNA. Domena HNH cepi tarčno verigo (to je veriga, ki vsebuje protovmesnik), domena RuvC pa cepi ne-tarčno verigo [1].
Med nastajanjem R-zanke se Cas9 konformacijsko spremeni tako, da prideta domeni HNH in RuvC na pravi poziciji, da cepita tarčno DNA – tarčna veriga je v aktivnem mestu domene HNH, ne-tarčna veriga pa v aktivnem mestu domene RuvC. To je popolnoma aktiven Cas9, ki razcepi fosfodiestrsko vez na obeh verigah tuje DNA znotraj protovmesnika, in sicer 3 bazne pare stran od sekvence PAM. Po cepitvi nastanejo topi konci, Cas9 pa ostane vezan na tujo DNA [1].
UPORABA V GENSKEM INŽENIRINGU
Sistemi CRISPR/Cas zaradi svoje učinkovitosti ter možnosti manipuliranja predstavljajo velik potencial na področju genskega inženiringa. Med vsemi tipi sistemov CRISPR/Cas je najbolj obetaven ravno tip II-A, saj zanj potrebujemo le tri komponente, Cas9, tracrRNA in crRNA. Poleg tega je možno tracrRNA in crRNA združiti v eno samo molekulo RNA, ki se imenuje sgRNA (angl. single-guide RNA), kar stvari še toliko bolj poenostavi [2].
V kolikor poznamo sekvenco DNA, na kateri želimo delati, lahko naredimo tako sgRNA, ki bo sporočila proteinu Cas9, da opravi razcep fosfodiestrske vezi na tarčnem delu DNA. Pri tem moramo biti pozorni, da je zraven našega željenega zaporedja prisoten PAM, sicer Cas9 tam ne bo cepil DNA. Sedaj lahko tarčno DNA modificiramo na več načinov. V primeru, da pustimo obe endonukleazni domeni (RuvC in HNH) aktivni, bodo po dvoverižni cepitvi nastopili nehomologni popravljalni mehanizmi (NHEJ), kar vodi do kratke insercije ali delecije na mestu cepitve in gen se ne bo mogel več izražati (angl. gene knock-out). Lahko pa dodamo homologni fragment DNA, ki se od tarčne sekvence razlikuje le v enem nukleotidu. V tem primeru pride do homolognega popravljanja (HDR) in naša željena mutacija se bo vstavila v gen. Cas9 lahko tudi dodatno mutiramo tako, da mu inaktiviramo eno ali obe endonukleazni domeni. V prvem primeru tako pride le to enoverižnih cepitev, kar poveča možnost za homologno popravljanje, v drugem primeru pa lahko na neaktivni Cas9 dodamo kakšen drug encim (npr. histon acetilazo) in s tem epigenetsko modificiramo željene gene [2].
Kljub veliko prednostim, ki jih CRISPR/Cas ima za genski inženiring, pa ima tudi nekaj omejitev. Najbolj očitni sta: pogoj, da mora gen vsebovati PAM, kar zmanjša število genov, na katerih lahko delujemo, ter tudi splošna večja kompleksnost evkariontskih celic napram prokariontskim [2].
LITERATURA
- [1] F. Jiang and J. A. Doudna, “CRISPR–Cas9 Structures and Mechanisms,” Annu. Rev. Biophys., vol. 46, no. 1, pp. 505–529, May 2017.
- [2] J. J. Ferretti, D. L. Stevens, and V. A. Fischetti, Streptococcus pyogenes. University of Oklahoma Health Sciences Center, 2016.
- [3] T. Nozawa et al., “CRISPR inhibition of prophage acquisition in Streptococcus pyogenes.,” PLoS One, vol. 6, no. 5, p. e19543, May 2011.
- [4] E. Deltcheva et al., “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III,” Nature, vol. 471, no. 7340, pp. 602–607, Mar. 2011.
- [5] R. Heler et al., “Cas9 specifies functional viral targets during CRISPR–Cas adaptation,” Nature, vol. 519, no. 7542, pp. 199–202, Mar. 2015.