Mehanizem delovanja kompleksa Cascade in sistem CRISPR/Cas pri E. coli
Uvod
Tako kot mnogi ostali prokarionti tudi E. coli pridobiva odpornost proti bakteriofagom z vgraditvijo kratkih fragmentov fagne DNA v lastno DNA. Ti odseki na bakterijski DNA se imenujejo CRISPR, oziroma gruče enakomerno prekinjenih kratkih palindromnih ponovitev (ang: »clustered regularly interspaced short palindromic repeats«), in skupaj z geni za proteine Cas predstavljajo bakterijski imunski sistem CRISPR/Cas tipa 1-E. Pri E. coli ima ključno vlogo 8 različnih Cas proteinov. Od tega jih 5 sestavlja kompleks Cascade. Cilj obrambnega sistema je prepoznati tujo DNA in jo s pomočjo Cas endonukleaz razrezati na manjše fragmente. V splošnem sistem CRISPR/Cas deluje v 3 korakih:
1. ADAPTACIJA: proteini Cas prepoznajo tujo DNA in jo vključijo v CRISPR.
2. BIOSINTEZA: sinteza proteinov Cas in transkripcija CRISPR.
3. INTERFERENCA: uničenje tuje DNA.
Lokus CRISPR
Kromosom E. coli vsebuje 2 lokusa CRISPR, imenovana CRISPR-I in CRISPR-II. Glavne strukturne značilnosti lokusa so vodilno zaporedje, vmesniki in ponovitve. CRISPR-I vsebuje 13 vmesnikov, CRISPR-II pa le 6. K lokusu CRISPR-I spadajo tudi geni cas.
8 genov cas, ki zapisujejo proteine Cas, se nahaja navzgor od vodilnega zaporedja na lokusu CRISPR-I in si od 5' proti 3' koncu po vrsti sledijo: cas3, cse1, cse2, cas7, cas5, cas6e, cas1 in cas2. Cas3 ima lasten promotor, medtem ko so ostali geni cas del istega operona, ki ga negativno regulira protein H-NS. Cas3 je endonukleaza in helikaza. Njena glavna naloga je cepitev in razgraditev tuje DNA. Cas1 in Cas2, obe endonukleazi, tvorita kompleks, ki lahko v bakterijsko DNA vgradi del tuje DNA. Ostali proteini Cas tvorijo kompleks Cascade.
Navzdol od vodilnega zaporedja na obeh lokusih sledi območje CRISPR, sestavljeno iz izmenjavajočih se vmesnikov in ponovitev, ki so delno palindromske. Vmesniki izvirajo iz fagne DNA in predstavljajo imunost proti posameznim bakteriofagom, saj se po prepisovanju v pre-crRNA in procesiranju v crRNA vgradijo v kompleks CRISPR. S pomočjo crRNA kompleks prepozna tujo DNA, ki je komplementarna vmesnikom (protovmesniki) in vsebuje prepoznavno zaporedje PAM (ang: »protospacer adjacent motif«).
Sistem CRISPR/Cas pri E. coli se uvršča v tip 1-E, za katerega je značilna prisotnost genov cse1 in cse2 ter odsotnost gena cas4.
Kompleks Cascade in procesiranje crRNA
Cascade je ribonukleoproteinski kompleks, ki ga sestavljajo proteini Cas in crRNA. Ti proteini so Cse1, Cse2, Cas7, Cas5e in Cas6e v stehiometričnem razmerju 1:2:6:1:1, skupaj s pre-crRNA pa se iz lokusa CRISPR prepisujejo v procesu biosinteze. Celoten kompleks enajstih podenot ima značilno obliko morskega konjička.
Vsaka izmed proteinskih podenot ima specifično funkcijo:
- Cse1 prepozna zaporedje PAM na tuji DNA, tvori interakcije s 5' koncem crRNA in veže Cas3.
- Cse2 ne tvori interakcij s crRNA, pomaga pa pri sestavljanju kompleksa, saj tvori interakcije s Cse1, Cas7 in Cas5e.
- Vsaka izmed šestih podenot Cas7 vsebuje žleb s pozitivno nabitimi aminokislinskimi ostanki, v katere se lahko skrije vsaka šesta baza crRNA. Posledično te baze ne morejo tvoriti interakcij z bazami na tuji DNA, kar zmanjša specifičnost kompleksa.
- Cas5e zasidra 5' konec crRNA v kompleks.
- Cas6e procesira pre-crRNA v crRNA in njen 3' konec zasidra v kompleks.
Prepisana pre-crRNA vsebuje več vmesnikov in ponovitev. Zaradi palindromskega zaporedja v ponovitvah se lahko v pre-crRNA vzpostavijo bazni pari in pride do nastanka lasnične zanke, ki jo Cas6e cepi na 3' koncu. S tem nastane zrela 61 nukleotidov dolga crRNA, na kateri je vmesnik (32 nt) obdan z deli palindromskih ponovitev: krajšim delom na 5' koncu in lasnično zanko na 3' koncu. Podenota Cas6e po obdelavi ostane vezana na 3' konec crRNA, ni pa še znano, ali je tekom procesiranja že vključena v Cascade. V kompleksu Cascade tvori interakcije s crRNA devet od enajstih podenot, postavljena je pa tako, da sta 5' konec in lasnična zanka vpeta med proteina Cas5e in Cas6e.
Brouns in sodelavci so v raziskavi iz leta 2008 dokazali, da pri samem procesiranju pre-crRNA sodeluje le Cas6e podenota. Poskuse so opravili na E. coli seva K12 in bakterijam izbili gene za posamezne podenote. Zrelo crRNA so zaznali le v bakterijah, ki so imele gen cas6e. Ugotovili so tudi, da Cas6e za svoje delovanje ne potrebuje dvovalentnih kovinskih kationov ali ATP, prav tako pa lahko pre-crRNA cepi neodvisno od ostalih podenot. Ko so Cas6e primerjali z ostalimi proteini iz njegove družine, so ugotovili, da vsebuje dobro ohranjen His20, ki je verjetno vključen v samo katalizo cepitve pre-crRNA, ni pa nujno potreben za izgradnjo kompleksa. Če so ta aminokislinski ostanek zamenjali z Ala, se je kompleks Cascade vseeno sestavil, crRNA pa ni nastala.
Vezava kompleksa Cascade na DNA
Cascade se na DNA veže na več načinov. Zaradi para zank bogatih z lizini na dveh izmed podenot Cas7 se lahko z nespecifičnimi elektrostatskimi interakcijami veže na negativno nabito ogrodje DNA, poleg tega pa je za delovanje kompleksa bistvenega pomena vezava na protovmesnik (zaporedja komplementarna vmesnikom na crRNA) in PAM. PAM so trije nukleotidi neposredno ob protovmesniku, s katerimi v malem žlebu interagira podenota Cse1, in so bistvenega pomena za ločevanje bakteriji tuje in lastne DNA. Za interakcije s PAM so ključni trije strukturni vzorci na N-koncu Cse1: lizinski prst, glicinska zanka in glutaminska zagozda. Izmed 64 možnih kombinacij na mestu PAM jih le majhno število tvori optimalne vezave s Cse1. V primeru, da je interakcija med PAM in Cse1 ugodna, lahko podenota s konformacijsko spremembo povzroči destabilizacijo in razklenitev tarčne DNA, tako da se lahko crRNA približa eni od verig. V primeru komplementarnosti vmesnika in tarčne DNA, se vezava kompleksa okrepi in omogoči nadaljevanje imunskega odziva CRISPR/cas, izpodrinjena veriga DNA pa tvori značilno zanko R.
Chaoyou Xue in sodelavci so leta 2017 v E. coli proučevali mehanizme, s katerimi se lahko Cascade veže na DNA. Uporabili so metodo FRET, kjer so s fluorescenčnim »donorjem« (Cy3) označili DNA v bližini tarčnega zaporedja, z »akceptorjem« (Cy5) pa podenoto Cas5e kompleksa Cascade. Metoda temelji na pojavu, kjer fluorescenca določene valovne dolžine donorskega označevalca vzburi akceptorski označevalec, če je ta dovolj blizu. Akceptorski označevalec nato fluorescira z drugo valovno dolžino, kar signalizira približanje označevalcev. Označevalca sta bila nameščena tako, da nista ovirala vezave Cascade na DNA, zaradi učinka FRET pa sta omogočala detekcijo vezave kompleksa.
V raziskavi so delali z molekulo DNA, ki je vsebovala popoln komplement uporabljenemu vmesniku in eno izmed ugodnih zaporedij PAM. Ugotovili so, da je v 20 % primerov prišlo do močne in dolgotrajne vezave, kjer je učinek FRET trajal tudi do 190 sekund, sicer pa so bile vezave krajše in najverjetneje poledica nespecifične interakcije ali nepopolne tvorbe zanke R. Nadaljnji eksperimenti z drugimi crRNA in DNA so pokazali, da se tudi v primeru, ko DNA ne vsebuje protovmesnika, Cascade lahko kratkotrajno veže. Ta pojav so povezali s prisotnostjo ugodnih PAM v DNA, saj je bilo takšnih vezav znatno manj v primeru, ko so delali z DNA brez PAM. Njihov končni model predpostavlja, da Cascade naključno »skenira« DNA s pomočjo nespecifičnih elektrostatskih interakcij, se upočasni in bolje veže ob prisotnosti PAM, do močne in trajne interakcije pa pride ob ujemanju vmesnika s protovmesnikom.
Interferenca in adaptacija, ki temelji na recikliranju ostankov tuje DNA po razgradnji s Cas3
Zdaj vemo, kako Cascade prepozna tujo DNA. Vprašajmo se, kaj sledi? Poznamo dva mehanizma.
Pri interferenci vzpostavitvi R-zanke sledi vpoklic Cas3. To je protein sestavljen iz treh domen, ki imajo helikazno in nukleazno aktivnost. Od ATP odvisna helikazna domena razvije izpodrinjeno verigo, nukleazna domena na C-koncu jo cepi, nato pa od Mg2+ odvisna HD-nukleazna domena do konca uniči ssDNA. Izpodrinjena veriga je tako uničena, ostane le še tarčna veriga. Mehanizem njenega uničenja zaenkrat še ni pojasnjen, obstaja le nekaj domnev, zagotovo pa vemo, da je na ta način prepisovanje tuje DNA onemogočeno in obramba uspešno izvedena.
Adaptacija, ki temelji na recikliranju ostankov tuje DNA po razgradnji s Cas3 (ang: »Primed adaptation«), pa z vpoklicem Cas1-Cas2 kompleksa poskrbi za vstavitev novega vmesnika v lokus CRISPR. Preden razložimo, kako se to zgodi, pa si poglejmo še nekaj dejstev. Še do pred nedavnim so bili znanstveniki prepričani, da v celici poteka ali adaptacija ali interferenca. Po raziskavah opisanih spodaj pa danes vemo, da ta trditev ne drži povsem.
Izkazalo se je, da je ključna determinanta, ki določa način nadaljnjega poteka obrambnega mehanizma interakcija med PAM in Cse1. PAM je sestavljen iz treh nukleotidov, kar pomeni, da obstaja 64 različnih možnosti tega zaporedja.
Že dalj časa vemo, da Cse1 specifično prepozna PAM sestavljen iz AAG. Temu sledi močna interferenca. Vendar pa tudi drugačni PAM sprožijo določen odziv, saj se Cse1 na različna zaporedja veže z različno visoko afiniteto. Odziv, ki temu sledi lahko razdelimo v tri skupine. V raziskavi Olge Musharova in sodelavcev narejeni marca letos, so ugotovili, da 17 PAM zaporedij sproži močno interferenco. 11 PAM je takih, ki sprožijo počasno interferenco, pri 36 pa interference ni možno zaznati. Zanimivo v tej raziskavi je bilo predvsem dejstvo, da v 36 primerih brez interference prav tako ni bilo možno zaznati adaptacije. To pa pomeni, da je predpostavka o nesklopljenosti adaptacije in interference napačna.
Danes vemo, da je zaradi metodoloških omejitev v primeru močne interference zelo težko zaznati tako vrsto adaptacije in obratno.
Zato lahko predpostavimo sledeč mehanizem adaptacije, ki temelji na recikliranju ostankov tuje DNA po interferenčni razgradnji s Cas3 (ang: »Primed adaptation«) in predpostavlja z interferenco sklopljeno aktivnost Cas1 in Cas2. Ta dva proteina tvorita stabilen kompleks Cas14:Cas22, kjer je dimer Cas2 objet z dvema dimeroma Cas1. Ob prepoznavi PAM najprej poteče interferenčna cepitev tuje DNA s Cas 3 in pri tem nastanejo manjši fragmenti. Cas1-Cas2 specifično prepozna pravi 33 nt velik oligodeoksinukleotid , ki predstavlja protovmesnik . Kako kompleks prepozna pravi protovmesnik bo opisano spodaj, Cas1-Cas2 naloga pa je še njegova vstavitev v lokus CRISPR .
Naivna adaptacija
Obrambni odziv E. Coli pa sestavlja še tretji mehanizem, ki ne vključuje Cascade. Izkaže se, da Cas1-Cas2 kompleks lahko tudi sam prepozna in cepi tujo DNA. Mehanizem se začne, ko en izmed dimerov Cas1 prepozna PAM in cepi vez med 2. in 3. nukleotidom. Drug izmed dimerov Cas1 pa poskrbi za cepitev po 33. nukleotidu, tako da nastane protovmesnik ravno prave dolžine. Tak protovmesnik se veže v kompleks Cas1-Cas2 in vstavi v lokus CRISPR.