OTTER: Difference between revisions

From Wiki FKKT
Jump to navigationJump to search
No edit summary
No edit summary
Line 22: Line 22:
=== Priprava modela za učinek sacB na rastno krivuljo ''E.coli'' ===
=== Priprava modela za učinek sacB na rastno krivuljo ''E.coli'' ===


Za pripravo modela so pripravili plazmid v katerem je bil sfGFP z linkerjem povezan s sacB. Protein je bil pod kontrolo inducibilnega promotorja pLac. Merili rast kultur z merjenjem absorbance kulture pri valovni dolžini svetlobe 600 nm (OD<sub>600</sub>) pri različnih koncentracijah IPTG in saharoze.  
Za pripravo modela so pripravili plazmid v katerem je bil sfGFP z linkerjem povezan s sacB. Protein je bil pod kontrolo inducibilnega promotorja pLac. Merili rast kultur z merjenjem absorbance kulture pri valovni dolžini svetlobe 600 nm (OD<sub>600</sub>) pri različnih koncentracijah IPTG in saharoze. Na podlagi pridobljenih podatkov jim je uspelo pripraviti enačbo in izračunati njene parametre, ki dobro opisujejo rast kulture [1].
 
== OTTER ==
 
Z modelom OTTER so hoteli zasnovati in predvideti delovanje RNA-stikal. Začeli so z linearno regresijo. Pripravili so model s trideset neodvisnimi in tremi odvisnimi spremenljivkami. Nabor podatkov so uporabili iz “A deep learning approach to programmable RNA switches” ​(Angenent-Mari in sod., 2020)​. Nabor podatkov je vseboval 135793 parov tarčnih zaporedij in RNA-stikal. Po prileganju je model dosegel prenizek R<sup>2</sup>, da bi z njim lahko predvidel delovanje RNA-stikala. Zaradi tega so nadaljevali z najenostavnejšo nevronsko mrežo, večslojnim perceptronom (MLP). R<sup>2</sup> te nevronske mreže, ki je bila natrenirana na enakem naboru podatkov, je bil večji, vendar še vedno ni bil dovolj dober, zato so nadaljevali z velikim jezikovnim modelom s katerim bi napovedali delovanja RNA-stikal in s transformerjem, s katerim bi lahko načrtovali RNA-stikalo glede na tarčno zaporedje. Veliki jezikovni modeli so primerni za napovedovanje delovanja RNA-stikal, ker lahko ocenijo kako povezane so besede v povedi. Če namesto besed uporabimo nukleotide, bi lahko napovedali kateri nukleotidi RNA-stikala in tarčnega zaporedja med seboj interagirajo. Za terniranje velikega jezikovnega modela je počasno, zato je potrebno veliko računalniške opreme. Ekipi je zaradi pomanjkanja razpoložljive računalniške opreme uspelo le 25 generacij učenja velikega jezikovnega modela. Kljub temu so dosegli opazno povišanje natančnosti modela v primerjavi s prejšnjim. Drug cilj je bil priprava transformerja za načrtovanje RNA-stikal na podlagi tarčnih zaporedij. Za učenje so uporabili isti nabor podatkov kot do sedaj. Naučenemu transformerju je uspelo zelo natančno predvideti zaporedje RNA-stikal na osnovi tarčnih zaporedij. Model je imel stopnjo napake 6 %.


== Literatura ==
== Literatura ==

Revision as of 19:58, 19 May 2024

OTTER (angl. Optimized Technique for swiTch Engineering and Ranking) je projekt ekipe iz Singapurja, s katerim se je udeležila tekmovanja iGEM leta 2023.

Cilj projekta je bil priprava orodja OTTER in visokozmogljive metode za karakterizacijo RNA-stikal SIGNAL (angl. Scalable Information Generation for Nucleic Acid Lineage Assessment Workflow). Orodje OTTER ustvari zaporedje RNA-stikala in predvidi učinkovitost delovanja. S SIGNAL se eksperimentalno ovrednoti delovanje RNA-stikal. Namen je bil, da s SIGNAL pripravijo veliko število podatkov o delovanju parov tarčno zaporedje in RNA-stikalo in s pridobljenimi podatki pripravijo računalniški model za OTTER [1].

Za ta projekt so se odločili zaradi pomanjkanja orodij za napovedovanje interakcij RNA-RNA, ustvarjanja RNA-stikal in pomanjkanja zbirk podatkov o RNA-RNA interakcijah s katerimi bi lahko pripravili modele za napovedovanje interakcij RNA-RNA. V projektu so se osredotočili na RNA-stikala, ki so občutljiva na prisotnost specifičnih RNA [1].

RNA-stikalo je del mRNA, ki glede na prisotnost liganda uravnava izražanje gena. RNA-stikala tvorijo posebno sekundarno strukturo, ki je občutljiva na prisotnost liganda. Ob prisotnosti tega, se spremeni sekundarna struktura, kar spremeni izražanje. RNA-stikala lahko uravnavajo povzročijo predčasno terminacijo transkripcije, inhibirajo iniciacijo translacije, povzročijo predčasno terminacijo translacije ali vplivajo na razpolovni čas transkripta [2].

SIGNAL

Visokozmogljiva metoda za ovrednotenje RNA-stikal temelji na eno-plazmidnem sistemu, ki omogoča pozitivno in negativno selekcijo parov RNA-stikalo in tarčno zaporedje. S tem zmanjšamo število transformacij, ki so potrebne za ovrednotenje delovanja RNA-stikala. V plazmidu sta tarčno zaporedje in RNA-stikalo z reporterjem pod ločenimi inducibilnimi promotorji. Skupaj z reporterjem se izrazita tudi selekcijska markerja, ki omogočata pozitivno in negativno selekcijo. To sta protein, ki omogoča rezistenco proti antibiotiku in sacB. SacB je levansaharaza. Pretvarja sahafozo (disaharid iz glukoze in fruktoze) v levan. Levan je polisaharid, sestavljen iz fruktoze, povezane z 2,6-β glikozidnimi vezmi. Levan je znotraj Escherichia coli strupen. Natančen mehanizem delovanja levana na E. coli še ni znan [1,3].

Z rezistenčnim markerjem se omogoča rast celicam v katerih se tarčno zaporedje veže na RNA-stikalo in tako omogoča izražanje proteina, ki omogoča rezistenco. Z dodatkom saharoze k celicam, ki nimajo induciranega izražanja tarčne RNA ubijemo celice v katerih RNA-stikalo ne zavira izražanja. S tem lahko izločimo RNA-stikala, ki so tekom mutageneze izgubila funkcijo [1].

Priprava eno-plazmidnega sistema

Sprva so pripravili eno-plazmidni sistem z RNA-stikali toehold. Ti tvorijo lasnično zanko z vezavnim mestom za ribosom (RBS) in začetnim kodonom. Z vezavo tarčne RNA se lasnična zanka razvije in je ribosomu omogočena vezava. Izražanje tarčne RNA je pod kontrolo promotorja pLac. Tega se v laboratoriju inducira z dodatkom izopropil β-D-1-tiogalaktopiranozid (IPTG). Pod kontrolo promotorja pTet, ki se ga inducira ob dodatku anhidrotetraciklina (ATC) je bil transkript, ki je vseboval RNA-stikalo, ki je nadzorovalo izražanje zapisa za zeleni fluorescenčnim protein (sfGFP) povezan s sacB [1].

Pripravljen plazmid ni deloval kot pričakovano. Ravni izražanja sfGFP so bile enake pod vsemi kombinacijami induktorjev. Za kontrolo so pripravili plazmid, kjer je bilo izražanje sfGFP le pod kontrolo pTet. Pri tem plazmidu je bilo izražanje sfGFP očitno. Neuspešnost so pripisali temu, da so originalne konstituitivne promotorje zamenjali za inducibilne. To naj bi motilo interakcijo med tarčno RNA in RNA-stikalom. Odločili so se uporabiti drugačno vrsto RNA-stikal, ki tvorijo terminatorsko zanko, ki inhibira elongacijo transkripta. Ob prisotnosti angl. small transcription activating RNAs (STAR) se zanka sprosti in elongacija poteče [1,4].

Tokrat so pripravili eno-plazmidni sistem s konstituitivnimi promotorji. Izražanje sfGFP je bilo manjše kakor z originalim dvo-plazmidnim sistemom, kjer sta bila STAR in reporterski protein na različnih plazmidih s konstituitivnimi promotorji. Predvidevali so, da je razlika v izražanju posledica različnega razmerja med STAR in zapisom za reporterski protein. Konstiuitivna promotorja so poskusili zamenjati z inducibilnima, vendar se je pojavil enak problem kot prej. Po nekaj diagnostičnih poskusih so težavo pripisali menjavi konstituitivnega promotorja za inducibilnega navzgor od RNA-stikala. Zanka je zaradi inducibilnega promotorja postala neobčutljiva na STAR [1].

Priprava modela za učinek sacB na rastno krivuljo E.coli

Za pripravo modela so pripravili plazmid v katerem je bil sfGFP z linkerjem povezan s sacB. Protein je bil pod kontrolo inducibilnega promotorja pLac. Merili rast kultur z merjenjem absorbance kulture pri valovni dolžini svetlobe 600 nm (OD600) pri različnih koncentracijah IPTG in saharoze. Na podlagi pridobljenih podatkov jim je uspelo pripraviti enačbo in izračunati njene parametre, ki dobro opisujejo rast kulture [1].

OTTER

Z modelom OTTER so hoteli zasnovati in predvideti delovanje RNA-stikal. Začeli so z linearno regresijo. Pripravili so model s trideset neodvisnimi in tremi odvisnimi spremenljivkami. Nabor podatkov so uporabili iz “A deep learning approach to programmable RNA switches” ​(Angenent-Mari in sod., 2020)​. Nabor podatkov je vseboval 135793 parov tarčnih zaporedij in RNA-stikal. Po prileganju je model dosegel prenizek R2, da bi z njim lahko predvidel delovanje RNA-stikala. Zaradi tega so nadaljevali z najenostavnejšo nevronsko mrežo, večslojnim perceptronom (MLP). R2 te nevronske mreže, ki je bila natrenirana na enakem naboru podatkov, je bil večji, vendar še vedno ni bil dovolj dober, zato so nadaljevali z velikim jezikovnim modelom s katerim bi napovedali delovanja RNA-stikal in s transformerjem, s katerim bi lahko načrtovali RNA-stikalo glede na tarčno zaporedje. Veliki jezikovni modeli so primerni za napovedovanje delovanja RNA-stikal, ker lahko ocenijo kako povezane so besede v povedi. Če namesto besed uporabimo nukleotide, bi lahko napovedali kateri nukleotidi RNA-stikala in tarčnega zaporedja med seboj interagirajo. Za terniranje velikega jezikovnega modela je počasno, zato je potrebno veliko računalniške opreme. Ekipi je zaradi pomanjkanja razpoložljive računalniške opreme uspelo le 25 generacij učenja velikega jezikovnega modela. Kljub temu so dosegli opazno povišanje natančnosti modela v primerjavi s prejšnjim. Drug cilj je bil priprava transformerja za načrtovanje RNA-stikal na podlagi tarčnih zaporedij. Za učenje so uporabili isti nabor podatkov kot do sedaj. Naučenemu transformerju je uspelo zelo natančno predvideti zaporedje RNA-stikal na osnovi tarčnih zaporedij. Model je imel stopnjo napake 6 %.

Literatura

[1] OTTER | NUS-Singapore. https://2023.igem.wiki/nus-singapore/

[2] C. M. Schmidt in C. D. Smolke: RNA Switches for Synthetic Biology. Cold Spring Harb Perspect Biol 2019, 11, a032532.

[3] Levan polysaccharide. Wikipedia, 2024.

[4] J. Chappell, M. K. Takahashi, J. B. Lucks: Creating small transcription activating RNAs. Nat Chem Biol 2015, 11, 214–220.