OTTER: Difference between revisions

From Wiki FKKT
Jump to navigationJump to search
No edit summary
No edit summary
 
(10 intermediate revisions by the same user not shown)
Line 1: Line 1:
OTTER (angl. ''Optimized Technique for swiTch Engineering and Ranking'') je projekt ekipe iz Singapurja, s katerim se je udeležila tekmovanja iGEM leta 2023.
OTTER (angl. ''Optimized Technique for swiTch Engineering and Ranking'') je projekt ekipe iz Singapurja, s katerim se je udeležila tekmovanja iGEM leta 2023. Projekt je dosegel tretje mesto na dodiplomskem tekmovanju in osvojil nagrado za najboljši projekt temeljnega napredka.  


Cilj projekta je bil priprava orodja OTTER in visokozmogljive metode za karakterizacijo RNA-stikal SIGNAL (angl. ''Scalable Information Generation for Nucleic Acid Lineage Assessment Workflow''). Orodje OTTER ustvari zaporedje RNA-stikala in predvidi učinkovitost delovanja. S SIGNAL se eksperimentalno ovrednoti delovanje RNA-stikal. Namen je bil, da s SIGNAL pripravijo veliko število podatkov o delovanju parov tarčno zaporedje in RNA-stikalo in s pridobljenimi podatki pripravijo računalniški model za OTTER.
Cilj projekta je bil priprava računalniškega orodja OTTER in visokozmogljive metode za karakterizacijo RNA-stikal SIGNAL (angl. ''Scalable Information Generation for Nucleic Acid Lineage Assessment Workflow''). Orodje OTTER ustvari zaporedje RNA-stikala in predvidi učinkovitost delovanja. S SIGNAL se eksperimentalno ovrednoti delovanje RNA-stikal. Namen je bil, da s SIGNAL pripravijo veliko število podatkov o delovanju parov tarčno zaporedje in RNA-stikalo in s pridobljenimi podatki pripravijo računalniški model za OTTER [1].


Za ta projekt so se odločili zaradi pomanjkanja orodij za napovedovanje interakcij RNA-RNA, ustvarjanja RNA-stikal in pomanjkanja zbirk podatkov o RNA-RNA interakcijah s katerimi bi lahko pripravili modele za napovedovanje interakcij RNA-RNA. V projektu so se osredotočili na RNA-stikala, ki so občutljiva na prisotnost specifičnih RNA [1].
Za ta projekt so se odločili zaradi pomanjkanja orodij za napovedovanje interakcij RNA-RNA, ustvarjanja RNA-stikal in pomanjkanja zbirk podatkov o RNA-RNA interakcijah s katerimi bi lahko pripravili modele za napovedovanje interakcij RNA-RNA. V projektu so se osredotočili na RNA-stikala, ki so občutljiva na prisotnost specifičnih RNA [1].


RNA-stikalo je del mRNA, ki glede na prisotnost liganda uravnava izražanje gena. RNA-stikala tvorijo posebno sekundarno strukturo, ki je občutljiva na prisotnost liganda. Ob prisotnosti tega, se spremeni sekundarna struktura, kar spremeni izražanje. RNA-stikala lahko uravnavajo iniciacijo, terminacijo ali razpolovni čas transkripta [2].
RNA-stikalo je del mRNA, ki glede na prisotnost liganda uravnava izražanje gena. RNA-stikala tvorijo posebno sekundarno strukturo, ki je občutljiva na prisotnost liganda. Ob prisotnosti tega, se spremeni sekundarna struktura, kar spremeni izražanje. RNA-stikala lahko uravnavajo povzročijo predčasno terminacijo transkripcije, inhibirajo iniciacijo translacije, povzročijo predčasno terminacijo translacije ali vplivajo na razpolovni čas transkripta [2].


== SIGNAL ==
== Metoda SIGNAL ==
Visokozmogljiva metoda za ovrednotenje RNA-stikal temelji na eno-plazmidnem sistemu, ki omogoča pozitivno in negativno selekcijo parov RNA-stikalo in tarčno zaporedje. S tem zmanjšamo število transformacij, ki so potrebne za ovrednotenje delovanja RNA-stikala. V plazmidu sta tarčno zaporedje in RNA-stikalo z reporterjem pod ločenimi inducibilnimi promotorji. Skupaj z reporterjem se izrazita tudi selekcijska markerja, ki omogočata pozitivno in negativno selekcijo. To sta protein, ki omogoča rezistenco proti antibiotiku in sacB. SacB je levansukraza. Pretvarja sukrozo (disaharid iz glukoze in fruktoze) v levan. Levan je polisaharid, sestavljen iz fruktoze, povezane z 2,6-β glikozidnimi vezmi. Levan je znotraj ''Escherichia coli'' strupen. Natančen mehanizem delovanja levana na ''E. coli'' še ni znan [1,3].


Z rezistenčnim markerjem se omogoča rast celicam v katerih se tarčno zaporedje veže na RNA-stikalo in tako omogoča izražanje proteina, ki omogoča rezistenco. Z dodatkom sukroze k celicam, ki nimajo induciranega izražanja tarčne RNA ubijemo celice v katerih RNA-stikalo ne zavira izražanja. S tem lahko izločimo RNA-stikala, ki so tekom mutageneze izgubila funkcijo [1].
Visokozmogljiva metoda za ovrednotenje RNA-stikal temelji na eno-plazmidnem sistemu, ki omogoča pozitivno in negativno selekcijo parov RNA-stikalo in tarčno zaporedje. S tem zmanjšamo število transformacij, ki so potrebne za ovrednotenje delovanja RNA-stikala. V plazmidu sta tarčno zaporedje in RNA-stikalo z reporterjem pod ločenimi inducibilnimi promotorji. Skupaj z reporterjem se izrazita tudi selekcijska markerja, ki omogočata pozitivno in negativno selekcijo. To sta protein, ki omogoča rezistenco proti antibiotiku in sacB. SacB je levansaharaza. Pretvarja saharozo (disaharid iz glukoze in fruktoze) v levan. Levan je polisaharid, sestavljen iz fruktoze, povezane z 2,6-β glikozidnimi vezmi. Levan je znotraj ''Escherichia coli'' strupen. Natančen mehanizem delovanja levana na ''E. coli'' še ni znan [1,3].
 
Primer presejanja za pridobivanje RNA-stikal, ki omogočajo visoko raven izražanja ob prisotnosti tarčnega RNA zaporedja  in močno zavirajo izražanje ob njegovi odsotnosti.
Ob dodatku ATC se inducira izražanje mRNA z RNA-stikalom. Z dodatkom saharoze pobijemo celice, katerim RNA-stikalo ne preprečuje izražanja sacB. Preživele celice precepimo in induciramo izražanje tarčne RNA z dodatkom IPTG in izražanje mRNA z RNA-stikalom z dodatkom ATC. Celice katerim tarčno zaporedje aktivira RNA-stikalo, izražajo encim, ki jim omogoča odpornost proti kanamicinu A. Z dodatkom kanamicina A ubijemo celice, pri katerih tarčno zaporedje ni aktiviralo izražanja gena za odpornost. Tako nam ostanejo le celice, ki imajo delujoče RNA-stikalo, ki omogoča izražanje gena ob prisotnosti tarčne RNA [1]


=== Priprava eno-plazmidnega sistema ===
=== Priprava eno-plazmidnega sistema ===


Sprva so pripravili eno-plazmidni sistem z RNA-stikali TOEBOX. Ti tvorijo lasnično zanko z vezavnim mestom za ribosom (RBS) in začetnim kodonom. Tarčno RNA zaporedje je pod kontrolo promotorja pLac. Tega se v laboratoriju inducira z dodatkom izopropil β-D-1-tiogalaktopiranozid (IPTG). Pod kontrolo promotorja pTet, ki se ga inducira ob dodatku anhidrotetraciklina (ATC) je bil transkript, ki je vseboval RNA-stikalo, ki je nadzorovalo izražanje zapisa za zeleni fluorescenčnim protein (sfGFP) povezan s sacB [1].
Sprva so pripravili eno-plazmidni sistem z RNA-stikali toehold. Ti tvorijo lasnično zanko z vezavnim mestom za ribosom (RBS) in začetnim kodonom. Z vezavo tarčne RNA se lasnična zanka razvije in je ribosomu omogočena vezava. Izražanje tarčne RNA je pod kontrolo promotorja pLac. Tega se v laboratoriju inducira z dodatkom izopropil β-D-1-tiogalaktopiranozid (IPTG). Pod kontrolo promotorja pTet, ki se ga inducira ob dodatku anhidrotetraciklina (ATC) je bil transkript, ki je vseboval RNA-stikalo, ki je nadzorovalo izražanje zapisa za zeleni fluorescenčnim protein (sfGFP) povezan s sacB [1].
 
Pripravljen plazmid ni deloval kot pričakovano. Ravni izražanja sfGFP so bile enake pod vsemi kombinacijami induktorjev. Za kontrolo so pripravili plazmid, kjer je bilo izražanje sfGFP le pod kontrolo pTet. Pri tem plazmidu je bilo izražanje sfGFP očitno. Neuspešnost so pripisali temu, da so originalne konstituitivne promotorje zamenjali za inducibilne. To naj bi motilo interakcijo med tarčno RNA in RNA-stikalom. Odločili so se uporabiti drugačno vrsto RNA-stikal. Ta tvorijo terminatorsko zanko, ki inhibira elongacijo transkripta. Ob prisotnosti smernega zaporedja angl. ''small transcription activating RNAs'' (STAR) se zanka sprosti in elongacija poteče [1,4].
 
Tokrat so pripravili eno-plazmidni sistem s konstituitivnimi promotorji. Izražanje sfGFP so primerjali z izražanjem sfGFP celic, ki so bile transformirane z originalnim dvo-plazmidnim sistemom. Na enem plazmidu je bil STAR pod konstituitivnim promotorjem. Na drugem plazmidu je bil zapis za sfGFP pod kontrolo konstituitivnega promotorja in protismerne STAR zanke. Izražanje sfGFP je bilo veliko večje pri dvo-plazmidnem sistemu, kot pri eno-plazmidnem. Predvidevali so, da je razlika v izražanju posledica različnega razmerja med STAR in zapisom za reporterski protein. Konstituitivna promotorja so poskusili zamenjati z inducibilnima, vendar se je pojavil enak problem kot prej. Nivo izražanja sfGFP je bilo enako pred in po dodatku induktorja ATC. Problem so diagnosticirali s pripravo plazmida, brez STAR terminatorske zanke. Celice s tem plazmidom so uspešno izražale sfGFP. Na podlagi te ugotovitve so težavo pripisali menjavi konstituitivnega promotorja za inducibilnega navzgor od RNA-stikala. Zanka je zaradi inducibilnega promotorja postala neobčutljiva na STAR. Testirali so še promotor pTet s tem, da so ga klonirali navzgor od gena za sfGFP. Promotor pTet je deloval kot pričakovano. Ob prisotnosti pTet je bila raven izražanja sfGFP veliko višja [1].
 
=== Priprava modela za učinek sacB na rastno krivuljo ''E.coli'' ===
 
Za pripravo modela so pripravili plazmid v katerem je bil sfGFP z linkerjem povezan s sacB. Protein je bil pod kontrolo inducibilnega promotorja pLac. Merili rast kultur z merjenjem absorbance kulture pri valovni dolžini svetlobe 600 nm (OD<sub>600</sub>) pri različnih koncentracijah IPTG in saharoze. Na podlagi pridobljenih podatkov jim je uspelo pripraviti enačbo in izračunati njene parametre, ki dobro opisujejo rast kulture. Pomembno je, da levan ubije le celico, ki ga proizvede. S tem umrejo le celice, ki bodo imele nedelujoče RNA-stikalo in ne ostalih v kulturi. To so preverili z gojenjem celic, ki izražajo sfGFP-sacB fuzijski protein in celic, ki izražajo rdeči fluorescenčni protein (RFP) hkrati. Ugotovili so, da nastanek levana v celicah, ki izražajo sacB in njihova liza, ne vpliva na preživetje celic, ki izražajo le rdeči fluorescenčni protein [1].
 
=== Poskus priprave knjižnice tarčnih RNA zaporedij ===
 
Za pripravo modelov z globokim učenjem potrebujemo veliko število podatkov. Zato so naročili zbirko tarčnih zaporedij in preverili kako dobro ostane ohranjena v tekoči kulturi. Zbirko so pomnožili s PCR in z metodo "Golden Gate" vstavili zaporedja v plazmide. Z mešanico plazmidov so transformirali celice ''E. coli'' in jih gojili skupaj v eni tekoči kulturi preden so preverili ohranjenost zbirke. Zbirka se je dobro ohranila. Po nekaj urah inkubacije se je izgubilo le nekaj procentov zbirke [1].
 
== Orodje OTTER ==
 
Z modelom OTTER so hoteli zasnovati in predvideti delovanje RNA-stikal. Začeli so z linearno regresijo. Pripravili so model s trideset neodvisnimi in tremi odvisnimi spremenljivkami. Nabor podatkov so uporabili iz “A deep learning approach to programmable RNA switches” ​(Angenent-Mari in sod., 2020)​. Nabor podatkov je vseboval 135793 parov tarčnih zaporedij in RNA-stikal. Po prileganju je model dosegel prenizek R<sup>2</sup>, da bi z njim lahko predvidel delovanje RNA-stikala. Zaradi tega so nadaljevali z najenostavnejšo nevronsko mrežo, večslojnim perceptronom (MLP). R<sup>2</sup> te nevronske mreže, ki je bila natrenirana na enakem naboru podatkov, je bil večji, vendar še vedno ni bil dovolj dober, zato so nadaljevali z velikim jezikovnim modelom s katerim bi napovedali delovanja RNA-stikal in s transformerjem, s katerim bi lahko načrtovali RNA-stikalo glede na tarčno zaporedje. Veliki jezikovni modeli so primerni za napovedovanje delovanja RNA-stikal, ker lahko ocenijo kako povezane so besede v povedi. Če namesto besed uporabimo nukleotide, bi lahko napovedali kateri nukleotidi RNA-stikala in tarčnega zaporedja med seboj interagirajo. Za terniranje velikega jezikovnega modela je počasno, zato je potrebno veliko računalniške opreme. Ekipi je zaradi pomanjkanja razpoložljive računalniške opreme uspelo le 25 generacij učenja velikega jezikovnega modela. Kljub temu so dosegli opazno povišanje natančnosti modela v primerjavi s prejšnjim. Drug cilj je bil priprava transformerja za načrtovanje RNA-stikal na podlagi tarčnih zaporedij. Za učenje so uporabili isti nabor podatkov kot do sedaj. Naučenemu transformerju je uspelo zelo natančno predvideti zaporedje RNA-stikal na osnovi tarčnih zaporedij. Model je imel stopnjo napake 6 %. S tema modeloma so pripravili uporabniški vmesnik OTTER [1].


V primerjavi z originalnim dvo-plazmidnim sistemom, kjer sta bila tarčno zaporedje in RNA-stikalo na različnih plazmidih in pod konstituitivnimi protmotorji, je bila rav
== Literatura ==
== Literatura ==
[1] OTTER | NUS-Singapore. https://2023.igem.wiki/nus-singapore/
[1] OTTER | NUS-Singapore. https://2023.igem.wiki/nus-singapore/


[2] C. M. Schmidt in C. D. Smolke: RNA Switches for Synthetic Biology. ''Cold Spring Harbor Perspectives in Biology''. '''2019''', ''11:a032532''.
[2] C. M. Schmidt in C. D. Smolke: RNA Switches for Synthetic Biology. ''Cold Spring Harb Perspect Biol'' '''2019''', ''11'', a032532.


[3] Levan polysaccharide. Wikipedia, 2024.
[3] Levan polysaccharide. Wikipedia, 2024.
[4] J. Chappell, M. K. Takahashi, J. B. Lucks: Creating small transcription activating RNAs. ''Nat Chem Biol'' '''2015''', ''11'', 214–220.

Latest revision as of 21:53, 19 May 2024

OTTER (angl. Optimized Technique for swiTch Engineering and Ranking) je projekt ekipe iz Singapurja, s katerim se je udeležila tekmovanja iGEM leta 2023. Projekt je dosegel tretje mesto na dodiplomskem tekmovanju in osvojil nagrado za najboljši projekt temeljnega napredka.

Cilj projekta je bil priprava računalniškega orodja OTTER in visokozmogljive metode za karakterizacijo RNA-stikal SIGNAL (angl. Scalable Information Generation for Nucleic Acid Lineage Assessment Workflow). Orodje OTTER ustvari zaporedje RNA-stikala in predvidi učinkovitost delovanja. S SIGNAL se eksperimentalno ovrednoti delovanje RNA-stikal. Namen je bil, da s SIGNAL pripravijo veliko število podatkov o delovanju parov tarčno zaporedje in RNA-stikalo in s pridobljenimi podatki pripravijo računalniški model za OTTER [1].

Za ta projekt so se odločili zaradi pomanjkanja orodij za napovedovanje interakcij RNA-RNA, ustvarjanja RNA-stikal in pomanjkanja zbirk podatkov o RNA-RNA interakcijah s katerimi bi lahko pripravili modele za napovedovanje interakcij RNA-RNA. V projektu so se osredotočili na RNA-stikala, ki so občutljiva na prisotnost specifičnih RNA [1].

RNA-stikalo je del mRNA, ki glede na prisotnost liganda uravnava izražanje gena. RNA-stikala tvorijo posebno sekundarno strukturo, ki je občutljiva na prisotnost liganda. Ob prisotnosti tega, se spremeni sekundarna struktura, kar spremeni izražanje. RNA-stikala lahko uravnavajo povzročijo predčasno terminacijo transkripcije, inhibirajo iniciacijo translacije, povzročijo predčasno terminacijo translacije ali vplivajo na razpolovni čas transkripta [2].

Metoda SIGNAL

Visokozmogljiva metoda za ovrednotenje RNA-stikal temelji na eno-plazmidnem sistemu, ki omogoča pozitivno in negativno selekcijo parov RNA-stikalo in tarčno zaporedje. S tem zmanjšamo število transformacij, ki so potrebne za ovrednotenje delovanja RNA-stikala. V plazmidu sta tarčno zaporedje in RNA-stikalo z reporterjem pod ločenimi inducibilnimi promotorji. Skupaj z reporterjem se izrazita tudi selekcijska markerja, ki omogočata pozitivno in negativno selekcijo. To sta protein, ki omogoča rezistenco proti antibiotiku in sacB. SacB je levansaharaza. Pretvarja saharozo (disaharid iz glukoze in fruktoze) v levan. Levan je polisaharid, sestavljen iz fruktoze, povezane z 2,6-β glikozidnimi vezmi. Levan je znotraj Escherichia coli strupen. Natančen mehanizem delovanja levana na E. coli še ni znan [1,3].

Primer presejanja za pridobivanje RNA-stikal, ki omogočajo visoko raven izražanja ob prisotnosti tarčnega RNA zaporedja in močno zavirajo izražanje ob njegovi odsotnosti. Ob dodatku ATC se inducira izražanje mRNA z RNA-stikalom. Z dodatkom saharoze pobijemo celice, katerim RNA-stikalo ne preprečuje izražanja sacB. Preživele celice precepimo in induciramo izražanje tarčne RNA z dodatkom IPTG in izražanje mRNA z RNA-stikalom z dodatkom ATC. Celice katerim tarčno zaporedje aktivira RNA-stikalo, izražajo encim, ki jim omogoča odpornost proti kanamicinu A. Z dodatkom kanamicina A ubijemo celice, pri katerih tarčno zaporedje ni aktiviralo izražanja gena za odpornost. Tako nam ostanejo le celice, ki imajo delujoče RNA-stikalo, ki omogoča izražanje gena ob prisotnosti tarčne RNA [1]

Priprava eno-plazmidnega sistema

Sprva so pripravili eno-plazmidni sistem z RNA-stikali toehold. Ti tvorijo lasnično zanko z vezavnim mestom za ribosom (RBS) in začetnim kodonom. Z vezavo tarčne RNA se lasnična zanka razvije in je ribosomu omogočena vezava. Izražanje tarčne RNA je pod kontrolo promotorja pLac. Tega se v laboratoriju inducira z dodatkom izopropil β-D-1-tiogalaktopiranozid (IPTG). Pod kontrolo promotorja pTet, ki se ga inducira ob dodatku anhidrotetraciklina (ATC) je bil transkript, ki je vseboval RNA-stikalo, ki je nadzorovalo izražanje zapisa za zeleni fluorescenčnim protein (sfGFP) povezan s sacB [1].

Pripravljen plazmid ni deloval kot pričakovano. Ravni izražanja sfGFP so bile enake pod vsemi kombinacijami induktorjev. Za kontrolo so pripravili plazmid, kjer je bilo izražanje sfGFP le pod kontrolo pTet. Pri tem plazmidu je bilo izražanje sfGFP očitno. Neuspešnost so pripisali temu, da so originalne konstituitivne promotorje zamenjali za inducibilne. To naj bi motilo interakcijo med tarčno RNA in RNA-stikalom. Odločili so se uporabiti drugačno vrsto RNA-stikal. Ta tvorijo terminatorsko zanko, ki inhibira elongacijo transkripta. Ob prisotnosti smernega zaporedja angl. small transcription activating RNAs (STAR) se zanka sprosti in elongacija poteče [1,4].

Tokrat so pripravili eno-plazmidni sistem s konstituitivnimi promotorji. Izražanje sfGFP so primerjali z izražanjem sfGFP celic, ki so bile transformirane z originalnim dvo-plazmidnim sistemom. Na enem plazmidu je bil STAR pod konstituitivnim promotorjem. Na drugem plazmidu je bil zapis za sfGFP pod kontrolo konstituitivnega promotorja in protismerne STAR zanke. Izražanje sfGFP je bilo veliko večje pri dvo-plazmidnem sistemu, kot pri eno-plazmidnem. Predvidevali so, da je razlika v izražanju posledica različnega razmerja med STAR in zapisom za reporterski protein. Konstituitivna promotorja so poskusili zamenjati z inducibilnima, vendar se je pojavil enak problem kot prej. Nivo izražanja sfGFP je bilo enako pred in po dodatku induktorja ATC. Problem so diagnosticirali s pripravo plazmida, brez STAR terminatorske zanke. Celice s tem plazmidom so uspešno izražale sfGFP. Na podlagi te ugotovitve so težavo pripisali menjavi konstituitivnega promotorja za inducibilnega navzgor od RNA-stikala. Zanka je zaradi inducibilnega promotorja postala neobčutljiva na STAR. Testirali so še promotor pTet s tem, da so ga klonirali navzgor od gena za sfGFP. Promotor pTet je deloval kot pričakovano. Ob prisotnosti pTet je bila raven izražanja sfGFP veliko višja [1].

Priprava modela za učinek sacB na rastno krivuljo E.coli

Za pripravo modela so pripravili plazmid v katerem je bil sfGFP z linkerjem povezan s sacB. Protein je bil pod kontrolo inducibilnega promotorja pLac. Merili rast kultur z merjenjem absorbance kulture pri valovni dolžini svetlobe 600 nm (OD600) pri različnih koncentracijah IPTG in saharoze. Na podlagi pridobljenih podatkov jim je uspelo pripraviti enačbo in izračunati njene parametre, ki dobro opisujejo rast kulture. Pomembno je, da levan ubije le celico, ki ga proizvede. S tem umrejo le celice, ki bodo imele nedelujoče RNA-stikalo in ne ostalih v kulturi. To so preverili z gojenjem celic, ki izražajo sfGFP-sacB fuzijski protein in celic, ki izražajo rdeči fluorescenčni protein (RFP) hkrati. Ugotovili so, da nastanek levana v celicah, ki izražajo sacB in njihova liza, ne vpliva na preživetje celic, ki izražajo le rdeči fluorescenčni protein [1].

Poskus priprave knjižnice tarčnih RNA zaporedij

Za pripravo modelov z globokim učenjem potrebujemo veliko število podatkov. Zato so naročili zbirko tarčnih zaporedij in preverili kako dobro ostane ohranjena v tekoči kulturi. Zbirko so pomnožili s PCR in z metodo "Golden Gate" vstavili zaporedja v plazmide. Z mešanico plazmidov so transformirali celice E. coli in jih gojili skupaj v eni tekoči kulturi preden so preverili ohranjenost zbirke. Zbirka se je dobro ohranila. Po nekaj urah inkubacije se je izgubilo le nekaj procentov zbirke [1].

Orodje OTTER

Z modelom OTTER so hoteli zasnovati in predvideti delovanje RNA-stikal. Začeli so z linearno regresijo. Pripravili so model s trideset neodvisnimi in tremi odvisnimi spremenljivkami. Nabor podatkov so uporabili iz “A deep learning approach to programmable RNA switches” ​(Angenent-Mari in sod., 2020)​. Nabor podatkov je vseboval 135793 parov tarčnih zaporedij in RNA-stikal. Po prileganju je model dosegel prenizek R2, da bi z njim lahko predvidel delovanje RNA-stikala. Zaradi tega so nadaljevali z najenostavnejšo nevronsko mrežo, večslojnim perceptronom (MLP). R2 te nevronske mreže, ki je bila natrenirana na enakem naboru podatkov, je bil večji, vendar še vedno ni bil dovolj dober, zato so nadaljevali z velikim jezikovnim modelom s katerim bi napovedali delovanja RNA-stikal in s transformerjem, s katerim bi lahko načrtovali RNA-stikalo glede na tarčno zaporedje. Veliki jezikovni modeli so primerni za napovedovanje delovanja RNA-stikal, ker lahko ocenijo kako povezane so besede v povedi. Če namesto besed uporabimo nukleotide, bi lahko napovedali kateri nukleotidi RNA-stikala in tarčnega zaporedja med seboj interagirajo. Za terniranje velikega jezikovnega modela je počasno, zato je potrebno veliko računalniške opreme. Ekipi je zaradi pomanjkanja razpoložljive računalniške opreme uspelo le 25 generacij učenja velikega jezikovnega modela. Kljub temu so dosegli opazno povišanje natančnosti modela v primerjavi s prejšnjim. Drug cilj je bil priprava transformerja za načrtovanje RNA-stikal na podlagi tarčnih zaporedij. Za učenje so uporabili isti nabor podatkov kot do sedaj. Naučenemu transformerju je uspelo zelo natančno predvideti zaporedje RNA-stikal na osnovi tarčnih zaporedij. Model je imel stopnjo napake 6 %. S tema modeloma so pripravili uporabniški vmesnik OTTER [1].

Literatura

[1] OTTER | NUS-Singapore. https://2023.igem.wiki/nus-singapore/

[2] C. M. Schmidt in C. D. Smolke: RNA Switches for Synthetic Biology. Cold Spring Harb Perspect Biol 2019, 11, a032532.

[3] Levan polysaccharide. Wikipedia, 2024.

[4] J. Chappell, M. K. Takahashi, J. B. Lucks: Creating small transcription activating RNAs. Nat Chem Biol 2015, 11, 214–220.