Avtomatizacija načrtovanja genetskih vezij
Povzeto po članku: Nielsen AA, Der BS, Shin J, et al. Genetic circuit design automation. Science. 2016;352(6281):aac7341. doi:10.1126/science.aac7341
Uvod
Celice se odzivajo na svoje okolje, sprejemajo odločitve, gradijo strukture in koordinirajo naloge. Osnova vseh teh procesov so logične operacije, ki jih izvajajo omrežja regulatornih proteinov, ki integrirajo signale in nadzorujejo časovno ekspresijo genov. Celice lahko z uporabo genetskih vezij »sprogramiramo« tako, da generirajo želeno operacijo, vendar pa je načrtovanje celo najbolj enostavnih genetskih vezij časovno zahtevno in nezanesljivo. EDA (»Electronic Design Automation«) je kategorija programske opreme, razvite za pomoč inženirjem za načrtovanje električnih vezij. Načela EDA lahko uporabimo pri načrtovanju genetskih vezij. V izhodiščnem članku so za to uporabili »jezik opisa strojne opreme« Verilog (ang. »Hardware Description Language«), ki omogoča uporabniku opis funkcije vezja. Uporabnik določi tudi senzorje, aktuatorje in »datoteke omejitev uporabnika« (ang. »User Constraints File«, v nadaljevanju »UCF«), ki definirajo organizem, tehnologijo logičnih vrat in veljavne pogoje delovanja.
Programska oprema »Cello« (www.cellocad.org) uporablja te informacije za samodejno oblikovanje zaporedja DNK za kodiranje želenega vezja. Za to uporablja niz algoritmov, ki razčlenjujejo sintakso Verilog-a, ustvarijo diagram vezja, dodelijo logična vrata, upoštevajo podane omejitve za izgradnjo DNK sekvence in simulirajo učinkovitost. Zanesljivo načrtovanje vezja zahteva izolacijo vrat iz genetskega konteksta, tako da delujejo enako, kadar se uporabljajo v različnih vezjih. V izhodiščnem članku je bila programska oprema »Cello« uporabljena za načrtovanje 60 genetskih vezij za E.coli (880.000 baznih parov DNK), od katerih so bile vse DNK sekvence zgrajene izključno na način, ki je bil predviden s strani programske opreme, brez dodatnih popravkov. Od teh jih je 45 delovalo pravilno v vsakem izhodnem stanju (do 10 regulatorjev in do 55 delov).
Programska oprema »Cello«
Verilog koda ima hierarhično organizacijo, ki bazira na modulih. V izhodiščnem članku so funkcije vezja definirali z »Case, Assign in Stuctural« stavki znotraj modulov, z fokusom na razvoju asinhrone kombinatorne logike brez povratnih informacij, kar je uporabno pri načrtovanju genetskih vezij, ki lahko procesirajo več okoljskih senzorjev in izberejo med različnimi celičnimi funkcijami. »Cello« je namenjen načrtovanju vezij za visoko specifične fizične sisteme in pogoje delovanja. Deluje po vzorcu UCF, slednji specificira:
i) tehnologijo logičnih vrat, vključujoč DNK sekvence in funkcionalne podatke,
ii) definirane fizične lokacije za vezje (plazmidni ali genomski lokusi),
iii) organizem, vrsto in genotip,
iv) pogoje obratovanja, v katerih je zasnova vezja veljavna,
v) preferirane logične motive, ki jih je treba vključiti v sintezo vezja.
UCF sledi JSON standardu (»JavaScript Object Notation«), ki je konvertibilen tudi z SBOL (»Synthetic Biology Open Language«). V izhodiščnem članku so razvili Eco1C1G1T1 UCF za E. coli in tehnologijo logičnih vrat, ki bazira na setu 12 prokariontskih represorjev. Z razvojem nadaljnjih UCF-jev bi lahko tak način načrtovanja vezja postal prenosljiv na druge organizme in pogoje.
Začetno sestavljanje vrat in neuspešni modeli
Konstruirali so knjižnico vrat, ki je bazirala na setu šestnajstih Tet represorjev (TetR) homologov, ki so bili ortogonalni. Te so pretvorili v preprosta NOT/NOR vrata, tako da so vhodni promotorji vodili ekspresijo represorjev, za katerim je bil teminator in izhodni promotor. Zaradi pomanjkanja močnih terminatorjev, so bila vsa vrata generirana z istim terminatorjem (BBa_B0015), vsak represor pa je imel drugačen RBS, ki je bil izbran tako da je maksimiziral dinamični razpon. Vrata so lahko povezali, tako da so tvorila preprosta funkcionalna vezja; vseeno pa je bila v vsakem primeru potrebna dodatna prilagoditev, prav tako je bil dinamični razpon izhoda nizek. Testirali so tudi odzivne funkcije vrat za napovedovanje obnašanja vezja kot celote, brez dodatnih prilagoditev. Načrtovali so set osmih preprostih vezij sestavljenih iz teh vrat, ki so vsebovala od enega do štirih represorjev. Skoraj vsa generirana vezja so dala napačen odziv. Med vsemi vezji je bilo skupaj pravilnih 13 izhodnih stanj od 32.
Tudi vezja, ki so bazirala samo na enem represorju so pogosto generirala nepredvidljiv odziv, ko so bila sklopljena z različnimi promotorji. Promotorji so generirali transkripte z različnimi 5'-netranslatiranimi regijami (5'-UTR), kar lahko ima močan vpliv na ekspresijo genov. Nekateri promotorji v »downstream« poziciji (poziciji 2 NOR vrat) so reducirali transkripcijo »upstream« promotorja, kar se imenuje »roadblocking«. Nadalje, so nekatera vezja imela probleme z rastjo, kar je bilo povzročeno s strani represorjev, ki so postali toksični, ko so bili izraženi preko nekega določenega praga. Številna vezja pa so bila nestabilna tudi zaradi homologne rekombinacije delov, ki so bili ponovno uporabljeni v istem vezju.
Izolirana vrata
Nadalje je bila generirana druga generacija vrat. Dodane so bile naslednje spremembe:
i) Novi deli so bili dodani k vratom za izolacijo iz genetskega konteksta,
ii) V datoteko UCF so bila dodana navodila, ki niso dovoljevala določenih delov, pozicij in kombinacij delov, ki bi lahko vodile do nepredvidljivega obnašanja,
iii) Transkripcijska izolacija je bila dosežena z dodajanjem drugih močnih terminatorjev z dovolj raznolikimi sekvencami za izogib homologni rekombinaciji,
iv) Izhodni promotorji so bili izolirani na obeh straneh,
v) Nazadnje je bila izmerjena nagnjenost promotorjev k »roadblockingu«, in v datoteko UCF so bila dodana pravila, ki takih promotorjev ne dovoljujejo na poziciji 2 v NOR vratih.
Funkcije odziva so bile potem eksperimentano določene za vsa vrata. Številna vrata prve generacije so imele funkcije odziva take, da jih je bilo težko povezati funkcionalno k senzorjem ali drugim vratom. Da bi povečali možnost uspešne vezave so naredili več verzij teh vrat z različnimi RBS-ji, kar je premaknilo prag odziva. Vpliv na rast vsakih vrat je bil potem izmerjen kot funkcija aktivnosti vhodnih promotorjev, z namenom določanja praga toksičnosti. Da so izločili toksične ali »cross-growth« represorje, so originalni set TetR homologov zmanjšali iz 16 na 12. Štirje od teh so povzočili defekt rasti pri visokih vhodnih vrednostih, čemur se je dalo izogniti z asignacijskim algoritmomom. Ostalih osem preprostih vezij je bilo ponovno oblikovanih z novo knjižnico vrat. Vsa vezja so funkcionirala pravilno in dala 32/32 pravilnih izhodnih stanj.
Avtomatizacija načrtovanja vezij z uporabo programa »Cello«
»Cello« je bil uporabljen za načrtovanje velikega seta 52 dodatnih vezij, ki so bazirala na izoliranih vratih. Ta vezja so vsebovala »Priority Detector«, »well-known functions« (npr. multiplexer) in logiko avtomatizirane formacije celularnih vzorcev (»Rule 30«). Dodatno so bila zgrajena tro-vhodna in eno-izhodna logična vezja, ki demonstrirajo sposobnost interakcije vhodov na različne načine. Taka vezja bi lahko bila uporabljena da celično funkcijo vklopijo ali izklopijo (ON/OFF) v odziv na okolje, definirano z multiplimi signali.
Vsako izmed 52 vezij je bilo določeno ali z uporabo »behavioral« Verilog kode (temelji na uporabi modulov) ali z uporabo ločene enumeracije za identifikacijo globalnega minimuma števila vrat in specifikacijo veznih diagramov z uporabo »structural« Verilog kode (temelji na uporabi »blocks«). Dodatno so bila v datoteko UCF vključena tro-vhodna logična vrata z globalnimi minimumi. Za vsako vezje so bili določeni promotorji senzorjev in ON/OFF vrednosti, izbrana je bila Eco1C1G1T1 UCF in DNK sekvenca je bila avtomatsko generirana s strani programske opreme »Cello«. Sekvence generirane DNK so vsebovale do 10 regulatorjev in do 55 delov. Izhodna stanja vsakega vezja so bila izmerjena z uporabo pretočne citometrije in primerjana z stanji, ki jih je napovedal »Cello«. Izvedenega ni bilo nobenega dodatnega prilagajanja DNK sekvence, ki bi se razlikovala od sekvence, ki jo je predvidel »Cello«.
Od 52 dizajniranih vezij jih je 37 funkcioniralo kot je bilo predvideno, tako da so vsi izhodi korelirali z predvidenimi ON/OFF nivoji. Nadalje je napovedana pretočna citometrija sovpadala z eksperimentalno določeno. Od 412 izhodnih stanj v vseh vezjih jih je bilo 92% pravilnih. Od 52 vezij jih je bilo sedem nepravilnih v enem stanju, dva sta bila nepravilna v dveh stanjih in pet jih je bilo nepravilnih v več kot treh stanjih. Z večanjem števila dodanih vrat se je povečala možnost napake. Analiza je pokazala, da je do nepričakovanega obnašanja večinoma prišlo pri anhidrotetraciklinskem senzorju (aTc senzor) ali pri AmtR vratih.
Zaključek
Načrtovanje sintetičnih regulatornih omrežij je bilo v glavnem dominirano s strani ročnega razmišljanja po sistemu »trial and error« na nivoju nukleotidov. »Cello« avtomatizira selekcijo in povezovanje delov, z upoštevanjem povezanih omejitev. S tem omogoča hitrejše načrtovanje sistemov z večjim številom delov.
Viri
[1] Nielsen AA, Der BS, Shin J, et al. Genetic circuit design automation. Science. 2016;352(6281):aac7341. doi:10.1126/science.aac7341
[2] Brophy JA, Voigt CA. Principles of genetic circuit design. Nat Methods. 2014;11(5):508‐520. doi:10.1038/nmeth.2926