Umetna nevronska mreža na proteinski ravni v sesalskih celicah
Izhodiščni članek: A synthetic protein-level neural network in mammalian cells
Uvod
Umetne nevronske mreže predstavljajo osnovo obdelave informacij v računalniških sistemih. Temeljijo na procesih, ki posnemajo delovanje živčnega sistema in omogočajo transformacijo več vhodnih signalov v določene izhodne vzorce, kar se uporablja za reševanje zahtevnih nalog, kot so razvrščanje, zaznavanje vzorcev ter odločanje v nepopolno definiranih podatkovnih prostorih [1]. Podobni klasifikacijski procesi potekajo tudi v živih celicah, kjer kompleksen splet interakcij med geni, RNA in proteini omogoča zaznavanje in interpretacijo signalov iz okolja. Celice tako sprejemajo kvantitativno in kvalitativno raznolike informacije ter se nanje odzovejo z določenimi funkcionalnimi izidi. Na primer, tumorsupresorska pot p53 omogoča razločevanje med tipi celičnega stresa in sproži ustrezne odzive, kot sta apoptoza ali senescenca [2]. Med razvojem živčnega sistema koncentracije morfogenov, kot sta BMP in Hedgehog, vodijo v spremembe nevralnih progenitorskih celic [3], v imunskem sistemu pa kombinacije citokinov vplivajo na diferenciacijo T-celic [4]. Z vzpostavitvijo podobnih umetnih vezij v celicah lahko dosegamo zanesljive in nadzorovane odzive celic na določene vhodne signale in s tem bolj programirano obnačanje celic. Teoretični modeli so že predlagali načine za izdelavo biokemijskih nevronskih vezij, pri čemer so eksperimentalni poskusi do zdaj vključevali predvsem klasifikatorje na osnovi DNA oz. encimov in vitro, ali pa mikroRNA in genetskih vezij in vivo [5]. Sistem, zasnovan na ravni proteinov, bi prinesel številne prednosti, kot so hiter in reverzibilen odziv brez potrebe po transkripciji, združljivost z različnimi celičnimi tipi ter neposredno povezovanje z endogenimi vhodnimi in izhodnimi komponentami [6].
Razvoj znotrajceličnih proteinskih nevronskih mrež je omogočil napredek sintezne biologije na dveh ključnih področjih: prvič, de novo zasnovani heterodimeri (DHD) omogočajo programabilno in selektivno povezovanje med proteini; drugič, ti interakcijski moduli omogočajo ponovno sestavo razcepljenih virusnih proteinaz, s čimer lahko natančno uravnavamo njihovo encimsko aktivnost. Na podlagi teh pristopov so raziskovalci zasnovali proteinsko zmagovalec-vzame-vse (ang. winner-takes-all, WTA) mrežo, poimenovano tudi »perceptein« [8]. WTA vezje je ena najučinkovitejših sistemov za klasifikacijo vhodnih signalov, pri kateri pride do aktivacije zgolj tistega izhodnega elementa, katerega vsota uteži vhodnih signalov presega vse ostale vsote. Tak sistem omogoča binarne, nedvoumne odločitve ter učinkovito razločevanje med različnimi vhodnimi stanji.
Zasnova sistema
Delovanje proteinskega WTA vezja temelji na treh ključnih mehanizmih: uteženo seštevanje vhodnih signalov, ki omogoča, da se vozlišča, osnovne funkcionalne enote vezja, različno močno odzivajo na posamezne vhode; medsebojna inhibicija izhodov, ki preprečuje sočasno aktivacijo več izhodov; ter samoaktivacija, ki zagotavlja vzdrževanje aktivnosti izbranega izhoda po njegovi začetni aktivaciji [9]. Za izpeljavo teh mehanizmov so znanstveniki zasnovali komplet himernih proteinov, ki tvorijo vezje. Vhodni signal predstavlja nabor posebej zasnovanih DHD monomerov, ki se vežejo na proteine, ki jim rečemo N-vozlišča. Ti vsebujejo odzivno domeno, na katero se veže vhodni protein, N-terminalno polovico virusne proteinaze ter rekonstitucijsko domeno, ki je pri vseh N-vozliščih enaka in se poveže s C-vozliščem. Ob vezavi vhodnega proteina N-vozlišča tvorijo kompleks s C-vozlišči, ki vsebujejo komplementarne (C-terminalne) polovice proteinaz. S tem se sestavi funkcionalna proteaza, katere koncentracija in aktivnost predstavlja izhodni signal posameznega vozlišča. V strukturo teh vozlišč so vključeni tudi dodatni regulatorni elementi, kot so specifična mesta za cepitev proteaz in DHFR degroni, ki omogočajo natančen nadzor nad stabilnostjo in aktivnostjo proteinov v sistemu [1].
Vsak vhodni protein lahko aktivira katerokoli vozlišče v mreži. V odsotnosti vhodnih signalov odzivna in rekonstitucijska DHD domena v posameznem N-vozlišču tvorita šibko intramolekularno interakcijo, kar povzroči njuno zložitev v neaktivno konformacijo in s tem onemogoča interakcijo s C-vozlišči. Ob prisotnosti ustreznega vhodnega DHD proteina pride do vezave na odzivno domeno N-vozlišča, kar prekine intramolekularne interakcije in sprosti rekonstitucijsko domeno. Ta domena nato omogoči tvorbo kompleksa s komplementarno domeno v C-vozlišču. Rezultat je bodisi funkcionalna proteaza, kadar se združita ujemajoči se polovici iste virusne proteaze, bodisi nefunkcionalna kombinacija, kadar se združita polovici drugačnih proteaz. Funkcionalne proteaze nato pripomorejo h samoaktivaciji in inhibiciji proteaz drugih vrst. Samoaktivacija poteče s proteolitično razgradnjo DHFR degron domene na istem proteinu, ki bi sicer sprožila razgradnjo proteina v kratkem času. Inhibicija proteaz drugih vrst pa poteče s proteolitično odstranitvijo rekonstrukcijske DHD domene na C-vozliščih proteinov z drugo vrsto proteaze.
Modeliranje in simulacije
Za razumevanje delovanja proteinskega WTA vezja v bioloških pogojih so raziskovalci razvili podroben matematični model, ki simulira dinamiko proteinskih interakcij v sistemu. Model je bil ustvarjen v programu Python na osnovi poenostavljene notacije, kjer so posamezne proteinske komponente, kot so vhodni proteini (Xi), N-vozlišča (NijD z degronom ali Nij brez), C-vozlišča (Ck), in izhodne proteaze (Yi) predstavljene s simboli, ki označujejo njihove vloge in medsebojne interakcije. V primeru dveh vhodov in dveh izhodov imamo osem začetnih proteinov: dva Xi, štiri NijD in dva Ck. Posamezen Xi se veže na enega od NijD, nastali kompleks pa se veže z enim od Ck, kar tvori funkcionalno (j je k) ali nefunkcionalno (j ni k) proteazo. Vsaka možna interakcija med temi komponentami je bila definirana z ustreznimi kinetičnimi parametri, vključno z vezavnimi afinitetami, hitrostmi razgradnje, sinteze ter proteolitske aktivnosti. Kljub preprostosti sistema je zaradi tvorbe različnih dimerov in trimerov sistem generiral kar 158 unikatnih proteinskih vrst, ki so sodelovale v 310 različnih kemijskih reakcijah. Te reakcije so bile opisane s pomočjo sistema diferencialnih enačb, ki so modelirale potek vezav, tvorbo funkcionalnih ali nefunkcionalnih proteaz, njihovo samoaktivacijo ter medsebojno inhibicijo. Izvajanje WTA klasifikacije so raziskovalci preverjali s simulacijami, v katerih so sistem izpostavili različnim kombinacijam koncentracij vhodnih signalov. Ko je bila koncentracija vhodnega proteina X1 višja od X2, je proteaza Y1 dosegla izrazito višjo aktivnost že v treh urah, medtem ko je maksimalna raven aktivnosti nastopila v približno 100 urah. Enak odziv so opazili v obratnem primeru, ko je prevladoval vhod X2. Vezje je pravilno izvajalo klasifikacijo pri širokem razponu koncentracij in je ostalo občutljivo tudi pri zelo majhnih razlikah med vhodoma, celo pri 10-odstotni razliki v koncentraciji [1].
Eksperimentalna validacija
Za preverjanje delovanje proteinskega vezja v živalskih celicah, so raziskovalci eksperimentalno sestavili celoten sistem z dvema vhodoma in dvema izhodnima proteazama v človeških HEK293 celicah. Uporabili so dve ortogonalni virusni proteazi, TEVP (Tobacco Etch Virus Protease) in TVMVP (Tobacco Vein Mottling Virus Protease), ki sta bili gensko razdeljeni na N- in C-terminalni polovici [10]. Te polovice so bile nato fuzirane z DHD domenami za specifično dimerizacijo, cepitvenimi mesti za uravnavanje funkcionalnosti ter degronskimi zaporedji za nadzor razgradnje. Aktivnost proteaz so spremljali s fluorescenčnim reporterskim sistemom, v katerem vsaka proteaza specifično zmanjša signal določenega fluorescenčnega proteina. TEVP je cepila citrin oz. rumeni fluorescenčni protein, TVMVP pa mCherry [10].
Eksperimenti so potrdili, da se ob prisotnosti ustreznega vhoda aktivira pravilna proteaza, ki razcepi tarčni protein, medtem ko so v odsotnosti vhoda ravni fluorescence ostale nespremenjene. Nato so preverili sposobnost vezja za uteževanje vhodnih signalov. S sistematično spremembo razmerij med izraženimi mRNA, ki kodirajo različice N-vozlišč, so pokazali, da se količina reaktivirane proteazne aktivnosti linearno povečuje v odvisnosti od relativnih koncentracij posameznih N-vozlišč. Ta rezultat potrjuje, da vezje omogoča kvantitativno porazdelitev vhodnega signala glede na nastavljivo utež, določeno z izražanjem ustreznih proteinskih komponent. Eksperimentalno je bilo potrjeno tudi delovanje dveh ključnih mehanizmov v vezju: samoaktivacija in inhibicija med proteazami. Samoaktivacijo so preverili s konstrukti, pri katerih so bila cepitvena mesta za proteazo v degronski domeni mutirana, s čimer so preprečili cepitev in s tem odstranitev degrona. V teh primerih je bila stabilnost proteina bistveno zmanjšana, kar je potrdilo, da se aktivirane proteaze lahko stabilizirajo preko odcepitve lastnega degrona. Za preizkus medsebojne inhibicije so v sistem vnesli presežek ene vrste proteaze, kar je vodilo do opaznega znižanja aktivnosti druge vrste. Ta pojav kaže, da posamezne proteaze lahko neposredno zavrejo delovanje konkurenčnih poti z razcepom ključnih gradnikov njihove aktivacije.
Končno so pokazali, da celotno proteinsko vezje uspešno razlikuje med različnimi koncentracijami vhodnih proteinov in s tem pravilno izvede klasifikacijo, kar je eksperimentalno potrjeno s fluorescenčnimi odčitki. Doseženi izhodi so se kvantitativno zelo dobro ujemali z napovedmi iz simulacij. Raziskovalci so funkcionalnost vezja preverili tudi pri neposrednem uravnavanju pomembnih celičnih odzivov. V ta namen so na izhodno proteazo TEVP fuzirali inhibicijsko sekvenco za kaspazo-3, ki ob aktivaciji sproži apoptozo [11]. Ko je vezje prepoznalo višjo koncentracijo ustreznega vhodnega proteina in povišalo koncentracijo aktivne TEVP, je ta razcepila kletko okoli kaspaze-3 in sprožila apoptozo. Na ta način so pokazali, da vezje lahko pretvori vhodne signale v različne celične odzive [1].
razširjena klasifikacija
Ker je eden ključnih elementov nevronskih mrež njihovo modularno razširjanje za reševanje bolj zapletenih nalog klasifikacije, so znanstveniki razširitev klasifikacije želeli izpeljati tudi na ustvarjenem proteinskem vezju. V sistem so vključili tretjo proteazo (HRV3CP), ki je konstantno aktivna in zavira dve ostali proteazi, hkrati pa so pripravili posebno linijo celic, ki v jedru vsebujejo tri fluorescenčne beljakovine (poleg citrina in mCherry tudi miRFP680), vsaka od njih pa je bila občutljiva na aktivnost ene od proteaz [10]. Celice so sočasno prejele vse potrebne proteine in nato so spremljali fluorescenčne signale. Celice so pokazale jasno ločene vzorce fluorescence glede na prevladujoč vhodni protein, kar je bilo skladno s predhodnimi računalniškimi simulacijami. S tem so pokazali, da lahko vezje razširimo z dodajanjem več neodvisnih proteaz, ki lahko uporabljajo več vhodov in izhodov. To omogoča bolj kompleksno klasifikacijo signalov. Znanstveniki so simulirali tudi večje sisteme z različnim številom vhodov in vozlišč, kjer so ugotovili, da sistem ohranja svojo funkcionalnost, čeprav z manjšo občutljivostjo. Kompleksnost sistema (merjena s številom kemijskih reakcij) se je povečevala približno linearno z velikostjo omrežja, kar pomeni, da sistem ostaja učinkovit tudi ob povečanju števila komponent.
Zaključek
V predstavljenem projektu so raziskovalci pokazali, da je mogoče umetno ustvariti proteinske nevronske mreže z uporabo de novo oblikovanih proteinskih domen in inženirskih encimov. Tako so v žive celice vpeljali klasični WTA klasifikacijski sistem z nastavljivimi odločitvenimi mejami. Pomembna značilnost proteinskega vezja je, da med delovanjem nastaja veliko različnih proteinskih vrst in kompleksov, ki pa so nastali iz relativno majhnega začetnega nabora proteinskih komponent, kar spominja na procese v naravi, kjer proteini s spajanjem, cepitvijo ali kombiniranjem ustvarjajo veliko raznolikost funkcionalnih produktov.
Kljub uspehom pa ima sistem tudi omejitve. Izidi klasifikacije niso povsem digitalni, temveč nakazujejo na spekter, kar je verjetno posledica variabilnosti izražanja pri začasni transfeckiji. Velikost omrežja je trenutno omejena s številom zanesljivih inženirskih proteaz ter tehničnimi izzivi pri nadzorovanem izražanju velikega števila proteinov. Prav tako se kompleksnost sistema povečuje linearno ali celo multiplicativno z dodajanjem več komponent, kar omejuje njegovo razširjanje.
Za razvoj večjih in bolj zapletenih bioloških računalniških vezij bo potrebno izboljšati izdelavo različnih encimskih različic z natančno programabilno specifičnostjo, optimizirati izražanje večgenskih sistemov ter razviti učinkovitejše oblike vezij, ki bodo bolj podobne naravnim. Z napredkom genomskega inženiringa lahko takšni nevronski sistemi bistveno izboljšajo sposobnost celic za obdelavo informacij, kar odpira nove možnosti za natančno in dinamično uravnavanje bioloških funkcij. To lahko privede do razvoja bolj učinkovitih terapij, biotehnoloških aplikacij in razumevanja kompleksnih celičnih mehanizmov [12].
Literatura
[1] Chen Z, Linton JM, Xia S, et al. A synthetic protein-level neural network in mammalian cells. Science. 2024;386(6727):1243-1250. doi:10.1126/science.add8468 [2] 1.Hafner A, Bulyk ML, Jambhekar A, Lahav G, The multiple mechanisms that regulate p53 activity and cell fate. Nat. Rev. Mol. Cell Biol 20, 199–210 (2019) [3 ]Zagorski M, Tabata Y, Brandenberg N, Lutolf MP, Tkačik G, Bollenbach T, Briscoe J, Kicheva A, Decoding of position in the developing neural tube from antiparallel morphogen gradients. Science 356, 1379–1383 (2017) [4] Antebi YE, Reich-Zeliger S, Hart Y, Mayo A, Eizenberg I, Rimer J, Putheti P, Pe’er D, Friedman N, Mapping differentiation under mixed culture conditions reveals a tunable continuum of T cell fates. PLoS Biol 11, e1001616 (2013). [5] Genot AJ, Fujii T, Rondelez Y, Computing with competition in biochemical networks. Phys. Rev. Lett 109, 208102 (2012). [6] Hong M, Clubb JD, Chen YY, Engineering CAR-T Cells for Next-Generation Cancer Therapy. Cancer Cell, doi: 10.1016/j.ccell.2020.07.005 (2020) [7] Benenson Y, Biomolecular computing systems: principles, progress and potential. Nat. Rev. Genet 13, 455–468 (2012). [8] Maass W, On the computational power of winner-take-all. Neural Comput 12, 2519–2535 (2000). [9] 31.Kim J, Hopfield J, Winfree E, “Neural Network Computation by In Vitro Transcriptional Circuits” in Advances in Neural Information Processing Systems 17, Saul LK, Weiss Y, Bottou L, Eds. (MIT Press, 2005), pp. 681–688. [10] Gao XJ, Chong LS, Kim MS, Elowitz MB, Programmable protein circuits in living cells. Science 361, 1252–1258 (2018). [11] Xia S, Lu AC, Tobin V, Luo K, Moeller L, Shon DJ, Du R, Linton JM, Sui M, Horns F, Elowitz MB, Synthetic protein circuits for programmable control of mammalian cell death. Cell 187, 2785–2800.e16 (2024). [12] Zhang M, Yang C, Tasan I, Zhao H, Expanding the Potential of Mammalian Genome Engineering via Targeted DNA Integration. ACS Synth. Biol 10, 429–446 (2021)