Ce este genetica?
Genetica este ca o carte de rețete pentru viață, scrisă într-un limbaj codat numit ADN. Indiferent dacă ești om, pisică, copac sau virus, această carte conține instrucțiuni precise – ca niște rețete – care spun fiecărei celule ce ingrediente să folosească și cum să le combine pentru a crește, a funcționa și a se reproduce. Așa cum din aceleași ingrediente pot ieși preparate foarte diferite, la fel și din același cod genetic pot apărea variații uimitoare ale vieții cu implicații directe pentru sănătatea acelui organism.
În acest context, putem spune ca geneticienii sunt niste bucătari curioși care studiază, decodează și chiar modifică aceste rețete pentru a face viata mai gustoasă, adică pentru a înțelege mai bine mecanismele biologice ale vieții, a preveni și trata boli.
Și acum trebuie să vă spun cine sunt bioinformaticienii – eu fiind una dintre ei. Bioinformaticienii pot fi comparați cu cei care creează și folosesc ustensilele inteligente din bucătăria științei. Lăsând gluma la o parte, aceștia sunt experți care îmbină biologia, matematica, statistica și informatica pentru a analiza și interpreta volume uriașe de date genetice și genomice. Practic, bioinformaticienii transformă informațiile brute în modele matematice simplificate, în grafice, tabele și concluzii clare, indispensabile pentru geneticieni, medici și cercetători din diverse domenii.
Ce este gena? Câte gene sunt în genomul uman?
O genă reprezintă o secțiune bine definită a lanțului de ADN, care conține instrucțiunile necesare pentru formarea unei molecule funcționale, cum ar fi ARN-ul mesager (ARNm), utilizat ulterior pentru producerea unei proteine. Unele gene sunt formate din doar câteva sute de nucleotide, în timp ce altele pot avea milioane, organizate în unități numite codoni (o secvență de trei nucleotide din mARN care codifică un aminoacid). În genomul uman există aproximativ 20.000 de gene care codifică proteine [1], distribuite de-a lungul celor 23 de perechi de cromozomi, iar acestea reprezintă doar aproximativ 2% din întregul ADN. Restul de 98% este alcătuit din regiuni care nu codifică proteine, dar care au roluri esențiale: unele generează molecule de ARN funcțional (precum tRNA, rRNA sau microARN), altele reglează activitatea genelor prin elemente precum promotorii și enhancerii (secvențe scurte de ADN care inițiază sau cresc probabilitatea transcrierii genelor), iar altele contribuie la structura genomului sau constau în secvențe repetitive și elemente mobile, paraziți genetici, ce au capacitatea de a se muta dintr-un loc în altul în genom (transpozoni și retrotranspozoni alcătuiesc aproximativ 46% din genomul uman [2]). Deși nu produc proteine, aceste regiuni care nu codifică proteine sunt indispensabile pentru organizarea, controlul și stabilitatea materialului genetic.
Ca o curiozitate, multe dintre diferențele dintre oameni și alte specii se găsesc nu în genele în sine, ci în aceste regiuni de reglare care determină cum, când și unde sunt activate genele. De exemplu, porumbul (Zea mays) are aproximativ 40.000 gene[3]. Sau ospecie de pește cu plămâni (Lepidosiren paradoxa) descoperită în America de Sud a revendicat titlul de animal cu cel mai mare genom secvențiat până în prezent. ADN-ul aceste specii de pește conține 91 de miliarde de nucleotide, de 30 de ori mai multe decât genomul uman. Totuși, și acest pește are în jur de 20.000 restul restul fiind alcătuit din ADN care nu codifică. [4]
Ce este ARN-ul?
Am explicat deja că ADN-ul se află în nucleul celular și are rolul de a păstra informația genetică. ARN-ul, în special ARN-ul mesager, este o copie a unui fragment din ADN și funcționează ca un curier, transportând mesajul din nucleu în citoplasmă, unde acest mesaj este folosit pentru a fabrica proteinele esențiale. Aceste proteine sunt vitale pentru construirea, repararea și funcționarea tuturor structurilor din corp – de la enzime și hormoni, până la mușchi, piele și organe. Mai mult decât atât, ARN-ul nu doar că indică „ce” proteină trebuie produsă, ci și „când” și „în ce cantitate”. Astfel, producția de proteine este strict reglată, răspunzând în timp real nevoilor celulei.
Altfel spus, deși ADN-ul conține informația genetică necesară pentru construirea și funcționarea organismelor, această informație nu este activă sau funcțională în sine. ADN-ul devine „activ” și înțeles doar prin intermediul ARN-ului, care preia instrucțiunile din ADN și le transformă în proteine — moleculele care îndeplinesc funcții în celulă.
Ce înseamnă „genă exprimată” și în ce context medical este importantă?
O „genă exprimată” este o genă activă – adică una care este „citită” de celulă și transformată mai întâi în ARN mesager, iar apoi într-o proteină. Această proteină îndeplinește o funcție specifică în organism, de la reglarea proceselor metabolice până la construirea și repararea structurilor celulare. În contrast, o genă inactivă „tăcută” (sau „silenced”) este o genă care, deși prezentă în genom, nu este exprimată – adică nu produce ARN mesager sau proteine. „Tăcerea” genelor poate fi cauzată de diferite mecanisme, cel mai important fiind inactivarea epigenetică, care reglează expresia genelor fără a modifica secvența ADN-ului.
In context medical, în cancer, de exemplu, oncogenele pot deveni supraexprimate (proteinele produse de acele gene sunt în cantități mai mari decât normal), în timp ce genele care suprimă tumorile sunt „tăcute” prin mecanisme epigenetice, favorizând dezvoltarea tumorilor.
Și în cazul bolilor autoimune, supraexprimarea genelor implicate în răspunsul imun determină atacul organismului asupra propriilor țesuturi.
Dar în cazul fibrozei chistice, mutațiile nu influențează neapărat cantitatea de proteine produse de gena CFTR, ci determină producerea unor proteine defectuoase.
În boala Alzheimer, genele care produc proteinele APP și tau sunt supraexprimate, formând plăci amiloide și încrengături toxice în creier, în timp ce genele pentru protecția neuronilor și eliminarea deșeurilor sunt subexprimate.
În bolile cu etiologie complexă – fie ele neurologice (Alzheimer, autism), cardiovasculare (ateroscleroză), autoimune (lupus, diabet tip 1) sau oncologice (cancer) – apar dereglări în expresia multor gene care perturbă funcționarea normală a celulelor și țesuturilor afectate.
Ce este epigenetica?
Însă modul în care genele sunt exprimate nu depinde doar de secvența ADN-ului, ci un rol crucial îl joacă epigenetica.
Epigenetica influențează modul în care informația din ADN este „citită” și transformată în ARN – adică, influențează ce gene sunt active și ce gene sunt inactive. Chiar dacă celula cere o anumită proteină, nu poate fi produsă decât dacă ADN-ul este accesibil. Epigenetica e ca un “panou de comandă” care decide ce gene sunt active și ce gene rămân inactive, în funcție de nevoile celulei. Ceea ce este fascinant pentru noi toți este că factori externi precum alimentația, stresul, somnul, poluarea sau stilul de viață pot influența epigenetica. Mai mult, unele modificări epigenetice pot fi chiar moștenite de la părinți, explicând de ce anumite predispoziții la boli apar în familii fără a avea neapărat o cauză genetică directă.
Genetică vs genomică:
Genetica este ramura biologiei care studiază genele. De exemplu, dacă cercetătorii studiază o mutație din gena BRCA1 care crește riscul de cancer de sân, atunci aceștia fac un studiu genetic.
Genomica, pe de altă parte, se refera la studiul întregului genom – totalitatea materialului genetic al unui organism. Genomica analizează toate genele împreună, precum și interacțiunile dintre ele și factorii de mediu. De exemplu, cand cercetătorii cartografiază întregul genom uman, identificând toate cele 20.000 de gene, ei fac un studiu genomic.
Ce este genomul de referință? Ce este T2T și importanța sa?
Secvențierea ADN-ului presupune citirea secvenței de nucleotide din molecula de ADN. Tehnologiile actuale, cum ar fi secvențierea de tip short-read, nu pot citi molecule întregi de ADN dintr-o dată, ci o fragmentează în bucăți mici, de aproximativ 150 de nucleotide. Aceste fragmente sunt apoi secvențiere individual, iar pentru a reconstitui întregul genom, ele trebuie aliniate cu un genom de referință – o versiune model, standard a genomului uman (sau al altor organisme).
Totuși, această metodă poate avea limite: în regiunile complexe sau repetitive ale genomului (centromere și telomere), fragmentele scurte sunt greu de plasat cu precizie, ceea ce duce la imposibilitatea de a reconstrui secvențe complete de ADN.
Aici intervine importanța secvențierii cu fragmente lungi (long-read sequencing), care poate citi segmente de zeci sau sute de mii de nucleotide dintr-o singură bucată. Această abordare permite asamblarea mai completă și mai precisă a genomului, inclusiv în regiunile dificile.
Genomul T2T reprezintă o versiune completă și continuă a genomului uman, fără lacune (gaps). Este prima secvențiere a întregului genom uman care include toate regiunile ADN-ului, chiar și secvențele complexe care au fost omise în proiectele anterioare. Genomul T2T a fost posibil datorită tehnologiilor noi de secvențiere, cum ar fi Pacific Biosciences (PacBio) și Oxford Nanopore, care permit citirea fragmentelor foarte lungi de ADN.[5] Această realizare reprezintă un pas uriaș în înțelegerea completă a genomului uman și deschide noi posibilități în cercetarea genetică și medicina personalizată.
Am dorit să evidențiez importanța proiectului T2T și să prezint tehnologia PacBio, deoarece mă aflu într-un moment de tranziție semnificativă în cariera mea, după 25 de ani petrecuți în mediul academic. Începând cu 1 iulie a acestui an, voi face parte din echipa Pacific Biosciences, în calitate de Genomic Sales Specialist II, responsabil pentru regiunea Germania de Vest și Benelux.
[1] https://doi.org/10.1093/nar/gkae1078
[2] https://www.science.org/doi/10.1126/science.abj6987
[3] https://plants.ensembl.org/Zea_mays/Info/Annotation/
[4] https://doi.org/10.1038/s41586-024-07830-1
[5] https://www.science.org/doi/10.1126/science.abj6987
Acest material a fost publicat de autoare și pe contributors.ro
- Despre Ligia Monica Mateiu AICI