|
|
|
|||||||||
Il computer creativo per decifrare la vitaEdoardo Boncinelli
Ancora non sappiamo quello che vorremmo sapere. Solo il matrimonio tra biologia e teoria dell’informazione potrebbe aiutarci a scovare correlazioni su larga scala. Dobbiamo inventarci un modo per leggere il codice della vita. Per la civiltà sarà l’equivalente della Stele di Rosetta che ci aiutò a svelare il segreto dei geroglifici.
La biologia si espande a macchia d’olio e sta incontrando obbligatoriamente l’informatica. Sta nascendo la bionformatica, che tuttavia va inventata. Oggi bioinformatica può significare tante cose (attinenti per esempio alla conformazione spaziale di una proteina, alla corteccia cerebrale, alle proprietà dei cosiddetti computer neurali, ndr), ma quello che mi interessa qui è la possibilità di utilizzare, attraverso il computer, la grande quantità di dati del Genoma umano.
La ricerca su Genoma umano ci ha permesso di comprendere il segreto della vita, che – come spesso accade per le grandi scoperte – è un segreto abbastanza semplice: in ciascuna cellula del corpo umano è contenuta una serie di istruzioni per farla nascere, tenerla in vita e farla crescere. Ma se affermassimo che oggi sappiamo tutto della vita, diremmo una grossa stupidaggine.
Il genoma è una sorta di manuale di istruzioni per l’uso: è scritto come un testo, che va però interpretato. Ed è qui la grandezza e la bellezza della sfida. Il genoma è lineare, unidimensionale. La sua lettura può essere quadridimensionale.
Ogni cellula contiene un programma. Dunque in ogni pezzetto del nostro corpo c’è un programma. Nel nostro corpo ci sono 10 mila miliardi di cellule; cioè 10 mila miliardi di programmi.
Il patrimonio genetico di ciascuno di noi è dunque un enciclopedia; ma è sempre un testo, un testo lineare. E un testo scritto nel DNA con un alfabeto di quattro lettere: A,G,C e T. Per raccontare come è fatto un uomo ci vogliono 3 miliardi di lettere. Ma sono ben 2 o 3 milioni le lettere che fanno ognuno di noi diverso dall’altro.
Ora la ricerca sul genoma mira a stabilire che cos’è essenziale e che cos’è accessorio.
Fin qui è il bello della situazione. Il brutto è che questo testo è troppo lungo e non si riesce a leggerlo tutto. Se ne può fruire solo per via informatica. Per questo l’uso del computer è essenziale. Perchè via computer si può gestire questa massa enorme di lettere e informazioni. Ma occorrono computer potentissimi e software eccezionali. Ed è per questo che nella guerra pubblico-privato ad arrivare primi per completare il Progetto Genoma, alla fine ha vinto il privato che ha potuto mettere in campo forse biologi meno brillanti, ma sicuramente molta più potenza di calcolo.
E tuttavia ad oggi conosciamo solo il 4-5% di quello che ci piacerebbe conoscere. Ma quello che ci piacerebbe conoscere non è tutto quello che dovremmo conoscere. In realtà il fatto più importante è che non sappiamo quello che vorremmo sapere.
Le tre grandi famiglie di geni
Torniamo dunque al lunghissimo testo che dobbiamo leggere. Bene, al di dentro di questo testo ci sono capitoli che per tradizione chiamiamo geni. Ma quanti sono i geni? quali sono? Ognuno di noi biologi fa le sue previsioni. Una cosa sembra assodata. Che ci sono tre grandi compartimenti di geni: quelli semplici o “monofattoriali”; i “cogeni”, o geni deboli, che sono multifattoriali e poi una categoria di geni che non è nè del primo nè del secondo tipo.
I geni monofattoriali- La fibrosi cistica e la talassemia.
I geni monofattoriali sono quelli che, se sono alterati, producono una determinata patologia genetica. Sono i geni che danno origine, quando alterati, a malattie come la fibrosi cistica e la talassemia. Non esiste, dunque, il gene della talassemia: c’è un gene sano che, quando è alterato, degenera in una malattia o crea altri problemi.
Questi geni sono i più facili da individuare. Ed è per questo che sono di gran lunga i più numerosi tra i 4-5000 geni che conosciamo. Ad ogni mutazione corrisponde il difetto di quel gene specifico.
I cogeni (geni deboli, multifattoriali)- Il colore della pelle
I cogeni (o geni deboli) sono quelli responsabili, per esempio, di determinate caratteristiche. Il colore della pelle, per esempio, è determinato da 7 o 8 geni; il diabete da 150 circa; l’intelligenza da migliaia. E ci rendiamo conto di quanto sia difficile studiare i geni dell’intelligenza dalla difficoltà di trovare, per esempio, i 30 geni responsabili di una certa patologia.
Ed è per questo che è così importante studiare il patrimonio genetico di certe popolazioni come gli islandesi o i sardi. Occorre mettere in connessione decine e decine di geni e per questo occorrono grandi famiglie e grandi potenze di calcolo. Ancora siamo lontani da una conoscenza accettabile dei geni multifattoriali nella genetica umana. Molto meglio con la genetica vegetale, dove si possono fare esperimenti di incrocio a piacimento. Così abbiamo scoperto, per esempio, che il peso del pisello dipende essenzialmente da sette geni.
L’impresa di domani della nuova genomica sarà quella di finire l’esame dei geni multifattoriali. Ci sono ancora duemila famiglie di malattie di cui non sono stati identificati i geni coinvolti. E’ un impegno spaventoso, impossibile da tentare di affrontare senza l’ausilio massiccio del computer.
Geni complessi- La memoria, i ricordi
C’è poi – ci deve essere - una terza categoria di geni, che non è nè del primo, nè del secondo tipo. Ma non ne sappiamo praticamente nulla. Non sappiamo neppure come leggere il testo. Se sappiamo che i primi due tipi di geni si leggono a tre letterine per volta. Possiamo ipotizzare che questi geni del terzo tipo possano essere letti a due letterine per volta, o a quattro, o con un’altra chiave di lettura ancora tutta da scoprire. Sono geni complessi e dovrebbero essere quelli responsabili di fattori come la memoria. Nessuno sa come sono scritti i nostri ricordi. Eppure siamo certi che esistono dei geni che codificano i ricordi. Sono ricerche ancora più complesse. Solo il matrimonio tra biologia e teoria dell’informazione potrebbe aiutarci a scovare correlazioni su larga scala.
Insomma dobbiamo inventarci un modo per leggere il codice della vita. Chi riuscirà a indovinare la chiave di lettura sarà autore di un cambiamento sconvolgente che potrà rivoluzionare non solo la biologia, ma anche l’informatica. Quella chiave è un punto d’arrivo per la biologia, ma è anche un punto di partenza che rivoluzionerà il mondo dei computer. Una cosa è certa: la soluzione verrà da un’integrazione felice tra il cervello umano e una straordinaria capacità di calcolo dei computer. Forse chi farà scattare il “clic”, chi accenderà la lampadina non sarà un biologo. A volte non sapere nulla è un vantaggio. Anzi io mi auguro che sia una persona al di fuori del mondo della biologia, che approcci il problema senza preconcetti. Per la civiltà sarà l’equivalente della Stele di Rosetta che ci aiutò a svelare il segreto dei geroglifici.
E probabilmente l’autore della scoperta della nuova Rosetta non sarà una persona sola: io credo proprio che ad arrivare a far scattare il “clic” sarà una molteplicità di cervelli: persone particolarmente dotate aiutate da computer particolarmente flessibili, veloci e potenti.
|
![]()
|
|||||||||
|
|
||||||||||
|
|
||||||||||