Libero
SCIENZA

Perché AlphaGenome è un punto di svolta nello studio del DNA

AlphaGenome, nuova svolta nella ricerca sulle malattie rare: cos'è e perchè è tanto importante

Pubblicato:

Ricerca sul genoma umano 123RF

Una delle sfide più complesse della genomica moderna è di certo l’interpretazione degli effetti delle varianti genetiche (soprattutto quelle non codificanti). Oltre il 98% delle variazioni del DNA del genere umano non modifica le proteine in maniera diretta. Agisce infatti regolando processi come l’espressione genica, lo splicing o l’organizzazione della cromatina.

AlphaGenome si inserisce proprio in questo scenario complesso. Un nuovo modello di deep learning che punta a fare un salto di qualità nella predizione degli effetti regolatori delle varianti genetiche.

Modello unico per leggere il DNA

Cos’è AlphaGenome? Parliamo di un modello “sequence-to-function”, in grado di prendere in input fino a 1 megabase di DNA, producendo migliaia di predizioni funzionali con risoluzione a singola base.

Questo è un risultato decisamente sorprendente, dal momento che fino a oggi i modelli erano costretti a scegliere: contesto genomico ampio oppure dettaglio fine. Si tenta così di superare finalmente questo compromesso, integrando entrambi.

L’addestramento del modello è stato svolto sui genomi umani e murino. Predice di fatto oltre 5.900 tracce genomiche nell’uomo, coprendo ben 11 modalità differenti. Tra queste:

  • espressione genica (RNA-seq);
  • inizio della trascrizione;
  • accessibilità della cromatina;
  • modifiche istoniche;
  • legame dei fattori di trascrizione;
  • mappe di contatto della cromatina;
  • descrizione più completa dello splicing.

La differenza dai modelli precedenti

I modelli più noti finora si dividevano in due categorie. Da un lato avevamo quelli altamente specializzati, come i dedicati allo splicing o all’accessibilità cromatinica. Dall’altro, invece, i generalisti, in grado di coprire più ambiti, al netto però di una risoluzione limitata. AlphaGenome prova dunque a unificare questi mondi.

Sfruttando un’architettura ispirata alle U-Net, il modello fa un uso combinato di convoluzione e transformer, riuscendo a catturare segnali locali e interazioni a lunga distanza, dai siti di splicing, ad esempio, alle interazioni tra enhancer e promotori separati da centinaia di kilobasi.

Il risultato? Un nuovo sistema che eguaglia o supera lo stato dell’arte in 25 test su 26, nei benchmark. Un risultato sorprendente, a dir poco, per la predizione degli effetti delle varianti.

Dalla ricerca alle applicazioni cliniche

Uno degli aspetti cardine di AlphaGenome è la capacità di modellare lo splicing a più livelli:

  • siti di splicing;
  • uso competitivo dei siti;
  • giunzioni tra esoni.

Questo approccio consente di identificare in modo più accurato le varianti che alterano la struttura degli RNA. Di fatto una delle cause più frequenti di malattie genetiche. Per quanto riguarda l’espressione genica, il modello mostra dei miglioramenti significativi nella predizione degli eQTL (varianti che influenzano quanto un gene viene espresso).

Non riesce soltanto a stimare l’intensità dell’effetto, va ben oltre e comprende anche la direzione (aumento o diminuzione dell’espressione. Di fatto un aspetto cruciale per collegare le varianti ai risultati degli studi GWAS.

Come se non bastasse tutto ciò, sorprende l’approccio multimodale. Una singola variante può infatti essere analizzata contemporaneamente per i suoi effetti su cromatina, trascrizione e splicing.

Questo consente di ricostruire meccanismi complessi, come nel caso di varianti oncogeniche che attivano nuovi enhancer e aumentano l’espressione di geni coinvolti nei tumori. In prospettiva, AlphaGenome potrebbe diventare uno strumento chiave per la ricerca sulle malattie rare, per la progettazione di terapie basate su RNA e per l’analisi funzionale delle varianti non codificanti, ancora oggi le più difficili da interpretare.