DeepMind AlphaGenome

AlphaGenome: come l’AI di DeepMind sta decodificando il 98% del genoma umano

Per decenni, i biologi e i genetisti si sono trovati di fronte ad un paradosso imbarazzante. Nel 2003, quando il Progetto Genoma Umano fu dichiarato completo, il mondo celebrò la lettura del “libro della vita”. Eppure c’era un problema che pochi fuori dagli addetti ai lavori comprendevano appieno: riuscivamo a leggere le lettere, ma capivamo a malapena il 2% delle frasi.

Quel 2% è costituito dai geni codificanti, le istruzioni per costruire le proteine che ci tengono in vita. E il resto? Il restante 98% del nostro DNA è stato a lungo, e ingiustamente, etichettato come “DNA spazzatura” o, con un termine più poetico e inquietante, “Dark Genome” (genoma oscuro). Si intuiva che non fosse lì per caso, che contenesse gli interruttori e i regolatori che decidono quando e quanto un gene deve lavorare, ma la sua complessità era tale da renderlo indecifrabile. Era un oceano di dati bui in cui la scienza navigava a vista.

Fino al 28 gennaio 2026. In quella data, Google DeepMind ha pubblicato su Nature i risultati di AlphaGenome, un sistema di intelligenza artificiale che promette di fare per la genomica ciò che AlphaFold ha fatto per la biologia strutturale. Non stiamo parlando di un semplice aggiornamento software, ma di un cambio di paradigma che ridefinisce i confini della medicina di precisione. Come AssoInnovatori, abbiamo analizzato il paper tecnico e le prime reazioni della comunità scientifica per spiegarvi perché, da oggi, la biotecnologia non sarà più la stessa.

Il problema del contesto nella genomica

Per capire la portata di questa innovazione, dobbiamo prima comprendere il limite tecnologico che ci ha frenato fino a ieri. Immaginate di dover capire la trama di un romanzo complesso, come Guerra e Pace, potendo però leggere solo tre parole alla volta. Potreste forse intuire il senso di una frase, ma perdereste completamente le connessioni tra un capitolo e l’altro, i riferimenti incrociati, la struttura profonda della narrazione.

I modelli di AI genomica precedenti funzionavano esattamente così. Erano limitati da una “finestra di contesto” ristretta. Potevano analizzare brevi sequenze di DNA e identificare motivi locali, ma erano ciechi di fronte alle interazioni a lungo raggio. E nel nostro DNA, la distanza conta. Un “interruttore” (enhancer) posizionato a centinaia di migliaia di lettere di distanza può essere responsabile dell’attivazione di un gene fondamentale per lo sviluppo del cuore o del cervello. Se il tuo modello non riesce a vedere entrambi contemporaneamente, quell’interazione rimane invisibile.

AlphaGenome ha frantumato questo limite. La sua architettura neurale è stata progettata per gestire una finestra di contesto di 1 milione di paia di basi. È come passare dal leggere tre parole alla volta a visualizzare interi capitoli in un unico colpo d’occhio. Questa capacità di “vedere il quadro d’insieme” permette al modello di prevedere come una singola mutazione, un banale errore di battitura in quel 98% di genoma oscuro, possa alterare l’espressione genica e scatenare una patologia.

Come funziona l’oracolo del DNA

Tecnicamente, AlphaGenome è un capolavoro di ingegneria algoritmica che unisce l’architettura Transformer (la stessa alla base dei moderni LLM) con strutture a “U-Net” per gestire la risoluzione spaziale. Ma lasciamo da parte il gergo informatico per concentrarci sul risultato funzionale.

Il modello è stato addestrato su una mole immensa di dati pubblici (inclusi i dataset del progetto ENCODE e genomica comparativa tra uomo e topo) per imparare la “grammatica” molecolare. Non si limita a memorizzare; predice. Sottoposto a una batteria di test rigorosi, AlphaGenome ha surclassato i modelli precedenti in 25 su 26 benchmark di predizione delle varianti. È in grado di stimare simultaneamente l’attività di 11 diverse modalità biologiche – dall’accessibilità della cromatina alla metilazione, fino all’espressione dell’RNA – con una risoluzione alla singola base.

Cosa significa in pratica? Significa che se un ricercatore trova una variante genetica rara in un paziente affetto da una malattia sconosciuta, e questa variante si trova in una zona “deserta” del DNA dove non ci sono geni noti, AlphaGenome può analizzare quella singola lettera fuori posto e dire: “Attenzione, questa mutazione rompe un sito di legame che regola un gene critico distante 500.000 basi da qui”. Trasforma un dato privo di senso in un’ipotesi clinica verificabile.

Isomorphic Labs e la nuova frontiera del Drug Discovery

Non possiamo parlare di DeepMind senza citare il suo braccio operativo nel settore farmaceutico: Isomorphic Labs. Se AlphaGenome è la mappa, Isomorphic Labs è l’esploratore che la usa per trovare tesori. Con un finanziamento recente che ha sfiorato i 600 milioni di dollari e partnership strategiche con giganti come Eli Lilly e Novartis (per un valore potenziale di 3 miliardi di dollari), l’azienda sta integrando AlphaGenome nel suo motore di scoperta farmaceutica.

Perché questo è rilevante per l’industria? Perché la maggior parte dei farmaci oggi in commercio colpisce bersagli legati a quel famoso 2% di genoma codificante. Ma molte malattie complesse – dall’Alzheimer al diabete, fino a molti tumori solidi – hanno radici profonde nel malfunzionamento della regolazione genica, nel “buio” del 98%. AlphaGenome apre la porta a una nuova classe di farmaci che non mirano solo a bloccare una proteina difettosa, ma a correggere l’errore di regolazione a monte. È la promessa di passare dalla cura dei sintomi alla riprogrammazione dei meccanismi biologici errati.

Limiti e sfide etiche per AlphaGenome

Tuttavia, come Innovation Manager e professionisti della tecnologia, abbiamo il dovere di mantenere i piedi per terra e di non cadere nel sensazionalismo sfrenato. AlphaGenome è uno strumento di ricerca straordinario, ma non è (ancora) un oracolo infallibile pronto per la corsia d’ospedale.

Leggendo le note tecniche e le reazioni degli esperti indipendenti citati da Science Media Centre, emergono alcuni limiti chiari:

  1. Specificità cellulare: il modello è eccellente nel predire l’effetto delle varianti in generale, ma fatica ancora a distinguere perfettamente come la stessa mutazione possa comportarsi in modo diverso in una cellula del fegato rispetto a un neurone. La biologia è contesto-dipendente, e qui c’è ancora lavoro da fare.
  2. Distanze estreme: sebbene 1 milione di basi sia un record, alcune interazioni genomiche avvengono su distanze ancora maggiori o addirittura tra cromosomi diversi. Queste rimangono, per ora, fuori dalla portata del modello.
  3. Il rischio dell’allucinazione: come ogni AI generativa o predittiva, esiste il rischio di falsi positivi. Un medico non può basare una diagnosi di vita o di morte solo sull’output di AlphaGenome. Il modello serve a prioritizzare gli esperimenti di laboratorio, non a sostituirli.

Inoltre, l’apertura parziale del codice solleva questioni di governance. DeepMind ha reso disponibile il codice per uso non commerciale, ma i pesi del modello completo sono risorse strategiche. Questo crea un divario inevitabile tra chi ha le risorse computazionali per far girare questi giganti e i piccoli laboratori di ricerca. La democratizzazione della genomica AI è una sfida politica, non solo tecnica.

Stiamo riscrivendo il futuro?

Il rilascio di AlphaGenome nel gennaio 2026 segnerà probabilmente sui libri di storia della scienza il momento in cui abbiamo smesso di guardare il genoma come una lista di componenti e abbiamo iniziato a guardarlo come un sistema operativo dinamico. Per le aziende biotecnologiche, per gli investitori e per i professionisti della salute, i dati non sono più il collo di bottiglia. Ne abbiamo fin troppi. Il vantaggio competitivo ora risiede nella capacità di interrogare questi dati con strumenti di intelligenza artificiale avanzata.

Il “DNA spazzatura” non esiste più. Esistono solo dati che non sapevamo ancora leggere. E ora, grazie all’unione tra biologia e silicio, abbiamo finalmente trovato gli occhiali giusti per farlo.