Vol. 2° -  XIX.1.

Variabilità nella sequenza del DNA

Una domanda importante che sorge spontanea nello studio dell’evoluzione è come i profili e i tassi evolutivi siano diversi tra geni e tra parti diverse dello stesso gene.

I tassi di evoluzione di determinate sequenze di DNA possono venir misurati confrontando le sequenze in due organismi diversi che, in qualche momento conosciuto del passato, si sono originati per divergenza da un antenato comune.

Assumiamo che l’antenato comune possedesse una singola sequenza di DNA. Successivamente, dopo che i due organismi si separarono da questo antenato, le loro sequenze di DNA andarono incontro a cambiamenti evolutivi diversi, producendo le differenze che rileviamo oggi nelle loro sequenze. Ad esempio, si ritiene che la maggior parte dei principali gruppi di mammiferi si sia diversificata a partire da un antenato comune all’incirca 65 milioni d’anni fa.

Supponiamo di aver esaminato nel topo e nell’uomo una sequenza particolare di DNA, per esempio quella dell’ormone della crescita. Potremmo trovare che le sequenze per questo gene sono diverse nell’uomo e nel topo per 20 nucleotidi. Questi 20 nucleotidi devono essere cambiati nei 65 milioni d’anni trascorsi dal momento della separazione delle linee evolutive dell’uomo e del topo.

Per calcolare il tasso di variazione evoluzionistica di questo gene, calcoliamo dapprima il numero di cambiamenti o sostituzioni nucleotidiche che si sono verificate per produrre le 20 differenze tra i nucleotidi che si osservano al giorno d’oggi. Esistono numerosi metodi matematici per stimare questo numero, che viene di solito espresso come sostituzioni nucleotidiche per sito nucleotidico, così che il tasso di evoluzione sia indipendente dalla lunghezza delle sequenze confrontate.

Per ottenere le velocità di variazione, dividiamo il valore delle sostituzioni per sito per il numero di anni di tempo evoluzionistico che separano i due organismi. Il tasso di variazione ottenuto viene poi espresso come sostituzioni per sito per anno. Nel nostro esempio dell’ormone della crescita, potremmo trovare che il tasso di variazione è stato di 4 x 10-9 sostituzioni per sito per anno.

Tassi relativi di cambiamento evolutivo
nelle sequenze di DNA dei geni di mammifero

Sequenze

Sostituzioni
nucleotidiche
per sito
per anno
(x 10-9)

Geni funzionali

 

sequenza fiancheggiante al 5’

2,36

sequenza leader

1,74

sequenza codificante sinonima

4,65

sequenza codificante non sinonima

0,88

introne

3,70

sequenza di coda o trailer

1,88

sequenza fiancheggiante al 3’

4,46

Pseudogèni

4,85

Studi delle sequenze nucleotidiche in numerosi geni hanno rivelato che parti diverse dei geni evolvono con velocità differenti. Si ricordi che un gene eucariotico tipico è composto da alcuni nucleotidi che specificano per la sequenza aminoacidica di una proteina - le sequenze codificanti - e da altri nucleotidi che non codificano per aminoacidi in una proteina, cioè le sequenze non codificanti.

Le sequenze non codificanti comprendono:

§   gli introni

§   le regioni leader

§   le regioni trailer [1]

che sono trascritte ma non tradotte;

§   le sequenze fiancheggianti al 5’ e al 3’ che non vengono trascritte

Altre sequenze non codificanti comprendono:

§   gli pseudogèni, che sono sequenze nucleotidiche che non danno più un prodotto genico funzionale a causa di mutazioni.

Anche all’interno delle regioni codificanti di un gene funzionale non tutte le sostituzioni nucleotidiche producono una corrispondente variazione a livello della sequenza aminoacidica della proteina. In modo particolare, molte delle mutazioni che avvengono alla terza posizione del codone non hanno effetto sulla sequenza aminoacidica della proteina, dato che tali mutazioni producono un codone sinonimo che codifica per lo stesso aminoacido.

Diverse regioni del gene sono in apparenza sottoposte a diverse forze evolutive ed evolvono a velocità differenti. La tabella mostra i tassi relativi di variazione in parti diverse dei geni dei mammiferi. Si noti che tra i geni funzionali i tassi di variazione più elevati comprendono i cambiamenti sinonimi nelle sequenze codificanti. Il tasso di variazione nucleotidica sinonima è all’incirca cinque volte più elevato di quello osservato per la variazioni non sinonime.

L’alto tasso d’evoluzione delle variazioni sinonime, che non alterano la sequenza aminoacidica della proteina, non è inatteso, in quanto queste variazioni non hanno effetto sul funzionamento di una proteina. Probabilmente le mutazioni sinonime e non sinonime insorgono con uguale frequenza: tuttavia, i cambiamenti non sinonimi che insorgono all’interno di sequenze codificanti di solito riducono la fitness e vengono eliminati per selezione naturale, mentre le mutazioni sinonime sono raramente deleterie, e pertanto tollerate.

Sempre dalla tabella si può desumere che alti tassi di cambiamenti evolutivi sono presenti anche a livello delle regioni fiancheggianti al 3’ di geni funzionali. Come le variazioni sinonime, le sequenze delle regioni fiancheggianti al 3’ non hanno alcun effetto noto sulla sequenza aminoacidica e di solito hanno scarso effetto sull’espressione genica; molte delle mutazioni che avverranno in queste regioni saranno tollerate dalla selezione naturale. Anche i tassi di variazione negli introni sono elevati, ma non così alti come per le variazioni sinonime e quelle nelle regioni fiancheggianti 3’.

Nonostante le sequenze negli introni non codifichino per proteine, l’introne deve venire disgiunto in modo appropriato perché l’mRNA venga tradotto in una proteina funzionale. Alcune sequenze all’interno dell’introne sono critiche per una corretta scelta del punto di giunzione: queste includono le sequenze consenso alle estremità 5’ e 3’ dell’introne e la sequenza al punto di ramificazione. Come risultato, non tutti i cambiamenti a livello degli introni saranno tollerati e pertanto il tasso generale di evoluzione è più basso di quello osservato per le sequenze codificanti sinonime e per le regioni fiancheggianti 3’.

Nella regione fiancheggiante 5’ si osservano tassi evolutivi inferiori. Nonostante questa regione non venga trascritta né tradotta, essa contiene il promotore del gene, pertanto le sequenze nella regione fiancheggiante 5’ sono importanti per l’espressione genica. In questa zona si trovano importanti sequenze consenso, come il TATA box [2] . Mutazioni nelle sequenze consenso potrebbero impedire che il gene venga trascritto e avranno pertanto effetti deleteri sulla fitness dell’organismo. La selezione naturale elimina queste mutazioni e mantiene bassi i cambiamenti in questa regione.

Seguono, in quanto a tasso evolutivo, le regioni leader e trailer, che hanno tassi alquanto più bassi che non la regione fiancheggiante 5’. Nonostante le sequenze leader e le sequenze trailer non vengano tradotte, esse sono trascritte e forniscono segnali importanti per il processamento dell’mRNA e per l’associazione del ribosoma all’mRNA. Pertanto in queste regioni le sostituzioni nucleotidiche sono limitate. I tassi evolutivi più bassi si riscontrano per le sequenze codificanti non sinonime: cambiamenti in questi nucleotidi alterano la sequenza aminoacidica della proteina e molte delle mutazioni che avvengono in questi siti sono eliminate dalla selezione naturale.

Un’ultima cosa da notare nella tabella è che il tasso più elevato di evoluzione si osserva negli pseudogèni. L’alto tasso evolutivo osservato in queste sequenze non funzionali dipende dal fatto che gli pseudogèni non codificano più per proteine e siccome i cambiamenti a livello di questi geni non hanno effetto sulla fitness, le variazioni stesse non vengono eliminate per selezione naturale.

Per riassumere

Osserviamo i tassi di variazione evolutiva più elevati
in quelle sequenze dotate di effetti minori sulla funzione

 

Un’osservazione interessante proveniente dallo studio delle sequenze nucleotidiche è che, nonostante il tasso evolutivo dei cambiamenti nucleotidici sinonimi sia molto più alto di quello delle variazioni non sinonime, i tassi di cambiamento sinonimi spesso non sono così elevati come quelli osservati per gli pseudogèni.

Quest’osservazione suggerisce che le mutazioni sinonime non siano completamente sinonime. La selezione naturale potrebbe favorire alcuni codoni sinonimi a scapito di altri. Quest’ipotesi è rafforzata dalla scoperta che i codoni sinonimi non vengono utilizzati in modo identico nelle sequenze codificanti. Ad esempio, 6 codoni diversi specificano per l’aminoacido leucina (UUA, UUG, CUU, CUC, CUA e CUG), ma, nei batteri, il 60% dei codoni per leucina sono CUG e, nel lievito, l’80% sono UUG. Dato che codoni sinonimi codificano per lo stesso aminoacido, la selezione deve favorire alcuni codoni sinonimi rispetto ad altri. Si ricordi che alcuni codoni sinonimi si appaiano con tRNA diversi che portano lo stesso aminoacido.

Pertanto, una mutazione a carico di un codone sinonimo non determina un cambiamento dell’aminoacido, ma può far variare il tRNA. Studi sui diversi tRNA hanno rivelato che, all’interno di una cellula, la quota dei tRNA isoaccettori (vale a dire tRNA diversi che accettano lo stesso aminoacido) varia, e che i tRNA più abbondanti sono quelli che si appaiano ai codoni più frequentemente usati. La selezione potrebbe favorire un codone sinonimo rispetto a un altro perché il tRNA per quel codone è più abbondante e la traduzione di quel codone è più efficiente. Oppure, l’energia di legame tra codone e anticodone per codoni sinonimi potrebbe essere diversa dal momento che si appaiano basi differenti e questo fatto potrebbe essere soggetto a selezione naturale.

Oltre alle differenze nei tassi evolutivi tra le diverse parti di un gene, geni funzionali diversi si evolvono a velocità differenti. Ad esempio, il tasso di sostituzione nucleotidica non sinonima nel gene per la prolattina dei mammiferi è oltre 300 volte più alto che non quello trovato, sempre nei mammiferi, per il gene dell’istone H4.

 sommario 

 avanti 



[1] Trailer in inglese significa rimorchio, coda.

[2] I promotori di tutti i geni che codificano per proteine sono stati analizzati anche confrontando le sequenze di DNA a monte di numerosi geni strutturali per verificare se si individuano regioni con sequenze simili. I risultati indicano che si tratta di un’organizzazione caratterizzata da una serie di elementi regolatori, o moduli di regolazione. Partendo da quello più vicino al sito d’inizio della trascrizione, gli elementi promotori sono il TATA box, detto anche Goldberg e Hogness in onore degli scopritori, l’elemento CAAT e l’elemento GC. L’elemento TATA ha una sequenza consenso TATAAA. Mutazioni dell’elemento TATA normalmente riducono di poco la trascrizione, ma causano spesso l’inizio della trascrizione in un punto errato.