Una domanda importante che sorge spontanea nello studio dell’evoluzione è come i profili e i tassi evolutivi siano diversi tra geni e tra parti diverse dello stesso gene.
I tassi di evoluzione di determinate sequenze di DNA possono venir misurati confrontando le sequenze in due organismi diversi che, in qualche momento conosciuto del passato, si sono originati per divergenza da un antenato comune.
Assumiamo che
l’antenato comune possedesse una singola sequenza di DNA. Successivamente,
dopo che i due organismi si separarono da questo antenato, le loro sequenze di
DNA andarono incontro a cambiamenti evolutivi diversi, producendo le
differenze che rileviamo oggi nelle loro sequenze. Ad esempio, si ritiene che la maggior parte dei principali gruppi di mammiferi si
sia diversificata a partire da un antenato comune all’incirca 65
milioni d’anni fa.
Supponiamo di aver esaminato nel topo e nell’uomo una sequenza particolare di DNA, per esempio quella dell’ormone della crescita. Potremmo trovare che le sequenze per questo gene sono diverse nell’uomo e nel topo per 20 nucleotidi. Questi 20 nucleotidi devono essere cambiati nei 65 milioni d’anni trascorsi dal momento della separazione delle linee evolutive dell’uomo e del topo.
Per
calcolare il tasso di variazione evoluzionistica di questo gene, calcoliamo
dapprima il numero di cambiamenti o sostituzioni nucleotidiche che si sono
verificate per produrre le 20 differenze tra i nucleotidi che si osservano al
giorno d’oggi. Esistono numerosi metodi matematici per stimare questo
numero, che viene di solito espresso come
sostituzioni
nucleotidiche per sito nucleotidico, così che il tasso di evoluzione sia indipendente
dalla lunghezza delle sequenze confrontate.
Per ottenere le velocità di variazione, dividiamo il valore delle sostituzioni per sito per il numero di anni di tempo evoluzionistico che separano i due organismi. Il tasso di variazione ottenuto viene poi espresso come sostituzioni per sito per anno. Nel nostro esempio dell’ormone della crescita, potremmo trovare che il tasso di variazione è stato di 4 x 10-9 sostituzioni per sito per anno.
Tassi
relativi di cambiamento evolutivo |
|
Sequenze |
Sostituzioni |
Geni
funzionali |
|
sequenza
fiancheggiante al 5’ |
2,36 |
sequenza
leader |
1,74 |
sequenza
codificante sinonima |
4,65 |
sequenza
codificante non sinonima |
0,88 |
introne |
3,70 |
sequenza
di coda o trailer |
1,88 |
sequenza
fiancheggiante al 3’ |
4,46 |
Pseudogèni |
4,85 |
Studi delle sequenze nucleotidiche in numerosi geni hanno
rivelato che
parti diverse dei geni evolvono con velocità differenti.
Si ricordi che un gene eucariotico tipico è composto da alcuni nucleotidi che
specificano per la sequenza aminoacidica di una proteina - le sequenze
codificanti - e da altri nucleotidi che non codificano per aminoacidi in una
proteina, cioè le sequenze non codificanti.
Le sequenze non codificanti
comprendono:
§
gli
introni
§
le
regioni leader
§
le
regioni trailer
[1]
che sono trascritte ma non
tradotte;
§
le
sequenze fiancheggianti
al 5’ e al 3’ che non vengono trascritte
Altre sequenze non codificanti
comprendono:
§
gli pseudogèni, che sono sequenze
nucleotidiche che non danno più un prodotto genico funzionale a causa di
mutazioni.
Anche all’interno delle regioni codificanti di un gene
funzionale non tutte le sostituzioni nucleotidiche producono una
corrispondente variazione a livello della sequenza aminoacidica della
proteina. In modo particolare, molte delle mutazioni che avvengono alla terza
posizione del codone non hanno effetto sulla sequenza aminoacidica della
proteina, dato che tali mutazioni producono un codone
sinonimo che codifica per lo stesso aminoacido.
Diverse regioni del gene sono in apparenza sottoposte a diverse forze evolutive ed evolvono a velocità differenti. La tabella mostra i tassi relativi di variazione in parti diverse dei geni dei mammiferi. Si noti che tra i geni funzionali i tassi di variazione più elevati comprendono i cambiamenti sinonimi nelle sequenze codificanti. Il tasso di variazione nucleotidica sinonima è all’incirca cinque volte più elevato di quello osservato per la variazioni non sinonime.
L’alto tasso d’evoluzione delle variazioni sinonime,
che non alterano la sequenza aminoacidica della proteina, non è inatteso, in
quanto queste variazioni non hanno effetto sul funzionamento di una proteina.
Probabilmente le mutazioni sinonime e non sinonime insorgono con uguale
frequenza: tuttavia, i cambiamenti non sinonimi che insorgono all’interno di
sequenze codificanti di solito riducono la fitness
e vengono eliminati per selezione naturale, mentre le mutazioni sinonime sono
raramente deleterie, e pertanto tollerate.
Sempre dalla tabella si può desumere che alti tassi di
cambiamenti evolutivi sono presenti anche a livello delle regioni
fiancheggianti al 3’ di geni funzionali. Come le variazioni sinonime, le
sequenze delle regioni fiancheggianti al 3’ non hanno alcun effetto noto
sulla sequenza aminoacidica e di solito hanno scarso effetto sull’espressione
genica; molte delle mutazioni che avverranno in queste regioni saranno
tollerate dalla selezione naturale. Anche
i tassi di variazione negli introni sono elevati, ma non così alti come per
le variazioni sinonime e quelle nelle regioni fiancheggianti 3’.
Nonostante le sequenze negli introni non codifichino per
proteine, l’introne deve venire disgiunto in modo appropriato perché l’mRNA
venga tradotto in una proteina funzionale. Alcune sequenze all’interno dell’introne
sono critiche per una corretta scelta del punto di giunzione: queste includono
le sequenze consenso alle estremità 5’ e 3’ dell’introne e la sequenza
al punto di ramificazione. Come risultato, non tutti i cambiamenti a livello
degli introni saranno tollerati e pertanto il tasso generale di evoluzione è
più basso di quello osservato per le sequenze codificanti sinonime e per le
regioni fiancheggianti 3’.
Nella regione fiancheggiante 5’ si osservano tassi
evolutivi inferiori. Nonostante questa regione non venga trascritta né
tradotta, essa contiene il promotore del gene, pertanto le sequenze nella
regione fiancheggiante 5’ sono importanti per l’espressione genica. In
questa zona si trovano importanti sequenze consenso, come il TATA box
[2]
.
Mutazioni nelle sequenze consenso potrebbero impedire che il gene venga
trascritto e avranno pertanto effetti deleteri sulla fitness dell’organismo. La selezione naturale elimina queste
mutazioni e mantiene bassi i cambiamenti in questa regione.
Seguono, in quanto a tasso evolutivo, le regioni leader
e trailer, che hanno tassi alquanto più bassi che non la regione
fiancheggiante 5’. Nonostante le sequenze leader
e le sequenze trailer non vengano
tradotte, esse sono trascritte e forniscono segnali importanti per il
processamento dell’mRNA e per l’associazione del ribosoma all’mRNA.
Pertanto in queste regioni le sostituzioni nucleotidiche sono limitate. I tassi evolutivi più bassi si riscontrano per le
sequenze codificanti non sinonime: cambiamenti in questi
nucleotidi alterano la sequenza aminoacidica della proteina e molte delle
mutazioni che avvengono in questi siti sono eliminate dalla selezione
naturale.
Un’ultima cosa da notare nella tabella è che il tasso più elevato di evoluzione si osserva negli pseudogèni. L’alto tasso evolutivo osservato in queste sequenze non funzionali dipende dal fatto che gli pseudogèni non codificano più per proteine e siccome i cambiamenti a livello di questi geni non hanno effetto sulla fitness, le variazioni stesse non vengono eliminate per selezione naturale.
Per riassumere
Osserviamo
i tassi di variazione evolutiva più elevati |
Un’osservazione interessante proveniente dallo studio delle sequenze nucleotidiche è che, nonostante il tasso evolutivo dei cambiamenti nucleotidici sinonimi sia molto più alto di quello delle variazioni non sinonime, i tassi di cambiamento sinonimi spesso non sono così elevati come quelli osservati per gli pseudogèni.
Quest’osservazione suggerisce che le mutazioni sinonime non siano
completamente sinonime. La selezione naturale potrebbe favorire alcuni codoni
sinonimi a scapito di altri. Quest’ipotesi è rafforzata dalla scoperta che
i codoni sinonimi non vengono utilizzati in modo identico nelle sequenze
codificanti. Ad esempio, 6 codoni diversi specificano per l’aminoacido
leucina (UUA, UUG, CUU, CUC, CUA e CUG), ma, nei batteri, il 60% dei codoni
per leucina sono CUG e, nel lievito, l’80% sono UUG. Dato che codoni
sinonimi codificano per lo stesso aminoacido, la selezione deve favorire
alcuni codoni sinonimi rispetto ad altri. Si ricordi che alcuni codoni
sinonimi si appaiano con tRNA diversi che portano lo stesso aminoacido.
Pertanto, una mutazione a carico di un codone sinonimo non
determina un cambiamento dell’aminoacido, ma può far variare il tRNA. Studi
sui diversi tRNA hanno rivelato che, all’interno di una cellula, la quota
dei tRNA isoaccettori
(vale a dire tRNA diversi che accettano lo stesso aminoacido) varia, e che i
tRNA più abbondanti sono quelli che si appaiano ai codoni più frequentemente
usati. La selezione potrebbe favorire un codone sinonimo rispetto a un altro
perché il tRNA per quel codone è più abbondante e la traduzione di quel
codone è più efficiente. Oppure, l’energia di legame tra codone e
anticodone per codoni sinonimi potrebbe essere diversa dal momento che si
appaiano basi differenti e questo fatto potrebbe essere soggetto a selezione
naturale.
Oltre alle differenze nei tassi evolutivi tra le diverse
parti di un gene,
geni funzionali diversi si evolvono a velocità differenti.
Ad esempio, il tasso di sostituzione nucleotidica non sinonima nel gene per la
prolattina dei mammiferi è oltre 300 volte più alto che non quello trovato,
sempre nei mammiferi, per il gene dell’istone H4.
[1] Trailer in inglese significa rimorchio, coda.
[2] I promotori di tutti i geni che codificano per proteine sono stati analizzati anche confrontando le sequenze di DNA a monte di numerosi geni strutturali per verificare se si individuano regioni con sequenze simili. I risultati indicano che si tratta di un’organizzazione caratterizzata da una serie di elementi regolatori, o moduli di regolazione. Partendo da quello più vicino al sito d’inizio della trascrizione, gli elementi promotori sono il TATA box, detto anche Goldberg e Hogness in onore degli scopritori, l’elemento CAAT e l’elemento GC. L’elemento TATA ha una sequenza consenso TATAAA. Mutazioni dell’elemento TATA normalmente riducono di poco la trascrizione, ma causano spesso l’inizio della trascrizione in un punto errato.