Par différents mécanismes les séquences d'ADN subissent des mutations ponctuelles provoquant des substitutions de nucléotides et donc une une altération de l'information génétique portée par un individu. Ces mutations peuvent survenir dans des portions non géniques du génome o elles seront sans grande conséquence. Par contre, l'occurrence de telles mutations dans les gènes peut modifier la fonction de protéines ou d'ARN. L'étude ce processus de mutation est difficile, car nous ne pouvons l'étudier que de manière indirecte, par comparaison de séquences d'ADN entre des individus de la mme espèce ou d'espèces différentes. C'est ˆ partir de ces comparaisons que l'on va tenter de reconstruire l'histoire du processus évolutif par substitution. C'est notamment pour expliquer le fort degré de polymorphisme dans les séquences protéiques et de l'ADN que la théorie neutraliste de l'évolution a été développée.
Lorsque l'on compare 2 séquences d'ADN, on fait l'hypothèse qu'elles ont évolué de manière indépendante depuis le temps o elles ont divergés. Cette divergence date du temps o un individu ancestral les a transmises en tant que deux copies séparées ˆ deux descendants différents, qui les ont ensuites également transmises ˆ leurs descendants jusqu'au moment o on les observe.Ce temps de divergence depuis l'anctre commun est aussi appellé temps de coalescence. Si les deux séquences sont restées inchangées depuis leur anctre commun, on dit alors qu'elles sont identiques par ascendance. Si le temps de coalescence entre les deux séquences est long, alors il est probable que des mutations se seront produites sur l'un ou les deux lignages relaiant les séquences actuelles ˆ leur anctre.
![]() |
Temps t depuis l'anctre commun |
Si le rythme d'accumulation des mutations est constant au cours du temps (théorie des horloges moléculaires), le nombre de mutations entre 2 séquences sera approximativement proportionnel au temps de divergence ou au temps de coalescence entre les séquences.
On distingue différents types de substitution suivant les bases impliquées.
![]() |
Les substitutions de purines
en purines ou de pyrimidines en pyrimidines sont des
transitions (.....) Les substitutions de pyrimidines en purines ou de purines en pyrimidines sont des transversions (___) |
Lorsque l'on compare deux séquences, on différencie aussi les substitutions selon leur ordre et leurs conséquences.
| Séquence 1 | Séquence 2 | Nombre de subtitutions observé |
Nombre de subtitutions réel |
|
| Substitution unique | C | C |
1 |
1 |
| Substitutions multiples | A | A |
1 |
2 |
| Substitutions coincidentes au mme site | C |
C |
1 |
2 |
| Substitutions parallèles | T |
T |
0 |
1 |
| Substitutions convergentes | C |
C |
0 |
3 |
| Substitution réverse | C |
C | 0 |
2 |
De manière générale, si un site est l'objet de plusieurs substitutions, soit sur le mme lignage, soit sur des lignages différents, le nombre total d'événements mutationnels sera sous-estimé.
Donc, le nombre de différences observées ne correspond pas forcément au nombre réel de substitutions (mutations) s'étant produites au cours du temps, et ce nombre sera en général inférieur au nombre de mutations s'étant réellement produites. Ce déficit sera d'autant plus important que le temps de divergence entre les 2 séquences sera long et que le taux de mutation sera élevé.
On tente de corriger ce biais dž aux substitutions multiples en faisant des hypothèses sur la faon dont les bases sont substituées ˆ un locus donné. On b‰tit donc un modèle évolutif ad hoc.
Exemples de corrections pour les substitutions multiples
Après correction pour les substitutions multiples, on peut estimer des taux de substitution si l'on conna”t le temps de divergence des séquences.
![]() |
Si le temps de divergence depuis l'anctre commun est de t années, le temps d'évolution séparant 2 séquences est de 2t. |
Le taux de substitution m par gène et par année est donné par
o K est le nombre de substitution corrigé entre 2 séquences. Le taux de substitution moyen par nucléotide (u) s'obtient en divisant m par le nombre de nucléotides séquencés (n),
On distingue le taux de substitutions synonymes du taux de substitutions non-synonymes. Cela dépendra du code génétique. Ces taux de substitution ne sont pas forcément identiques. On a fait les constatations suivantes:
Cette double propriété est le reflet de contraintes fonctionnelles. En effet, une mutation conduisant ˆ un changement d'acide aminé va probablement altérer, voire supprimer la fonctionnalité de la protéine. Une telle mutation ne sera retenue par l'évolution que si elle est sélectivement neutre ou favorable ˆ son porteur, ce qui est certainement rare. Il est donc vraisemblable que la grande majorité des mutations synonymes sera conservée, alors que la grande majorité des mutations non-synonymes sera éliminée par la sélection naturelle. On parle alors de sélection purificatrice. Comme les mutations synonymes ne font pas ou peu l'objet de pressions sélectives, leur taux va principalement dépendre du taux de mutation, d'o une variabilité plus faible que pour les mutations non-synonymes dont le taux dépendra de la séquence protéique et de contraintes fonctionnelles variables selon les protéines.
Les taux de substitution sont variables pour différentes portions du génome.
L'ADN mitochondrial des vertébrés évolue de manière générale 10 fois plus rapide que leur ADN nucléaire. Les transitions représentent souvent plus de 90 % de toutes les substitutions. Du fait de ce fort biais transitionnel, la différence observée entre 2 séquences n'est pas proportionnelle au temps de divergence et semble atteindre un plateau après environ 40 millions d'années de divergence.
Explication
Du fait du très fort taux de substitution, il est probable qu'un mme nucléotide soit le sujet de plusieurs substitutions. Il y aura alors saturation des sites polymorphes. Comme il s'agit le plus souvent de transitions, il y aura des substitutions réverses qui ne sont pas observables lors de comparaisons de séquences. Donc, mme si les mutations s'accumulent ˆ un rythme constant, elles deviendront de moins en moins visibles.
Conséquence
On va fortement sous-estimer le temps de divergence réel entre des espèces séparées depuis longtemps
Le mme phénomène s'applique ˆ l'ADN nucléaire, mais il est moins visible du fait d'un moindre biais transitionnel et d'un plus faible taux de mutation.
A la fin des années 60, avec l'accumulation des données moléculaires, une nouvelle théorie sur l'évolution du polymorphisme dans les populations a vu le jour. Jusque lˆ, on pensait que l'évolution était un processus quasi-déterministe, impliquant des progrès évolutifs sous l'effet de la sélection naturellle.
Motoo Kimura a été le principal artisan de cette nouvelle théorie appellée théorie neutraliste de l'évolution. Il a mis l'accent sur le fait que la plupart des régions géniques étaient soumises ˆ une sélection purificatrice, pour proposer que la majeure partie du polymorphisme observé concernait des séquences fonctionnellement et sélectivement équivalentes et donc neutres du point de vue évolutif.
Cette théorie minimise le r™le de la sélection adaptative comme principal facteur d'évolution et met en avant le r™le de forces stochastiques (dérive génétique, effet fondateur) comme moteur principal de l'évolution. Selon cette vue, la sélection existe, mais concerne une faible part du polymorphisme total. Ainsi, l'évolution ne va pas systématiquement choisir le meilleur allèle et éliminer les autres, mais plut™t tolérer la présence d'un grand nombre d'allèles fonctionnellement équivalents dans la population. La population sera donc le plus souvent polymorphe, et ce polymorphisme peut tre considéré comme un polymorphisme de transition entre 2 fixations. Le fait qu'un allèle soit fréquent ne signifie pas qu'il soit mieux adapté, mais simplement que sa fréquence a fluctué sous l'action du hasard pour atteindre sa fréquence actuelle. Il aurait tout aussi bien pu s'agir d'un autre allèle.
On peut brièvement résumer les principaux résultats de Kimura :
,
et la fréquence des hétérozygotes (H) ˆ l'équilibre est donnée par H=1-F soit,
Pour des mutants sélectivement avantagés, ce taux n'est plus indépendant de la taille de la population.
o s est l'avantage sélectif des nouveaux mutants, et v et le taux de mutation en faveur des mutants avantagés. Le temps de fixation pour des mutations avantageuses est en général plus rapide que pour les mutations neutres, car 4Nes > 1. Cependant, toute mutation peut tre perdue par dérive génétique, quel que soit son avantage sélectif.
Remarques:
La théorie des horloges moléculaires (Zuckerkandl et Pauling, 1962) est basée sur l'observation du taux d'évolution des protéines (notamment les a-globines). En effet, on a remarqué que le taux d'évolution des protéines semble ˆ peu près constant chez les vertébrés. Cela suppose que les mutations se produisent ˆ un rythme régulier (comme le battement d'une horloge) pour une protéine donnée pour différentes espèces. Cela suppose que les contraintes fonctionnelles sont identiques pour un gène donné dans toutes les espèces.
Selon cette théorie, il est donc possible de dater la divergence entre 2 espèces en comparant leur séquence (d'ADN ou protéique) si l'on conna”t le taux de mutation au locus considéré. Il faut cependant bien calibrer l'horloge moléculaire avec des espèces pour lesquelles la date de divergence est connue (par des données fossiles par exemple), ce qui n'est pas toujours facile.
On a aussi remarqué que certains gènes évoluaient ˆ des vitesses différentes. Certains évoluent très rapidement (fibrinopeptides) alors que d'autres sont très peu variables entre espèces (cytochrome c, histones). Ces différences sont vraisemblablement le reflet de différentes contraintes fonctionnelles, en accord avec la théorie neutraliste. Les gènes très importants seront conservés et évolueront très lentement.
La théorie des horloges moléculaires est actuellement fortement controversée et plusieurs arguments ont été développés en opposition ˆ cette théorie:
Exemples
Remarque: Bien que le débat concernant la validité des horloges moléculaires subsiste, il semble bien que l'horloge marche assez bien sur de longues périodes de temps, pour des gènes ayant un taux de mutation relativement faible, car dans ce cas, mme si l'horloge ne bat pas très régulièrement, les ralentissements et les accélérations se compensent.
On a constaté (principalement en étudiant les gènes de la globine) l'occurence de taux de substitution différents selon les espèces.
Explication possibles
Remarque: Il faut aussi se méfier des estimations des temps de divergence entre espèces qui sont basés sur la comparaison d'un petit nombre de gènes. On a besoin de plus de données, de plus de gènes examinés, et de plus grands échantillons pour faire avancer le débat, et peut tre améliorer la théorie.
© Laurent Excoffier (1999), Département d'Anthropologie, Université de Genève
Dernière mise ˆ jour: 12.03.99 ˆ 18:21