Skip to content

Instantly share code, notes, and snippets.

@YannBouyeron
Last active February 20, 2023 09:04
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save YannBouyeron/b2386921f4cce3ec29c522619d4085f9 to your computer and use it in GitHub Desktop.
Save YannBouyeron/b2386921f4cce3ec29c522619d4085f9 to your computer and use it in GitHub Desktop.
Démonstration Hardy Weimberg

Démonstration Hardy Weimberg

Proposée en 1908 indépendamment par le mathématicien anglais Hardy et le médecin allemand Weinberg, la loi de Hardy-Weinberg se définit ainsi : dans une population de grand effectif, où les unions se font au hasard (= panmixie et pangamie), où il n’existe ni migration, ni sélection naturelle, et en l’absence de mutations, les fréquences des différents génotypes et les fréquences alléliques restent constantes d’une génération à l’autre.

On considère une population de très grande taille: N = 400 * 109 considérée comme infinie, dans laquelle on s’intéresse à un gène (un couple d’allèles) avec 2 allèles différents dans la population: A et a.

Pour simplifier, on considère une espèce (diploïde) à fécondation externe (exemple des Echinodermes tels que les oursins), en l’absence d’accouplement, on évite ainsi de devoir tenir compte de la panmixie.

Dans cette population, la répartition des génotypes est la suivante:

GénotypesA//AA//aa//a
Effectifs observés x 109100200100

On peut calculer les fréquences génotypiques et alléliques sur cette population:

Fréqences génotypiques:

  • f(A//A) = 100 / 400 = 0.25
  • f(A//a) = 200 / 400 = 0.5
  • f(a//a) = 100 / 400 = 0.25

Fréquences alléliques:

  • f(A) = (2*100 + 200) / 800 = 0.5 = p
  • f(a) = (2*100 + 200) / 800 = 0.5 = q = 1 - p

Nos connaissances sur la méiose permettent d’envisager les fréquences alléliques dans l’ensemble des gamètes produits par les individus de la génération n. On suppose qu’il n’y a pas de sélection naturelle, donc tous les individus de génération n produisent autant de gamètes avec le même pouvoir fécondant et la même viabilité.

  • Les individus (A//A) produisent 100 % de gamètes (/A)
  • Les individus (A//a) produisent 50 % de gamètes (/A), et 50 % de gamètes (/a)
  • Les individus (a//a) prosuisent 100 % de gamètes (/a)

Si on considère que chaque individu réalise 2 méioses et produit donc 8 gamètes, et que le gène étudié n’est pas lié au sexe, alors on obtient les effectifs suivants dans les populations de gamètes mâles et femelles:

GénotypesA/a/
Effectifs observés gamètes mâles x 109800800
GénotypesA/a/
Effectifs observés gamètes femelles x 109800800

En soit, chaque individu réalise un grand nombre de méioses, mais ici la population étant au départ considérée comme infinie, on peut se contenter de 2 méioses par individus pour la démonstration. Le grand nombre de méioses (par individu) n’ayant d’importance que si on envisage un brassage génétique (inter ou intra chromosomique), ce qui n’est pas le cas ici puisqu’on ne s’intéresse qu’à un seul gène (un seul couple d’allèles).

Les gamètes étant haploïdes, leurs fréquences génotypiques correspondent donc à leurs fréquences allèliques:

Dans l’ensemble des gamètes mâles:

  • f(/A) = f(A) = 0.5 = p
  • f(/a) = f(a) = 0.5 = q

On observe les mêmes fréquences dans l’ensemble des gamètes femelles.

Pour respecter la condition de pangamie, il faut envisager un tirage au sort des gamètes mâles et femelles qui vont ensuite se rencontrer pour fusionner (fécondation).

Les probabilités sont donc de:

  • P(A/ mâle) = 0.5 = p
  • P(a/ mâle) = 0.5 = q
  • P(A/ fem) = 0.5 = p
  • P(a/ fem) = 0.5 =q

Bien qu’il s’agisse d’un tirage sans remise (le gamète tiré au sort n’est plus disponible une fois qu’il a participé à la fécondation), la taille infinie de la population et donc de l’ensemble des gamètes fait que ce tirage au sort équivaut tout de même à un tirage aléatoire avec remise: la probabilité de tirer au sort un gamète mâle (A/) reste donc constante quelque soit le nombre de gamètes mâles déjà tirés au sort précédemment.

Ce tirage au sort se faisant dans deux ensembles indépendants (ensemble des gamètes mâles d’une part et ensemble des gamètes femelles d’autre part), le fait de tirer au sort un gamète mâle et un gamète femelle constituent donc deux évènements indépendants.

Ainsi:

  • P(A ∩ A) = P(A) x P(A) = p * p = p2
  • P(A ∩ a) = P(A) x P(a) = p * q
  • P(a ∩ A) = P(a) x P(A) = q * p
  • P(a ∩ a) = P(a) x P(a) = q * q = q2

On en déduit que:

  • La probabilité de former un descendant (A//A) est donc de p2
  • La probabilité de former un descendant (A//a) est donc de 2pq
  • La probabilité de former un descendant (a//a) est donc de q2

Ces probabilités sont similaires aux fréquences téhoriques de HW. Cependant la loi de HW fait état de fréquences et non pas de probabilités.

  • La probabilité est la chance ou risque de voir se réaliser un évènement. Elle se détermine à priori, avant que l’on observe les résultats de l’expérience.

  • La fréquence est le rapport entre le nombre d'évènements effectivement réalisés et l'effectif de l'échantillon. Elle se détermine à posteriori une fois que l’on dispose des résultats de l’expérience.

Il faut donc établir un lien entre les probabilités de tirages au sort et d’unions estimées précédemment , et les fréquences attendues d’après HW. On utilise pour cela la loi des grands nombres: plus on réalise un grand nombre de fois une expérience aléatoire, plus les fréquences des événements observés à posteriori au sein des résultats tendent (se rapporchent) des probabilités que ces événements avaient de se réaliser à priori (avant d’observer les résultats).

Or notre population théorique étant de taille infinie, de même que le nombre de gamètes impliqués, qui de plus, en l’absence de sélection naturelle ont tous la même viabilité et le même pouvoir fécondant, on peut alors considérer que les fréquences attendues parmi les descendants correspondent aux probabilités estimées précédemment.

Ainsi, à l’équilibre de HW:

  • f(A//A) = p2
  • f(A//a) = 2pq
  • f(a//a) = q2

On en déduit que f(A) = p2 + 2pq / 2 soit f(A) = p et que f(a) = q

Alors à la génération suivante , les fréquences génotypiques et alléliques resteront constantes, et ce de générations en générations tant que les conditions de HW seront respectées.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment