694 - Sur la rareté de l’équipartition
N. Lygeros
La lecture de différents articles et études scientifiques dans un cadre non mathématique nous a permis de constater que la moindre différence de proportions est considérée comme révélatrice d’un phénomène scientifique. Le substrat mathématique de cette méthodologie est essentiellement constitué par ce que nous nommons la loi des grands nombres. Cependant celle-ci est interprétée de manière extrême et voire caricaturale. En effet la loi des grands nombres affirme que des évènements indépendants générés par la même procédure ont le même ordre de grandeur. Néanmoins hors du strict cadre mathématique, le même ordre de grandeur est remplacé par l’égalité. Ainsi la moindre différence est sensée avoir un sens. Afin d’expliciter l’erreur fondamentale de cette approche nous allons examiner un cas strictement mathématique dépourvu de tout autre contexte. Si nous lançons 2m fois une pièce normale, notons a(m) la probabilité d’obtenir m fois Pile et m fois Face. C’est ce que nous nommons l’équipartition. Le calcul de cette probabilité est relativement trivial en combinatoire puisqu’il correspond au coefficient central, le plus élevé, de la ligne numéro 2m du triangle de Pascal, divisé par la somme totale des coefficients de cette ligne. Or le coefficient central, c’est le nombre de combinaisons de 2m objets pris m à m, sans répétition i.e. C(m,2m) et la somme totale correspond au nombre de parties d’un ensemble à 2m éléments i.e. 2^(2m). Ainsi a(m)=C(m,2m)/2^(2m) et il est facile de montrer que cette valeur tend vers zéro en l’infini. Plus explicitement en développant C(m,2m) en factorielles et en appliquant la formule de Stirling à savoir n! ~ (n/e)^n*sqrt(2*Pi*n) nous obtenons : ((2m)!/(m!*m!))/2^(2m) ~ (2m/e)^(2m)*sqrt(2*Pi*2m)/ (2^(2m)*(m/e)^m*sqrt(2*Pi*m)*(m/e)^m*sqrt(2*Pi*m)) ~ 1/sqrt(Pi*m).
Par exemple, si nous lançons 10.000 fois une pièce de monnaie, l’équipartition a une probabilité équivalente à 1/(100*sqrt(Pi)) et donc inférieure à 1 %. Aussi des résultats qui sont en dehors de cette zone, ne peuvent être considérés comme révélateurs d’un phénomène quelconque. Toute l’information de la non équipartition est contenue dans le code mathématique et n’a aucun sens en dehors de celui-ci, aussi toute autre interprétation ne peut être qu’erronée et ce quelque soit le domaine.
Par ailleurs lorsque l’échantillonnage est très faible, de l’ordre d’une dizaine de cas, même s’il y a une équiprobabilité théorique, une légère différence dans les pourcentages est plus probable que l’équipartition. Pour 10 cas par exemple, il est deux fois plus probable d’obtenir 6 et 4 que 5 et 5 puisque la partition avec 5 est unique alors qu’avec 6 elle est double. A nouveau donc, cette différence n’est pas révélatrice d’un phénomène autre que purement mathématique.
De manière générale, l’utilisation de la mentalité mathématique doit être effectuée avec précaution car la moindre erreur d’interprétation dans un cadre scientifique conduit à des conclusions essentiellement fausses. L’outil mathématique sans l’esprit mathématique ne représente pas un avantage scientifique mais bien souvent une erreur cognitive caractérisée.