Logo du CNRS Le Journal Logo de CSA Research

Grande enquête « CNRS Le Journal »

Votre avis nous intéresse.

Le CNRS a mandaté l’institut CSA pour réaliser une enquête de satisfaction auprès de ses lecteurs.

Répondre à cette enquête ne vous prendra que quelques minutes.

Un grand merci pour votre participation !

Grande enquête « CNRS Le Journal »

Sections

De l’erreur de calcul à l’erreur judiciaire

De l’erreur de calcul à l’erreur judiciaire

17.07.2017, par
Si le recours aux outils technologiques et scientifiques a transformé le processus judiciaire, cet usage n’est pas sans faille. Ici, un témoin discute d'une preuve ADN avec l'avocat et le juge, lors d’un procès aux États-Unis.
Derrière l’objectivité des chiffres avancés dans certaines affaires judiciaires se dissimule parfois une utilisation mal maîtrisée ou dévoyée des mathématiques. La mathématicienne Leila Schneps décortique ce phénomène redoutable lors d’un entretien paru dans le deuxième numéro de la revue «Carnets de science».

Dans de très nombreux procès, notamment aux États-Unis, probabilités et statistiques ont servi à innocenter ou à démontrer la culpabilité de personnes et d’institutions accusées de meurtre, de vol, d’espionnage ou de discrimination. Pourquoi cet usage des mathématiques, qui cherche à rétablir une certaine justice, aboutit-il bien souvent à un résultat opposé ?
Leila Schneps1 :
Avec les mathématiques, il existe de multiples manières de se tromper, et il ne s’agit pas seulement de simples erreurs de calcul. Ne pas comprendre le sens de mathématiques parfaitement justes est un phénomène très fréquent. L’accusation de discrimination sexuelle à l’encontre de l’université de Berkeley, en Californie, est l’illustration parfaite d’un paradoxe connu sous le nom de « paradoxe de Simpson  ». Les administrateurs de l’université, ayant pris conscience du fait que 45 % des candidats masculins étaient acceptés contre seulement 35 % des candidates – alors même que les femmes ont en moyenne de meilleurs résultats que les hommes à l’université – ont décidé d’examiner ces statistiques département par département pour localiser les coupables. Quelle ne fut pas leur surprise de constater que chacun des départements acceptait autant de candidats femmes que d’hommes, sinon plus  !
Ce paradoxe a pourtant une explication très simple : dans les « petits  » départements, comme l’histoire de l’art, il y a beaucoup plus de candidates que de candidats, tandis que dans les départements immenses, comme les études d’ingénierie, il y a nettement plus de candidatures masculines. On arrive ainsi à une situation où, par exemple, sur 100 candidats en histoire de l’art – 80 femmes et 20 hommes –, sont admis 16 femmes et 4 hommes, soit 20 % de chaque groupe, tandis qu’en ingénierie, sur 100 candidats – disons 70 hommes et 30 femmes –, 35 hommes et 15 femmes sont acceptés, soit 50 % de chaque groupe. Vue comme cela, la répartition est totalement égale. Pourtant, si l’on combine les deux groupes, on constate qu’il y a un total de 200 candidats dont 110 femmes et 90 hommes, parmi lesquels l’université accepte 39 hommes (soit 43 %) et seulement 31 femmes (soit 28 %). On peut donc avoir la fausse impression d’une vraie injustice ! On voit ici comment des chiffres justes peuvent donner lieu à des interprétations erronées.

Cérémonie de remise des diplômes de droit, à l'université de Berkeley, en Californie, en mai 2015.
Cérémonie de remise des diplômes de droit, à l'université de Berkeley, en Californie, en mai 2015.

Un autre exemple frappant est celui du faux syndrome de Münchausen par procuration…
L.  S. :
Le syndrome de Münchausen désigne une maladie mentale qui amène le patient à se faire mal dans le but d’attirer l’attention et les soins du personnel médical. Par extension, on a défini un syndrome de Münchausen « par procuration », qui concerne des personnes qui, pour les mêmes motifs, blessent délibérément un tiers incapable de se défendre ou de parler, en l’occurrence souvent un bébé. Même s’il est certain que ce genre de cas a pu exister, ce diagnostic est devenu à une époque tellement « à la mode » outre-Manche que des centaines, peut-être des milliers d’enfants ont été retirés à leurs parents, parfois pour mourir loin d’eux, alors qu’ils étaient tout simplement atteints d’une véritable maladie non diagnostiquée. Pire, au plus fort de ce mouvement, des dizaines de mères dont les bébés étaient morts subitement furent condamnées et emprisonnées pour meurtre. C’est ce qui est arrivé à Sally Clark, qui a dû passer plusieurs années en prison après avoir été accusée du meurtre de deux de ses enfants. Comme dans la plupart des procès de ce genre, sa condamnation reposait essentiellement sur le témoignage du médecin « inventeur » de ce fameux syndrome par procuration. Celui-ci soutenait en particulier que la mort subite du nourrisson était un événement totalement aléatoire et d’une probabilité très faible, qu’il estimait à 1/8 000.

Ces probabilités étaient donc fantaisistes ?
L.  S. :
Non, elles étaient correctes  ; le problème, c’est l’utilisation qu’il en a faite. Pour bien comprendre, il faut revenir aux règles de calcul des probabilités. Prenons le cas d’un couple qui a décidé d’avoir deux enfants et dont la femme apprend qu’elle est enceinte : si elle mène sa grossesse à terme, la probabilité qu’elle accouche d’un garçon est de 1/2. Si la femme donne successivement naissance à deux enfants, la probabilité pour le couple d’avoir deux garçons est 1/2 x 1/2, soit 1/4. Mais effectuer cette multiplication n’est valable qu’à la condition que les deux événements soient indépendants, comme c’est le cas pour deux grossesses séparées. Par exemple, si la femme passe une échographie et apprend qu’elle est enceinte de vrais jumeaux, les deux naissances ne sont plus des événements indépendants et la probabilité d’avoir deux garçons (ou deux filles) est cette fois-ci de 1/2.

Où le médecin s’est-il trompé ?
L.  S. :
En se basant sur la probabilité de 1/8 000 qu’un bébé décède d’une mort subite du nourrisson, notre médecin « expert » a considéré que le risque pour une mère de perdre deux enfants de cette façon était donc de 1/8 000 x 1/8 000. Sa conclusion, apparemment logique, fut qu’une femme n’avait qu’une seule « chance » sur 64 millions d’être frappée par deux morts subites du nourrisson successives et que, si ce cas se présentait, l’interprétation la plus raisonnable serait qu’il s’agissait d’un double meurtre. Mais ce raisonnement, et le calcul qui y menait, faisait fi d’un fait bien connu : la probabilité qu’une mort subite survienne dans une famille donnée dépend de facteurs comme l’âge de la mère, la présence de fumeurs dans l’entourage, etc. Ce qui revient à dire que lorsqu’elles adviennent dans une même famille, deux morts subites ne sont pas des événements indépendants et qu’on ne peut, dans ce cas, simplement multiplier les probabilités de chaque événement individuel pour calculer le risque. En outre, il était faux d’affirmer qu’il n’y avait que deux possibilités (soit les deux enfants étaient décédés de mort subite, soit leur mère les avait tués). En réalité, il y en avait une troisième, de loin la plus probable, à savoir que l’un ou les deux enfants étaient morts d’une maladie que les médecins n’avaient pas réussi à déceler, ni avant le décès ni lors de l’autopsie. Et c’est justement ce qui a pu être prouvé lors du réexamen du dossier médical : le deuxième enfant souffrait d’une grave infection au moment de son décès.

À Londres, le 29 janvier 2003, Sally Clark gagne son procès en appel. Suite à une erreur de calcul statistique, elle avait été accusée à tort du meurtre de ses deux fils.
À Londres, le 29 janvier 2003, Sally Clark gagne son procès en appel. Suite à une erreur de calcul statistique, elle avait été accusée à tort du meurtre de ses deux fils.

Ces erreurs proviennent-elles d’une volonté délibérée de manipulation ou plutôt de l’ignorance, qu’il s’agisse de celle des accusateurs, des défenseurs ou des jurés ?
L.  S. :
Heureusement, la vraie volonté de manipulation est assez rare. Mais ce qu’on perçoit très souvent, c’est que les uns et les autres utilisent ou interprètent les calculs et les chiffres d’une manière à étayer l’opinion qu’ils ont déjà : ils tombent dans le piège du biais de confirmation. C’est pourquoi je pense qu’il faudrait toujours la présence d’une personne entraînée et objective pour observer l’utilisation des mathématiques dans un procès.

Au tribunal comme ailleurs, il existe aussi de « mauvaises intuitions mathématiques » dues à des biais cognitifs…
L.  S. :
Oh que oui ! Je vais vous donner mon exemple préféré, car il rend tout le monde fou, y compris les mathématiciens et même les probabilistes. Imaginez que lors d’un voyage, votre voisin, en bavardant, vous fait savoir qu’il a deux enfants dont un fils qui, vous l’apprenez au passage, est né un mardi. La question est la suivante : quelle est la probabilité que l’autre enfant de cet homme soit une fille ?
Spontanément, on aurait envie de répondre 50 %, car savoir que l’un des enfants est un garçon ne préjuge en rien du sexe de l’autre. Eh bien c’est faux ! Car si on ne connaissait que le fait que l’un des enfants est un garçon, la probabilité que l’autre soit une fille serait de 2/3. En effet – sans compter les jumeaux –, les familles de deux enfants sont réparties en quatre types : gg, gf, fg et ff. Mais comme cette famille n’est pas du type ff (puisqu’il y a un fils), elle est forcément de type gg, gf ou fg ; ces trois types étant également répartis, il y a bien deux chances sur trois que l’autre enfant soit une fille.
Mais nous savons aussi que le garçon est né un mardi. Cela paraît incroyable, absurde, de penser que ce fait puisse changer la probabilité d’avoir une fille. Pourtant c’est bien le cas ! En effet, si l’on dresse la liste de toutes les possibilités d’avoir une famille de type gg, par exemple, avec tous les jours de la semaine, on arrive à 49 possibilités. Il en sera de même pour les familles de type gf et fg, soit un total de 147 possibilités. Si l’on écarte maintenant toutes celles qui ne contiennent pas un garçon né un mardi, il en reste exactement 27, dont 13 où l’autre enfant est un garçon, et 14 où il s’agit d’une fille. D’où une probabilité de 14/27 que l’autre enfant soit une fille… Il y a de quoi s’arracher les cheveux !

La sacralisation actuelle des chiffres n’est-elle pas le pendant du relatif « analphabétisme mathématique » des magistrats comme du grand public ?
L.  S. :
Oui, certainement. Je crois que le sentiment de ne pas comprendre quelque chose produit toutes sortes de réactions psychologiques, allant du rejet méprisant au respect un peu craintif : ces sentiments apparaissent en particulier dès qu’une personne investie d’autorité nous assène une explication incompréhensible sur un ton péremptoire. Si l’on n’a pas les moyens de comprendre ce qu’on nous dit, encore moins d’y opposer des arguments logiques, on a beaucoup de mal à objecter, c’est tout simplement plus facile de l’accepter – mais c’est normal d’éprouver un peu de ressentiment en même temps. C’est très dommage, parce qu’en réalité les mathématiques utilisées dans les procès ne sont pas plus difficiles que celles qu’on apprend au lycée, elles sont à la portée de tout le monde.

Que préconisez-vous pour y remédier ?
L.  S. :
Il est capital de développer le sens – oserais-je dire le goût ? – des nombres, ainsi que l’esprit critique. Cela passe par un enseignement différent dès le plus jeune âge : les enfants pourraient apprendre à faire leurs propres estimations numériques dès qu’ils savent compter et à juger tout énoncé mathématique avec un esprit critique. Les cours de maths devraient contenir une multitude de questions sans « bonne » ni « mauvaise » réponse – deviner combien il y a de bonbons dans le bocal, par exemple, ou estimer la hauteur des bâtiments alentour ou le nombre de mètres carrés de papier peint qu’il faut pour tapisser la salle de classe. Plus tard, cela peut être intéressant de savoir estimer la taille d’une foule de manifestants vue à la télévision ou le coût réel de certaines opérations. Ce genre d’exercice sur des phénomènes familiers permet de déceler de nombreuses erreurs ou absurdités dans les journaux. Les nombres sont comme autant de mots ajoutés à notre vocabulaire pour décrire le monde qui nous entoure… Profitons-en !   

Cet article a été initialement publié dans le numéro 2 de la revue Carnets de science.

À lire :
Les Maths au tribunal, Leila Schneps et Coralie Colmez, Seuil, coll. « Science ouverte », septembre 2015, 288 p., 20 €

Notes
  • 1. Directrice de recherche à l’Institut de mathématiques de Jussieu-Paris Rive Gauche (CNRS/Université Pierre-et-Marie-Curie/Université Paris-Diderot).
Aller plus loin

Auteur

Lydia Ben Ytzhak

Lydia Ben Ytzhak est journaliste scientifique indépendante. Elle travaille notamment pour la radio France Culture, pour laquelle elle réalise des documentaires, des chroniques scientifiques ainsi que des séries d’entretiens.

Commentaires

12 commentaires

Bonjour, je ne suis pas un grand probabiliste mais la résolution du problème "gg, gf, fg et ff" me semble assez simple. Pour moi l'erreur vient du fait que pour les groupes contenant une fille, on considère l'ordre de naissance "gf, fg" ! Ce que l'on ne fait pas pour le groupe "gg". les faits (rien que les faits) : * les groupes gg, fg, gf, ff sont équitablement réparti (1 chance sur 4) * la famille à deux enfants * un des enfants est un garçon * ce garçon est né un mardi En fait, le garçon en question peut-être affecté au groupe "gg" de deux manière, soit c'est le premier, soit c'est le deuxième (comme on le fait pour les groupe "gf", "fg"). Si on considère l'ordre des naissances dans le cas "gg" disons "gG, Gg" où "g" est le garçon né un mardi. On ne sait donc rien sur le jour de naissance de "G". On obtient quatre groupes, "gG, Gg, fg, gf" équitablement réparti (1 chance sur 4). Voilà le fait que "g" soit né un mardi, ne change plus rien dans l'histoire et la probabilité que le deuxième enfant soit une fille est de 1/2. Dites-moi si je me trompes… Clément

Vous faites l'hypothèse que vos groupes gG et Gg sont de la même taille que les groupes fg et gf. Or c'est incorrect: la somme des groupes gG et Gg, qui forme le groupe appelé gg dans l'article, est de la même taille que fg et gf.

Bonjour, moi aussi, je dirai(s) que c'est comme au jeu de pile ou face. Avoir joué pile une fois laisse une probabilité 1/2 à rejouer pile la deuxième fois. On a gf=fg car la question ne précise pas l'ordre chronologique de naissance. Cette homme aurait onze enfants dont dix garçons, la probabilité fille ou garçon pour le onzième enfant resterait 1/2 (hors soupçon d'un facteur génétique dans le cas présent, ou d'une pièce de monnaie truquée dans le cas pile/face, ou de l'influence des astres le mardi). C'est ce que j'ai compris de tous les livres de probabilités que j'ai pu lire... Olivier Hardouin Duparc

On n'a pas fg = gf car ces groupes (gg, gf, fg, ff) représentent les familles de deux enfants dans la population. Celles qui ont d'abord un fils puis une fille sont distinctes de celles qui ont d'abord une fille puis un fils (et elles sont approximativement en même quantité). Donc on a bien 4 groupes distincts de familles, chaque groupe ayant le même nombre d'éléments. Ici la question n'est pas de savoir si le prochain enfant est une fille ou un garçon, mais de deviner duquel de ces groupes fait partie la famille de l'homme qui parle. Comme il nous donne de l'information, ça permet d'avoir de meilleures chances de deviner que de tirer au hasard.

Gilbert GABILLARD à Mme Leila SCHNEPS Permettez moi de vous contredire sur un exemple que vous donnez dans l'article sur Internet " https://lejournal.cnrs.fr/articles/de-lerreur-de-calcul-a-lerreur-judiciaire" . L'exemple fameux Fille Garçon que vous ne développez pas avec la rigueur souhaitée et commettez une erreur, hélas répandue ; <<Mais nous savons aussi que le garçon est né un mardi. Cela paraît incroyable, absurde, de penser que ce fait puisse changer la probabilité d’avoir une fille. Pourtant c’est bien le cas ! En effet, si l’on dresse la liste de toutes les possibilités d’avoir une famille de type gg, par exemple, avec tous les jours de la semaine, on arrive à 49 possibilités. Il en sera de même pour les familles de type gf et fg, soit un total de 147 possibilités. Si l’on écarte maintenant toutes celles qui ne contiennent pas un garçon né un mardi, il en reste exactement 27, dont 13 où l’autre enfant est un garçon, et 14 où il s’agit d’une fille. D’où une probabilité de 14/27 que l’autre enfant soit une fille… Il y a de quoi s’arracher les cheveux ! >> Admettons pour l'instant l'équiprobabilité des 247 couples restants. Que veut dire " on écarte ceux qui b ne sont pas né un mardi" ? Que l'équiprobabilité de 1/247 n'est plus valable puisque nous savons qu'un garçon est né un mardi. Comment calculer la nouvelle répartition de probabilité, sinon par la formule de Bayes ? 120 couples se retrouvent avec une proba de 0 ; il en reste 27 mais qui ne sont pas équiprobables et n'ont aucune raison de l'être car le couple ( gmardi, gmardi) se trouve affecté d'une proba plus forte que les autres : il faut faire le calcul ! U = l'univers constitué de ces 247 couples E = l'homme dit " le garçon dont je vous parle est né un mardi" je remplace les jours de la semaine par un chiffre de 1 à 7 (f1,g3) = l'ainé est une fille née un lundi, le cadet un garçon né un mercredi ; etc. P( E2 sachant (fi,gj)) = 0 si j est différent de 2 ; idem pour (gj,fi) 2x6x7 = 84cas P( E2 sachant (fi,g2)) = 1 et P( E2 sachant (g2,fi)) = 1 14 cas P( E2 sachant (gi,gj)) = 0 si i et j sont différents de 2 36 cas P( E2 sachant (gi,g2)) = 1/2 si i est différent de 2 6 cas P( E2 sachant (g2,gj)) = 1/2 si i est différent de 2 6 cas mais P( E2 sachant (g2,g2)) = 1 ce qui assure qu'on n'a pas équiprobabilité des couples restants !!! avec les probabilités des causes P (( fi,g2) sachant E2) pèse 2 fois plus que P ( (gi,g2) sachant E2) ( i différent de2 ) 15 couples( dont (g2,g2) pèsent chacun le double des douze autres. ce qui nous fait une masse totale de 15x1+12 x1/2 =21 les couples mixtes filles/ garçons comptant donc pour 14/21eme soit les 2/3 exactement. Ce qui confirme que nous n'avons rien appris ! L'erreur de base était de penser que l'information conservait l'équiprobabilité des cas favorables ; si on accepte de mettre à zéro certaines probas, il faut accepter aussi que les autres répartitions sont modifiées! C'est là que cela devient critique : Oh que oui ! Je vais vous donner mon exemple préféré, car il rend tout le monde fou, y compris les mathématiciens et même les probabilistes. Imaginez que lors d’un voyage, votre voisin, en bavardant, vous fait savoir qu’il a deux enfants dont un fils qui, vous l’apprenez au passage, est né un mardi. La question est la suivante : quelle est la probabilité que l’autre enfant de cet homme soit une fille ? Spontanément, on aurait envie de répondre 50 %, car savoir que l’un des enfants est un garçon ne préjuge en rien du sexe de l’autre. Eh bien c’est faux ! Car si on ne connaissait que le fait que l’un des enfants est un garçon, la probabilité que l’autre soit une fille serait de 2/3. En effet – sans compter les jumeaux –, les familles de deux enfants sont réparties en quatre types : gg, gf, fg et ff. Mais comme cette famille n’est pas du type ff (puisqu’il y a un fils), elle est forcément de type gg, gf ou fg ; ces trois types étant également répartis, il y a bien deux chances sur trois que l’autre enfant soit une fille. Cet exercice classique est hélas faux pour les mêmes raisons : Un calcul précis des probabilités montre qu'effectivement " on n'apprends rien sur le sexe de l'autre enfant" U = l'univers constitué des 4 couples FG GF GG FF avec équiprobabilité E = l'homme dit j'ai un garçon eh bien P( E sachant FF) = 0 ; P( E sachant FG) = 1/2 ; P( E sachant GF) = 1/2 et enfin P( E sachant G) = 1 on n'a plus équiprobabilité ! et par Bayes P(FF sachant E) = 0 ; P(FG sachant E) = 1/4 ; P(GF sachant E) = 1/4 et enfin P(GG sachant E) = 1/2 Le bon sens a finalement raison ! cordialement Gilbert GABILLARD RENNES

Désolé, cela semble indigeste. Pour résumer, il y a une erreur de raisonnement dans l'exemple : c'est de croire que après l'information "garçon" ou "mardi" l'équiprobabilité des cas favorables est conservée ; c'est heureusement faux , ce qui fait que l'intuition naïve est bonne... et Mme Schneps commet une erreur qui n'aura pas de conséquences judiciaires !

Bonjour désolé de vous contredire, mais si E=il y a un garçon, alors P(E sachant FF)=0 comme vous écrivez mais P( E sachant GF) = 1 et non 1/2 P( E sachant FG) = 1 et non 1/2 P(E sachant GG) = 1 et donc P(GG sachant E) = 1/3 cqfd. Cet exemple est bien connu, il est similaire à celui où on a 3 portes, l'une cachant un trésor. On en choisit une au hasard puis, avant qu'on ne découvre ce qu'il y a derrière, on vous ouvre une des 2 portes que vous n'aviez pas choisie et derrière laquelle il n'y a rien. Avez-vous intérêt à changer votre choix? La réponse est oui. En gros le point fondamental et que si on vous donne de l'information, ça a forcément un impact...

Personnellement j'aurais tendance à raisonner ainsi : puisque l'ordre des naissances n'intervient pas dans l'exemple "qui rend fou" il existe seulement 3 combinaisons possibles et non 4 = GG, FF et GF(ou FG), chacune avec 1/3 de probabilité. Il existe donc 2/3 pour qu'il y ait au moins une fille sur les 2 et le fait de savoir qu'il y a un G n'y change rien. L'introduction du mardi me semble porter sur un autre point : non pas le calcul de probabilité du résultat, mais le calcul de probabilité d'un second événement par rapport au premier. Et dans ce cas, que G soit né n'importe quel jour, il existe 1/2 chance pour que le second soit G ou qu'il soit F. On devrait avoir 14//28 au lieu de 14/27 s'il n'y avait pas l'incidence des arrondis. Mais à l'évidence je ne comprends rien aux probabilités ! :-)

Pages

Pour laisser votre avis sur cet article
Connectez-vous, rejoignez la communauté
du journal CNRS