Passer au contenu

Pourquoi on pourra bientôt identifier n’importe qui grâce à son ADN

Le succès des tests ADN et des plate-formes généalogiques fait le bonheur des enquêteurs qui peuvent ainsi retrouver la trace d’un meurtrier ou un violeur en série. Mais ces nouvelles techniques d’investigation représentent aussi potentiellement un grand risque pour nos vies privées.

En avril dernier, la police californienne a – probablement sans le savoir – révolutionné l’enquête criminalistique. Elle s’est appuyée sur une plateforme ouverte de partage d’informations ADN (GEDmatch.com) et sur les sites de recherche généalogique pour retrouver la trace du « Golden Gate Killer », un homme qui avait perpétré 12 meurtres et 50 viols il y a plus de quarante ans.

Cette technique d’investigation fait désormais fureur parmi les forces de l’ordre. Depuis cette première affaire, douze autres enquêtes pénales ont pu être résolues de la même manière, comme vient de le souligner un groupe de chercheurs israélo-américain. Au regard de ces nouvelles possibilités, les scientifiques ont voulu savoir quelle était la chance d’identifier une personne à partir de son ADN et en utilisant ces ressources ouvertes.

La clé d’une recherche sont les cousins éloignés

Pour cela, les chercheurs se sont procuré une base de 1,8 million de données ADN, fournie par l’opérateur MyHeritage. Ils ont ensuite analysé la probabilité, pour chaque ADN de cette base, de trouver un ou plusieurs cousins éloignés dans cette même base. Le résultat est de 60 %, ce qui n’est pas mal. Connaissant les cousins d’un ADN en particulier, les chercheurs ont alors rejoué l’enquête criminalistique en effectuant des recherches sur les sites généalogiques.

A première vue, retrouver quelqu’un en ne connaissant que quelques cousins de troisième ou quatrième degré peut sembler complexe. En réalité, les chercheurs ont constaté qu’il était possible de réduire de manière drastique le champ de recherche en y ajoutant des filtres géographiques et démographiques. Tout d’abord, l’ADN nous indique le sexe de la personne recherchée, ce qui divise par deux le nombre de candidats potentiels. Réduire la recherche à un rayon d’environ 100 km en supprime 57 % de plus. Et si en plus on connaît à peu près l’âge de la personne recherchée (à +/- cinq ans), on réduit de nouveau la liste des suspects de 91 %. Dans les tests effectués, il ne restait finalement qu’une petite vingtaine de personnes, une liste suffisamment petite pour pouvoir être vérifiée « à la main » par un service de police.

Le fichage de 2 % d’une population est suffisant

Cette technique est très efficace pour résoudre des crimes et aider les victimes. Mais cette technique fait quand même froid dans le dos quant on imagine d’autres usages… D’après les estimations des chercheurs, il suffit d’obtenir l’ADN de seulement 2 % d’une population pour pouvoir trouver des cousins éloignés de n’importe quel membre issu de cette population. Et, par conséquent, de pouvoir l’identifier avec une bonne chance de réussite.

Si l’on part de cette hypothèse, une base d’environ 1,5 million de fichiers ADN suffirait pour couvrir la population française. C’est d’autant plus intéressant quand on sait que le « Fichier national automatisé des empreintes génétiques » (FNAEG), la base de données ADN du ministère de l’intérieur, dépasse d’ores et déjà les 3,4 millions de profils enregistrés. Pour la police, identifier n’importe quel Français à partir de son ADN ne devrait donc plus être une grande difficulté.  

Protéger l’ADN avec des signatures électroniques

Malheureusement, les bases ADN commerciales et les plate-formes de partage généalogique peuvent également donner ce pouvoir à des acteurs non gouvernementaux. Les laboratoires 23andMe et Ancestry totalisent à eux deux déjà 14 millions de fichiers ADN, et ce n’est pas fini. Ces chiffres montrent bien le risque que représentent ces bases. Des hackers qui parviendraient à dérober une base ADN anonymisée -issue par exemple d’un projet de recherche médicale- pourraient, grâce à ces ressources en ligne, retrouver l’identité des participants et, pourquoi pas, revendre cette information à des sociétés d’assurance peu scrupuleuses.

Pour réduire ce risque, les chercheurs proposent que les opérateurs protègent les données ADN à l’aide de signatures électroniques qui devraient être systématiquement décodées et vérifiées avant de pouvoir effectuer une recherche de cousins éloignés. Cela donnerait une indication sur l’origine des données et leur caractère sensible. On pourrait alors, le cas échéant, interdire leur traitement.   

Source: Ars Technica

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Gilbert KALLENBORN