Articles / mars 1, 2022

La Science dans les nouvelles

par Julian Segert
chiffres par Aparna Nathan

À Mountain View, en Californie, près des sièges sociaux de Facebook et de Google, se trouve 23andMe, une entreprise qui a entrepris de rendre les tests génétiques accessibles et abordables pour le grand public. La société a commencé avec l’objectif de fournir des évaluations des risques pour les maladies génétiques, mais a récemment gagné en popularité en offrant des informations sur l’ascendance géographique. 23andMe est unique parmi les autres entreprises technologiques car elle collecte des échantillons physiques de clients (salive) afin de fournir des informations que les services purement numériques ne peuvent pas. Cette nouvelle ère de collecte et de partage de données génétiques a contribué à notre compréhension et à notre traitement des maladies génétiques, mais elle apporte également de nouvelles préoccupations en matière de confidentialité et de sécurité.

Comment fonctionnent les tests génétiques de consommation?

Chaque cellule de votre corps contient votre code génétique complet, ou génome, qui comprend tout votre ADN et donc tous vos gènes. Certaines parties du génome sont essentielles à la vie, elles sont donc partagées entre toutes les personnes. Cependant, tout le monde porte également un certain nombre de “variantes génétiques” dans des zones du génome qui ne sont pas directement essentielles à la vie; ces variantes rendent les gens uniques et peuvent nous en dire beaucoup sur les traits d’une personne et sa propension à la maladie.

Pendant des années, des conseillers génétiques spécialement formés ont pu effectuer des tests pour rechercher des variantes liées à la maladie et fournir un soutien émotionnel aux patients et aux familles en cas de mauvaise nouvelle. Récemment, cependant, de plus en plus de gens se sont tournés vers des kits commerciaux comme 23andMe ou Ancestry DNA. Ces trousses sont appelées ” direct to consumer ” (DTC) parce qu’elles sont annoncées et vendues directement aux consommateurs, par opposition à la demande d’un médecin. Ces kits ont tendance à être relativement abordables à environ 100-200 $, en partie parce qu’ils ne regardent qu’une fraction d’un pour cent du génome. À titre de comparaison, il en coûterait environ 1000 $ pour lire tout le code génétique d’un client. L’autre raison pour laquelle les entreprises peuvent se permettre de vendre des kits si bon marché est qu’elles peuvent vendre les données génétiques de leurs clients à des sociétés pharmaceutiques à des fins lucratives. 23andMe, par exemple, a un contrat de licence de données clients au géant de la biotechnologie Genentech pour ses efforts de recherche sur la maladie de Parkinson.

Que font exactement les entreprises avec vos données ?

Les entreprises partagent les données clients uniquement sur une base d’opt-in, et 80% des clients de 23andMe acceptent de participer. Les données 23andMe ont été utiles pour déterminer les risques de maladie associés à certaines variantes génétiques; cet utilitaire découle de la popularité du cisaillement de ce test et de la richesse des données qu’il a générées. L’étendue des données génétiques devient importante lorsque nous considérons que la plupart des variantes génétiques ne causent pas réellement de maladies. Ainsi, si une personne atteinte d’Alzheimer, par exemple, faisait tester son ADN, il serait impossible de savoir quelles variantes sont dangereuses et quelles variantes ne sont pas liées. Cependant, si vous testiez de nombreuses personnes atteintes ou non de la maladie d’Alzheimer et que vous recherchiez des variantes partagées entre les personnes atteintes de la maladie et largement absentes parmi les personnes sans maladie, vous trouveriez des variantes probablement liées à la maladie.

En pratique, ce type d’études sur les maladies génétiques nécessite souvent des centaines de milliers de personnes et finit par coûter de l’ordre de 250 millions de dollars. 23andMe représente une ressource précieuse car il a déjà fait le travail de collecte d’informations génétiques et d’informations sur la santé déclarées par les utilisateurs. Cette mine de données a été particulièrement utile pour identifier les fondements génétiques de maladies qui ont échappé aux analyses génétiques sur un plus petit nombre de personnes, en particulier les affections psychiatriques. Les données des utilisateurs de 23andMe ont récemment été exploitées pour étudier la génétique du trouble déficitaire de l’attention / hyperactivité (TDAH), du névrotisme et de la dépression.

Où d’autre les données génétiques peuvent-elles aboutir?

Les sociétés de test ne partagent les données qu’avec leur consentement explicite et sous des conditions d’anonymat. On ne peut pas en dire autant d’un certain nombre de services publics en ligne. Des sites Web comme GEDmatch permettent à quiconque de télécharger des informations génétiques pour rechercher des proches. La politique de confidentialité de GEDmatch est très différente de celle de 23andMe en ce qu’elle est consultable publiquement et inclut des noms réels. GEDmatch a pris de l’importance lorsqu’il a été utilisé par les forces de l’ordre pour résoudre le cold case du tueur de Golden State vieux de plusieurs décennies. Depuis que cette affaire a été résolue en avril, un total de 25 cas ont été résolus en utilisant des bases de données de généalogie publiques qui peuvent être interrogées sans mandat, une pratique activement encouragée par GEDmatch.

Bien que le partage de ses propres données soit facultatif, il n’existe aucun système en place pour protéger la vie privée génétique des proches. Chaque fois qu’une personne fait le choix de publier ses propres données, elle publie implicitement des données relatives à ses proches, car des individus apparentés partagent des parties de leur code génétique. Les données de parents aussi éloignés que les cousins au troisième degré peuvent être utilisées pour identifier les individus (figure 1). À l’heure actuelle, 60% des Américains d’origine nord-européenne peuvent être identifiés par des données qu’un parent a téléchargées dans une base de données publique. Ce nombre devrait atteindre plus de 90 % d’ici quelques années. Bien que loin d’être mis en œuvre, il y a eu des appels à des bases de données adn médico-légales nationales aux États-Unis qui incluent des données pour tous les citoyens, quels que soient leurs antécédents criminels.

Figure 1: Un arbre généalogique hypothétique montrant la portée des bases de données génétiques publiques comme GEDmatch. Dans cet exemple, l’un de vos cousins au troisième degré, qui partage le même arrière-grand-parent que vous, publie ses résultats de test. Ces informations vous rendent identifiable.

En plus de la capacité des tests génétiques à porter atteinte à la vie privée des personnes apparentées, il existe également une préoccupation valable que les données publiques révèlent un risque caché de maladie qui concerne également un parent qui préférerait ne pas le savoir. Il y a beaucoup de gens qui savent qu’ils peuvent être porteurs d’une maladie génétique et choisissent de ne pas être testés pour pouvoir continuer à vivre leur vie sans être définis par un diagnostic. Certains craignent également que leur fournisseur d’assurance augmente les tarifs s’ils ont vent d’un risque de maladie (aux États-Unis, cela est illégal pour les fournisseurs d’assurance maladie en vertu de la Loi sur la non-discrimination de l’information génétique, mais cela ne s’applique pas à l’assurance vie ou invalidité). Ce “droit de ne pas savoir” peut être menacé lorsqu’un proche partage des résultats de tests ADN impliquant une maladie.

Quelle est l’efficacité de la déidentification des données génétiques?

Toutes les données vendues par les services de tests génétiques ont été anonymisées pour supprimer des noms, mais il n’est pas clair si cela est tout à fait efficace car les données génétiques sont intrinsèquement identifiables. En effet, le génome de chaque personne est unique et peut leur être retracé, semblable à une empreinte du pouce. De plus, les études nécessitent généralement une certaine quantité d’informations sur la santé et la démographie afin d’utiliser les données génétiques (par exemple, elles doivent savoir si vous avez la maladie à l’étude et quels facteurs environnementaux vous avez été exposés). Dans une étude, les chercheurs ont pu déduire les noms de famille de sujets anonymes en utilisant seulement une petite partie de leurs données génétiques ainsi que des informations telles que la date de naissance et l’état d’origine. Cette technique n’est pas assez puissante pour ré-identifier la majorité des personnes, mais c’est une démonstration surprenante du pouvoir de l’inférence génétique. La ré-identification est plus susceptible de fonctionner lorsque le sujet a une maladie très rare, car cela réduit le nombre possible de personnes. Cela pourrait signifier que moins de patients atteints de maladies rares fournissent leurs données de peur d’être identifiés, ce qui nuirait aux efforts de recherche.

L’avenir des tests consommateurs

Quelques entreprises s’efforcent de changer de paradigme en donnant aux participants la propriété exclusive de leurs propres données et en les laissant les vendre anonymement, le tout avec la perspective d’un gain financier. Nebula Genomics, fondée par le généticien de Harvard George Church, offre aux clients une lecture complète de leur génome par opposition au petit échantillon lu par 23andMe. Il donne également aux clients la propriété exclusive de leurs propres données et la possibilité de les partager anonymement avec les entreprises de leur choix en utilisant un réseau de transfert de données sécurisé (figure 2). Nebula vise à fournir des données sans frais aux clients à condition qu’ils fournissent des informations sur leur santé. De même, la base de données génomique LunaDNA propose des actions de l’entreprise aux participants qui accordent une licence anonyme de données personnelles via leur réseau. Les participants reçoivent actuellement environ 3 $.50 pour un test de style 23andMe, alors qu’une lecture génétique complète, à peine inférieure à 1000 to à obtenir, vaut environ 21 $. La somme d’argent en jeu peut sembler décevante, mais la propriété des données génétiques donne également aux consommateurs le pouvoir de décider exactement qui peut et ne peut pas utiliser leurs données. Cela encourage les entreprises à être plus responsables avec les données des clients, car les personnes seront moins susceptibles de fournir leurs données à une entreprise ayant des antécédents de violation de données et plus susceptibles d’envoyer leurs données à des entreprises effectuant des recherches significatives.

Figure 2 : Tests génétiques CTT vs. données génétiques appartenant aux consommateurs. Cet organigramme montre les différences entre les services de tests ADN directs aux consommateurs tels que 23andMe (en haut) et les services tels que Nebula qui permettent aux clients de posséder et de licencier leurs propres données (en bas).

Les tests génétiques directs aux consommateurs sont là pour rester. À lui seul, 23andMe a testé plus de 5 millions de personnes et ne montre aucun signe de ralentissement. Ils obtiennent l’approbation de la FDA pour tester un nombre croissant de maladies génétiques et exploitent leurs données pour découvrir la génétique de conditions allant de banales à dévastatrices. En fin de compte, ce devrait être aux personnes ayant des informations génétiques en jeu de décider où placer leur confiance. C’est un moment critique où les politiques entourant le partage et l’utilisation de l’information génétique vont être décidées pour les années à venir. En tant que participants ou parents de participants à cette nouvelle ère de l’information génétique, nous avons le droit et la responsabilité de nous assurer que les données personnelles sont utilisées de manière responsable.

Julian Segert est étudiant de première année en sciences biologiques et biomédicales à la Harvard Medical School où il étudie la génétique et la génomique. Vous pouvez le suivre sur Twitter @JulianSegert.

Aparna Nathan est étudiante en deuxième année de doctorat dans le programme de doctorat en Bioinformatique et en Génomique intégrative de l’Université Harvard. Vous pouvez la trouver sur Twitter sous le nom de @aparnanathan.

International Blogging Network