Science in the News

Julian Segert
dane liczbowe Aparna Nathan

w Mountain View w Kalifornii, w pobliżu siedziby Facebooka i Google, leży 23andMe, firma, która postanowiła uczynić testy genetyczne przystępnymi i przystępnymi dla ogółu społeczeństwa. Firma rozpoczęła od celu zapewnienia oceny ryzyka chorób genetycznych, ale ostatnio zyskała większą popularność, oferując wgląd w pochodzenie geograficzne. 23andMe jest wyjątkowa wśród innych firm technologicznych, ponieważ zbiera fizyczne próbki klientów (ślinę) w celu dostarczenia informacji, których usługi czysto cyfrowe nie mogą. Ta nowa era gromadzenia i udostępniania danych genetycznych przyczyniła się do naszego zrozumienia i leczenia chorób genetycznych, ale niesie ze sobą również nowe obawy dotyczące prywatności i bezpieczeństwa.

jak działają konsumenckie testy genetyczne?

każda komórka w twoim ciele zawiera Twój kompletny kod genetyczny, czyli Genom, który zawiera całe twoje DNA, a tym samym wszystkie twoje geny. Niektóre części genomu są niezbędne do życia, więc są dzielone między wszystkich ludzi. Jednak każdy ma również szereg “wariantów genetycznych” w obszarach genomu, które nie są bezpośrednio niezbędne do życia; warianty te czynią ludzi wyjątkowymi i mogą nam wiele powiedzieć o cechach danej osoby i skłonności do chorób.

przez lata specjalnie wyszkoleni doradcy genetyczni byli w stanie wykonywać testy w celu znalezienia wariantów związanych z chorobą i zapewnić wsparcie emocjonalne dla pacjentów i rodzin, jeśli są złe wieści. Ostatnio jednak coraz więcej osób zwraca się do komercyjnych zestawów, takich jak 23andMe lub Ancestry DNA. Zestawy te są określane jako “direct to consumer” (DTC), ponieważ są reklamowane i sprzedawane bezpośrednio konsumentom, w przeciwieństwie do żądań lekarza. Te zestawy wydają się być stosunkowo niedrogie w około $100-200, po części dlatego, że patrzą tylko na ułamek procent genomu. Dla porównania, odczytanie całego kodu genetycznego klienta kosztowałoby około $ 1000. Innym powodem, dla którego firmy mogą sobie pozwolić na tak tanią sprzedaż zestawów, jest to, że mogą sprzedawać dane genetyczne swoich klientów firmom farmaceutycznym z zyskiem. 23andMe, na przykład, ma umowę na udzielenie licencji na dane Klienta gigantowi biotechnologicznemu Genentechowi w celu przeprowadzenia badań nad chorobą Parkinsona.

co dokładnie firmy robią z Twoimi danymi?

firmy udostępniają dane klientów tylko na zasadzie opt-in, a 80% klientów 23andMe wyraża zgodę na uczestnictwo. Dane 23andMe były przydatne w określaniu ryzyka choroby związanego z niektórymi wariantami genetycznymi; to narzędzie wynika z popularności ścinania tego testu i bogactwa danych, które wygenerował. Szeroki zakres danych genetycznych staje się ważny, gdy weźmiemy pod uwagę, że większość wariantów genetycznych nie powoduje chorób. Tak więc, jeśli ktoś z Alzheimerem, na przykład, miał ich DNA testowane, byłoby niemożliwe, aby powiedzieć, które warianty są niebezpieczne, a które warianty są niepowiązane. Jednak, jeśli testowano Wiele osób z i bez Alzheimera i szukał wariantów, które są wspólne dla osób z chorobą i w dużej mierze nieobecny wśród osób bez choroby, można znaleźć warianty, które są prawdopodobnie związane z chorobą.

w praktyce tego rodzaju badania nad chorobami genetycznymi często wymagają setek tysięcy ludzi i kończą się kosztem rzędu 250 milionów dolarów. 23andMe stanowi cenny zasób, ponieważ wykonała już pracę polegającą na zbieraniu informacji genetycznych i informacji zdrowotnych zgłaszanych przez użytkowników. To bogactwo danych było szczególnie korzystne dla identyfikacji genetycznych podstaw chorób, które wymknęły się z analiz genetycznych na mniejszej liczbie ludzi, w szczególności chorób psychicznych. Dane użytkownika 23andMe zostały ostatnio wykorzystane w celu zbadania genetyki deficytu uwagi / nadpobudliwości psychoruchowej (ADHD), neurotyzmu i depresji.

gdzie jeszcze mogą się znaleźć dane genetyczne?

firmy testujące udostępniają dane tylko za wyraźną zgodą i na warunkach anonimowości. Tego samego nie można powiedzieć o wielu publicznych usługach online. Strony takie jak GEDmatch pozwalają każdemu przesyłać informacje genetyczne w celu wyszukiwania krewnych. Polityka Prywatności GEDmatch znacznie różni się od 23andMe tym, że można ją publicznie przeszukiwać i zawiera prawdziwe nazwiska. GEDmatch zyskał na znaczeniu, gdy został użyty przez organy ścigania do rozwiązania wieloletniej sprawy Złotego zabójcy. Ponieważ ta sprawa została rozwiązana w kwietniu, w sumie przypadki 25 zostały rozwiązane za pomocą publicznych baz genealogicznych, które można przeszukać bez nakazu, co jest aktywnie wspierane przez GEDmatch.

chociaż udostępnianie własnych danych jest dobrowolne, nie istnieją systemy chroniące genetyczną prywatność krewnych. Ilekroć dana osoba podejmuje decyzję o upublicznieniu własnych danych, w domyśle upublicznia dane dotyczące swoich krewnych, ponieważ powiązane osoby udostępniają części swojego kodu genetycznego. Dane od krewnych tak odległych, jak kuzynów trzecich mogą być wykorzystane do identyfikacji osób (rysunek 1). W tej chwili 60% Amerykanów z Północnoeuropejskim dziedzictwem można zidentyfikować na podstawie danych przesłanych do publicznej bazy danych. Oczekuje się, że w ciągu kilku lat liczba ta wzrośnie do ponad 90%. Choć daleko do wdrożenia, w USA pojawiły się wezwania do krajowych kryminalistycznych baz danych DNA, które zawierają dane dla wszystkich obywateli, niezależnie od historii kryminalnej.

Rysunek 1: hipotetyczne drzewo genealogiczne pokazujące zasięg publicznych baz genetycznych, takich jak GEDmatch. W tym przykładzie jeden z Twoich kuzynów, który dzieli tych samych pradziadków co Ty, publikuje swoje wyniki testów. Te informacje umożliwiają identyfikację użytkownika.

oprócz zdolności badań genetycznych do naruszania prywatności powiązanych osób, istnieje również zasadna obawa, że dane publiczne mogą ujawnić ukryte ryzyko choroby, które dotyczy również krewnego, który wolałby nie wiedzieć. Jest wielu ludzi, którzy wiedzą, że mogą być nosicielami choroby genetycznej i nie chcą być badani, aby mogli nadal żyć bez zdefiniowania przez diagnozę. Niektórzy obawiają się również, że ich ubezpieczyciel podniesie stawki, jeśli dowiedzą się o ryzyku choroby (w USA jest to nielegalne dla ubezpieczycieli zdrowotnych na mocy ustawy o niedyskryminacji informacji genetycznej, ale nie dotyczy to ubezpieczenia na życie lub niepełnosprawności). To “prawo do niewiedzy” może stać się zagrożone, gdy bliski krewny dzieli wyniki badań DNA, które implikują chorobę.

jak skuteczna jest de-identyfikacja danych genetycznych?

wszystkie dane sprzedawane przez usługi badań genetycznych zostały zdezidentyfikowane w celu usunięcia nazw, ale nie jest jasne, czy jest to całkowicie skuteczne, ponieważ dane genetyczne są nieodłącznie identyfikowane. Dzieje się tak dlatego, że genom każdej osoby jest unikalny i może być przypisany do nich, podobnie jak odcisk kciuka. Co więcej, badania na ogół wymagają pewnej ilości informacji zdrowotnych i demograficznych w celu wykorzystania danych genetycznych(np. muszą wiedzieć, czy masz chorobę w badaniu i jakie czynniki środowiskowe byłeś narażony na). W jednym z badań naukowcy byli w stanie wywnioskować nazwiska anonimowych osób, wykorzystując tylko niewielką część ich danych genetycznych wraz z informacjami, takimi jak data urodzenia i stan domu. Technika ta nie jest wystarczająco potężna, aby ponownie zidentyfikować większość ludzi, ale jest to zaskakująca demonstracja siły wnioskowania genetycznego. Ponowna identyfikacja jest bardziej prawdopodobna, gdy podmiot ma bardzo rzadką chorobę, ponieważ zawęża to możliwą liczbę osób. Może to oznaczać, że mniej pacjentów z rzadkimi chorobami ochotniczo zgłasza swoje dane ze strachu przed ich zidentyfikowaniem, co byłoby szkodliwe dla wysiłków badawczych.

przyszłość testów konsumenckich

kilka firm stara się zmienić paradygmat, dając uczestnikom wyłączną własność własnych danych i pozwalając im sprzedawać je anonimowo, wszystko z perspektywą korzyści finansowych. Nebula Genomics, założona przez Harvard genetyk George Church, daje klientom pełny odczyt ich genomu w przeciwieństwie do małej próbki odczytanej przez 23andMe. Daje również klientom wyłączną własność własnych danych i możliwość anonimowego udostępniania ich wybranym firmom za pomocą bezpiecznej sieci przesyłania danych (rysunek 2). Nebula ma na celu dostarczanie klientom danych bez ponoszenia żadnych kosztów pod warunkiem, że dostarczą oni informacji o swoim stanie zdrowia. Podobnie, genomowa baza danych LunaDNA oferuje akcje firmy uczestnikom, którzy anonimowo licencjonują dane osobowe za pośrednictwem swojej sieci. Uczestnicy otrzymują obecnie około $3.50 za test w stylu 23andMe, podczas gdy kompletny odczyt genetyczny, wciąż ledwo poniżej $1000 do uzyskania, jest wart około $21. Kwota pieniędzy może wydawać się rozczarowująco mała, ale posiadanie danych genetycznych daje również konsumentom prawo do decydowania, kto może, a kto nie może korzystać z ich danych. Zachęca to firmy do większej odpowiedzialności za dane klientów, ponieważ ludzie będą mniej skłonni do wolontariatu swoich danych do firmy z historią naruszeń danych i bardziej skłonni do wysyłania swoich danych do firm prowadzących znaczące badania.

Rysunek 2: testy genetyczne DTC vs. dane genetyczne będące własnością konsumentów. Ten schemat pokazuje różnice między usługami bezpośredniego testowania DNA dla konsumentów, takimi jak 23andMe (Góra), a usługami takimi jak Nebula, które umożliwiają klientom posiadanie i licencjonowanie własnych danych (dół).

bezpośrednio do konsumenta. Sam 23andMe przetestował ponad 5 milionów ludzi i nie wykazuje oznak spowolnienia. Uzyskują zgodę FDA na testowanie rosnącej liczby chorób genetycznych i wykorzystują swoje dane, aby odkryć genetykę warunków od przyziemnych do niszczących. W końcu, to ludzie z informacji genetycznej w stawce, aby zdecydować, gdzie umieścić swoje zaufanie. Jest to krytyczny czas, kiedy polityki dotyczące udostępniania i wykorzystania informacji genetycznej będą rozstrzygane przez wiele lat. Jako uczestnicy lub krewni uczestników tej nowej ery informacji genetycznej mamy prawo i odpowiedzialność, aby upewnić się, że dane osobowe są wykorzystywane w sposób odpowiedzialny.

Julian Segert jest studentem pierwszego roku nauk biologicznych i biomedycznych w Harvard Medical School, gdzie studiuje genetykę i genomikę. Możesz śledzić go na Twitterze @ JulianSegert .

Aparna Nathan jest studentem drugiego roku studiów doktoranckich w zakresie bioinformatyki i genomiki integracyjnej na Uniwersytecie Harvarda. Możesz znaleźć ją na Twitterze jako @ aparnanathan.

Leave a Reply