Сервисы ДНК для любителей могут быть открыты для генетического взлома

dna
                Кредит: CC0 Public Domain

Онлайн-сервисы, которые позволяют пользователям загружать свою генетическую информацию, исследовать генеалогию и находить потерянных родственников, могут быть уязвимы для своего рода генетического взлома, считают два генетика из Университета Калифорнии в Дэвисе. Статья с описанием работы опубликована 7 января в журнале eLife.
                                                                                       

С ростом домашнего тестирования ДНК онлайн-сервисы, такие как GEDMatch, MyHeritage и FamilyTreeDNA, стали популярными местами, где люди могут загружать свою генетическую информацию и исследовать свою генеалогию. Они также использовались правоохранительными органами для поиска подозреваемых в уголовных преступлениях путем подбора ДНК с родственниками.

Но, по словам профессора Грэма Купа и постдокторского исследователя Майкла ‘Док’ Эджа из Отдела эволюции и экологии Калифорнийского университета в Дэвисе, кто-то с небольшим опытом в области генетики и вычислительной техники может спроектировать и загрузить последовательности ДНК, которые извлекают гораздо больше из этих баз данных чем некоторые потерянные кузены. Злоумышленник может извлечь генетическую информацию большинства людей из базы данных или идентифицировать людей с определенными генетическими особенностями, такими как болезнь Альцгеймера.

Coop и Edge уведомили компании-базы данных о проблеме в июле 2019 года, чтобы дать им время наложить контрмеры до публикации препринта в октябре.

«Люди отдают больше информации, чем они думают», когда они загружаются на эти общедоступные сайты, сказал Куп. И в отличие от информации о кредитной карте, вы не можете просто отменить свой старый геном и получить новый.

Проблемы не затрагивают коммерческие компании по секвенированию ДНК, такие как 23andMe, сказал Куп. Вы должны представить свою ДНК в качестве образца слюны, чтобы получить доступ к их генетическим данным. Однако общедоступные базы данных позволяют любому загружать последовательности ДНК и искать других пользователей с соответствующими последовательностями.

Идентичен по состоянию и происхождению

Эти сайты работают с использованием программного обеспечения для сравнения последовательностей ДНК, загруженных пользователями, с последовательностями, уже имеющимися в их базе данных. Ваш геном — это мозаика кусочков, унаследованных от ваших предков. Большие части, или плитки в мозаике, происходят от недавних предков. По прошествии нескольких поколений соответствующие последовательности нарезаются на более мелкие кусочки. Так что, если вы поделитесь большими кусками последовательности ДНК с кем-то еще, скорее всего, у вас есть недавний предок.

Куп и Эдж нашли три подхода к атаке на эти базы данных. Они называют эти методы тайлингом IBS (идентичным по последовательности), зондированием IBS и травлей IBS.

В их тестах в основном использовалась общедоступная коллекция последовательностей ДНК человека, доступных для исследования. Они также провели проверку концепции в базе данных GEDMatch, но без взаимодействия с данными ДНК других пользователей.

В тайле IBS злоумышленник загружает несколько геномов, обнаруженных в общедоступных исследовательских базах данных, и отслеживает, какие из них совпадают с другими геномами в базе данных и где. Если они могут найти достаточно подходящих плиток, они могут собрать большую часть чьего-либо генома.

Зондирование IBS может использоваться для охоты на людей, которые несут определенный генетический вариант — например, ген, связанный с болезнью Альцгеймера. Для этого злоумышленник создает поддельный геном с последовательностью ДНК, которая вряд ли кому-либо будет соответствовать, за исключением одного небольшого участка, который будет соответствовать интересующему гену. Совпадения из базы данных, вероятно, будут людьми с этим генетическим вариантом.

Наконец, приманка IBS основывается на обмане одного класса алгоритмов, используемых для идентификации родственников. (Однако не все базы данных используют этот тип алгоритма). Куп и Эдж подсчитали, что, используя всего 100 загруженных последовательностей ДНК, злоумышленник может использовать этот метод для получения большей части геномной информации в базе данных.

Coop и Edge провели проверку концепции с базой данных GEDMatch в декабре 2019 года. Работая только с последовательностями ДНК, которые они загрузили, и используя «режим исследования» GEDMatch, чтобы не взаимодействовать с данными других пользователей, они показали, что приманка IBS может быть использована для идентификации специфических генетических вариантов (однонуклеотидных полиморфизмов или SNP) в базе данных.

Все три атаки могут быть выполнены кем-то, обладающим знаниями в области генетики и вычислительной техники, например аспирантом или серьезным любителем, но «хорошая новость заключается в том, что это вполне предотвратимо», сказал Эдж.

В статье Купа и Эджа описан ряд шагов, которые генетические службы, работающие непосредственно с потребителем, могли бы предпринять, чтобы блокировать эти атаки. По словам Купа, хотя они уже поделились информацией с ведущими службами, они получили «разнообразный» ответ.

Использование этих услуг обязательно подразумевает отказ от личной информации, и миллионы людей, похоже, готовы сделать это в обмен на изучение семейной истории или других личных целей. Но пользователи должны лучше знать, сколько именно информации они могут отдавать, когда получают доступ к этим услугам.

«Мы хотели бы (службы) прояснить их уязвимости и то, как они их устраняют», — сказал Куп./p>

Похожие новости

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *