Данные корейского проекта генома опубликованы для публичного использования

геном
                Кредит: CC0 Public Domain

Команда исследователей, члены которых связаны с большим количеством учреждений в Корее, два в США и один в США, опубликовали данные начальной фазы проекта «Геном Кореи» (Korea1K). В своей статье, опубликованной в журнале Science Advances, группа отмечает, что данные включают информацию, описывающую 1094 полных генома, а также 79 количественных клинических признаков.
                                                                                       

Korea1K — крупнейший проект по секвенированию генома, осуществленный до настоящего времени в Южной Корее — он начался еще в 2006 году и с тех пор поддерживается различными источниками. Его целью является сбор, анализ и распространение информации о геноме Кореи для использования в клинических и этнографических исследованиях. Ожидается, что одно из основных применений данных будет в области исследований рака.

На первом этапе проекта секвенировали 1094 полных генома со средней глубиной 31x. Данные для каждого секвенированного генома были соединены с 79 ассоциированными признаками человека, чей геном был секвенирован. В своей статье команда выделяет заметные детали данных.

Некоторые примеры примечательных деталей: было идентифицировано тридцать девять миллионов однонуклеотидных вариантов и инделей, половина из которых, как было установлено, представляла собой дублеты или синглтоны. Исследователи также обнаружили, что у Korea1K была более высокая точность вменения, чем при использовании панели 1000 Genomes, что делает фильтрацию раковых проб более эффективной. Они также отмечают, что 1007 геномов, секвенированных в рамках проекта, были заново сгенерированы, и эта информация в данных включала характеристики инделей, SNV, вставок переносимых элементов, вариантов количества копий и типов антигенов лейкоцитов человека, которые уже сравнивались с данными из других групп населения.

Исследователи также отмечают, что более 70 процентов обнаруженных до настоящего времени двойных или синглетонов никогда ранее не регистрировались, и менее 20 процентов из них были названы общими. Они также обнаружили, что в Indels было больше удалений, чем вставок, что свидетельствует о возможном искажении вариантов вызова. Они завершают свои замечания, предлагая, чтобы набор данных обеспечил надежную справочную панель в будущем, тем самым расширяя возможности персонализированных медицинских приложений для народа Кореи.

Похожие новости

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *