Как проанализировать ваш геном; Часть I — Митохондриальная ДНК

Структура MT-Cyb - нативная
                Нативная структура субъединицы белка MT-Cyb человека. Предоставлено: proteinmodelportal.org.

Анализ генома сегодня в основном слепой. Обычно это происходит путем случайной проверки совокупности возможных вариантов, которые слабо связаны с каким-либо заболеванием или физическим признаком. Если у вас уже нет серьезных проблем со здоровьем, этот вид узко сфокусированного броска не может изменить вашу игру.
                                                                                       

В этой пустоте мы хотели бы предложить более методичный подход — простую формулу для логического анализа геномов в их критических точках и установления надежных физиологических предикторов, которые актуальны для всех. Но сначала требуется небольшой фон.

Наши геномы — это гибриды, созданные вирусами и бактериями. У нас их два, большой геном и маленький. Биоинформатика в целом игнорировала простую митохондриальную ДНК в 16500 позиций (мтДНК) и вместо этого сосредоточилась почти исключительно на сложной ядерной ДНК в положении 3 миллиарда (нукДНК). Как мы увидим, это полностью отсталый.

За исключением небольшого пептида, называемого гуманином, все белки, которые кодируются в крошечном человеческом митогеноме, используются исключительно в дыхательных комплексах с I по V. Две дуэльные трехмерные печатающие головки (см. ниже), локализованные по обе стороны от двойного митохондриального Мембранная система совместно выдавливает и размещает каждую субъединицу в соответствующем монтажном отсеке. Оказавшись там, факторы сборки, специфичные для каждого комплекса, последовательно сшивают друг с другом. Сторона митохондриального матрикса этой мембраны содержит миторибосомы, а сторона клеток — цитозольные рибосомы.


            Цитозольные и миторибосомы
                Цитозольные и миторибосомы работают в тандеме по обе стороны двойной митохондриальной мембраны. Предоставлено: Wikipedia.org.

Митохондрии развивались как бактериальные эндосимбионты. Они создали самое первое эукариотическое ядро ​​и каждое ядро ​​с тех пор, используя оборудование копирования-вставки-модификации, которое они позаимствовали у вирусов. Нуклеотидные ленты читаются, записываются и изменяются с использованием митохондриально-специфических ДНК- и РНК-полимераз, которые уже давно выгружены в ядро ​​для хранения вместе с большинством других необходимых им белков. Понимание этого митохондриального строительного проекта будет нашим ключом к открытию всего генома.

В nucDNA есть как минимум 1500 мест, которые нас интересуют. Это места, которые кодируют белки и некоторые РНК, которые используются в митохондриях. Хитрость в распознавании этих генов заключается в том, что они обычно начинаются с последовательности митохондриальной локализации, которая направляет их к правой органелле. Не все эти гены, которые культурно ассимилировались в ядре, являются мигрантами из нуклеоида. Многие просто дублировали себя из существующих ядерных генов и впоследствии придумали альтернативный способ сплайсинга в мотиве локализации органелл.

Хотя полный список этих генов («митонуклеарный геном») еще не полностью открыт, многие из них, которые были до сих пор добыты, находятся в Интернете на веб-сайте MitoCharta. Исследователи продолжают находить гораздо больше жителей митонуклеарного генома. Они не экспрессируются всеми тканями и не всегда содержат мотивы локализации, но могут проникать в митохондрии. В совокупности это критические точки гибридного генома.

Другими словами, сладкое место в геномике лежит в местах пересечения двух геномов. Чтобы проанализировать их, мы должны искать корреляции между полиморфизмом в расширяющемся митонуклеарном геноме и крошечном митогеноме. Более конкретно, нам нужно создать панель эффектов, которые можно ожидать, когда будут обнаружены варианты в> 1500-сильном митонуклеарном геноме наряду с конкретными вариантами в 13-сильном митогеноме.

До недавнего времени поиск в базах данных заболеваний по отдельным вариантам, которые могли бы соответствовать пациенту, был единственным способом анализа риска или диагностики многих редких заболеваний. Митохондриальное заболевание, которое когда-то считалось чрезвычайно редким, на самом деле поражает всех в той или иной форме. Хотя возможно создание клеточных гибридов или «кибридов» для изучения эффектов специфических мутаций мтДНК в исследовательских условиях, обычно это не делается для отдельных лиц. К счастью, теперь есть другой путь вперед, а именно, структурное моделирование и молекулярно-динамическое моделирование.

Прелесть этого подхода в том, что он может превзойти грубый поиск в базе данных о делах других людей (и часто других организмах), которые лишь возвращают рассеянную смесь плохих совпадений конкретному набору вариантов индивидуума. Теперь любой генетический профиль может быть напрямую переработан. Другими словами, мы можем индивидуально пометить все наши варианты, а затем исследовать последствия каждого из них на комплексной основе.

Каждый комплекс встроен в периферию связанных компонентов импорта, репликации, трансляции и метаболического цикла митонуклеарного арсенала, который организуется в различные макрокомплексы в различных условиях. В дополнение к мутациям, которые изменяют каталитическую активность отдельных субъединиц в ядре, в настоящее время широко признано, что изменения в периферических аминокислотах, с которыми взаимодействуют субъединицы, часто дают наиболее легко видимые эффекты. Эти пограничные аминокислоты являются теми, которые наиболее непосредственно контролируют сборку субъединиц в структуры более высокого порядка — вплоть до неуловимого дыхательного суперкомплекса.

Хороший способ начать анализ — использовать пример реальной мтДНК. Недавно я получил полное секвенирование генома (WGS) от Dante Labs со специальным запросом на секвенирование мтДНК, которое стоило всего несколько сотен долларов. Я получил результаты mtDNA через несколько недель в виде двух файлов в общем формате, известном как FASTQ. Каждый файл содержит данные секвенирования, полученные путем секвенирования фрагментов ДНК в одном направлении. Чтобы сравнить результаты с Кембриджской эталонной митохондриальной последовательностью (CRS) и извлечь мои конкретные варианты, я загрузил свои файлы на веб-сайт, называемый mtDNA-Server, и использовал «односторонний» для типа файла.

В дополнение к перечислению ваших вариантов, наиболее распространенная «гомоплазматическая» последовательность получается из представленного вами образца, вы также получаете результаты о гетероплазме. Эти данные состоят из дополнительных считываний низкой численности, в основном из так называемых ядерных сегментов митохондриальной ДНК (NUMT). В основном это нефункциональные реликтовые копии мтДНК, расположенные на многих хромосомах. В дальнейшем будет важно проанализировать мтДНК из других отделов, кроме слюны, чтобы лучше разобраться в фактической гетероплазме в различных митохондриях.

Например, клетки сердечной мышцы или фибробласты могут преимущественно накапливать мутированную и удаленную мтДНК. В других случаях разные ткани намеренно поддерживают отдельные популяции гетероплазматических митохондрий. В моем случае я получил следующие гомоплазматические варианты:

11788 C> T MT-ND4

1438 A> G MT-CYB (должен быть MT-RNR2)

15326 A> G MT-CYB

16519 T> C MT-DLOOP1

263 A> G MT-DLOOP2

4769 A> G MT-ND2

750 A> G MT-RNR1

8860 A> G MT-ATP6

Хорошая новость заключается в том, что, хотя не все являются победителями в потоке генетической рекомбинации, каждый с митохондрией может быть отнесен к определенному гаплотипу. Это говорит им о том, где они вписываются в генеалогическое древо человека, и, в меньшей степени, о типах среды, в которой адаптированы их митохондрии. Используя такие инструменты, как MitoMap и Phylotree, и экспертную помощь исследователей Marie Lott и Shiping Zhang из Детской больницы Пенсильвании, я обнаружил, что попал прямо в гаплогруппу «H». Это связано с тем, что я использую в этой группе все очень распространенные маркеры 263G, 750G, 1438G, 4769G, 8860G, 15326G и 16519C. Один редкий аллель, который у меня есть, в 11788T, обнаружен только в 25 из 45 000 последовательностей в базе данных MitoMap, и это наталкивает меня на подгруппу H56. Этот гаплотип является преимущественно североевропейской подгруппой, предположительно возникшей вскоре после последнего ледникового периода.

Одна вещь, которая сразу бросается в глаза — это очевидное изобилие вариантов A> G в моей работе. A> G также, по-видимому, чрезмерно представлен среди известных тяжелых мутаций митохондриальной болезни, таких как, например, MELAS. Мари и Шипинг отметили, что, хотя A> G является статистически предпочтительным переходом (сдвиги G> A и A> G происходят в соотношении 2,26 к 1), их обилие может быть частично объяснено преобладанием переходов над трансверсиями и естественным асимметрия цепей в мтДНК; Легкая цепь, от которой пронумерован митогеном, имеет ~ 30 процентов A, но только ~ 13 процентов G. Более того, известно, что варианты A и G преимущественно локализованы в определенных областях мтДНК.

Спускаясь по списку вариантов, мы обнаруживаем, что некоторые варианты, кодирующие белок, такие как 4769A> G в MT-ND2 или 11788 C> T в гене MT-ND4, были «синонимами». Эти гены кодируют субъединицы NADH-дегидрогеназного комплекса I. Синоним означает, что, хотя нуклеотид изменяется, новый кодон все равно будет распознаваться той же самой мт-тРНК или семейством сходных тРНК. Следовательно, эти варианты вряд ли могут влиять на саму последовательность белка. Все еще возможно, что некоторые незначительные изменения в скорости или точности перевода могут произойти.

Переход 8860 A> G MT-APT6, с другой стороны, является несинонимичной заменой. Более конкретно, эта миссенс-мутация из A> G изменяет специфичность кодонов от специфичности T к A. Важно понимать, что в мире кодонов T представляет собой аминокислоту треонин, а не нуклеозид тимидин, тогда как A представляет собой аланин, а не аденозин. Чтобы определить, где эта мутация происходит в субъединице белка 6 F-АТФазы комплекса V, мы можем использовать Mitomap для преобразования координат 8860 мтДНК, связанных с белками, в 112 координат.

Используя базы данных о структуре белка, такие как Uniprot, и сайты интерактивного моделирования, такие как Protein Model Portal, мы можем указать вариант аланина в положении 112 и посмотреть, где он находится среди различных петель и складок белка. На главном изображении статьи вверху показан весь белок ATP6, а на изображении ниже выделена позиция 112.


            MT-Cyb с вариантом в позиции 112 (выделено зеленым)
                MT-Cyb с вариантом в позиции 112 (выделено зеленым). Предоставлено: proteinmodelportal.org.

Поиск в базе данных коротких нуклеотидных вариаций dbSNP показал, что несколько вариантов MT-CYB связаны с гипертрофической кардиомиопатией, поэтому я хотел провести там более глубокий анализ. Одна статья, которая включала мой конкретный вариант 15326A> G в их исследование, дает отличный рецепт. Авторы этого исследования 2013 года использовали PolyPhen для анализа мутаций, близких к консервативной функции гем-связывающих окислительно-восстановительных центров MT-CYB. Хотя Polyphen предлагает основанные на чувствах метрики, которые оценивают различные мутации как «возможно очень вредные», он также может приписывать эти субъективные описания фактическим функциональным параметрам, таким как переупаковка в захороненных участках белка.

В зависимости от того, доступны ли кристаллические структуры человеческих белков с достаточно высоким разрешением, можно использовать программное обеспечение для прогнозирования, такое как I-TASSER и Swiss-PDB Viewer, для внесения аминокислотных изменений и оценки всех возможных ротамеров. Изменения водородных связей, макромолекулярных взаимодействий и минимизации энергии могут быть выполнены с использованием силового поля GROMOS.

Моделирование полной молекулярной динамики все еще не для слабонервных. Например, программы NAMD и CHARMM22 обычно требуют большой вычислительной мощности. Субъединица MT-Cyb взаимодействует с несколькими из 11 субъединиц в комплексе III. Пакеты, такие как симулятор STRIDE, могут вычислять вторичную структуру в последовательные моменты времени, чтобы выявить, где переходят взаимодействующие альфа-спирали и попеременно переходят в случайные катушки, чтобы разрушить структуру комплекса.

Мы завершим наш анализ митогенома в следующей статье этой серии, а также начнем рассматривать митонуклеарный геном, когда он станет мне доступен. Я пытаюсь пойти по стопам раннего пионера открытой геномики Брайана Парди, который был одним из первых, кто сделал весь свой геном доступным бесплатно для всех, кто заинтересован в его использовании для анализа. Моя собственная информация и файлы доступны по мере их поступления на этом блоге.

Похожие новости

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *