В журнале Nature опубликована серия статей, посвященных исследованию, которое эксперты называют прорывом, сообщает Science. Речь о первом проекте пангенома человека – коллекции геномов, собранных у людей со всего мира. Для ученых он может стать источником более полных представлений о нашей эволюции, а рядовому человеку полезен тем, что в будущем даст возможность более точного тестирования на склонность к разным болезням.
Сегодня, когда медики определяют риск того или иного пациента заболеть, например, раком или шизофренией, они ориентируются на его ДНК. Однако эта ДНК не индивидуальная: так называемый «эталонный» геном, который сейчас используется, составлен из фрагментов генетического материала нескольких людей.
Первая расшифровка генома человека была опубликована в 2001 году. Он представлял собой лоскутное одеяло из ДНК более чем 60 человек. Эта версия была не окончательной, в ней отсутствовало около 8% генетического «алфавита», который было трудно прочитать с помощью существовавших на тот момент технологий секвенирования, так что все последующие годы геном латали и дополняли.
В прошлом году было объявлено о первом полностью завершенном геноме человека T2T-CHM13. Он представляет собой почти 100% всей последовательности ДНК, но, несмотря на свою полноту, все же не отражает всего генетического разнообразия нашего вида. В него, например, не входит информация об аллелях – версиях одного и того же гена, которые могут присутствовать в одной популяции и отсутствовать в других.
Создатели пангенома – генетики из 14 научных институтов, составивших Справочный консорциум по пангеному человека (HPRC), – https://humanpangenome.org/ объединили геномы, собранные у 47 анонимных участников и их родителей. В эту группу вошли люди со всех континентов, кроме Антарктиды: прошлые генетические исследования много критиковали за то, что они опирались на ДНК людей европейского происхождения.
В ходе работы ученые детально проанализировали геном каждой особи, определив, какие участки принадлежали родителям. Им также удалось секвенировать длинные фрагменты ДНК, что позволило зафиксировать больше вариаций, чем в предыдущих исследованиях. Была значительно расширена библиотека пар оснований – строительных блоков ДНК: к уже известным добавилось 119 миллионов оснований.
Большая часть этой ДНК находится в ранее не исследованных частях генома, содержащих множество копий генов, которые дублируются с оригиналов в других частях ДНК. Эти дублированные части изменяются быстрее, чем недуплицированные участки генома, говорят авторы исследования, причем происходящие мутации фундаментально отличаются от мутаций в остальной части генома. Некоторые из этих дублированных областей связаны с размером мозга человека и другими чертами, отличающими нас от приматов, другие – с определенными чертами характера и склонностью к заболеваниям.
Наши геномы идентичны более чем на 99%. Но именно этот 1% – то, что делает каждого отдельного человека непохожим на других. «У каждого человека уникальный геном, поэтому использование единой эталонной последовательности генома для каждого человека может привести к неравенству в геномном анализе, – говорит генетик Адам Филлиппи из Национального исследовательского института генома человека в Мэриленде. – Например, предсказание генетического заболевания может хуже сработать для человека, в чьем геноме больше отличий от эталонного генома».
Пангеном – гораздо более широкий источник информации. По словам авторов, новая модель на 34% точнее при поиске небольших вариантов и на 104% – при поиске крупных, или структурных, вариантов, которые труднее всего обнаружить. Еще одним важным достоинством пангенома является то, что благодаря большему объему и разнообразию данных он дает возможность различать родительские наборы хромосом, что важно для изучения наследования заболеваний.
Несмотря на то, что пангеном сильно расширяет наши представления о генетическом разнообразии человека, он не лишен недостатков. Например, в нем по-прежнему плохо представлены латиноамериканцы, коренные американцы, люди с Ближнего Востока, нет никого из Океании. Словом, пока он не является репрезентативным для всех. Этот недостаток планируется устранять. Первая фаза проекта была направлена на разработку технологии для создания пангенома, а в будущем ученые будут добавлять в него новые данные. Через год в пангеноме должно быть уже 350 геномов. Большинство учреждений, участвующих в HPRC, базируются в США и Европе, однако к проекту, надеются его создатели, будут присоединяться научные организации из других стран. Цель – секвенировать новые геномы из других регионов и дать больше информации для изучения генетикам, биологам-эволюционистам, медицинским исследователям и другим специалистам.
Ознакомиться с исследованиями можно на сайте журнала Nature.