Всем нам хочется заглянуть в прошлое, понять, откуда мы родом. Коммерческие ДНК–тесты обещают простое решение: пара капель слюны — и вот на экране ноутбука мелькают проценты «викингов», «балканцев» и «кельтов», а в почте появляются письма от «родственников» с другого конца света. Звучит заманчиво, не так ли? Но реальность гораздо сложнее: за красочными диаграммами скрываются статистические ловушки, пробелы в глобальных базах данных и серьезные риски для конфиденциальности генетической информации.
Перед тем как отправить свою ДНК в лабораторию, важно понять, как устроены эти тесты, насколько точны их результаты и почему удалить «цифровые гены» оказывается гораздо сложнее, чем заказать набор для анализа.
Легкий путь к прошлому или запутанный лабиринт?
Реклама уверяет: «Плюньте — и размотайте клубок истории». За 30–90 евро курьер доставляет аккуратную коробочку, ватная палочка бережно касается внутренней поверхности щеки — и через пару недель на экране всплывают цифры: 9% норвежской крови, 27% балканской, 3% североафриканской.
На этом рынке доминируют 5 крупных игроков: 23andMe, Ancestry, FamilyTreeDNA, LivingDNA и MyHeritage. У каждого — своя база данных: Ancestry располагает обширной американской выборкой, MyHeritage и LivingDNA специализируются на европейских образцах. Африка и Азия пока остаются белыми пятнами, где статистика вынуждена опираться лишь на предположения.
Как устроена магия — и где ее пределы?
Наш геном содержит около 3 миллиардов «букв» ДНК — уникальный код, доставшийся нам от предков. Однако более 99,9% этого кода у всех людей идентичны. Вся информация о происхождении скрыта в крошечных вариациях — так называемых SNP (Single Nucleotide Polymorphisms).
Профессор эпигенетики Фидес Зенк, эксперт Немецкого общества генетики, поясняет: «Коммерческие тесты не секвенируют полный геном, а анализируют лишь сотни тысяч SNP — обычно от 600 до 800 тысяч. Это своеобразный генетический «каркас», на основе которого строится интерпретация».
Но важно понимать: эти тесты работают на вероятностях, сравнивая ваш генетический профиль с эталонными базами данных, собранными у тысяч добровольцев из разных регионов мира.
Почему базы данных решают все
Точность генетического тестирования напрямую зависит от масштабов и разнообразия референсных баз данных. Крупнейшие игроки рынка — 23andMe, Ancestry, FamilyTreeDNA, LivingDNA и MyHeritage — располагают обширными генетическими коллекциями, впрочем их географическое покрытие существенно различается.
Ancestry делает основной акцент на американской популяции, тогда как MyHeritage и LivingDNA специализируются на европейских образцах. Для жителей Африки и Азии доступно значительно меньше референсных данных, что неизбежно снижает точность результатов для этих регионов.
«При недостаточной репрезентативности базы алг...