Вопросы ДНК-генеалогии

Модератор: Analogopotom

Вопросы ДНК-генеалогии

Сообщение SergueiL » 28 июл 2011, 16:32

На этом форуме уже возникал топик, связанный с ДНК-генеалогией. Интересы к данной теме в рунете очень часто вдохновляются деятельностью Анатолия Алексеевича Клесова.
Но, как это ни странно, армия заинтересовавшихся нередко ополчается на самого Анатолия Алексеевича, выдавая, например, такое произведение или даже такое.
В свою очередь меня заинтересовала возможность более-менее популярно изложить некоторые ключевые моменты ДНК-генеалогии, которых имхо читателю будет достаточно, если не для составления собственного мнения, то хотя бы для появления пары вопросов, чтобы озадачить ими специалиста при случае.

Итак, общие идеи. По мужской линии, от отца к сыновьям передается в практически неизменном виде Y-хромосома, которая одним фактом своего наличия определяет пол человека, а вот генов, определяющих все остальное, в ней как раз очень мало. Соответственно у женщин ее нет вообще, поэтому мы получаем наследование Y-хромосомы именно по мужской линии. При дублировании хромосомы иногда происходит сбой, поэтому Y-хромосома сына может незначительно отличаться от хромосомы отца, и эти приобретенные отличия (мутации) сын в свою очередь передаст своим сыновьям, добавив и от себя лично что-то «сбойное».
Эти мутации обычно никак не влияют на жизнь человека, но могут рассматриваться в качестве меток, позволяющих восстанавливать структуру генеалогических деревьев.
Наиболее удобны для этого два типа мутаций – SNP(«снипы») и STR.
Первые, SNP – необратимые (а если появляется подозрение на обратимость, то это целое расследование), это качественные мутации, которые удобны для глобальной сортировки по гаплогруппам (и дочерним подгруппам – субкладам) генных паспортов людей – гаплотипов (в контексте ДНК-генеалогии этим термином обозначают набор STR-мутаций, и именно в этом смысле это слово будет использоваться дальше).
STR-мутации – количественные, они связаны с существованием повторяющихся фрагментов в хромосоме, число таких повторов и есть изменяющийся при мутации параметр. Каждое такое место в хромосоме называется маркер или локус, а число повторов в нем – аллель. Эти мутации, в отличие от SNP, обратимы: аллель может и увеличиваться, и уменьшаться. Поэтому, чтобы полноценно использовать эти мутации при построении деревьев гаплотипов, рассматривают аллели сразу в нескольких маркерах, чем больше маркеров в гаплотипе, тем надежней результаты. В этом случае до времени возможной обратной мутации, в других маркерах также могут случиться мутации, по наличию которых можно будет установить, какой из двух гаплотипов с одинаковым аллелем появился раньше в дереве гаплотипов.
Исследования показывают, что скорость накопления STR-мутаций более-менее постоянна, поэтому можно оценить время, за которое в дереве гаплотипов группы людей (наших современников), могло накопиться наблюдаемое число мутаций. В частности, каждая SNP-гаплогруппа происходит от одного человека, и анализируя накопившиеся у его потомков STR-мутации, можно попробовать оценить, когда этот человек жил. Но оценивать можно по-разному и с разными результатами, почему так получается и что с этим делать, я и постараюсь пояснить.
SergueiL
Логограф
Логограф
 
Сообщения: 20
Зарегистрирован: 08 мар 2011, 20:51

Re: Вопросы ДНК-генеалогии

Сообщение SergueiL » 28 июл 2011, 16:34

Рассмотрим воображаемое поселение людей и воспользуемся услугами математики.
Для удобства счета примем, что во всех семьях все сыновья рождаются практически сразу и одновременно раз в T лет (=20 или 25). Если в исходный момент времени все сыновья имеют одинаковый гаплотип, а вероятность мутации в гаплотипе составляет, к примеру, w=10%, то через T лет среди их сыновей будет 90% с исходным гаплотипом и 10% мутантов, т.е. 0.9*N1 и 0.1*N1, где N1 – общее число сыновей на первом этапе. Через следующие T лет исходный гаплотип останется у 0.9*(старые 0.9)=0.81, т.е. у 81 % сыновей второго поколения 0.81*N2, а количество сыновей с 1 мутацией будет складываться из только что мутировавших 0.1*( старые 0.9) и тех, кто унаследовал мутацию готовой 0.9*( старые 0.1), в итоге 0.09+0.09=0.18 или 18 %, 0.18*N2 , наконец, доля дважды мутантов – 0.1*( старые 0.1)=0.01 или 1 %, 0.01*N2 .
Причем, если изменение численности однородно по всем гаплотипам (т.е. среднее число сыновей в семье одинаково по всем семьям поселения:), то прирост или убыль N2 относительно N1 на полученные доли не повлияют (в каждом слагаемом появится один и тот же коэффициент прироста), в частности это справедливо и при постоянной численности N2=N1=N.
Полученная сумма в буквенных выражениях выглядит как a^2+2*a*b+b^2, где a=0.9 – доля сохраняющих гаплотип, b=0.1 – доля мутантов, при этом
a^2+2*a*b+b^2=(a+b)*(a+b)=(a+b)^2=1^2=1
Чтобы получить теперь выражение для произвольного n*T временнОго интервала достаточно заменить 2 на n в (a+b)^2 : (a+b)^n .
Слагаемые, возникающие после перемножения всех n скобок, будут давать доли мутантов, по аналогии с

исходн / с 1 мутацией / с 2 мутациями
a / b / - после первого шага
a^2 / 2*a*b / b^2 - после второго шага

Справка
Выражение (a+b)^n известно как «бином Ньютона», коэффициенты C(k,n) перед [a^k]*[b^(n-k)], возникающие после перемножения n скобок, называются биноминальными и рассчитываются по формуле
C(k,n)=[(n-k+1)*(n-k+2)*…*(n-1)*n]/[1*2* *k]
В нашем случае C(k,n)*[a^(n-k)]*[b^k] равно доле людей с k мутациями после n шагов,
k меняется от 0 до n, k=0 соответствует исходному гаплотипу.


При выбранной 10% вероятности мутации представляет интерес вопрос: если за T лет гаплотип мутирует у 1/10 части сыновей, останется ли исходный гаплотип через 10*Т лет?
С(0,10)*(a^10)=1*(0.9^10)=0.35=35%; - доля исходного гаплотипа
C(1,10)* (a^9)*(b^1)=10*(0.9^9) *(0.1^1)=0.39=39% - доля гаплотипов с 1 мутацией
C(2,10)* (a^8)*(b^2)=(9*10/2)*(0.9^8) *(0.1^2)=0.19=19% - доля гаплотипов с 2 мутациями
C(3,10)* (a^7)*(b^3)=(8*9*10/(2*3))*(0.9^7) *(0.1^3)=0.06=6% - доля гаплотипов с 3 мутациями

Видно, что при таком временнОм интервале(10 шагов) доля мутантов с 1 мутацией только что превысила долю исходного гаплотипа, на 9-ом шаге эти доли в точности равны. Аналогично, доля с 2 мутациями превысит долю с 1-ой при переходе от 19-го к 20-му шагу и так далее.
Также отсюда следует, что по числу мутаций в гаплотипе одного человека из группы делать оценки возраста группы очень рискованно: одновременно кто-то из группы сохранит исходный гаплотип, а другой человек из той же группы может оказаться рекордсменом по числу мутаций. Чтобы минимизировать риск расчета, нужно максимальное число людей в обсчитываемой группе, и для примеров выбирать не любой, а наиболее распространенный в группе гаплотип.

Вычислим, сколько всего мутаций накопилось в этой популяции за n*T лет?

Справка
Для подсчета всех мутаций нужно сложить k*(доля k-мутантов)*N для всех k от 1 до n (k=0 не содержит мутаций), где N – общее число сыновей после n шагов.
Но можно поступить проще. В этой сумме не важно, как менялось число N на предыдущих шагах (но изменения должны быть однородны по всей популяции), а решение при постоянном N можно получить сразу: на каждом шаге прибавляется по b*N мутаций, значит после n шагов накопится n*b*N мутаций.
Например, при n=10
Nмут=n*b*N=10*0.1*N=N, то есть равно общему числу сыновей после 10 шагов.


Другими словами, общее число мутаций будет таким, как если бы в каждой из N линий наследования случалось по одной мутации в каждые 10*T лет (для b=10%), но как было показано, это только кажется – распределение мутаций по линиям неодинаково.
SergueiL
Логограф
Логограф
 
Сообщения: 20
Зарегистрирован: 08 мар 2011, 20:51

Re: Вопросы ДНК-генеалогии

Сообщение SergueiL » 28 июл 2011, 16:35

Теперь рассмотрим условие, с которого начиналась модель поселения, что рождения сыновей происходят раз в T лет, то есть дискретно, шагами. Мы уже достаточно много рассчитали в рамках этой модели, но жизнь непрерывна, можно ли было пренебречь различием?
Найдем в рамках непрерывной модели долю сохраняющихся гаплотипов и сравним с результатом в дискретной. Этот результат, кстати, нам пригодится в дальнейшем для понимания идей Анатолия Алексеевича.

В первой модели фактически использовалась формула
dN/N= -b , где dN – означала убыль (поэтому знак минус) из-за мутаций в доле контекстного гаплотипа:
на первом шаге N означало общее число сыновей,
на втором использовалось и для числа 0.9*N1(из исходного в группу с 1 мутацией), и для 0.1*N1(из группы с 1 мутацией в группу с 2 мутациями).
Сейчас же нас интересует только убыль исходного гаплотипа, поэтому в этой формуле на каждом шаге N – уменьшающееся число исходного гаплотипа, и, чтобы не отвлекаться на прирост, считаем в задаче общее число сыновей неизменным во времени.

Для "непрерывности" модели увеличим размеры поселения до крупного города или страны, вместо шага в T лет и вероятности мутации, будем говорить о небольшом интервале времени dT=T2-T1 и скорости накопления мутаций. Получим:
dN/N= -b*dT/T, где dN – означает убыль исходного гаплотипа уже не за дискретный шаг в десятки лет (T в знаменателе), а за небольшой интервал времени dT, который, например, в масштабах страны может составлять пару минут (естественно, T в знаменателе при этом должен быть пересчитан в минуты, это будет очень большое число. Если b – была скорость появления мутации за шаг, то b/T – станет скоростью за минуту. N при этом – непрерывная убывающая функция времени N(t)
Чтобы узнать, например, изменение за день (между конечным временем Tкон и начальным Tнач):
DT=Tкон-Tнач (т.е. за 24*60 мин),
нужно суммировать изменения за все эти минутные промежутки, математически это означает суммирование уравнений для всех интервалов за день. В правой части уравнения скорость b и шаг T – не меняются, их при суммировании можно вынести за скобки, а сумма dT даст DT=Tкон-Tнач,
в итоге справа получаем
(-b/T)*DT
Если бы сумма левых частей уравнений также получилась как разность вида DN=Nкон-Nнач c определенным коэффициентом, то, зная численность в начале Nнач и сколько прошло времени DT=Tкон-Tнач, можно было бы определить Nкон.
Но в левой части уравнения N в знаменателе со временем меняется, и, если мы захотели бы заменить ее некоторой «средней величиной», то это просто лишило бы нас точного решения:

Справка
Подобное суммирование небольших изменений называется интегрированием, при постоянных коэффициентах оно просто и аналогично суммированию правой части, при переменных коэффициентах – как в левой части- требует специальных знаний.
В данном случае искомая разность равна ln(Nкон)-ln(Nнач)=(-b/T)*(Tкон-Tнач), где ln() – логарифмическая функция.

Справка.
Если человеку предложат сравнить два написанных числа, которые настолько велики, что даже их правильные названия неизвестны, то в решении он интуитивно использует логарифмы: больше то число, в котором больше цифр.
То есть речь идет о приближенном представлении числа в виде степеней десяток (так как используется десятичная система исчисления) , тогда соотношение чисел(больше-меньше) можно определять по соотношению показателей степени – количеству цифр в числе, которое намного меньше самого числа (в степени b^k число k – показатель степени, а число b – основание степени), часто так удобней и быстрее.
При этом важно, чтобы сравнивались степени с одним основанием: 2^2=4 и 2^3=8(из 2<3 следует 4<8), но не 3^2=9 и 2^3=8 (из 2<3 не следует 9<8). Чтобы сложить две дроби их нужно привести к общему знаменателю, аналогично и здесь: числа для сравнения нужно привести к общему основанию. Поэтому при вычислении логарифма числа N всегда указывается, по какому основанию “a” он вычисляется – log(a,N).
Итак, чтобы из основания “a” получить N, число a нужно возвести в степень(=показатель степени), равную log(a,N) :
a^log(a,N)=N.
Кстати, очень часто логарифмы не являются целыми числами, так как не только в квадрат, куб и т.д. возводятся числа, пусть вас это не смущает, любой инженерный калькулятор с кнопкой x^y выдаст ответ для любого y.
Для часто используемого основания a=10 (т.к. используется десятичная система) используется обозначение lg(N)=log(10,N) и название “десятичный” логарифм числа. Например, десятичный логарифм числа тысяча равен lg(1000)=3, т.к. 1000=10^3.
Сумма или разность логарифмов двух чисел N1 и N2 равна логарифму от N1*N2 или (для разности) от N1/N2:
log(a,N1)+log(a,N2)=log(a,N1*N2),
log(a,N1)-log(a,N2)=log(a,N1/N2).
То есть операции умножения или деления можно, как и в задаче про большие числа, проводить в «логарифмическом смысле», на уровне показателей степеней:
1000 (в логарифм. смысле = 3) делим на 10 (в логарифм. смысле = 1),
тогда в логарифм. смысле ответ =3 - 1=2, то есть 10^2 =100, как и должно быть.
Помимо 10, собственного обозначения удостоено еще одно основание – число e , примерно равное 2.71, и именно логарифм по этому основанию был ответом при интегрировании: log(e,N)= ln(N) – “натуральный” логарифм числа N.


Теперь можно получить расчетную формулу для изменения доли исходного гаплотипа:
ln(Nкон)-ln(Nнач)=(-b/T)*(Tкон-Tнач)
преобразуется в
Nкон/Nнач=e^[(-b/T)*(Tкон-Tнач)].
При неизменном общем число сыновей Nобщ=Nнач, поэтому
e^[(-b/T)*(Tкон-Tнач)] – доля исходного гаплотипа ко времени Tкон.
Если же Nобщ менялось бы (но однородно), то Nкон увеличилось бы ко времени Tкон в какое-то число q раз, где q – коэффициент прироста населения, но и Nобщ к этому времени также увеличилось бы в q раз по сравнению с Nнач, поэтому новая доля Nкон/Nобщ имела бы то же значение e^[(-b/T)*(Tкон-Tнач)].

Сравниваем результаты. Например, для старого временнОго шага Tкон-Tнач= T, поэтому
Nкон/Nнач=e^(-b)=2.71^(-0.1)=0.905=90.5%,
для 10 шагов Tкон-Tнач=10*T
Nкон/Nнач=e^(-10*b)=2.71^(-1)=0.37=37%
Напомню для сравнения, в старой модели было соответственно 90% и 35%, для понимания и оценок точность достаточная.
Последний раз редактировалось SergueiL 29 июл 2011, 05:29, всего редактировалось 1 раз.
SergueiL
Логограф
Логограф
 
Сообщения: 20
Зарегистрирован: 08 мар 2011, 20:51

Re: Вопросы ДНК-генеалогии

Сообщение SergueiL » 28 июл 2011, 16:38

Пришло время определиться с реальной скоростью накопления мутаций b. Очевидно, если мутации в каждом маркере происходят хотя бы примерно с равной скоростью, то чем больше маркеров учитываются в гаплотипе, тем больше вероятность попасть в мутанты. Есть стандартные наборы маркеров для исследования: 6,12,25, 37,67 маркерные гаплотипы, самый максимальный из доступных – 111 маркерный гаплотип.

Из работ Анатолия Алексеевича:
СРЕДНЯЯ СКОРОСТЬ МУТАЦИИ НА ГАПЛОТИП, для первых 6-ти маркеров в «научном формате», DYS19, 388, 390, 391, 393, 393 – 0.0088 мутаций на гаплотип на поколение, для первых 12-ти маркеров (первая панель маркеров в формате FTDNA) – 0.022 мутации на гаплотип на поколение, для первых 25-ти маркеров – 0.046 мутаций на гаплотип на поколение, для первых 37-ти маркеров – 0.09 мутаций на гаплотип на поколение, для 67-ми маркеров – 0.145 мутаций на гаплотип на поколение. Отсюда сразу можно заключить, что если два 67-маркерных гаплотипа отличаются, например, на 6 мутаций, то они разошлись от общего предка, который жил 6/2/0.145 = 21 поколение назад, или 525 лет назад. Однако для таких расчётов надо знать, что оба гаплотипа относятся к одной гаплогруппе, и понимать, что для двух гаплотипов и столь немногих мутаций подобные расчёты могут быть только оценочными.


Здесь необходимо сделать замечание, касающееся размерности «на поколение» у скорости: при определении этих скоростей рассматривается большое количество пар отец-сын, поэтому, фактически, определяется «скорость на акт рождения», т.е. вероятность b. Размерность же «на поколение» предполагает использование значения b для подсчета мутаций по формуле Nмут=n*b*N, которая требует постоянства или однородного изменения N.

«Средняя» же скорость – означает, прежде всего, средняя по группе, т.е. формула дает верную оценку времени только для типичных представителей группы, которых в группе больше всего (например, гаплотипы с 1 мутацией при b=10% через 10 шагов), именно поэтому не по каждым двум гаплотипам из группы можно делать расчеты.
В общем, время появления первых мутаций, при b=10% в группе из более чем 10 гаплотипов – 1 шаг, но «время гаплотипов с 1 мутацией» наступает только через 10 шагов.

Если же изменение общего числа сыновей происходит неоднородно, то роль первых мутаций может оказаться определяющей, и тогда «скорость на поколение» вообще потеряет смысл. Например, у султана в гареме сын-мутант может появиться через шаг. В случае, если именно мутант станет следующим султаном со своим гаремом, а его братья будут иметь существенно меньшее число сыновей, тогда никаких поколений ждать не придется – мутация с максимальной численностью в группе появится за шаг.
SergueiL
Логограф
Логограф
 
Сообщения: 20
Зарегистрирован: 08 мар 2011, 20:51

Re: Вопросы ДНК-генеалогии

Сообщение SergueiL » 28 июл 2011, 16:40

Теперь уже можно переходить к практике и проблемам соответствия жизни и теоретических моделей.
В дополнение к основной формуле для расчета времени накопления мутаций Nмут=n*b*N или n=Nмут/(b*N), где b – средняя скорость на гаплотип «на поколение» и N – число гаплотипов, Анатолий Алексеевич в числе «Десяти Заповедей ДНК-генеалогии» формулирует свое правило:
Положение десятое разработано мной, и это было несложно, поскольку моя специальность по образованию и по опыту работы – химическая кинетика. И изменение мутаций в гаплотипах во времени – это мой вопрос, в отличие от тематики
многих специалистов в области ДНК-генеалогии. Суть этого положения сводится к тому, что только те мутации в гаплотипах имеет смысл рассчитывать, экстраполируя к времени общего предка – которые подчиняются определенным количественным закономерностям. Другими словами, ДНК-генеалогия теперь может оперировать тремя экспериментальными факторами – (1) наличием снипов, относящих человека к определенному роду, (2) наличием мутаций, позволяющих оценивать время, прошедшее от общего предка совокупности гаплотипов, и – при больших выборках – от начала самого рода, от самого далекого из предков ныне живущих потомков данного рода, и (3) закономерности переходов гаплотипов в их мутированные формы, без численного учета самих мутаций. Это позволяет оценить, насколько достоверны расчеты предка по мутациям, и дает еще один, независимый способ расчетов.

Только если число поколений до общего предка совпадет по пп (2) и (3), естественно, в пределах разумной ошибки, то эту временнУю оценку можно считать числом поколений до общего предка. Иначе говоря, это совпадение показывает, что общий предок был один (в рамках ДНК-генеалогии; например, это могли быть и родные братья, и даже группа близких родственников с одинаковыми или близкими гаплотипами). Если же число поколений, полученное по числу мутаций и по доле сохранившихся немутированными гаплотипов, заметно различается (порой в 2-3 раза), то данная выборка гаплотипов не может численно обрабатываться в предположении, что предок был один. Такую выборку надо делить по разным общим предкам, и для этого могут использоваться деревья гаплотипов или медианные сети. Тогда разные ветви дерева часто (но не всегда) соответствуют разным общим предкам.

Приведу пример подобного подхода. Рассмотрим два набора по 10 гаплотипов в каждом.

14-16-24-10-11-12............ 14-16-24-10-11-12
14-16-24-10-11-12............ 14-16-24-10-11-12
14-16-24-10-11-12............ 14-16-24-10-11-12
14-16-24-10-11-12............ 14-16-24-10-11-12
14-16-24-10-11-12............ 14-16-24-10-11-12
14-16-24-10-11-12............ 14-16-24-10-11-12
14-17-24-10-11-12............ 14-16-25-9-11-13
15-16-24-10-11-12............ 14-16-25-10-12-13
14-15-24-10-11-12............ 14-17-23-10-10-13
15-17-24-10-11-12............ 16-16-24-10-11-12

Первые шесть гаплотипов в каждом наборе – базовые (предковые) гаплотипы. Остальные четыре – мутированные, в первом наборе 5 мутаций, во втором - 12. Если обращать внимание только на мутации, то количество поколений до общего предка будет равно 5/10/0.0088 = 57 поколений, и 12/10/0.0088 = 136 поколений, соответственно (с поправками на возвратные мутации разница будет еще больше, а именно 61 и 158 поколений, соответственно). Однако в обоих случаях число поколений, рассчитанное по доле базовых гаплотипов, равно ln(10/6)/0.0088 = 58 (с поправкой – 62 поколения; принципы расчетов описаны ниже). Как видно, только первый набор дал примерно такое же число поколений (61 и 62), и, таким образом, представляет «чистую выборку», имеющую одного общего предка. Второй набор искажен, и соответствует более чем одному общему предку. Поэтому он не может быть использован для прямых расчетов временной дистанции до общего предка.


Предлагаемый Анатолием Алексеевичем критерий - «закономерность переходов гаплотипов в их мутированные формы, без численного учета самих мутаций», проиллюстрированная численно выражением
ln(10/6)/0.0088 = 58,
соответствует выведенной ранее «непрерывной» формуле для доли сохранившихся гаплотипов :
ln(Nкон)-ln(Nнач)=(-b/T)*(Tкон-Tнач), где время считается в поколениях, т.е. Т=1,
b/T=0.0088 мутаций/поколение, а минус перенесли в левую часть
– (ln(Nкон)-ln(Nнач))= ln(Nнач) - ln(Nкон)= ln(Nнач/Nкон).
Но как было показано ранее, если модель накопления мутаций работает, то доля сохранившихся гаплотипов считается с хорошей точностью и по биномной формуле, полученной в начале.
То есть данный критерий - не новая независимая формула, а частный случай (первое слагаемое из) биномной, из которой, кстати, и формула для накопленных мутаций следует.
При таких условиях, если модель работает, то факторы (2) и (3)(расчет времени по суммарному числу мутаций и доле сохранившихся гаплотипов) – всегда совпадают как близнецы, но если они совпали, из этого еще не следует, что они верны и модель работает – нужно проверять остальные доли.

Очевидно, последовательней было бы вместо вычисления суммы сразу сравнивать по очереди все доли в биномной формуле - и сохранившихся гаплотипов, и мутантов. В качестве иллюстрации приведу фрагмент работы «Поиски пропавших колен израилевых с помощью ДНК-генеалогии»

Рассматриваются данные по одной из шести групп, в качестве общего предкового гаплотипа («гаплотип двенадцати колен») рассматривается
14-16-23-10-11-12

В группе ашкенази-коэнов из 76 человек 36 (47% от их общего числа) показали точное соответствие гаплотипу двенадцати колен:

14-16-23-10-11-12 (36 чел.)

Один шаг в сторону оказался у 16 человек (21%):

15-16-23-10-11-12 (10 чел.)
14-16-24-10-11-12 (2 чел.)
14-15-23-10-11-12 (2 чел.)
14-16-22-10-11-12 (1 чел.)
14-17-23-10-11-12 (1 чел.)

Два шага в сторону – 5 человек

15-15-23-10-11-12 (5 чел.)

Три шага в сторону – 9 человек

15-15-24-10-11-12 (8 чел.)
15-15-22-10-11-12 (1 чел.)

Четыре шага в сторону – 3 человека.

15-15-24-10-11-13 (2 чел.)
15-15-23-10-13-12 (1 чел.)

Пять шагов в сторону не показал никто из выборки.
SergueiL
Логограф
Логограф
 
Сообщения: 20
Зарегистрирован: 08 мар 2011, 20:51

Re: Вопросы ДНК-генеалогии

Сообщение SergueiL » 28 июл 2011, 16:41

После приведения данных по всем 6 группам мутации суммируются, т.е. представленные по группе «ашкенази-коэны» результаты признаны рабочими, в итоге:

В сумме 270 мутаций. Одна мутация в гаплотипе происходит в среднем за 2,666 лет. Время полужизни каждого гаплотипа, в том числе и исходного, ГДК - 1,850 лет. За 3600 лет останется четверть исходного гаплотипа, По нашим данным его осталось 46%; это значит, что на самом деле мутации происходят не неупорядоченно, и мутируют в большей степени уже мутированные гаплотипы, оставляя исходный гаплотип в большей сохранности. Или законы мутации подчиняются не слепой теории вероятности, но химическим принципам работы ферментов и регуляторных систем, считывающих короткие тандемные последовательности Y хромосомы ДНК. На это же указывает и тот факт, что гаплотипов с тремя, четырьмя и пятью мутациями больше, чем предсказывает теория вероятности.

Количество гаплотипов среди 200 чел., факт - Количество гаплотипов среди 200 чел., теория

0 мутаций – 92 (46%) -48 (24%)

1 - 32 (16%) - 68 (34%)

2 - 17 (8.5%) - 50 (25%)

3 - 37 (18.5%) - 24 (12%)

4 - 17 (8.5%) - 8 (4%)

5 - 5 (2.5%) - 2 (1%)



Однако, есть гораздо более простая причина расхождения теории и практики – нарушение условия однородного увеличения численности. Например, из данных по группе «ашкенази-коэны» видно, что гаплотипы с 2, 3 и 4 мутациями являются потомками самого многочисленного потомка с 1 мутацией
15-16-23-10-11-12
И, следуя идеологии самого Анатолия Алексеевича, эту ветвь необходимо обсчитывать отдельно. В исходной же ветке число людей в подобных всплесках должно заменяться на среднее значение по «рядовым» мутантам, обычно 1 или 2, т.е. считать именно гаплотипы, а не людей с идентичным мутантным гаплотипом, которые, очевидно, являются «близкими» родственники. В этом смысле мутанты более показательны: исходный гаплотип в начале имеется у всех людей, поэтому в нем «всплески» на общем фоне сложно различить.

С другой стороны, в отличие от исходной ветки, которая хоть как-то «кустится», имея 5 дочерних гаплотипов – мутантов, выделенная ветка «горизонтально» не расходится – только вертикально: очевидно, возможные боковые ответвления не смогли сохраниться. Из общих соображений, если стоит вопрос о выживании популяции, то например, среди 100 исходных гаплотипов у новоиспеченного мутанта шансов на сохранение – 1 к 100. Но если его семье повезет справиться с демографическими бедами (войны, голод, эпидемии) лучше других семей популяции, то шансы могут кардинально измениться.


Имхо, совокупность этих противоположно направленных факторов и определяет главным образом наблюдаемые на практике особенности деревьев гаплотипов:

Если развитие популяции в течение длительного времени стабильное, то наблюдается со всех сторон ровное дерево (идеальная ситуация).
Если при этом возможна экспансия небольшими группами, от идеального дерева будут ответвляться новые деревья.
Если развитие популяции стабилизировалось относительно недавно, то наблюдается множество относительно коротких веток, «куст».
Если сил у популяции хватало только на выживание, то наблюдается небольшое количество слабоветвящихся длинных веток.


Примерно так.
Как выглядят современные базы гаплотипов, включая 111-маркерные, можно посмотреть, перейдя по ссылкам.
На национальных проектах сайта familytreedna.com далее нужно пройти по пунктам меню
Y-DNA Results/Classic
SergueiL
Логограф
Логограф
 
Сообщения: 20
Зарегистрирован: 08 мар 2011, 20:51

Re: Вопросы ДНК-генеалогии

Сообщение Харитон Растаропша » 17 июл 2013, 17:36

Проведённые генетические исследования показывают, что на Северской Земле 80 % мужского населения имеет гаплогруппу R1a1, 10 % - угро-финскую гаплогруппу N1c1, а оставшиеся –североевропейскую (балтскую) гаплогруппу I1, южнославянскую (балканскую) гаплогруппу I2, аланско-черкесскую гаплогруппу G2 и гаплогруппу кельтов, половцев и русов R1b. Гаплогруппу R1a1 можно назвать северской просто потому, что концентрация людей с этой гаплогруппой наибольшая именно на Северской Земле. Угро-финское включение можно объяснить как ассимиляцией малочисленных меря, мурома и мещёра, так и смешением с теперешним эрзянским и татарским населением к востоку от Северской Земли. Существуют и свидетельства былого угро-финского присутствия – название реки Болва в Калужской и Брянской областях (не отсюда ли „болван”?) и название села Муром в Белгородской области. Название речки Лопань, протекающей через центр Харькова, говорит о былом балтском присутствии. Южнославянская гаплогруппа занесена переселенцами из-за Днепра и сербами. Не удивительно, что не исчезли потомки половцев, но сохранились и потомки судостроителей-русов – в Обояни много рыжих людей, а в Иловке нередко встретится фамилия Рыжих.
За много тысячелетий население Северской Земли как расселялось из-за перенаселённости, так и сокращалось, но никогда не исчезало совсем. Как доказательство расселения – большая доля мужчин с северской гаплогруппой среди этнических киргизов, таджиков, ойротов, хакасов, афганцев, пуштунов, северных индусов и даже уйгуров. Причём гаплогруппа этих народов, будучи изначально северской, претерпела ряд последовательных мутаций, но сохранила те мутации, которые случились в пору нахождения предков упомянутых народов среди европейских северцев. Поэтому задача решена однозначно – расселение северцев шло на восток и на юго-восток, и никогда – назад. Иначе говоря – назад никто не возвращался! Даже степняки – потомки северских отщепенцев, не пожелавших жить в землянках и ковыряться в земле! Но им пришлось переключиться с коров на овец, да ещё и одомашнить коня! Вот откуда у скифов северская гаплогруппа! Если смеются, что, якобы, сказочные укры приручили коня, то иначе и быть не могло, если под этими сказочными украми не понимать северских отщепенцев. Истинные же украинцы – подоляне – это южные славяне, и к северцам, так же, как и к скифам, они отношения не имеют!
Северцы жили только в узкой полосе лесостепей, где есть и лес, и поле, и выпадают дожди. На остальных пространствах Северной Евразии жили предки кетов и селькупов (гаплогруппа Q). Их постепенно вытесняли в горы и в тайгу угро-финны с гаплогруппой N1c1 – предки народов меря, мари, мещёра, мурома, эрьзя, шокша, мокша, сету, ижоры, вепсов, корела, коми, ханты, манси, суоми, ливов и эстонцев. Предки монголов-халха и джунгаров (гаплогруппа C3c) спустились с Тибета только в прошлом тысячелетии – и вовремя: немногочисленные их представители послужили страшилкой для народов, подвершихся так называемому «монголо-татарскому нашествию». Почему «так называемому»? Да потому, что монголы не оставили никаких следов монгольской гаплогруппы в якобы покорённых ими народах! Зато джунгары – один из монгольских народов – не только известен под названием калмыков, они дали миру смешанные с северцами народы киргизов и ойротов, а также, в смеси с угро-финнами – всю алтайскую семью народов, от турков до ненцев, саамов и якутов.
С другой стороны, появление северской гаплогруппы поляков и лужичан датируется более поздним временем, чем у салавьян с Прикарпатья. Почему же прародину северцев не следует искать в Прикарпатье? А потому, что Прикарпатье издавна имело население с балканской гаплогруппой I2, и, будь северцы оттуда, они бы непременно сперва смешались с балканцами, а затем занесли бы балканскую гаплогруппу и на Алтай, и на Тянь-Шань, и на Памир, и в Кашмир! Но во всех этих местах балканской гаплогруппы нет! Значит, северцы тоже попали в Прикарпатье в итоге расселения, а потом и дальше пошли расселяться на Балканы, а их потомки живут в Прикарпатье по сей день и говорят на малорусском языке – диалекте северского, а на Балканах – по сербски и по-македонски. Но вот 400 лет назад пошла волна переселения с Прикарпатья, которая занесла на Северскую Землю и балканскую гаплогруппу, и малорусский язык, который назад с северским смешиваться никак не хочет! А македонцы ещё во времена Киевской Руси попали в Залесье и постепенно создали из своего языка при небольшом северском влиянии и тюркской примеси «великий и могучий русский язык»! Этот язык стал более понятным северцам, чем македонский, и северцы оказались в языковом отношении накрепко сплетёнными с южными славянами!
А в Польшу и дальше, до берегов Ла-Манша, пошла следующая долгая волна расселения с территории нынешней Беларуси. Переселения же, как переезда в другую местность с семьёй и всем скарбом, скорее всего, не было вовсе, и потому, что не существовали колесницы! А на вьючных животных – много не увезёшь, и приходится перевозить скарб за несколько раз, но недалеко! А это уже не переселение, а расселение. А колесницы появились только с приходом железа – ведь надо же изготовить ось и обод колеса! Но более тысячелетия назад возникла перенаселённость на южных берегах Балтики, и новообразованные германские племена, не имея возможности мирно расселяться, силой оружия стали теснить северцев из-за Эльбы назад на восток, на земли нынешних Польши и Беларуси, и даже частью переселились на Британские острова!
В общем 46 % современных русских людей являются обладателями гаплогруппы R1a1, в населении Украины и Белоруссии – 50 % с северской гаплогруппой, в населении Польши – 56 %, а среди лужичан из восточной Германии – 63 %. Число немцев с этой гаплогруппой не превышает 10 % общей численности, зато половина имеет половецко-русо-кельтскую гаплогруппу R1b. Подобно тому, как северцы являются становым хребтом русских людей, русы являются становым хребтом немецкого народа!
Харитон Растаропша
Логограф
Логограф
 
Сообщения: 7
Зарегистрирован: 16 июл 2013, 10:19

Re: Вопросы ДНК-генеалогии

Сообщение Gosha » 03 авг 2013, 20:55

Каким образом мы можем определить отцовство, а не доминанту места. Понятно если в данной местности преобладающий генотип он закрепляется прочно. Норманистов, как раз интересует интервенция один раз в 870 году и до 1594 года сохранение преобладания перед окружением. Голубая кровь и белая кость.
Вероятности отрицать не могу, достоверности не вижу. М. Ломоносов
Аватара пользователя
Gosha
Фукидид
Фукидид
 
Сообщения: 2337
Зарегистрирован: 01 апр 2007, 10:16
Откуда: Moscow


Вернуться в Новые теории

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1

cron