前沿资讯

亲子关系鉴定中Y-STR突变的研究现状及应用

来源:《技术研究》  作者: 尚蕾  日期:2020-09-23

  Y染色体STR是亲子鉴定重要的遗传标记之一,被广泛应用于父系家族关系鉴定、混合斑男性个体检验等多方面。Y-STR标记因含有重复序列,极易产生突变,突变率通常在10-3~10-4数量级,导致在遗传过程中分型出现差异。

  正因如此,同一家系中的男性近亲可能有不同的Y-STR分型,而来自不同家系的男性个体也可能有相同的Y-STR分型,对男性家系排查造成影响。Y-STR的高突变率,在增强父系亲缘鉴定准确性的同时,也弱化了现场物证与目标家系的关联,给家系排查带来挑战。

  本文就国内外Y-STR突变在亲子鉴定领域的研究及应用进展进行综述,以期为解决上述难题提供思路。

  1、Y-STR突变的研究内容及方法

  由于Y染色体发生遗传重组的几率较小,Y-STR突变主要来自点突变和DNA复制中的复制滑脱。目前,针对Y-STR突变开展的主要研究内容包括:1)突变率;2)突变式样;3)影响因素。

  1.1 突变率的研究方法

  早期基于人群多样性估计Y-STR突变率的方法忽视了多步突变、回复突变的存在,在一定程度上低估了Y-STR的突变率。利用父子对或男性近亲样本分析Y-STR突变率的方法更简单直接而被大量使用。

  其中,父子对样本量从20对至1966对不等,近亲样本也来自多个家系,涉及几百甚至上千次减数分裂。

Y-STR研究

  Y-STR突变率的数据统计常用两种方法。

  一种是频率论方法(Frequentist approach)。计算公式为:Y-STR的突变率=突变事件发生数/减数分裂次数。突变率的95%置信区间(confi dence interval,CI)可以通过二项分布概率(binomial probability distribution)进行估算。

  一些研究还关注了特定Y-STR组合的平均突变率,如13个快速突变Y-STR、Yfi lerPlus、PowerplexY23等,其平均突变率的计算公式为:Y-STR组合的平均突变率=突变事件发生总数/(传代数目×Y-STR的数目)。

  另一种是贝叶斯方法(Bayesian approach)。借助二项分层贝叶斯模型(binomial hierarchical Bayesian model),预设先验分布,再根据实验观察到的各Y-STR突变情况,通过多次模拟,计算后验分布,从而实现对各基因座突变率及95%置信区间(credible interval)的估计。

  频率论方法较为简单直接,更为客观。该方法不参照过去的经验,仅通过大量的样本数据进行概率推断,其认为研究所估计的突变率是一个固定值,是当样本量趋近于无穷大时获得的极限值。但当数据量很少时,对统计结论的解释较弱。贝叶斯方法相对复杂。

  该方法对突变率的估计既利用样本数据,也利用先验知识。它认为研究所估计的突变率是一个随机变量,具有一定的分布。随着样本数据量的增加,可得到更接近真实的突变率分布,并作出统计推断。在数据量少时,该方法较为可靠。

  1.2 突变式样的研究方法

  Y-STR的突变式样(mutation pattern)是指在父子传代过程中观察到的等位基因突变特征(突变步数、突变方向等)及差异基因座特征(出现分型差异的基因座类型、数目等)的总称。国内外针对Y-STR的突变式样进行了大量研究,其研究材料不限于父子对样本,还包括兄弟、叔侄、祖孙、表亲等近亲样本对,甚至利用全家系样本来探讨其突变规律。

  通过直接统计计数可获得各Y-STR的等位基因突变特征,如突变步数(一步或多步突变)、突变方向(重复单元数的增减)等。这里,突变步数以增减的重复单元数来表示。例如,增减一个重复单元的突变称为一步突变。

  基于不同突变特征的数量,可计算获得相应的比重。一种方法是,将不同突变特征的数目相除,得到其比例。另一种方法是,将各突变特征的数目除以总突变数,获得各自的占比。比较各样本对的Y-STR基因座分型差异,可以获得更多突变信息。

  在父子对、兄弟对或者其他近亲样本对中,样本间隔的减数分裂次数由少至多,可分别获知在特定减数分裂次数下最多可有几个Y-STR基因座存在分型差异,以及最多可有多少步数的突变,为Y-STR在男性家系排查的应用提供基础数据。

  1.3 突变的影响因素及研究方法

  Y-STR的突变受到许多因素的影响,研究人员首先从Y-STR本身及样本供者特征等方面考虑可能的主要影响因素;其次,探讨上述因素与Y-STR突变率的关系,以进一步明确各因素对Y-STR突变的可能影响。在实际研究中,为了统计方便,有时将一些因素通过特定的方式加以量化。

  研究的主要影响因素一般为:

  1)重复单元数(repeat number)或者平均等位基因大小(average allele size),如DYS391的重复单元数为6~13,而DYS390的重复单元数则为18~27.

  2)重复序列的复杂程度(repeat complexity),通常划分为简单、复杂重复序列两大类。简单重复序列中,重复单元的序列完全相同,且中间无其他碱基间隔,如DYS460的核心重复序列为(TAGA)n.

  复杂重复序列中,重复单元的序列不完全相同,或者相同的重复单元序列中间存在至少1个碱基的间隔。如DYS449的核心重复序列为(TTCT)nN22(TTCT)3N12(TTCT)m.Kayser等还提出了将重复序列的复杂程度进行量化的方法,便于后期的统计分析。

  3)重复单元所含碱基的数量(the length in base pairs of the repeated motif),通常为3~6个不等。

  4)父子对中父亲的年龄。

  有两种方法研究上述影响因素(自变量)与Y-STR突变率(因变量)之间关系。

  一种是利用多元回归分析,采用单一的回归模型,将考虑到的多种因素综合在内,分析其对突变率的总体贡献,以及其中主要的影响因素。

  另一种是选取合适的统计手段,如线性回归(linear regression)等,分别分析各个因素与Y-STR突变率的关系,该研究方法较为简单直接。

  相比之下,第一种研究方法更为综合。如果个别因素对突变率无显着影响,将会从多元回归模型中剔除,那么,该因素与突变率的关系只能通过第二种方法研究。

Y-STR

  2、Y-STR突变的研究现状

  2.1 Y-STR的突变率

  突变率的研究由于受商品试剂盒(如Yfi ler、Yfi lerPlus、PowerplexY23等)检测基因座的限制,不少研究仅关注了试剂盒所包含的17、23或27个Y-STR基因座,并发现除少数几个基因座外,其突变率基本在10-3数量级。

  近年来,关于Y-STR突变率最全面的报道来自Ballantyne等的研究。该研究利用约2 000对父子对样本针对186个Y-STR基因座开展突变调查,发现91个Y-STR的突变率在10-3数量级,82个Y-STR的突变率在10-4数量级,另有13个突变率高于10-2的基因座,并首次将其命名为快速突变Y-STR(rapidly-mutating Y-STRs,RM Y-STRs)。

  随后的多项研究探讨了这13个快速突变Y-STR在巴基斯坦、塞尔维亚、意大利、中国山东汉族等不同人群中的突变率。各研究的样本量存在较大差异,这可能影响到Y-STR突变率的研究结果。

  而在样本量相当的情况下,Y-STR在不同人群中也表现出突变率的差异,例如DYS518基因座在韩国人群中的突变率为5.5×10-3,而在巴基斯坦人群中则为3.3×10-2;DYS449的突变率在韩国人群中为1.93×10-2,而在巴基斯坦人群中则为4.7×10-3.

  比较多项研究发现,DYF399S1、DYF403S1这两个基因座在多个人群中均具有较高的突变率,这可能与其存在多拷贝有关,DYF399S1在Y染色体上含有3个拷贝,而DYF403S1则拥有4个拷贝。

  此外,也有研究探讨了一些不常见Y-STR的突变率。利用湖北地区320对汉族父子样本,朱传红等研究了24个Y-STR基因座(包含5个不常见的Y-STR)的突变率。

  其中,除DYS388未见突变外,其他不常见Y-STR(DYS444、DYS447、DYS522、DYS527a/b)的突变率均在10-3数量级。

  Lang等研究了53个Y-STR基因座在100对父子样本中的突变情况,包括12个不常见的Y-STR(DYS388、DYS443、DYS446、DYS510、DYS520、DYS522、DYS552、DYS531、DYS587、DYS622、DYS630、Y_GATA_A10),仅DYS522的突变率达到10-2数量级。

  在Claerhout等开展的研究中,也有关于不常见Y-STR突变率的报道,包含7个单拷贝Y-STR(DYS388、DYS426、DYS442、DYS447、DYS454、DYS455、DYS607)和3个多拷贝Y-STR(DYS459、DYS724、YCAII),其突变率为2.8×10-4(DYS388)~1.52×10-2(DYS724)。

  2.2 Y-STR的突变式样

  研究显示,父子、兄弟或者其他男性近亲之间观察到的Y-STR突变,多数为一步突变,少数为两步突变或多步突变。这符合逐步突变模型(step-wise mutation model,SMM)。

  在重复序列的增减方面,并无统一的规律。一些研究中重复序列的增加(repeat gains)数量更多,而另一些研究中则是重复序列的减少(repeat losses)数量占优。

  在Y-STR突变式样的研究结果中,父子或者其他近亲样本对之间至多有几个基因座出现分型差异,或者至多产生多大的突变步数,可能更具有实际应用价值。

  探讨13个快速突变Y-STR,父子间最多出现了4个基因座突变。利用Yfi ler试剂盒(17个基因座)研究父子间的Y-STR突变情况,Goedbloed等发现来自波兰的1对父子样本在3个Y-STR上存在差异。

  利用广东汉族父子样本,Wang等发现,Yfi lerPlus所包含的27个Y-STR基因座中最多有3个同时突变,而其中Yfi ler所包含的17个基因座中,最多仅2个在父子传代过程中同时突变。

  此外,张广峰等利用遗传关系清晰的大家系,探讨了不同复合扩增体系中Y-STR的变异情况,发现该家系的两两个体间最大差异基因座数为3(Yfi ler体系)~6个(Yfi lerPlus结合快速突变Y-STR体系)不等。采用不同的复合扩增体系,样本间的最大突变步数也可能存在差异。

  对湖北汉族人群的研究发现,利用AGCU-24 Y-STR试剂盒(中德美联),父子间仅有1个基因座发生突变,而等位基因的突变步数最多可达3(最小单倍型,minimal haplotype)~4步(AGCU-24体系),且两步以上突变均出现在多拷贝基因座(DYS385a/b、DYS527a/b)。这提示在Y-STR比对时应设置不同的容差。

  当前研究对样本间突变基因座的数量极为关注,而对其中总突变步数关注极少,加强这方面深入研究,对今后Y-STR应用有重要指导意义。

  不少研究发现,个别基因座发生特殊突变,且分型在父子间传递。例如,DYS19在一些情况下会出现双峰,而DYS385、DYF387S1则可能出现三拷贝。特殊分型的父子传递或可成为判定父系遗传关系的有力依据。

  2.3 Y-STR突变的影响因素

  Ballantyne等利用近2 000个父子对和186个Y-STR研究了可能影响Y-STR突变率的因素,发现重复单元数不仅影响Y-STR的突变率,还会影响其突变方向,即重复单元数多的等位基因倾向于丢失重复单元,而重复单元数少的等位基因则倾向于获得重复单元。

  重复序列越复杂、父亲的年龄越大,则Y-STR的突变率越高。上述结论也得到了其他研究的证实。Y-STR突变率随重复单元所含碱基数的变化似乎呈现出钟形趋势,即四碱基重复单元的突变最频繁,而三碱基或五碱基重复单元的突变率下降,六碱基重复单元的Y-STR其突变率有进一步下降的趋势。

  从统计结果看,多拷贝的Y-STR基因座其突变率相对较高,因此,拷贝数也可能是Y-STR突变率的影响因素之一。考虑统计上的差异,Y-STR的突变还会受到研究样本量及样本来源人群的不同影响,如2.1中所述。

  探明各类因素对Y-STR突变率的可能影响,有助于从进化的角度深入理解STR遗传标记。目前,此类研究在亲子鉴定领域的应用尚未开展。考虑到常染色体STR突变率研究的困难,今后或可根据已有的Y-STR相关研究结论,预判常染色体STR突变率的高低,筛选快速突变常染色体STR标记加以应用。

研究现状

  3、Y-STR不同突变类型的应用

  根据突变率的不同,Y-STR可分为三种突变类型。一是快速突变Y-STR,其突变率超过1×10-2;二是慢速突变Y-STR(slowly mutating Y-STRs),其突变率在10-4数量级;三是常见的中速突变Y-STR,其突变率在10-3数量级。各类Y-STR基因座因其突变率的不同,可在不同方面发挥其价值。

  3.1 快速突变Y-STR

  快速突变Y-STR在亲子鉴定领域受到广泛关注,大量研究探讨了其区分效能。

  3.1.1快速突变Y-STR的复合扩增

  快速突变Y-STR在亲子鉴定领域的实际应用离不开复合扩增。Ballantyne等首先利用3个独立的扩增体系(RM1~RM3)进行了快速突变Y-STR的复合扩增,其中,每个独立的扩增体系都包含1~2个多拷贝基因座及2~3个单拷贝基因座,并用于快速突变Y-STR数据库的建立及其他研究。

  Alghafri等建立了包含全部13个快速突变Y-STR的复合扩增体系,经优化,开展了灵敏度、特异性和混合样本检验等方面的测试。针对这其中包含的4个多拷贝基因座,该研究组研究了其等位基因特征,为后期应用奠定了基础。

  Abuidrees等优化了该复合体系的反应条件,将扩增时间从2.5 h缩短至28 min.也有研究将13个快速突变Y-STR分成两个体系进行复合扩增。除此之外,陆续推出的商品试剂盒加入了一定数量的快速突变Y-STR,有研究单独将Yfi lerPlus试剂盒未涉及的7个快速突变Y-STR(DYF399S1,DYF403S1,DYF404S1,DYS526,DYS547,DYS612,DYS626)进行了复合扩增。

  另有研究将除DYS518以外的其他12个快速突变Y-STR进行复合扩增。与之相比,含有全部13个快速突变Y-STR的复合扩增体系仍具有更强的实用性。国内对快速突变Y-STR基因座的复合扩增研究相对滞后。

  利用五色荧光技术,黄代新等建立了一个快速突变Y-STR基因座的复合扩增体系,并申请了发明专利,但其中DYF403S1的扩增仅选用了单一引物。

  实际上,DYF403S1基因座有四个拷贝,其中两个拷贝的核心序列为(TTCT)nATC(TTCT)m,一个拷贝的核心序列为(TTCT)nTT(TTCT)3,另一个拷贝的核心序列为(TTCT)nN2(TTCT)m(TTCC)p(TTCT)q N2(TTCT)3.

  根据作者的研究,使用单一引物进行扩增,前三个拷贝虽然具有两种不同的核心序列,其扩增产物却在同一长度区间,等位基因分型标准物难以制备,各拷贝之间不易分辨。Lee等为了有效区分不同等位基因,将DYF403S1基因座重新设计引物。

  此外,Chen等建立了一个快速突变Y-STR复合扩增体系,并研究了其在山东汉族人群中的突变情况。

  3.1.2快速突变Y-STR的应用效能

  快速突变Y-STR的应用领域主要集中于男性家系排查,其应用效能体现在两方面:一方面是针对无关个体的区分能力,可视为对不同家系的分辨效能;另一方面则是对近亲个体的区分能力,如父子、兄弟、叔侄等,表现的是对同一家系内不同个体的分辨效能。

  2012年,研究人员初次对13个快速突变Y-STR的上述效能进行了评估,并将其与运用Yfi ler试剂盒检验的结果进行对比,发现快速突变Y-STR无论对无关个体(98.3%vs 90.4%)或者近亲个体(66%vs15%)均具有更高的分辨力。

  而后,Ballantyne等利用来自全球的人群样本,进一步比较了快速突变Y-STR扩增体系与Yfi ler试剂盒在分辨力方面的差异。

  研究表明,快速突变Y-STR基因座可区分实验样本中超过99%的无关男性个体,并可区分27%的父子样本和56.3%的兄弟样本,而Yfi ler试剂盒仅能区分4.5%的父子和10%的兄弟。其他比较研究也得到了一致的结论。

  Turrina等比较了快速突变Y-STR体系与PowerplexY23试剂盒对意大利近亲样本的区分能力,随着样本对减数分裂次数的增加,两个体系的区分能力均有所提升,但快速突变Y-STR的区分能力更强,针对相差2~4次减数分裂的样本对,其区分比例为52.8%~88.9%,而PowerplexY23试剂盒的区分比例仅为10.1%~29.6%.Rahka等利用巴基斯坦人群进行不同Y-STR扩增体系的比较研究,发现快速突变Y-STR体系对近亲样本的区分能力(32.88%)远高于Yfi lerPlus、PowerplexY23试剂盒的分辨效能(3.65%、6.85%)。

  国内,利用13个快速突变Y-STRs,针对湖北汉族人群和云南白族人群分别开展的遗传多态性研究中,单倍型多样性分别达到0.999 937和1,指出了快速突变Y-STR对无关个体极强的分辨能力。近年来,Y-STR数据库建设持续开展,随着Yfi lerPlus、PowerplexY23等试剂盒的使用,入库的基因座中包含不少快速突变Y-STR(如DYS570、DYS576、DYS627等)。

  一方面,快速突变Y-STR的加入使数据库中的分型信息更为全面,有助于凸显不同家系之间的分型差异,实现精细化区分。另一方面,高突变率的Y-STR可能导致家系内部的近亲个体分型差异明显,影响家系排查工作中的有效判定。在实际工作中,快速突变Y-STR与其他类型Y-STR联合应用,可能会获得更好的效果。

  3.2 慢速突变Y-STR

  快速突变Y-STR基因座因其高突变率,可能导致在亲权鉴定中出现误排,同时,也可能影响系统发育研究中对于进化时间的估计。因此,Baeta等提出了慢速突变Y-STR的概念。

  该研究组将6个突变率在10-4数量级的Y-STR(DYS388、DYS426、DYS461、DYS485、DYS525、DYS561)进行复合,构建了第一个慢速突变Y-STR扩增体系,并探讨了该体系的灵敏度和稳定性。

  慢速突变Y-STR由于其低突变率,在近亲之间十分保守,可应用于父系亲权鉴定,尤其是一些排除亲权关系的案件,作为现有商品试剂盒的补充。但同样因其突变率低,系统分辨能力十分有限,可能无法有效区分相关及无关个体,继而影响其在亲子鉴定领域的应用。

  因此,慢速突变Y-STR并不能作为亲权鉴定的主体,而应通过增加标记数量、与其他类别Y-STR综合运用等方式,以实现良好的应用效果。在进化研究方面,为减小遗传标记的可能影响,研究人员往往使用数以千计的多态性标记,同时,利用SNP来开展进化研究。

  相比之下,无论从数量或是功能,慢速突变Y-STR对于系统发育研究的贡献均处于次要位置。但慢速突变Y-STR可以提供与其他类型Y-STR不同的信息,或使系统发育信号更为清晰。此类Y-STR的相关应用价值仍有待未来的实验验证。

  3.3 中速突变Y-STR

  具有中等突变率的Y-STR最为常见,应用也最为广泛。其中,开展男性家系排查是中速突变Y-STR在亲子鉴定领域的一项重要应用。然而,利用Y-STR分型进行排查结果的判定一直是实际工作中的难题。

  具有中等突变率既意味着同一家系的男性个体可能存在Y-STR分型的差异,同时,也暗示了来自不同家系的男性个体可能在一些Y-STR基因座上分型一致。因此,在排查工作中,突变率、突变式样等都需要纳入考虑范畴。

  目前,男性家系排查中如何判定比中家系尚无统一的标准,多数工作仍根据经验来进行。实际上,现用于家系排查的Y-STR不止中速突变Y-STR,还包括部分快速突变Y-STR,这提示在判定排查结果时需要更加谨慎。

  正如2.2节所述,采用不同的扩增检验体系(Yfi ler、Yfi lerPlus或快速突变体系),父子之间最多可检测到的突变基因座数目明显不同(2,3或4个)。

  有研究者利用河南省Y-STR数据库中的近亲样本和无关个体数据做了综合分析,发现利用Yfi ler分型进行家系排查分析,2个以内的基因座突变或者2步以内的突变步数均不能排除个体来自同一家系的可能性,而如果利用Yfi lerPlus分型展开比对分析,则不排除的范围应扩展到4个以内的基因座突变或者5步以内的突变步数,才能保证后期侦查方向的可靠性。当然,这一标准也应在未来的实践中不断检验、修正。

  综合上述三种Y-STR突变类型的特征,在开展男性家系排查时,建议以中速或慢速突变Y-STR分型作初步比对,获得一定范围的比中家系,再根据快速突变Y-STR分型进行细化,以缩小目标家系范围。

  在特定目标家系中,由于单靠中速或慢速突变Y-STR对近亲个体的区分度有限,可运用快速突变Y-STR为家系内部的比对提供更多有价值的信息。

  4、展望

  Y-STR的突变研究已取得了一定进展,并指导了当前Y-STR在亲子鉴定领域的实际应用。然而,无论是研究方法或是应用实践,仍存在一些亟待解决的问题:

  1)计算Y-STR可靠突变率的最小样本量。既有数据显示,不同研究在计算Y-STR突变率时选取的父子对或者其他近亲样本数量存在较大差异,甚至相差2个数量级。如能通过综合分析,获得Y-STR突变率研究的最小样本量,将能够极大地减小样本量对于突变率数据造成的影响,并可能节约必要的研究成本。

  2)国内人群Y-STR的突变研究。已有的研究多集中于国外人群,要全面掌握中国人群Y-STR基因座的突变情况,应针对中国不同地区、多个民族的人群开展研究,以便为后期Y-STR在亲子鉴定领域的深入应用奠定基础。

  3)Y-STR突变数据对家系排查的应用指导。在拥有充足Y-STR突变数据的前提下,如何精准地指导Y-STR在男性家系排查中的应用,是值得关注的一个重要问题。如真正解决该问题,将能在一定程度上节约鉴定成本,对于案件具有重要的意义。

手机(24小时)18030879397

在线咨询:09:00~17:30