网站主页 全外显子组捕获测序 新闻专题 全外显子组捕获测序的应用

全外显子组捕获测序的应用

发布日期:2020/1/2 8:16:04

背景及概述[1]

外显子组(exome)即一个个体的基因组DNA上所有蛋白质编码序列(即外显子。exon)的总和。人类外显子组序列仅占人类整个基因组序列的1%,约为30Mb,包括18万个左右的外显子,估计85%的人类致病突变都位于这1%的蛋白质编码序列上。因此,对各种疾病患者的外显子组进行测序分析,所针对的是与疾病最相关的“编码序列”即区域exome,捕捉的是疾病的大部分致病突变信息。在单基因致病基因的定位中,普遍的做法是假设致病突变为一个患者共有稀有突变,在常用数据库中不存在,故常用的策略是将测序得到的变异体过滤常用数据库(如dbSNP数据库、HapMap计划数据库和千人基因组计划数据库)。有的学者也利用自己的数据库(in-housedatabase)进行过滤。国内的研究则还可利用炎黄计划数据库。

全外显子组测序(Wholeexomesequencing,WES)是一种只针对外显子区域DNA的新型基因组分析技术,它首先将全基因组外显子区域DNA捕捉并富集,再进行高通量测序,然后结合生物信息学分析鉴定罕见及常见疾病相关的致病基因。目前,WES与全基因组测序相比,其成本低、效率高的优势日益显著。自2009以来,WES已广泛应用于孟德尔遗传病、罕见综合征及复杂疾病的研究,取得了前所未有的成就。近几年来,外显子组测序已对许多疑难杂症的致病基因进行了定位克隆。外显子组捕获测序已在基础医学和转化医学的研究领域中突显出其优越性。

应用

外显子组捕获测序在Freeman-Sheldon和Miller综合征中应用成功后,又用该技术成功鉴定了Kabuki综合征的致病基因MLL2。在对单基因遗传病致病基因的鉴定中,目标序列捕获测序也得到了成功应用,使得致病基因克隆的成本进一步降低。例如将X染色体外显子组捕获测序(X-exomecaptureandsequencing)应用于终端骨发育不良(terminalosseousdysplasia)的研究,通过对2例无血缘关系的患者进行测序,确定了FLNA为其致病基因。外显子组捕获测序在多基因疾病的研究方面也取得了显著成果。2011年,上海交通大学医学院的陈赛娟小组通过对急性单核细胞白血病(acutemonocyticleukemia)的外显子组测序,发现DNMT3A基因突变在该型白血病患者中高频发生,进一步的研究证实了DNA甲基化与该病的发生有关。通过对透明细胞癌(clearcellcarcinoma)组织进行外显子组测序,将SWI/SNF染色质重塑复合体基因PBRM1确定为透明细胞癌的第2个主要致癌基因,并进一步证实了体细胞遗传对透明细胞癌发生的作用,强调染色质生物学在癌症发病中的地位。通过对10例胰腺神经内分泌瘤组织进行测序,发现与染色体重塑相关的MEN1、DAXX、ATRX基因在体细胞中高频突变,而mTOR通路中的基因也有高频突变。Harbour等通过对2例转移性葡萄膜黑色素瘤(metastasizinguvealmelanomas)进行测序后发现,BAP1基因在体细胞中高频突变。2011年,北京大学深圳医院的蔡志明小组通过对8例人膀胱移行细胞组织的外显子组测序,发现UTX、MLL-MLL3、CREBBP-EP300、NCOR1、ARID1A和CHD6等基因在移行细胞癌组织中高频突变,为移行细胞癌遗传基础的研究提供了新的思路。

通过对离子通道相关基因的重测序研究,认为通过大样本测序得到变异体只是疾病研究的步,在细胞或模型上的功能研究则更为关键。运用外显子组测序对包括癌症在内的多基因疾病的探讨目前多在组织水平上进行,在种系水平上的研究尚未见报道。在多基因疾病的研究中,外显子组测序更倾向于一种提示性的方法,即先做小样本外显子组测序,然后在大样本验证中使用目标序列捕获或Sanger直接测序予以验证,从而大大降低研究成本。

测序平台

目前,商业上使用的三种主要的外显子组捕获测序平台为:Agilent公司的SureSelectHumanAllExon50Mb,Roche/Nimblegen公司的SeqCapEZExomeLibraryv2.0和Illumina公司的TruSeqExomeEnrichment。2011年,美国斯坦福大学医学院的Clark等对Agilent、Illumina和Nimblegen三种商业平台进行了全面评估。总体而言,Nimblegen平台使用高密度重叠探针(overlappingbaits),相对其它两种平台覆盖了较少的基因组区域,但通过较少测序可以灵敏地检测出小变异(smallvariants)。而Agilent和Illumina可以通过测序得到更多的变异体。另外,Illumina平台可以捕获非翻译区序列,而Nimblegen和Agilent却不能。三种平台的在寡核苷酸探针的设计上也有着本质的差异。Nimblegen的探针覆盖到多次捕获的碱基上,故其成为三者中密度最高的平台;Agilent探针以紧密相邻的方式覆盖整个外显子区;而Illumina基于paired-endreads,将覆盖区域扩大到探针序列以外,且覆盖这些间隔区域。因此,三种平台的捕获区域不尽相同。

在捕获富集效率方面,三种平台也有差异。通过对每个平台的80M的reads目标碱基覆盖率来衡量总捕获富集效率后发现,在Nimblegen富集中,98.6%的目标碱基被覆盖至少一次,96.8%的目标碱基覆盖≥10×;在Illumina中,对应数据为97.1%和90.0%;至于Agilent,对应数据则为96.6%和89.6%。在测序深度方面,相对于另外两种平台,Nimblegen可以富集到更多的目标碱基;Illumina和Agilent在更多的reads数量情况下可富集更多的目标碱基。有效探针则分别在40M(Nimblegen),50M(Agilent)和60M(Illumina)reads时达到饱和,并以碱基覆盖≥10×情况下以2增长。上述结果表明,平台设计的差异可显著影响捕获效率以及目标碱基数量的平衡。高密度设计,捕获较少的目标碱基,导致更高的效率;而低密度设计可捕获更多的碱基数量,但需要更深度的测序。在对变异体检测的效率方面,富集效率和变异检测效率并不成正相关关系。

在一般的80M的reads数据量中,Nimblegen可检出46960个单核苷酸变异体(singlenucleotidevariants),而Agilent和Illumina分别为50634和52859个。与IlluminaHuman1M-DuoSNPChip的单核苷酸多态性读取数据进行对比后,Nimblegen、Agilent和Illumina的一致率依次为99.5%、99.3%和99.2%。在等位平衡(allelicbalance)对比中,Nimblegen、Agilent和Illumina依次为0.53、0.53和0.55。对小插缺(smallindel)的检测中,在低reads数时,Agilent富集后检出率低于Illumina,但在50M的read数量时,Illumina则高于Agilent。

主要参考资料

[1] 全外显子组测序技术及其在遗传性耳聋研究中的应用

[2] 全外显子组捕获测序技术在单基因遗传病研究和诊断中的意义

分享 免责申明

欢迎您浏览更多关于全外显子组捕获测序的相关新闻资讯信息