网站主页 全基因组重测序 新闻专题 全基因组重测序的应用

全基因组重测序的应用

发布日期:2019/3/7 14:43:46

背景及概述[1-2]

对已有参考基因组序列的物种进行个体或群体全基因组测序称为全基因组重测序。全基因组重测序结果与已有参考基因组序列进行比对,检测出全基因组范围的单核苷酸多态、插入缺失突变、拷贝数变异和机构变异等变异信息,获得个体或群体分子遗传特征,进行动物重要经济性状候选基因预测及遗传进化分析,广泛应用于遗传变异检测、性状基因定位、遗传图谱构建和遗传进化研究。全基因组重测序数据分析最关键的一步在于序列比对,将重测序所得的reads序列与已有的参考基因组序列进行相似性比较,比对过程一般按两步进行:首先归类整理reads数据或参考基因组序列,然后用适当算法比对和定位reads序列。

测序指标[3]

测序深度和测序覆盖度是评价测序量的两个重要指标:测序深度是评价样本测序量的一个指标,指测序获取的碱基总量与基因组大小的比值。测序深度越大,出现假阳性结果的概率越小。如果待测序个体采用的是双末端测序法,测序深度需要控制在50X~100X以上,才能保证基因组覆盖度和控制测序错误率。测序覆盖度指基因组被测序得到的碱基覆盖的比例,反映测序的随机性,且其与测序深度之间存在正相关关系,通过Lander-WatermanModel可以确定测序深度与覆盖度间的具体关系。

技术发展[3]

全基因组重测序技术主要使用第2代测序技术(NGS)和第3代测序技术。

1)第1代测序技术又称Sanger测序法(双脱氧末端终止法),20世纪90年代初开始使用的DNA测序方法,采用循环测序模式,但是在读取碱基信息时容易出错,且每次获取的数据量少。SangerDNA测序法经过不断地发展,测序的准确度达到几乎100%,测序片段长度已经达到1000kb。

2)第2代测序技术是高通量测序,中心思想是边合成边测序,即用不同颜色的荧光标记A、T、C、G4种碱基,然后根据新合成末端的标记来确定待测DNA的序列。支持的技术平台主要有Illumina/SolexaGenomeAnalyzer、Roche/454FLX和AppliedBiosystemsSOLIDsystem,三个平台各有优势。大致流程是构建测序文库→进行锚定连接→预扩增→单碱基延伸测序→数据分析。第2代测序技术已经实现了快速、低成本地检测全基因组序列,获得的数据量大大增多。

3)第3代测序技术于2011年正式推广,在进行基因组测序时,不需要PCR扩增,直接测序,能单独测序每条DNA分子,因此又被称为单分子测序技术,测序成本更低。有单分子荧光测序(SMRT技术)和纳米孔测序(电泳技术)两大测序技术,支持的技术平台主要有Heliscope/HelicosGeneticAnalysisSystem、SMRT和纳米孔单分子。其中纳米孔测序技术能完全摆脱洗脱和PCR扩增过程,实现超高读长、高通量、更少的测序时间和更为简单的数据分析。每一代测序技术在当时都发挥着重要的作用,并且一直更新换代。但是人们对科研的要求越来越高希望能用较少的成本、较少的时间检测出更多的基因组信息,相信最新的测序技术能改变世界。随着科技的进步,检测手段越来越先进,测序可变得便捷、高效。

应用[3]

1.在动物方面的应用

通过基因比对,能够预测与动物重要性状有关的候选基因,通过全基因组重测序能够定位QTL,预测候选基因,分析群体进化过程等。利用全基因组重测序技术在动物育种方面也取得了一些研究成果。全基因组重测序技术的不断发展和应用,在基因组研究领域取得了一定的成果,比如构建遗传图谱、分析群体进化、性状基因定位、检测变异等。2000年就完成了黑腹果蝇全基因组序列的测定,其作为模式生物,在基因组学和基因功能学领域取得了很大的成就,这些研究成果可以应用在医学、生命科学等领域。研究人员选取3个突变世袭果蝇(自交286代),共发现了174个可信SNP。在不同测序深度条件下,统计突变数量、SNP位点和突变率。江西农业大学、华大基因和加利福尼亚大学的研究人员利用全基因组重测序揭示了猪的环境适应性分子机制,在全基因组范围内证明了219个基因位点与猪种环境适应性有关。

另外,证实了中国地方猪对培育世界猪种做出过重要贡献。我国地域面积广大,研究结果可以指导培育我国猪种适应不同的地域环境,促进养猪业持续健康发展。以2头奶牛和232头公牛为研究对象,利用全基因组重测序技术共检测出了283万个变异和与产奶量、胚胎死亡以及卷毛等性状有关的基因,为改善产奶量提供科学依据,其中胚胎死亡直接影响牛的繁殖性能。首次用RAD-seq(限制性内切位点相关的DNA测序)对3个国外引进鸡种和13个中国鸡种进行SNP和基因分型研究,经过严格筛选新发现了15404个SNPs。通过对3头巴克夏母猪进行基因组重测序,并与38个其他个体的基因组重测序数据进行比对,对SNP进行主成分分析,发现巴克夏猪含有更多中国猪血液,揭示了猪种之间的遗传关系,鉴定出了巴克夏的人工选择痕迹,为改善猪遗传育种提供重要信息。对小尾寒羊、蒙古羊和多浪羊进行全基因组重测序,得到了大量的结构变异,揭示中国短脂尾绵羊微进化关系,同时预测了7个基因与其繁殖性状相关,MMP14、HMGCR、PRL等8个基因在小尾寒羊中发生了进化,只有HOXA10基因在蒙古羊中发生进化。易综合上述的研究成果,利用全基因组重测序技术研究动物的重要经济性状,能够获得全基因组范围内的变异位点,找到与之相关的候选基因。但是关于如何在分子育种中利用这些变异和基因,加快优良品种的培育和性能的改善,目前还没有出现相关的应用报道。利用全基因组重测序技术发掘基因组信息和基因还处于研究阶段,离真正地将基因加以应用还有一段距离。

2. 全基因组重测序在其他领域的应用

除了在动物育种方面的运用,全基因组重测序在植物、微生物和昆虫等方面也有应用。比如利用IlluminaHiSeq2000and2500平台对水稻种质资源-KRICE_CORE进行全基因组重测序,并用2046529个高质量SNPs进行系统发育和群体分析,研究结果有助于以后的分子育种、功能和进化研究。以3个不同杨树品种为研究对象,利用全基因组重测序的数据来表征和比较3个品种的核苷酸多态性、位点频率图谱和群体规模重组率。研究结果能帮助人们理解各种进化力如何相互影响,从而影响相关物种之间的基因组进化。随着科学技术的日新月异,从发表人类基因组工作草图至今,已经过去了十几年,在此期间报道了大量的研究成果,涉及动物、植物、微生物和人类疾病等方面,测序技术越来越发达,研究内容也越来越深入,在基因组水平的研究取得了一定的进步和理论突破。

全基因组重测序技术在我国在植物和微生物领域进行研究的应用比较多,在动物方面主要用全基因组重测序发现影响重要经济性状相关的变异位点和候选基因,再对其进行下一步的验证,以期加快动物分子育种的步伐。全基因组重测序只是基因组研究的一个缩影,基因组测序、蛋白质和转录组学在生命科学领域也发挥着重要的作用。比如2016年2月,在《Nature》杂志报道了鳗草的全基因组序列,该研究具有极高的科研价值,有助于研究人员深入探究有助于生物量生产和恢复的遗传因素,也有助于海草的保护和恢复。2016年3月在《Science》杂志发表了人工合成了世界上最小的基因组-Syn3.0,研究目标是深入了解细胞的生命活动机以及利用这些有机体和新加入的基因生产出人类所学的燃料、药物等物质。另外,还有很多基因组学的研究为生命领域的探索打开了一道大门,揭示了生命的奥秘。

存在的问题和解决方法[3]

全基因组重测序技术已经经历了3代,测序手段和技术越加先进,检测的精确性和完整性提高,也取得了一些技术和理论突破,但同时也带来了一些挑战。对个体或群体进行重测序,会出现庞大的数据,如何有效、快速地储存、处理和分析数据是人们面临问题之一。主要问题就是怎样利用大数据以及利用哪些数据,如果不能经济有效地利用测序数据或者利用了无效数据,就会造成资源浪费甚至得到错误的结论。因此,如果能够克服数据储存和分析的难题。将会促进重测序的广泛应用。解决这一问题的方法有:①简化基因组重测序的数据,能去除冗长、无用的信息,保留有用信息。②降低测序产生的错误率,提高准确性。如果物种基因组太大,测序深度不够的话,会降低结果的准确性。③处理数据的软件和系统能够普及化。很多单位得到数据,但不会使用软件分析。开发简单易懂的软件或者提供具体的软件使用手册,使数据分析软件能够普及。④降低测序成本。对于普通科研单位来说,全基因组测序成本还是比较昂贵的,如果大样本研究的话,很难承受高昂的测序成本,就限制了全基因组重测序技术的使用。如果能降低测序成本,提高基因检测水平,那么就有可能实现大规模检测基因。

主要参考资料

[1] 基因组测序技术及其应用研究进展

[2] 全基因组测序在重要家畜上的研究进展

[3] 全基因组重测序及其在动物育种的研究进展

分享 免责申明