2011年7月25日,由深圳华大基因研究院(BGI-Shenzhen)主导完成的“基于全基因组组装数据检测人类基因组结构变异(SVs)”(Single-nucleotide Resolution Structural Variations of Two Human Genomes mapped by Whole Genome de novo Assemblies)的研究成果在国际知名学术杂志《自然-生物技术》(Nature Biotechnology)上在线发表,这是华大基因在人类个体基因组研究领域取得的又一项重要成果。
本研究采用新一代测序技术获得的全基因组组装的短片段构建了一个亚洲人和一个非洲人详尽的结构变异图谱,为人类基因组结构变异检测提供了一种新方法——基于全基因组组装的结构变异检测,该方法与其他检测方法相比具有性价比高、速度快等优点。据称,该方法可检测到1-50kbp范围内不同长度的结构变异,包括插入、缺失、倒置、基因重排等。
在该研究中,研究人员在亚洲人和非洲人的个人基因组组装区域(1-23kbp)共检测到27万多个结构变异,并对这些变异进行了验证,结果表明,该方法具有高准确度的特点。同时,研究人员还对这些结构变异的特性和生物学作用相关方面进行了研究。
为了推断结构变异在人群中的频率分布,研究人员对106个“千人基因组计划”(1000 Genomes Project)中的个体进行了基因组结构变异的统计,发现与SNPs相比,SVs一般呈现出更强的负向选择,证明其比SNPs具有更强的个体特异性。SVs的高度特异性将有助于研究人员进行人类表型差异研究。
研究还发现,基于基因组重测序构建的相关图谱在准确度上还是会有所偏差,所以研究人员建议在以后的人类基因组研究工作中,最好能够进行基于从头组装的全基因组研究,这样会使研究结果更加准确及可靠,尤其是明升手机版基因组及相关领域的研究。
人类遗传变异被Science杂志评为2007年世界十大科技突破之一。近年来人类基因组中的大量变异被发现,研究这些变异不仅有助于揭示许多复杂疾病和个体性状的遗传学机制,也能够加快个性化医疗的发展。
在高通量基因组测序技术出现以前,研究者主要采用传统的细胞遗传学方法在全基因组中寻找变异,随着分子生物学和基因组学的飞速发展,很多方法被用于结构变异的检测,如基因芯片、reads 深度异常(aberrant Read Depth)、reads开gap比对(gapped alignment of reads)、配对末端图谱法(Paired End Mapping, PEM)等等,但是由于技术方面的限制和SV结构的复杂性,上述方法仍有一些劣势因此不能构建详尽的结构变异图谱,例如有的方法只能检测某一小范围内的或者某一种类型的SV,不能准确描述基因重排发生的断裂点和精细结构重排,以及不能检测到复杂的基因重排。
华大基因的这一研究首次证实,基于全基因组组装的结构变异检测方法是可行的,而且具有准确度高、检测SV长度范围广以及可以更好的检测到一些更复杂的SV序列等优势。该研究对全面理解结构变异和它们对基因组进化和生物学方面的影响具有十分重要的意义。(来源:)