Genome-wide somatic variant calling using localized colored de Bruijn graphs
http://www.nature.com/articles/s42003-018-0023-9
Giuseppe Narzisi, André Corvelo, Kanika Arora, Ewa A. Bergmann, Minita Shah, Rajeeva Musunuri, Anne-Katrin Emde, Nicolas Robine, Vladimir Vacic & Michael C. Zody
doi:10.1038/s42003-018-0023-9
肿瘤遗传学;肿瘤基因组学;基因组组装算法;罕见变异;软件
Published:
22 March 2018
Reliable detection of somatic variations is of critical importance in cancer research. Here we present Lancet, an accurate and sensitive somatic variant caller, which detects SNVs and indels by jointly analyzing reads from tumor and matched normal samples using colored de Bruijn graphs. We demonstrate, through extensive experimental comparison on synthetic and real whole-genome sequencing datasets, that Lancet has better accuracy, especially for indel detection, than widely used somatic callers, such as MuTect, MuTect2, LoFreq, Strelka, and Strelka2. Lancet features a reliable variant scoring system, which is essential for variant prioritization, and detects low-frequency mutations without sacrificing the sensitivity to call longer insertions and deletions empowered by the local-assembly engine. In addition to genome-wide analysis, Lancet allows inspection of somatic variants in graph space, which augments the traditional read alignment visualization to help confirm a variant of interest. Lancet is available as an open-source program at http://github.com/nygenome/lancet.
本周发表的一项研究,介绍了一个比现有方法更精确、灵敏地识别罕见的癌细胞基因突变的检测方法。
在癌症研究中,能对体细胞变异进行可靠的检测是至关重要的一环。现有的识别癌细胞里的基因突变的方法共有的策略是,先把正常的细胞和癌细胞的基因都测序,然后把两个序列和基因组参考序列做对比,最后把癌细胞独有的基因突变找出来。这个策略的弱点是,如果做对比时有技术上的困难,那就很难找出癌细胞独有的突变。
领导发表本篇文章的纽约基因组研究中心的团队的Narzisi博士说:“我们的研究发现,现有的几个变异评分系统互相有出入,同样的突变会在一个系统里得高分但在另一个系统里被鉴定为假阳性。这会给决定临床或者药物的研究方向带来很大的问题,因为你很可能就选了一个根本不存在的变异体来做研究。”
Narzisi博士领导的团队在本文中介绍了名为“柳叶刀”的微装配基因组分析技术,在没有基因组参考序列的对照的情况下,把小段的序列重组成基因组,这样就避过了基因组参考序列的信息模糊或者评分标准不统一的问题。柳叶刀采用一个名为彩色de Bruijn图的数据结构,把正常细胞和癌细胞的基因组一起分析,并检测单核苷酸位点变异和基因组小片段插入或缺失,从而能够发现少有的癌细胞的变异体。Narzisi博士领导的团队用柳叶刀技术对人造的和真实的全基因组的序列的数据集做分析, 从而证明了柳叶刀比其他寻找体细胞变异体的方法(例如MuTect,MuTect2,LoFreq,Strelka和Strelka2)有更高的灵敏度和准确度。
柳叶刀可靠的变异体评分系统有利于变异体的优先级划分。它在给长段的基因缺陷或者基因插入评分时,能在不牺牲灵敏度的同时找出低频率突变。除全基因组分析外,柳叶刀还用图形显示的体细胞变异体的位置来增加数据的可读性。
柳叶刀有望成为一个帮助临床医疗人员和研究人员推动癌症研究和改善医疗质量的工具。柳叶刀在以开放源代码程序形式向公众开放。(来源:明升手机版(明升官网))