高通量测序技术的两大挑战

没有测序的癌症诊断是不完整的,完整的癌症诊断应该包括一系列基于细胞遗传学技术、荧光原位杂交技术、标准分子技术以及NGS的预后与预测性分析。对于早期癌症患者来说,NGS序列分析在多种癌症的筛查技术中具有不容忽视的代表性;而对于晚期癌症患者,大量的侵入性测试往往只能筛查出少数几个药物靶点。

随着技术的进步与价格的下调,NGS综合分析技术越来越多地在临床肿瘤筛查中得到了推广(诸如NCI MATCH项目),综合基因组分析技术引起了人们对肿瘤全基因组与全外显子组测序的热情。同时,全基因组测序也越来成为神经疾病诊断的一线工具。

反观问题的另一面,生物信息学的发展滞后使得测序技术迅猛发展的后继需要难以满足,高通量测序数据的处理面临着两个巨大的挑战,即肿瘤样本全基因组突变评估与DTC(direct-to-consumer )市场遗传学研究结果不一致。

肿瘤样本全基因组突变评估

Alioto和他的同事们对国际癌症基因组联盟中八家实验室的成神经管细胞瘤样本HiSeq全基因组测序结果进行了对比,最初的对比结果显示不同实验室的样本预处理方式(是否选择PCR对样本DNA进行扩展)对测序深度以及覆盖率有着极大影响,其中两家样本DNA浓度没有达到平均测序深度最小要求实验室的数据得到了剔除。即使在剩下的六家实验室中,全基因组测序的覆盖深度范围也从50%-75%不等,这样的结果严重限制了后期的突变识别。

在生物信息学方面,共有18家实验室向国际癌症基因组联盟提交了体细胞单碱基突变分析,16家实验室提交了插入或缺失结果。虽然国际癌症基因组联盟拥有与之相关的黄金标准,但其标准仍然只能够涵盖所有实验室不到四分之一的体细胞单碱基突变与347个插入或缺失中的1个。

测序结果的分析主要有以下四个特点:

1.染色体上均衡分布的突变绝大多数为真阳性,少数为假阳性;

2.均衡分布的突变中具有许多假阴性位点;

3.假阳性簇临近着丝粒;

4.聚集突变具有较高的假阳性率。

相关的研究结果证明测序工具的选择对突变位点的精确辨析有着巨大的影响。同时,肿瘤细胞的相对含量对于突变位点的精确辨析也有着巨大的影响。即使是对经验丰富的实验室来说,全基因组测序突变筛查仍然是一项容易出错的工作,全基因组和全外显子测序离临床实验室的应用标准还有着一定的距离,相关临床工具的开发工作应该在相关机构的指导下得到有效开展。

为此,Alioto和他的同事们对测序事业的相关工作者提出了以下几点要求:

1.进行全基因组测序前避免对基因组进行PCR扩展,防止扩增引起的错误;

2.肿瘤样本的测序覆盖深度应高于100X;

3.生殖细胞系基因组测序深度应与其他类型肿瘤一致;

4.结合使用多种定位与多样的筛查软件;

5.应用多种突变筛查技术;

6.对重复序列中的突变进行修正;

7.根据序列质量、制图效果以及链偏好性对序列进行过滤处理,同时使用参照基因组对序列质量进行有效控制。

DTC市场中存在的遗传学研究结果不一致

对比显示,DTC测序产品的检测结果往往更加具有挑拨性。Corpas等人将一个西班牙家庭一家四口(爸爸妈妈,儿子女儿)的样本分别送至四家DTC测序公司进行全基因组分析,他们发现这四家公司的测序报告在至少一位家庭成员中存在明显的差异。即使是与样本最匹配的部分,四家公司的测序结果中仍鲜有重叠。四家公司中的三家报道了三位或四位家庭成员存在多个变异,而另一家公司报道仅仅一位家庭成员基因组发生变异。

这项研究说明DTC测序公司的全基因组测序服务往往有着大相径庭的结果,有效反映了目前行业对于测序与数据分析标准的缺失,不同测序机构难以产出一致且有效的报告。“消遣性测序”的准确性应该受到质疑,相关的循证研究对于行业的可持续发展具有积极意义。

;