白癜风精细诊疗优惠 http://m.39.net/baidianfeng/a_5781341.html
杂志:NATURECOMMUNICATIONS
IF:12.
发表日期:.4.30
摘要
随着髓系恶性肿瘤临床相关基因特征的发现,靶向基因检测对于疾病的风险分层是不够的。在这里,我们开发并验证了一种用于急性髓系白血病(AML)分层的临床转录组分析方法。将RNA-Seq测序与全基因组和外显子组测序进行比较,发现独立的RNA-Seq检测提供了最大的诊断回报,包括基因融合、单核苷酸和短插入/缺失变异,以及全转录组表达信息。来自名AML患者的表达数据被用于开发一种新的AML预后评分系统,该试验与来自三个独立队列的名患者和来自一个前瞻性队列的42名患者的预后密切相关。当与分子风险指南相结合时,该风险评分系统可将来自三个独立队列的22.1%-25.3%的AML患者重新归入正确的风险组。在不良风险亚组中,我们确定了一类以整合素信号失调和RUNX1或TP53突变为特征的患者。进一步研究表明,这些患者可能从PTK2编码的局灶性黏附激酶抑制剂的治疗中获益,这表明了基于转录组的检测在髓系恶性肿瘤治疗选择中具有额外的效用。
研究结果
实验设计、SNV和短indel检测
为了比较RNA-Seq、WGS和WES作为髓系恶性肿瘤临床评估的潜力,我们构建了一个患者队列(AML个性化药物计划,或AMLPMP队列),包括新发AML、继发性AML(sAML)、治疗相关AML(tAML)、MDS和治疗相关MDS(tMDS)患者。为了证明RNA-Seq的分析有效性,分析了其它几个队列的RNA-Seq数据(图1A)。
我们使用三种变异检测算法评估了配对的RNA-Seq、WES和WGS在检测SNV和短indel的一致性、序列覆盖和变异等位基因频率(VAF),结果表明,与WES或WGS相比,RNA-Seq检测变异的覆盖深度要高得多。这三种检测方法对大多数变异的检测结果是一致的。RNA-Seq与WGS相比,有8种变异仅在RNASeq数据中检出变异,有2种变异仅在WGS数据中检出(图1B)。RNA-Seq与WES相比,有19个变异仅出现在RNA-Seq数据中,还有8个变异只出现在WES数据中(图1C)。仅在RNA-seq中检出而在匹配的WES或WGS数据中未检出的的变异大多是因为WES或WGS数据的覆盖率较低导致的。然而,有少数在WES和WGS中的低频变异在RNA-Seq数据中被发现高表达。
比较发现,GATKHaplotypeCaller检测变异的灵敏度最高,PPV最低(图1E),因此我们选择使用GATKHaplotypeCaller进行后续研究。
图1.实验概述和短核苷酸变异/indel分析
结构变异
髓系恶性肿瘤的特点是存在复发的结构变异。我们从患者队列的RNA-Seq数据中检测到主要临床相关的融合基因,包括PML-RARA(9例)、MYH11-CBFB(11例)、RUNX1-RUNX1T1(8例)和MLLT3-KMT2A(4例)(图2A)。唯一一个通过细胞遗传学检测到临床相关的染色体重排,而RNA-Seq未检测到的病例是MECOM(EVI1)-RPN1融合,由于融合断点发生在这两个基因的下游。我们比较了这些基因的相对表达(图2B),相关病例表现出了预期的MECOM表达升高的模式。这些结果表明,通过表达分析可以检测MECOM重排,以识别MECOM高表达但缺乏KMT2A家族重排的病例。
图2.结构变异分析
基因表达信号-AML预后评分(APS)
我们使用LASSO分析获得了16个基因的表达特征,将其命名为APS(图3A)。APS值与AMLPMP队列的总生存率密切相关(图3B),我们使用APS观察到TCGALAML(图3C)和BeatAML(图3D)队列中与总生存率的强相关性。然后,在前瞻性的本地队列中通过APS再次观察与总生存率的强相关性(图3E)。有趣的是,APS在儿童AML队列中也具有预测作用(图3F)。
图3.AML预后评分(APS)基因表达信号的验证
基于表达的分层
为了确定基因表达信息是否可以改善AML的风险分层,我们使用单因素生存分析AMLPMP队列中的临床分子标志物的贡献(图4A)。已知一些基因的表达水平与AML预后相关,包括GPR56、BAALC、MN1、MECOM和FLT3。在单变量分析中,除了APS和LSC17多基因表达特征外,我们还分析了这些基因的持续表达。APS中位数以上的患者观察到的危险比最高,还观察到中位数以上的LSC17表达、MECOM表达和GPR56表达。我们在TCGALAML(图4B)和BeatAML队列(图4C)中观察到类似的结果。
为了对患者队列进行重新分层,我们首先使用了仅从RNA-Seq检测中获得信息的ELN标准(ELN-RNA分层),将患者队列分为低、中间和高风险组。根据APS值将患者队列分为三组,观察到低、中间和高风险组患者的APS值随着风险状态的增加而显著增加(图4D)。
图4.单变量生存分析
在AMLPMP队列中,例患者中有34例(22.1%)进行了重新分层(图5A)。值得注意的是,ELN-RNA-APS模型的生存曲线与ELN-RNA模型的生存曲线没有差异,这表明中间状态的患者被准确地进行了重新分层(图5B-C)。随后,我们将相同的模型应用于TCGALAML和BeatAML队列(图5D-I)。在两个验证队列中,我们观察到类似的模式:中风险患者的数量减少,而新分层的患者的结果与ELN-RNA模型非常相似。在TCGALAML队列(图5D)中,例中有43例(24.9%)被重新分组了;而在BeatAML队列(图5G)中,例中有74例(25.3%)被重新分组了。总之,在所有三个队列中,ELN-RNA-APS分层模型比单独使用ELN标准的标准模型能提供更加明确的分层信息。
图5.患者分层
通路分析和差异表达分析
为了证明基于转录组的分析和基因表达特征在治疗选择中的实用性,我们首先使用IPA和GSEA软件分析低风险和高风险APS患者之间的差异激活通路,观察到高危组中涉及整合素、趋化因子和细胞因子信号通路的分子调控异常(图6A)。使用GSEA软件分析得到了类似的结果:整合素和趋化因子信号通路在所有三个患者队列高危组中都强烈富集(图6B)。
图6.通路富集分析
为了进一步分析APS低值和高值患者之间差异的生物学机制,我们进行了差异表达分析(图7)。我们发现APS基因CD、CALCRL和TMEM存在较大差异。作为使用基于转录组的检测进行治疗选择的证明原则,我们选择通过FAK