期刊:NatureCommunications
IF:12.
发表时间:.1
摘要
肉瘤是影响成年人、青少年和儿童的恶性软组织和骨肿瘤的总称。肉瘤形态学存在异质性,部分肉瘤没有特有的组织病理学特征,因此,诊断较困难。我们利用DNA甲基化芯片数据,使用机器学习分类系统提示软组织和骨肿瘤的分类。该肉瘤分类系统使用来自个甲基化分布图的数据集进行训练,其中包括62个甲基化类别,在整个年龄范围内覆盖了大部分软组织和骨肉瘤亚型。在个肉瘤中得到验证,其中例得以分类。结果证明了基于DNA甲基化的肉瘤分类在科研和未来诊断中的潜力。
研究背景
DNA甲基化是关键的表观遗传标记,在正常发育和疾病中起重要作用。在癌症中,DNA甲基化既反映了细胞的起源类型,也反映了肿瘤形成过程中的获得性变化。
研究结果
1.典型肉瘤的DNA甲基化图谱
队列中包括62种肿瘤和3种对照DNA甲基化类别。甲基化类别按照WHO方案进行颜色编码和分组。依据甲基化类别,个肉瘤病例被分为与WHO分类有关的四个类别(图1a)。
图1建立基于DNA甲基化的肉瘤分类参考队列
2.肉瘤分类系统的开发
肉瘤分类系统使用随机森林机器学习分类算法。交叉验证是肉瘤分类系统的内部性能指标,在特性曲线分析下,原始评分的估计错误率为1.95%,判别能力为99.9%。错误分类率低,证明了分类系统算法的辨别力(图2)。
图2基于DNA甲基化的肉瘤分类系统的交叉验证
热图显示对随机森林分类系统进行三重交叉验证的结果,该分类系统包含了n?=个生物学上独立的样品(分配给65个甲基化类别)的信息。与二等分线的偏离表示分类错误。甲基化类别家族(MCF)用正方形表示。颜色代码和缩写与图1a相同。
3.在临床队列中验证分类系统性能
在MNP2.0,PTT2.0,INFORM或NCTMASTER试验中,另外例(主要代表复发性和难治性软组织和骨肿瘤)对肉瘤分类系统的性能进行了验证,这些试验侧重于分子分析。将肉瘤分类系统预测的甲基化分类与病理诊断进行比较(图3)。例中的例的标定评分≥0.9(75%)。甲基化分类与病理诊断相匹配的病例为/例(61%)。在59/例病例中(14%)遇到校准分类系统预测得分≥0.9的分类系统预测差异。
图3肉瘤分类系统的验证
在这些情况下,针对亚型特异性变化筛选分子数据,修订最初的诊断,以便在29/59例病例中预测甲基化类别。在26/59例中,由于缺乏特异性突变,组织学诊断和分类系统预测之间的差异无法解决。相对于预测的甲基化类别,保留了4/59例的初步诊断(图4)。
图4病理诊断和甲基化类别预测的比较
图5肿瘤细胞纯度对分类系统性能的影响
4.肉瘤的拷贝数分析
肉瘤中常见的拷贝数改变包括:高度分化/去分化的脂肪肉瘤的MDM2扩增,放射线诱导的血管肉瘤的MYC扩增或横纹肌样瘤包含SMARCB1的22q节段性染色体缺失。一般情况下,这些改变是不同肉瘤的特征,但是由于它们偶尔也会出现在其他肉瘤类型中,因此不属于特定肿瘤病理性特征。但是,CNV图结合甲基化图谱,通常可以更快速诊断。分子分类系统报告中提供了预测的甲基化类别的分子和临床特征(图6)。
图6预测的甲基化类别及其分子特征
总结
总而言之,我们介绍了一种基于DNA甲基化数据和概率进行肉瘤分类的自动算法分析工具。我们开发了一个网页,列出了肉瘤甲基化类别的特征。这个在线平台还可为本地生成的甲基化数据提供免费的上传服务,该数据会立即进行分析,并将结果作为具有预测置信度得分的分子分类系统报告返回。肉瘤分类系统可在