Cancer Res:南京医科大学杨柳/鲍军:多维片段组学技术实现结直肠癌的早期和准确检测
医疗资讯网-妇科问诊
结直肠癌常在晚期被诊断,突显了开发早期检测方法的必要性。利用游离DNA(cfDNA)片段组学进行液体活检是一种有前景的方法,但由于其复杂性和成本,临床应用受到限制。
2024年10月1日,南京医科大学杨柳和鲍军共同通讯在Cancer Research 在线发表题为“Multidimensional Fragmentomics Enables Early and Accurate Detection of Colorectal Cancer”的研究论文。该研究旨在开发一个整合模型,利用cfDNA片段组学进行准确且具有成本效益的早期结直肠癌检测。
作者从一个包含360名参与者的训练队列中提取并测序了血浆cfDNA,其中包括176名结直肠癌患者和184名健康对照。作者采用包含五个机器学习模型的集成堆叠模型,通过五个cfDNA片段组学特征来区分结直肠癌患者与健康对照。该模型在一个独立的236名参与者队列(117名结直肠癌患者和119名对照)以及一个前瞻性队列(242名参与者,其中129名患者和113名对照)中进行了验证。集成堆叠模型显示出在结直肠癌患者和对照之间具有显著的区分能力,超越了所有基础模型,并在验证队列中实现了0.986的高受试者工作特征曲线下面积。该模型在验证队列中检测结直肠癌的灵敏度达到94.88%,特异性达到98%,且灵敏度随着癌症进展而提高。模型在同次和不同次测试以及健康个体的各种条件下表现出始终如一的高准确性。在前瞻性队列中,灵敏度为91.47%,特异性为95.58%。该集成模型利用cfDNA片段组学的多重特性,实现了高灵敏度和稳健性,具有显著的前景,为早期结直肠癌检测和广泛的患者受益提供了重要可能性。
结直肠癌(CRC),包括结肠和直肠的恶性肿瘤,是全球最常见的癌症之一。根据2020年的数据,全球预计新诊断的结直肠癌病例为190万例,导致的死亡人数为94万,成为癌症相关死亡的第二大原因。尽管由于有效的筛查措施,结直肠癌的总体发病率预计会下降,但在50岁以下的年轻人群中,结直肠癌的发病率却呈现上升趋势。从2010年到2017年,年轻成人的发病率年均增加约2.2%。此外,许多发展中国家的结直肠癌发病率仍在上升,表明筛查的影响存在全球差异。鉴于结直肠癌的生长速度较慢以及早期症状往往不明显,增强基于人群的筛查和预防策略显得尤为重要。
虽然在结直肠癌筛查方法方面取得了一定进展,但早期阶段的准确诊断仅在40%的患者中实现。因此,这些患者的五年生存率为90%。然而,对于不幸进展至转移性疾病的20%的结直肠癌患者,其五年生存率骤降至12.5%。尽管结肠镜检查仍然是结直肠癌的金标准,但它存在一些缺点,例如高成本、资源密集型需求以及公众因相关不适而产生的恐惧感。其他一些侵入性较小的替代方法,包括粪便隐血检测(FOBT),已被多个指南推荐用于结直肠癌筛查。虽然特异性针对人血红蛋白的粪便免疫化学检测(FIT)已经取代了传统的基于石碱的FOBT,但这两种方法在敏感性上仍然不足,且检测结果差异较大。因此,开发一种准确的非侵入性结直肠癌检测方法极为重要。
实验流程图(图片源自Cancer Research )
近年来,基于血浆cfDNA的液体活检作为一种革命性方法,逐渐兴起,并在早期检测结直肠癌等固态恶性肿瘤中显示出巨大的潜力。cfDNA是细胞凋亡、坏死或分泌过程中释放的细胞外DNA片段,含有丰富的遗传和表观遗传信息,如突变、拷贝数变异、染色体重排、超甲基化和去甲基化等。癌细胞与健康细胞之间的不同特征推动了cfDNA在癌症检测中的应用。然而,cfDNA的检测由于其在血液中的低浓度,尤其在疾病早期阶段,变得复杂。为了定位异常,所需的深度测序显著提高了这些检测的成本,从而可能阻碍其更广泛的应用。尽管基于甲基化的方法,如全基因组亚硫酸氢盐测序或在NGS方法中进行额外的亚硫酸盐转换,已成为早期癌症检测的有前景的替代方案,但它们也伴随着技术复杂性和冗长程序等固有缺点。因此,亟需替代方法来简化技术挑战,缩短周转时间,同时保持早期癌症检测的高灵敏度和特异性。
片段组学(fragmentomics)这一新兴领域,通过研究cfDNA的片段化模式,在缺乏全面深度全基因组测序(WGS)数据时,展现出显著的潜力。有趣的是,cfDNA的片段化模式在基因组中并不是均匀分布的,这些模式被推测受染色质组织的影响,从而为核小体定位和基因表达提供了有价值的见解。DNA片段评估以实现早期拦截(DELFI)是一个重要里程碑,评估5 Mb窗口内的片段覆盖率、大小及其他统计信息。研究发现,短片段(100-150 bp)和长片段(151-220 bp)之间的比率在癌症患者与健康个体之间有所不同,这为疾病状态的区分提供了可能性。片段组学研究还利用了癌症组与非癌症组之间的其他区分模式,如优选末端坐标和末端基序。最近,研究人员深入研究了cfDNA的转录因子谱,成功识别出具有较高准确度的患者特异性和肿瘤特异性模式。
鉴于cfDNA中蕴含丰富的信息及其区分癌症与健康状态的潜力,作者开发了一种模型,以捕捉cfDNA的全面特征。通过利用五种优化的片段特征,作者采用强大的集成堆叠机器学习策略设计了模型。本研究的主要目标是提供一种灵敏且经济实惠的结直肠癌检测模型,旨在为实际医疗场景带来显著的临床优势。
原文链接:
https://doi.org/10.1158/0008-5472.CAN-23-3486