
亚太医学
Journal of Medicine in the Asia-Pacific
- 主办单位:未來中國國際出版集團有限公司
- ISSN:3079-3483(P)
- ISSN:3080-0870(O)
- 期刊分类:医药卫生
- 出版周期:月刊
- 投稿量:1
- 浏览量:201
相关文章
暂无数据
NSCLC新辅助疗效预测模型的研究进展与挑战
Research Progress and Challenges in Efficacy Prediction Models for Neoadjuvant Therapy of Non-Small Cell Lung Cancer
引言
据最新国家癌症中心数据显示:肺癌发病率及死亡率均居我国恶性肿瘤首位。根据2025年美国国立综合癌症网络(National Comprehensive Cancer Network, NCCN)指南,手术仍是可切除Ⅰa-Ⅲa期NSCLC核心治疗手段,新辅助治疗已成为综合治疗的重要组成部分。CheckMate-816研究证实:新辅助纳武利尤单抗联合化疗可显著提升主要病理缓解(major pathological response,MPR)和完全病理缓解(complete pathological response,pCR),但并非所有接受了新辅助治疗的患者都能达到预期的效果。目前程序性死亡配体-1(programmed death-ligand1,PD-L1)和肿瘤突变负荷(tumor mutation burden,TMB)是临床上常用的免疫治疗标志物,但存在如检测成本较高、耗时及不同活检部位的表达水平有差异等问题,因此临床实践中部分患者直接接受经验性免疫治疗。同时评估免疫治疗获益人群是一个复杂的过程,因此寻找可靠的新标志物并借助更高效的数据分析技术来精准筛选是当前迫切需求。
人工智能(Artificial Intelligenc,AI)技术发展为这一难题提供了新思路,其在NSCLC的生存、复发、疗效、远处转移预测等方面展现了巨大潜力。但仍面临问题如:①特征筛选主观性强;②小样本模型缺乏标准化的建模与验证流程;③研究报告标准的普遍不透明化;④多组学特征可及性差、检测成本高等问题,各级医疗场景普及难度大。
1 疗效预测模型的核心预测指标与数据类型
1.1 临床特征、实验室指标与生物标志物的应用价值
PD-L1与TMB在临床实际应用过程受到较多限制,如准确性有限、检测方法复杂、不同平台间标准化与判读标准不统一等问题。临床常规数据具有易获取性和低成本的优势成为疗效预测模型的重要数据来源。多项研究显示吸烟史、肿瘤大小、TNM分期等临床特征与新辅助治疗疗效密切相关。此外,实验室检测指标如外周血炎症指标和肿瘤标志物等也是预测免疫疗效的重要指标。近年来该领域的研究逐渐从向动态变监测转变,且效能显著优于静态模型。
1.2 多模态数据融合
近年来多组学数据在NSCLC疗效预测模型中的应用成为研究热点。一方面,多组学模型能系统性地揭示肿瘤发生、进展及治疗反应背后的复杂机制。另一方面,多组学整合可提升模型预测性能,一项预测晚期NSCLC患者免疫治疗敏感性的研究显示:临床风险模型预测效能有限(AUC=0.659),但整合了外周血代谢组等构建的多组学模型预测效能大幅提升。这表明多组学能更全面解析肿瘤异质性,揭示单一数据难以发现的生物学机制。
2 当前研究存在的争议与挑战
2.1 构建模型的严谨性问题
2.1.1 单中心小样本研究占比高
目前NSCLC新辅助治疗疗效预测模型研究仍以单中心、小样本设计为主。部分研究的样本量有限,易出现过拟合现象影响模型的准确性。一项机器学习的研究对纳入的84项研究进行分析后发现约78%为单中心设计。一项综述指出:当前大多数癌症预测模型依赖单中心、小规模数据集构建,这是导致模型在外部验证时性能下降和泛化能力不足的关键原因。
2.1.2 模型选择与样本量不匹配
部分研究在样本量有限的情况下构建模型时,过度追求复杂算法,导致产生大量过拟合严重、无法复现的模型,这类模型不仅缺乏临床转化价值,也无法为实际诊疗决策提供可靠的依据。
2.1.3 验证流程与报告标准缺失
当前的研究在验证流程与报告透明度存在着明显的不足。一方面,模型验证流程普遍不完善。一项综述发现:纳入的422项临床预测模型研究在原论文基础上进行外部验证仅约10%。外部验证的的缺失可能会导致模型在新数据集上的泛化能力显著下降,但深层问题是方法学缺乏严谨性。另一方面,研究报告标准的普遍不透明化严重阻碍了临床转化,一项系统综述发现,在纳入的152项研究里,模型的具体说明和预测性能完整报告率分别低至5.2%与5.9%,这是导致大量模型难以被独立验证和临床采纳的重要原因。
2.1.4评估体系不全面
目前的评估体系主要存在两个方面的问题:一是评估指标单一,部分研究过分依赖区分度指标(如AUC),忽视敏感性、特异性、校准度等指标;二是临床实用性评估缺失,一项癌症动态预后模型的综述发现:该研究纳入的34项模型研究都报告了区分度指标,但超过35%的研究未进行校准度评估、近33%的研究未说明内部验证方法。这种做法会直接影响模型临床可靠性。一项方法学的系统性综述提出:完整的模型评估要包括对临床影响的分析,但目前大多数研究达不到这一标准。
2.2 特征选择的主观性与优化困境
2.2.1 特征选择缺乏统一标准
当前在特征选择面临着两个困境:无客观严谨的筛选标准以及无稳健的实施路径。首先是特征筛选过程多数研究缺乏统一规范,Staartjes等指出:特征选择的目标应该是平衡模型复杂性与预测准确性。而当前部分研究偏离了这一原则,可能导致同一临床问题的特征组合选择可能存在差异,降低了预测的可靠性,如NLR、PLR等炎症指标的预测价值尚未形成共识。筛选特征的实施路径上存在两种典型偏误:一是部分研究过度探索高维特征;二是过度依赖单因素分析。
2.2.2 生物标志物临床价值存在争议
NSCLC生物标志物的临床价值面临检测标准化与临床可及性的双重挑战。一方面,检测方法标准化不足导致结果存在差异,直接影响相关被检测物作为构建预测模型的可靠性,如关键生物标志物PD-L1的表达检测,在不同实验室乃至不同检测抗体平台之间都可能存在显著差异。同时,PD-L1表达在同一患者不同肿瘤部位间也存在高度异质性,严重削弱了基于单次活检结果的临床决策可靠性。
2.3 多组学数据的应用困境
近年多组学数据成为研究热点,但Li等研究发现:盲目整合多种数据类型的组合不一定能提升预测准确性,反而可能导致预测性能下降;且多组学数据的获取依赖专业实验室设备与技术团队,基层医疗机构可能因资源有限而难以开展。因此在疗效预测模型的构建中,数据是否包含核心预测信息远比数据类型的复杂度和数量更有意义。
2.4 模型的临床转化瓶颈
2.4.1 模型推广成本高,可及性差
当前NSCLC疗效预测模型,无论是整合多组学的复合模型,还是基因组学、影像组学等单一维度的复杂模型,其数据获取与处理过程均成了较高的成本和技术壁垒,限制了临床的推广应用。
复杂模型的高成本主要体现在三个方面:1、专业的人力成本:高质量影像组学或病理组学模型的构建需要精准的病灶标注。2、硬件与计算负担沉重:复杂模型的训练、验证与部署依赖高性能计算设备,且模型的开发与训练需消耗大量的计算与存储资源;3、检测费用昂贵。
2.4.2 模型可解释性差,临床信任度低
临床预测模型领域中,黑箱模型的广泛应用对模型的可解释性与可靠性形成了挑战,研究者需要权衡模型的性能与可解释性,因此部分研究更倾向于采用性能较高的深度神经网络或集成模型,刻意避免逻辑回归等内在可解释性强的模型。
2.4.3 未形成标准化临床应用流程
临床疗效预测模型的研究产出与临床应用之间存在着脱节。主要体现在三方面:①模型的可用性与辅助决策功能不足[32];②不同研究的模型纳入标准、预测指标和输出格式上差异大,缺乏统一的应用规范与报告指南;③模型普遍缺乏瞻性临床验证。
3未来研究方向与优化策略
针对上述NSCLC新辅助治疗疗效预测模型面临的问题,我们应该通过制定客观严谨的标准化的研究模型来解决问题,同时明确未来发展方向。
3.1 标准化建模与验证流程
针对小样本量、模型选择与样本量不匹配的问题,我们应该根据实际样本规模来选择合适的算法,首先需要保证模型的稳健性与可解释性,尽量避免小样本与复杂模型不匹配导致过拟合。在验证流程方面需要构建并遵循标准化的内部验证规范,避免性能被高估;同时需要进一步加强外部独立验证和多中心协作,通过更大规模的数据验证模型的泛化能力。在报告规范层面需要严格遵循TRIPOD等规范,提高研究透明度和可复现性;完善模型评估体系,完整报告临床关键指标并进行临床实用性评估。
3.2 精准化特征筛选体系
面对特征选择缺乏长期统一标准等问题,需构建结合临床知识和算法优化的综合筛选框架、制定客观的验证标准来增强特征选择的客观性与合理性。在生物标志物检测的异质性强问题上,需推进客观标准化建设生物标志物检测流程,降低跨平台导致的差异;在提升特征应用的可靠性与适用性方面,优先选用临床更易获取、检测成本低的常规指标,
3.3轻量化数据应用路径
多组学的兴起为预测模型带来了更多的数据维度,但同时其高昂的人力和技术成本也一定程度上限制了推广。这提示应该用一种更理性的态度对待多组学的价值,不盲目追求数据复杂度,在此基础上探索包含核心特征的轻量化模式。
3.4体系化临床转化机制
在技术层面,应开发自动化标注工具与轻量模型来降低专业人力与硬件门槛,利用可解释性人工智能技术提升临床信用度;制定统一的应用规范,将预测概率转变为实际的分层治疗建议;加强前瞻性验证,推动其向临床实践转化。
4结语
目前NSCLC预测模型不断向复杂化方向发展,但应明确临床转化方向:未来研究重心应明确临床需求,以适配建模、严谨化验证、规范化报告和多中心协作作为策略,从追求更复杂的模型转向主球更适用更具推广性的工具,最终实现肺癌精准治疗体系的成熟与完善。
参考文献:
- [1] Han B, Zheng R, Zeng H, et al. Cancer incidence and mortality in China,2022[J]. Journal of the national cancer center,2024,4(01):47-53.
- [2] Riely G J, Spira A I, Ahn M J, et al. NCCN guidelines insights: Non-small cell lung cancer, Version1.2026[J]. Journal of the national comprehensive cancer network,2025,23(11): e255003.
- [3] Wang C, Zhang Z, Li M, et al. Neoadjuvant nivolumab plus chemotherapy versus chemotherapy for resectable NSCLC: Subpopulation analysis of Chinese patients in CheckMate816[J]. ESMO open,2023,8(06):102040.
- [4] Pao W, Girard N. New driver mutations in non-small-cell lung cancer[J]. Lancet oncol,2011,12(02):175-180.
- [5] Zhang X. Research progress on immunotherapy in triple-negative breast cancer (Review)[J]. International journal of oncology,2022,61(02):95.
- [6] Shu C, Zhu D, Zhou Q, et al. Biomarkers for neoadjuvant immune checkpoint inhibitors in non-small cell lung cancer[J]. Chinese journal of lung cancer,2022,25(02):130-136.
- [7] Mo D, Chen Y, Chen R, et al. The role of PD-L1 in patients with non-small cell lung cancer receiving neoadjuvant immune checkpoint inhibitor plus chemotherapy: A meta-analysis[J]. Scientific reports,2024,14(01):26200.
- [8] Rajpurkar P, Chen E, Banerjee O, et al. AI in health and medicine[J]. Nature medicine,2022,28(01):31-38.
- [9] Gainey J C, Patton C M, Liu F, et al. Predictive power of deep-learning segmentation based prognostication model in non-small cell lung cancer[J]. Frontiers in oncology,2023,13:868471.
- [10] Kumar S, Agarwal A, Chatterjee S. Feature learning augmented with sampling and heuristics (FLASH) improves model performance and biomarker identification[J]. Npj systems biology and applications,2025,11(01):137.
- [11] Abbasi A F, Sajjad M, Asim M N, et al. Multi-omics driven computational framework for cancer molecular subtype classification[J]. Scientific reports,2025, in press.
- [12] Hsu C Y, Askar S, Alshkarchy S S, et al. AI-driven multi-omics integration in precision oncology: Bridging the data deluge to clinical decisions[J]. Clinical and experimental medicine,2025,26(01):29.
- [13] Wang X, Lamberti G, Di Federico A, et al. Tumor mutational burden for the prediction of PD-(L)1 blockade efficacy in cancer: Challenges and opportunities[J]. Annals of oncology,2024,35(06):508-522.
- [14] Hu M, Li X, Lin H, et al. Easily applicable predictive score for MPR based on parameters before neoadjuvant chemoimmunotherapy in operable NSCLC: A single-center, ambispective, observational study[J]. International journal of surgery,2024,110(04):2275-2287.
- [15] Suay G, Garcia-Cañaveras J C, Aparisi F, et al. Sex differences in the efficacy of immune checkpoint inhibitors in neoadjuvant therapy of non-small cell lung cancer: A meta-analysis[J]. Cancers (Basel),2023,15(18):4433.
- [16] Jiang Q Y, Xue R Y. Neutrophil-to-lymphocyte ratio and platelet-to-lymphocyte ratio: Markers predicting immune-checkpoint inhibitor efficacy and immune-related adverse events[J]. World journal of gastrointestinal oncology,2024,16(03):577-582.
- [17] Wu R, Wei K, Huang X, et al. Multi-omics analysis reveals the sensitivity of immunotherapy for unresectable non-small cell lung cancer[J]. Frontiers in immunology,2025,16:1479550.
- [18] Moglia V, Johnson O, Cook G, et al. Artificial intelligence methods applied to longitudinal data from electronic health records for prediction of cancer: A scoping review[J]. BMC medical research methodology,2025,25(01):24.
- [19] Yang H, Yang M, Chen J, et al. Multimodal deep learning approaches for precision oncology: A comprehensive review[J]. Brief bioinform,2024,25(01): bbad518.
- [20] Yang C, Kors JA, Ioannou S, et al. Trends in the conduct and reporting of clinical prediction model development and validation: A systematic review[J]. Journal of the american medical informatics association,2022,29(05):983-989.
- [21] Andaur Navarro C L, Damen J A A, et al. Completeness of reporting of clinical prediction models developed using supervised machine learning: A systematic review[J]. BMC medical research methodology,2022,22(01):12.
- [22] Yan P, Xu Z, Hui X, Chu X, et al. The reporting quality and methodological quality of dynamic prediction models for cancer prognosis[J]. BMc medical research methodology,2025,25(01):58.
- [23] Binuya M A E, Engelhardt E G, Schats W, Schmidt M K, Steyerberg E W. Methodological guidance for the evaluation and updating of clinical prediction models: A systematic review[J]. BMC Medical Research Methodology,2022,22(01):316.
- [24] Staartjes V E, Kernbach J M, Stumpo V, et al. Foundations of feature selection in clinical prediction modeling[J]. Acta Neurochirurgica Supplementum,2022,134(134):51-57.
- [25] Li Y, Wang Y, Liu Z, Chen Y, et al. Neutrophil-to-lymphocyte ratio predicts outcome of lung cancer patients treated with immune checkpoint inhibitors: A meta-analysis[J]. Medicine (Baltimore),2022,101(34): e28617.
- [26] Lu X, Wan J, Shi H. Platelet-to-lymphocyte and neutrophil-to-lymphocyte ratios are associated with the efficacy of immunotherapy in stage III/IV non-small cell lung cancer[J]. Oncology letters,2022,24(02):266.
- [27] Hempenius M A, Koomen B M, Deckers I A G, et al. Considerable interlaboratory variation in PD-L1 positivity for head and neck squamous cell carcinoma in the Netherlands: a nationwide evaluation study[J]. Histopathology,2024,85(01):133-142.
- [28] Li Y, Herold T, Mansmann U, Hornung R. Does combining numerous data types in multi-omics data improve or hinder performance in survival prediction? Insights from a large-scale benchmark study[J]. BMC medical informatics and decision making,2024,24(01):244.
- [29] 李建生,何斌. 重视人工智能在医学影像中的研究与应用[J]. 中国中西医结合影像学杂志,2022,20(04):305-308.
- [30] Gao Z, Mao A, Dong Y, et al. SMMILe enables accurate spatial quantification in digital pathology using multiple-instance learning[J]. Nature cancer,2025,6(12):2025-2041.
- [31] Ai Y, Du X, Liu J, et al. Biologically interpretable model for precise recurrence prediction of non-small cell lung cancer[C]//Annual international conference of the IEEE engineering in medicine and biology society.2024.
- [32] Dingle L. A comparison and analysis of explainable clinical decision making using white box and black box models[D].Lakehead University,2024.
- [33] Markowetz F. All models are wrong and yours are useless: making clinical prediction models impactful for patients[J]. NPJ precision oncology,2024,8(01):54.
- [34] Shiferaw K B, Roloff M, Balaur I, et al. Guidelines and standard frameworks for artificial intelligence in medicine: A systematic review[J]. Journal of the American medical informatics association open,2025,8(01): ooae155.
