Schizophrenia:首次发作精神病患者功能预后多变量预测模型的交叉验证:基于EUFEST和PSYSCAN的研究
医疗资讯网-妇科问诊
首次发作精神病(First-Episode Psychosis,FEP)的患者在功能预后上存在极大的异质性。精神分裂症谱系障碍患者的长期功能恢复非常复杂,因此,开发预测患者功能预后的工具对临床决策尤为关键。近年来,机器学习技术在精神病学中被广泛应用,以从多变量数据中学习复杂关联,从而对个体患者的预后做出预测。本研究旨在通过两个大规模国际队列——EUFEST和PSYSCAN,开发和验证首次发作精神病患者一年后功能预后的多变量预测模型,并采用交叉验证方法评估模型的地理推广性。
本研究基于来自两个大型国际队列的数据,EUFEST(338名患者)和PSYSCAN(226名患者)。EUFEST是一项多中心、开放标签、随机对照试验,比较了不同抗精神病药物治疗首次发作精神病患者的效果,随访一年。PSYSCAN是一个自然观察性的纵向研究,旨在评估精神分裂症谱系障碍患者的早期阶段,包含来自多个中心的首次发作精神病患者。研究使用了Global Assessment of Functioning(GAF)量表作为功能预后评估工具,GAF评分低于65被定义为功能不良,GAF评分65及以上则被定义为功能良好。
机器学习模型开发基于Koutsouleris等人提出的交叉验证和支持向量机(SVM)算法。研究首先在两个数据集中选择了重叠的基线变量,使用5-最近邻法处理缺失值,并将数据标准化到[0-1]区间。在模型开发中,采用20次外部交叉验证(CV2)和5次内部交叉验证(CV1)的嵌套交叉验证框架,并使用贪婪向前特征选择来识别最具预测性的变量。然后在两个数据集中分别训练模型,并使用交叉验证策略评估模型的表现。
图1. 各分类中最重要的预测基线变量对比
在EUFEST和PSYSCAN的数据中,分别有23.1%和50%的患者在一年后表现出功能不良的预后(GAF < 65)。基于EUFEST数据训练的SVM模型在内部交叉验证中,预测功能不良的患者的平衡准确率为66.1%,而基于PSYSCAN数据训练的模型预测准确率为64.6%。然而,当这些模型应用于另一个数据集时,准确率显著下降,平衡准确率分别降低了9.9%和14.6%。
尽管模型在交叉验证中表现出一定的预测能力,模型的外部验证结果显示出预测能力显著下降,尤其是敏感性和特异性的不平衡。例如,EUFEST模型在PSYSCAN数据中的敏感性达到82.3%,但特异性仅为30.1%。尽管如此,联合两个数据集的离站分析模型表现相对较好,平衡准确率达到72.4%,说明通过结合不同研究设计的数据可以提高模型的推广性。
进一步分析显示,预测功能不良的重要基线特征包括病情严重程度(CGI评分)、当前或反复发作的抑郁症状、强迫症和教育问题,而基线GAF评分和收缩压对功能良好的预测更为显著。此外,在EUFEST数据中,阿米舒必利(Amisulpride)治疗与良好功能预后相关。
图2. 不同模型中基线预测变量的交叉验证比率
本研究表明,尽管基于机器学习的模型能够在单一数据集中预测首次发作精神病患者的功能预后,但在应用于独立样本时,其表现显著下降,反映了预测模型的外部验证对模型实际临床应用至关重要。通过联合不同研究设计的数据可以提高模型的预测能力,然而,由于不同数据集之间的校准问题仍然存在,因此在临床实践中应用此类预测模型之前,需进行更大规模、跨地域的外部验证。此外,未来研究应致力于建立标准化的功能预后评估工具,以提高不同研究间模型的可比性和推广性。
原始出处:
Slot MIE, Urquijo Castro MF, Winter - van Rossum I, et al. Multivariable prediction of functional outcome after first-episode psychosis: a crossover validation approach in EUFEST and PSYSCAN. Schizophrenia. 2024;10:89. DOI:10.1038/s41537-024-00505-w.