Davide Carino, et al. Is the EuroSCORE II reliable in surgical mitral valve repair?-A single-centre validation study. European Journal of Cardio-Thoracic Surgery 2020
摘 要
背景:
EuroSCORE II评分广泛应用于预测经开胸以及介入治疗的心血管手术患者的30天死亡率。本研究基于单中心大样本量,旨在评估EuroSCORE II评分对于二尖瓣成形手术的患者30天死亡率的预测价值。
方法:
回顾性分析本中心的数据库,寻找2012年1月至2019年12月在我们科室接受二尖瓣成形的所有患者。使用ROC曲线(受试者工作特征曲线)来评估EuroSCORE II评分的区分度。使用最大约登指数来定义最佳临界值。通过校准曲线评估校准度,直观地用校准曲线比较预测死亡率和实际死亡率。同时使用Hosmer-Lemeshow检验进行校准度的拟合优度检验。最后,用Brier分数验证模型的准确度。
结果:
共计纳入2645例患者,EuroSCORE II评分的中位数是1.3% (0.6-2.0%)。对于退行性二尖瓣返流(MR)患者的30天死亡率的预测,EuroSCORE II评分表现为区分度低(曲线下面积AUC为0.68)、准确度低(Brier分数为0.27)且校准度差(虚高)。对于继发性MR患者30天死亡率的预测,EuroSCORE II评分总体表现较好,区分度高(AUC为0.88),准确度高(Brier分数为0.003)且校准度好。
结论:
对于在高水平、大手术量的中心进行成形手术的退行性MR患者而言,EuroSCORE II评分会高估其30天死亡率。
讨 论
在现今的心血管手术实践中,预测模型意义重大,而EuroSCORE II是评估围手术期死亡风险用得最多的一种工具。
尽管EuroSCORE II评分最初构建时有超过1900名二尖瓣成形研究人群(在大中心治疗),但它从未经受同时期的大样本量验证。此外,也没有将退行性和继发性MR患者(两者临床特征不同、病理原因不同、转归不同)进行分类验证。
我们的研究主要发现如下:
EuroSCORE II评分最初的构建目的是提高旧模型EuroSCORE的准确度。许多队列研究显示EuroSCOR II有更好的区分度,AUC大于0.8。然而,它的表现取决于不同的手术类型,并且在高危患者中表现更差。到目前为止,与我们类似的退行性MR的死亡率被高估的情况还没有被报导过,30天实际死亡率在我们的观测中是很低的(0.39%; 10/2530),这也反映了我们中心在二尖瓣成形手术方面技术水平优异。事实上,二尖瓣成形后的容量负荷和转归之间的高度相关性已经被证实。我们的结果在某种程度上与Osnabrugge等人的研究形成了对比。在他们的亚组分析中有1000例患者(未根据病因进行研究分类)在美国多个中心接受二尖瓣成形手术,其EuroSCORE II的表现比我们的更好,AUC为0.82,校准度也更好。尽管基线的EuroSCORE II中位数相近,但与之在评分结果上的显著差异可以解释为他们(1.32%)和我们(0.39%)的患者30天实际死亡率上的差距。将一个在某专业领域水平较高的中心与在该领域水平不同的多个中心团体进行数据对比时往往产生这种结果。
虽然EuroSCORE II在我们退行性MR的队列中表现不佳,但在继发性MR的患者中表现出了较高的区分度、较高的校准度和较好的准确性。总所周知,退行性和继发性MR是两种完全不同的疾病类型,在患者概况、自然病史和治疗转归上均不同。毋庸置疑,在我们的研究队列中,继发性和退行性MR患者的风险预测(EuroSCORE II中位数为2.4% vs 1%)和30天死亡率(2.6% vs 0.39%)均存在显著差异。也就是说EuroSCORE II对继发性MR患者的30天死亡率预测有更好的区分度、校准度和准确性。
本研究的主要局限性在于缺乏长期随访。不过,我们的目的仅仅是验证EuroSCORE II对于30天死亡率的预测,而不是长期存活率。另一个相对局限性是,与退行性MR患者队列相比,继发性MR患者的样本量较小。最后,本研究的结论不适用于因风湿性或心内膜炎进行二尖瓣成形的患者。事实上,由于样本量有限,这两类患者都被特意剔除,结果也可能因此增加偏差风险。
正文图表
表1:两组患者术前特征
表2: 手术特征变量
表3:术后并发症
图1+2:左:退行性MR患者的ROC曲线。AUC为0.68,表明在低手术风险患者队列中,EuroSCORE II的区分度相对较低(EuroSCORE II中位数为1%)。右:退行性MR患者的EuroSCORE II样条曲线。该图以非线性方式突出显示了低手术风险患者30天死亡率的高估。
图3+4:左:继发性MR患者的ROC曲线。AUC为0.86,表明在高手术风险患者队列中,EuroSCORE II的区分度相对较高(EuroSCORE II中位数为2.4%)。右:继发性MR患者的EuroSCORE II样条曲线。该图以非线性方式突出显示了低手术风险患者评分的校准度更好,而当EuroSCORE II> 5%则明显倾向于高估死亡率。
表4:EuroSCOSE II在两组中的表现:不同检验的最佳表现。
Brier分数=0;越接近1,整体精度越差。
AUC:越接近1,检测方法真实性越高;等于0.5时,则准确度最低,无应用价值
Somers’Dxy=1时最佳;与1越接近,区分度越好。
尤登(Youden)的指数定义了最佳的临界点,这是得分表现最大化的地方。斜率:接近1,校准效果更好。截距:越接近0,校准越好。
Hosmer–Lemeshow的拟合优度:P值不显著表明校验良好