使用光电容积脉搏波(PPG)和深度学习技术预测心血管疾病(CVD)风险

论文Predicting cardiovascular disease risk using photoplethysmography and deep learning主要探讨了使用光电容积脉搏波(PPG)和深度学习技术预测心血管疾病(CVD)风险的可行性。研究背景是心血管疾病是全球早逝的主要原因之一,尤其在资源有限的低收入和中等收入国家(LMICs)中,早期检测和干预至关重要。然而,现有的CVD风险评估通常需要体检或实验室检测,这在资源有限的地区可能难以实现。该研究提出了一种基于PPG的深度学习评分系统(DLS),通过仅使用年龄、性别、吸烟状况和PPG数据来预测未来十年内发生主要不良心血管事件(MACE)的风险。

论文作者为Wei-Hung Weng ,Sebastien Baur ,Mayank Daswani ,Christina Chen,Lauren Harrell,Sujay Kakarmath,Mariam Jabara,Babak Behsaz,Cory Y. McLean,Yossi Matias,Greg S. Corrado,Shravya Shetty,Shruthi Prabhakara ,Yun Liu,Goodarz Danaei,Diego Ardila,来自Google和Harvard School of Public Health。

论文内容概要如下:

一、研究背景

心血管疾病(CVD)是全球范围内的主要健康问题,尤其在低收入和中等收入国家(LMICs),由于医疗资源有限,早期检测和干预措施常常难以有效实施。传统的心血管风险评分依赖于血压、胆固醇等实验室测量数据以及体检信息,这些在资源有限的环境中难以普及。为解决这一问题,研究者探索了利用光电容积脉搏波(PPG)和深度学习技术进行心血管风险预测的可能性。PPG是一种简单、低成本且易于通过智能手机获取的技术,广泛用于心率监测。该研究旨在开发一种基于PPG信号的深度学习评分系统(DLS),以更便捷的方式预测未来十年内发生主要不良心血管事件(MACE)的风险。

二、方法论与实验设计

1. 数据来源与处理

该研究的数据来源于UK Biobank,其中包含141,509名参与者的开发数据集和54,856名参与者的测试数据集。研究者通过地理位置对数据集进行了分层,确保了模型的外部有效性。PPG数据通过一款名为PulseTrace PCA2的脉搏波设备采集,该设备能输出标准化的100时间单位的PPG波形信号。为了处理这些数据,研究者应用了一维ResNet18深度学习模型,提取PPG特征并通过主成分分析(PCA)将其简化为五个主要特征。这些特征随后与年龄、性别、吸烟状态等人口统计学信息一同输入Cox比例风险模型,用于预测未来十年内的MACE风险。

2. 模型开发与验证

模型分为两个主要部分:PPG特征提取器和Cox比例风险模型。在特征提取阶段,ResNet18模型被用来学习PPG波形的低维嵌入表示。随后,研究者使用这些嵌入表示和人口统计学信息开发了Cox模型。模型的训练、验证和测试均在不同的地理区域上进行,以验证其在不同环境下的稳健性。此外,研究者还将DLS模型的表现与重新拟合的WHO评分系统进行了比较,后者基于传统的体检数据(如BMI、血压等)进行CVD风险预测。

三、结果分析

1. 模型性能

DLS模型在测试数据集上的C统计量为71.1%,显示出与传统的WHO评分系统(70.9%)相当的性能。更为重要的是,DLS模型的校准性能良好,平均绝对校准误差为1.8%,这表明模型在不同的风险区间上预测的准确性较高。此外,将DLS模型的特征与传统的WHO评分系统相结合,可以进一步提升C统计量,增加1.0%。

2. 解释性分析

研究者还对DLS模型提取的PPG特征进行了深入分析,发现这些特征与PPG波形的形态学变化密切相关,尤其是与波形中的峰值位置和反射指数相关联。通过对这些特征的危害比(HR)和Spearman相关系数的分析,研究者确认了部分PPG特征与MACE风险之间的显著相关性,这为理解PPG波形在心血管疾病预测中的作用提供了重要线索。

四、讨论与潜在影响

1. 研究贡献

该研究的一个重要贡献在于展示了PPG信号与深度学习技术相结合的潜力,为在资源有限的环境中进行大规模CVD筛查提供了一种创新的解决方案。通过不依赖实验室数据或复杂的体检信息,DLS模型可以作为一种低成本、易获取的风险评估工具,帮助早期识别高风险个体,从而优化医疗资源配置。

2. 临床应用潜力

研究表明,DLS模型不仅在性能上与传统方法相当,而且在实际应用中可能更加灵活,特别是在没有专业医疗设备的情况下。随着智能手机的普及,未来可以进一步开发基于智能手机的PPG数据采集和风险预测工具,这将显著降低CVD筛查的门槛,特别是在LMICs。

五、局限性与未来研究方向

1. 数据局限性

虽然该研究展示了DLS模型的可行性,但其仅在UK Biobank数据集上进行了验证,这可能限制了其在其他人群中的泛化能力。尤其是UK Biobank数据主要来自高收入国家,尚需在更具代表性的低收入和中等收入国家人群中进行验证。此外,研究所用的PPG数据来自单一设备和严格控制的实验条件,而实际应用中可能存在更多的噪声和变异。

2. 未来研究方向

未来的研究应着重于在更多样化的人群中验证DLS模型的有效性,尤其是在资源有限的环境中。进一步的工作还应探索如何将模型应用于不同的PPG采集设备上,包括智能手机,以评估其在实际环境中的性能。此外,研究者还可以考虑引入更多的健康指标或基因数据,以进一步提高模型的预测能力和适用性。

六、结论

论文通过引入深度学习技术,展示了基于PPG信号的心血管疾病风险预测的可行性。研究结果表明,DLS模型在不依赖传统体检数据的情况下,可以有效预测未来十年内的MACE风险,尤其适用于资源有限的环境。尽管当前的研究仍存在一些局限性,但其为未来的临床应用提供了重要的参考依据,并可能在全球范围内推动更广泛的CVD筛查和预防策略的实施。


Smartphone PPG software library on GitHub: https://github.com/google-research/CVD-paper-mobile-camera-example

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注