Предсказание сердечно-сосудистых событий при помощи комплексной оценки факторов риска с использованием методов машинного обучения

DOI: https://doi.org/10.29296/25877305-2020-05-08
Скачать статью в PDF
Номер журнала: 
5
Год издания: 
2020

Д.В. Гаврилов(1), Л.М. Серова(1), кандидат технических наук, И.Н. Корсаков(1), кандидат физико-математических наук, А.В. Гусев(1), кандидат технических наук, Р.Э. Новицкий(1), Т.Ю. Кузнецова(2), доктор медицинских наук (1)ООО «К-Скай», Петрозаводск (2)Петразоводский государственный университет E-mail: dgavrilov@webiomed.ai

Актуальность: профилактика сердечно-сосудистых заболеваний (ССЗ) является актуальной проблемой, связанной с лидирующем уровнем смертности от них в мире, различными способами оценки сердечно-сосудистого риска, точностью его определения. Цель: разработать модель при помощи машинного обучения для предсказания сердечно-сосудистого риска и валидировать ее с использованием российских медицинских данных. Материал и методы: набор данных для обучения получен из Фрамингемского исследования, в него входили 4363 пациента без ССЗ, из которых 852 (19,5%) умерли от инфаркта миокарда и инсульта в течение 10 лет с начала наблюдения. Входящие признаки модели: пол, возраст, систолическое АД, холестерин, курение, индекс массы тела, частота сердечных сокращений. Исходный набор данных был разделен на 2 части: учебный набор данных «train» (80% записей) и набор данных проверки «validate» (оставшиеся 20%). Дополнительно было проведено тестирование модели на внешнем наборе данных «test», который включал 411 деперсонифицированных данных пациентов российской популяции. Результаты: итогом работы стала модель WML.CVD.Score, построенная методом последовательной нейронной сети с одним входным, двумя скрытыми и одним выходным слоем. Результаты точности на учебном наборе данных: Accuracy – 81,15%, AUC – 0,80. Эти же показатели на проверочном наборе данных «validate» составили: Accuracy – 81,1%, AUC 0,76. Результаты тестирования на наборе данных «test»: Accuracy – 79,07, AUC – 0,86. На российских тестовых данных AUC для шкалы SCORE составила 0,81 против 0,86 для разработанной модели, что показало обоснованность применения машинного обучения с целью повышения прогностической модели. Заключение: разработанная модель продемонстрировала высокую точность предсказания сердечно-сосудистых событий как при внутренней, так и при внешней валидации.

Ключевые слова: 
кардиология
сердечно-сосудистые заболевания
факторы риска
моделирование риска
машинное обучение

Для цитирования
Д.В. Гаврилов, Л.М. Серова, И.Н. Корсаков, А.В. Гусев, Р.Э. Новицкий, Т.Ю. Кузнецова Предсказание сердечно-сосудистых событий при помощи комплексной оценки факторов риска с использованием методов машинного обучения . Врач, 2020; (5): 41-46 https://doi.org/10.29296/25877305-2020-05-08


It appears your Web browser is not configured to display PDF files. Download adobe Acrobat или click here to download the PDF file.

Список литературы: 
  1. WHO Global Action Plan for the Prevention and Control of Non-communicable Diseases 2013–2020 (resolution WHA66.10, 27 May 2013) Available at: http://apps.who.int/gb/ebwha/pdf_files/WHA66/A66_R10-en.pdf?ua=1 [Accessed 27 Mar. 2020].
  2. Федеральная служба государственной статистики [Federal State Statistic Service (in Russ.)]. Available at: https://gks.ru/folder/13721 [Accessed 27 Mar. 2020].
  3. Паспорт национального проекта «Здравоохранение» (утв. Президиумом Совета при Президенте РФ по стратегическому развитию и национальным проектам, протокол от 24.12.2018 №6) [Passport of the national project «Healthcare» (in Russ.)] Available at: http://www.consultant.ru [Accessed 27 Mar. 2020].
  4. Шляхто E.В., Звартау Н.Э., Виллевальде C.В. и др. Система управления сердечно-сосудистыми рисками: предпосылки к созданию, принципы организации, таргетные группы. Рос. кардиол. журн. 2019; 24 (11): 69–82 [Shlyakhto E.V., Zvartau N.E., Villevalde S.V. et al. Cardiovascular risk management system: prerequisites for developing, organization principles, target groups. Russian Journal of Cardiology. 2019; 24 (11): 69–82 (in Russ.)]. DOI: 10.15829/1560-4071-2019-11-69-82
  5. Белялов Ф.И. Шкалы прогноза сердечно-сосудистых заболеваний. Архив внутренней медицины. 2015; 5: 19–21 [Belyalov F.I. Prognostic scores for cardiovascular diseases. The Russian Archives of Internal Medicine. 2015; 5: 19–21 (in Russ.)].
  6. Бойцов С.А., Шальнова С.А., Деев А.Д. и др. Моделирование риска развития сердечно-сосудистых заболеваний и их осложнений на индивидуальном и групповом уровнях. Тер. арх. 2013; 85 (9): 4–10 [Boitsov S.A., Shalnova S.A., Deev A.D. et al. Simulation of a risk for cardiovascular diseases and their events at individual and group levels. Therapeutic archive. 2013; 85 (9): 4–10 (in Russ.)].
  7. Weng S.F., Reps J., Kai J. et al. Can machine-learning improve cardiovascular risk prediction using routine clinical data? PLoS One. 2017; 12 (4): e0174944. DOI: 10.1371/journal.pone.0174944
  8. Angraal S., Mortazavi B.J., Gupta A. et al. Machine Learning Prediction of Mortality and Hospitalization in Heart Failure With Preserved Ejection Fraction. JACC: Heart Failure. 2020; 8 (1): 12–21. https://doi.org/10.1016/j.jchf.2019.06.013
  9. Meyer A., Zverinski D., Pfahringer B. et al. Machine learning for real-time prediction of complications in critical care: a retrospective study. Lancet Respir. Med. 2018; 6 (12): 905–14. https://doi.org/10.1016/S2213-2600(18)30300-X
  10. Kuznetsova T., Novitskiy R., Gusev A. et al. Deep and machine learning models to improve risk prediction of cardiovascular disease using data extraction from electronic health records. Eur. Heart J. 2019; 40 (Suppl. 1): 1923–4. https://doi.org/10.1093/eurheartj/ehz748.0670
  11. Clinical Practice Research Datalink, reference number: CPRD00039761. Available at: https://www.cprd.com
  12. European guidelines on cardiovascular disease prevention in clinical practice: third joint task force of European and other societies on cardiovascular disease prevention in clinical practice (constituted by representatives of eight societies and by invited experts). Eur. J. Cardiovasc. Prev. Rehabil. 2003; 10 (4): 1–10. DOI: 10.1097/01.hjr.0000087913.96265.e2
  13. Conroy R.M., Pyorala K., Fitzgerald A.P. et al. Estimation of ten-year risk of fatal cardiovascular disease in Europe: the SCORE project. Eur. Heart J. 2003; 24: 987–1003. DOI: 10.1016/s0195-668x(03)00114-3
  14. Beunzaa J.-J., Puertasa E. et al. Comparison of machine learning algorithms for clinical event prediction (risk of coronary heart disease). J. Biomed. Inform. 2019; 97: 103257. DOI:10.1016/j.jbi.2019.103257
  15. Fawcett T. An introduction to ROC analysis. Pattern Recognition Letters. 2006; 27 (8): 861–74. https://doi.org/10.1016/j.patrec.2005.10.010