Prediction of Cardiovascular Diseases Using Machine Learning Models

Authors

  • Michael Rafael Rodríguez Rodríguez Universidad CESMAG, Facultad de Ingeniería, Ingeniería de Sistemas. Pasto, Colombia Author
  • Claudia Alejandra Delgado Calpa Universidad CESMAG, Facultad de Ingeniería, Ingeniería de Sistemas. Pasto, Colombia Author
  • Héctor Andrés Mora Paz Universidad CESMAG, Facultad de Ingeniería, Ingeniería de Sistemas. Pasto, Colombia Author

DOI:

https://doi.org/10.56294/shp2026364

Keywords:

Cardiovascular diseases, machine learning, kernel functions, SVM, preventive diagnosis

Abstract

The study addressed the global problem of cardiovascular diseases, which were one of the leading causes of mortality and morbidity according to the World Health Organisation. Multiple risk factors, both modifiable and non-modifiable, were identified, and the need to implement technologies that would enable early and accurate detection was emphasised. Given this scenario, the use of machine learning algorithms such as Support Vector Machines (SVM) and Artificial Neural Networks (ANN), combined with traditional and alternative kernel functions, was proposed. A comparative approach was developed to validate the hypothesis that under-explored kernel functions could improve predictive performance in terms of accuracy and response time. To this end, models were trained with data extracted from recognised platforms such as Kaggle and UCI, and metrics such as accuracy, recall and F1-score were applied. The models were adjusted with hyperparameter optimisation techniques using random search. The results demonstrated that certain alternative kernel functions offered improvements in the error-time ratio, in some cases outperforming conventional kernels. The research not only contributed methodological advances in the development of predictive models, but also provided a support tool for clinical decision-making, particularly useful in contexts where timely diagnosis is crucial. Finally, the project contributed to strengthening artificial intelligence in public health, promoting well-being through the prevention and proactive management of cardiovascular diseases.

References

1. Patiño Zambrano CF. Dispositivo vestible inteligente para la generación de alertas tempranas de eventos cardiovasculares de riesgo. Envigado; 2022.

2. Sanofi Campus. Machine Learning y predicción de enfermedades cardiovasculares [Internet]. 2022 [citado 25 de febrero de 2023]. Disponible en: https://campus.sanofi.es/es/noticias/machine-learning-prediccion-enfermedades-cardiovasculares

3. Gómez LA. Las enfermedades cardiovasculares: un problema de salud pública y un reto global. SciELO. 2011;1.

4. Pérez Leal LE, Buitrago Cárdenas JA. Predicción del diagnóstico de diabetes a partir de perfiles clínicos de pacientes utilizando aprendizaje automático. Bogotá: Universidad Antonio Nariño; 2021.

5. Gallego Valcárcel DA, Lucas Monsalve DF. Modelos de aprendizaje automático para la predicción del riesgo de fatalidad por insuficiencia cardíaca con datos clínicos. Bogotá: Universidad Antonio Nariño; 2021.

6. Álvarez Vega M, Quirós Mora LM, Cortés Badilla MV. Inteligencia artificial y aprendizaje automático en medicina. Rev Méd Sinergia. 2020;5(8):12.

7. Mora Paz HA. Comparativo de Kernels sobre predicción de oferta de fuentes alternativas de energía. Pasto: UNIR La Universidad en Internet; 2019.

8. Friedman PA, Kapa S, López Jiménez F, Noseworthy PA. Inteligencia artificial en cardiología [Internet]. Mayo Clinic; 2023 [citado 22 de mayo de 2023]. Disponible en: https://www.mayoclinic.org/es-es/departments-centers/ai-cardiology/overview/ovc-20486648

9. Aprende IA. Kernel y máquinas de vectores de soporte [Internet]. Aprende IA; [citado 6 de abril de 2023]. Disponible en: https://aprendeia.com/kernel-maquinas-vectores-de-soporte-clasificacion-regresion/

10. Sowmya V, Sanjana K, Gopalakrishnan E, Soman KP. Inteligencia artificial explicable para la variabilidad de la frecuencia cardíaca en la señal de ECG. Health Technol Lett. 2020;7(6):146.

11. Wu H, Yang L, Jin X, Zheng P. Study of cardiovascular disease prediction model based on random forest in eastern China. Sci Rep. 2020;10(1):5245.

12. Chavez Olivera O, Galindo Honores L, Barrientos Padilla A, Cuadros Galvez M. Aplicación móvil para predecir la probabilidad de pertenecer al grupo de riesgo cardiovascular utilizando machine learning. En: XII Conf Iberoamericana de Complejidad, Informática y Cibernética. Lima; 2022.

13. Scavino M, Castrillejo A, Estragó Mérola VS, Luraghi López LE, Muñoz M, Álvarez Vaz R. Informe final publicable del proyecto de creación de algoritmos utilizando técnicas de clasificación supervisada y no supervisada para el diagnóstico de enfermedades cardiovasculares. Uruguay; 2022.

14. Polero LD, Garmendia CM, Echegoyen RE, Alves de Lima A, Bertón F, Lambardi F, et al. Predicción de riesgo de sufrir un síndrome coronario agudo mediante un algoritmo de Machine Learning (ANGINA). Rev Argent Cardiol. 2020;88(1).

15. Perez Tatis JD. Optimización de un modelo de clasificación de enfermedades cardiovasculares utilizando técnicas de aprendizaje profundo supervisado y despliegue de dashboard web. Cartagena; 2021.

16. Martínez EJ. Predicción de enfermedades cardiovasculares mediante algoritmos de inteligencia artificial. Málaga; 2020.

17. Carrascal Porras FL, Florez Prias LA. Modelo de inteligencia artificial como apoyo diagnóstico para la estimación de riesgo cardiovascular en pacientes atendidos bajo la modalidad de telemedicina. Sucre: UNAD; 2021.

18. Dolores C, Ordovás J. Genes, dieta y enfermedades cardiovasculares. Genética. 2007;5:71–118.

19. Martínez EJ. Predicción de enfermedades cardiovasculares. Málaga: Universidad de Málaga; 2020.

20. Sans Menéndez S. Enfermedades cardiovasculares. Barcelona: Institut d'Estudis de la Salut; 2011.

21. Perez Tatis JD. Optimización de un modelo de clasificación de enfermedades cardiovasculares utilizando técnicas de aprendizaje profundo supervisado y despliegue de dashboard web. Cartagena: Universidad del Sinú; 2021.

22. MathWorks. Máquina de soporte vectorial (SVM) [Internet]. [citado 28 de marzo de 2023]. Disponible en: https://es.mathworks.com/discovery/support-vector-machine.html

23. Ecured. Función kernel [Internet]. [citado 27 de marzo de 2023]. Disponible en: https://www.ecured.cu/Funci%C3%B3n_Kernel

24. Wikipedia. Clasificador lineal [Internet]. 2019 [citado 30 de abril de 2023]. Disponible en: https://es.wikipedia.org/wiki/Clasificador_lineal

25. Tibco Data Science. ¿Qué es el aprendizaje supervisado? [Internet]. [citado 28 de marzo de 2023]. Disponible en: https://www.tibco.com/es/reference-center/what-is-supervised-learning

26. Montiel de Jesús A. Desarrollo de una aplicación para dispositivos móviles para la detección temprana de enfermedades cardiovasculares. Orizaba, México: TECNM; 2022.

27. Sitio BigData. Modelos de Machine Learning: Métricas de regresión [Internet]. 2019 [citado 23 de abril de 2023]. Disponible en: https://sitiobigdata.com/2019/05/27/modelos-de-machine-learning-metricas-de-regresion-mse-parte-2/

28. Martínez Heras J. Métricas de clasificación: precisión, recall, F1, accuracy [Internet]. IArtificial; 2020 [citado 28 de abril de 2023]. Disponible en: https://www.iartificial.net/precision-recall-f1-accuracy-en-clasificacion/

29. Quintanilla L, Warren G, Kirsch S, Youssef V, Kershaw N, Killeen S, et al. Learn Microsoft: métricas de ML [Internet]. 2023 [citado 30 de abril de 2023]. Disponible en: https://learn.microsoft.com/es-es/dotnet/machine-learning/resources/metrics

30. Boehm B. Desarrollo en espiral [Internet]. Wikipedia; 2012 [citado 30 de abril de 2023]. Disponible en: https://es.wikipedia.org/wiki/Desarrollo_en_espiral

31. Ballina Ríos F. Paradigmas y perspectivas teórico-metodológicas en el estudio de la administración. UVMX; 2013.

32. Radrigán M. Método empírico-analítico [Internet]. Wikipedia; 2022 [citado 22 de mayo de 2023]. Disponible en: https://es.wikipedia.org/wiki/M%C3%A9todo_emp%C3%ADrico-anal%C3%ADtico

33. IBM. Conceptos básicos de ayuda de CRISP-DM [Internet]. 2021 [citado 30 de abril de 2023]. Disponible en: https://www.ibm.com/docs/es/spss-modeler/saas?topic=dm-crisp-help-overview

34. Vallalta Rueda JF. CRISP-DM: una metodología para minería de datos en salud [Internet]. IA Health Data Miner; [citado 30 de abril de 2023]. Disponible en: https://healthdataminer.com/data-mining/crisp-dm-una-metodologia-para-mineria-de-datos-en-salud/

35. Toral Barrera JA. Redes neuronales. España: CUCEI; 2019.

36. Asunción A, Newman D. Repositorios. Rexa.info: Massachusetts Amherst; 2007.

37. Mora Paz H, Riascos JA, Salazar Castro JA, Mora G, Pantoja A. Comparación de funciones kernel para la predicción de la oferta energética fotovoltaica. RISTI. 2020;(E38):310-24.

38. Belanche LA, Villegas MA. Kernel functions for categorical variables with application to problems in the life sciences. 2023;(08034):1-3.

39. Esri. Spatial analysis in ArcGIS Pro [Internet]. ArcGIS Pro; [citado 15 de agosto de 2023]. Disponible en: https://pro.arcgis.com/es/pro-app/latest/help/analysis/introduction/spatial-analysis-in-arcgis-pro.htm

40. Scriptología. Tutorial de Flask: desarrollando aplicaciones web en Python [Internet]. 2024 [citado 1 de enero de 2024]. Disponible en: https://scriptologia.com/tutorial-de-flask-desarrollando-aplicaciones-web-en-python/

41. Hunter J, Dale D, Firing E, Droettboom M. Introducción a pyplot [Internet]. Matplotlib; 2012. Disponible en: https://es.matplotlib.net/stable/tutorials/introductory/pyplot.html

42. Python. Biblioteca Pickle [Internet]. 2001. Disponible en: https://docs.python.org/es/3/library/pickle.html

43. DataScientest. Uso de pandas en Python [Internet]. 2023. Disponible en: https://datascientest.com/es/pandas-python

44. Manav N. Escribir bytes a archivo en Python [Internet]. 2023. Disponible en: https://www.delftstack.com/es/howto/python/write-bytes-to-file-python/

45. Python. Biblioteca base64 [Internet]. Disponible en: https://docs.python.org/es/dev/library/base64.html

46. Navarro S. ¿Para qué sirve el train-test split? [Internet]. KeepCoding; 2024 [citado abril de 2024]. Disponible en: https://keepcoding.io/blog/para-que-sirve-el-train-test-split/

47. Scikit Learn. Nystroem Kernel Approximation [Internet]. 2007. Disponible en: https://scikit-learn.org/stable/modules/generated/sklearn.kernel_approximation.Nystroem.html

48. Li B, Lu P, chmccl v. Multiclass Neural Network [Internet]. Microsoft Learn; 2023 [citado 1 de junio de 2023]. Disponible en: https://learn.microsoft.com/es-es/azure/machine-learning/component-reference/multiclass-neural-network?view=azureml-api-2

49. Imbert A, Lemaitre G. sklearn.svm.SVC [Internet]. Scikit-Learn; 2024. Disponible en: https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html

50. Ruiz M. ¿Qué es Redux? [Internet]. OpenWebinars; 2018 [citado diciembre de 2018]. Disponible en: https://openwebinars.net/blog/que-es-redux/

51. Moes T. ¿Qué es Windows? [Internet]. SoftwareLab; 2023 [citado julio de 2023]. Disponible en: https://softwarelab.org/es/blog/que-es-windows/

52. D. A. Qué es Bootstrap [Internet]. Hostinger; 2023. Disponible en:https://www.hostinger.mx/tutoriales/que-es-bootstrap

53. Monk R. What is Python used for [Internet]. Coursera; 2023 [citado noviembre de 2023]. Disponible en: https://www.coursera.org/mx/articles/what-is-python-used-for-a-beginners-guide-to-using-python

54. Valiente FT. Aprendizaje por refuerzo [Internet]. IIC UAM; [citado 28 de marzo de 2023]. Disponible en: https://www.iic.uam.es/inteligencia-artificial/aprendizaje-por-refuerzo

55. Arceo Vilas AM. Estado nutricional y adherencia a la dieta mediterránea en población mayor de 40 años: IA vs estadística clásica. A Coruña: Universidad de Coruña; 2020.

56. Sánchez Santos JM, Sánchez Fernández PL. Predicción de eventos cardiovasculares y hemorrágicos en pacientes con doble antiagregación con modelos ML. CREDOS. Salamanca; 2020.

57. Gallego Valcárcel DA, Lucas Monsalve DF. Modelos de aprendizaje automático para la predicción del riesgo de fatalidad por insuficiencia cardiaca con datos clínicos. Bogotá: Universidad Antonio Nariño; 2021.

58. Lozada J. Investigación aplicada. Dialnet UNIRIOJA. 2014;3(1):47-50.

59. Núñez Cárdenas FJ, Zavaleta Chi IDC, Felipe Redondo AM, Meléndez Hernández J. Aplicación de minería de datos para tipificación de ECV en alumnos universitarios. México; 2018.

60. Martínez J. Más allá del accuracy: precision, recall y F1 [Internet]. Datasmarts; 2019 [citado 23 de abril de 2023]. Disponible en: https://datasmarts.net/es/mas-alla-del-accuracy-precision-recall-y-f1/.

Downloads

Published

2026-01-01

How to Cite

1.
Rodríguez Rodríguez MRRR, Delgado Calpa CA, Mora Paz HA. Prediction of Cardiovascular Diseases Using Machine Learning Models. South Health and Policy [Internet]. 2026 Jan. 1 [cited 2025 Sep. 5];5:364. Available from: https://shp.ageditor.ar/index.php/shp/article/view/364