El uso de Machine Learning en la prevención de la diabetes

Autores/as

  • Maria Alice Lopes Instituto Politécnico de Viseu, Viseu, Portugal
  • Cristina Lacerda Instituto Politécnico de Viseu, Viseu, Portugal | Centro de Estudos em Educação e Inovação (CI&DEI), Viseu, Portugal https://orcid.org/0000-0002-8921-4747
  • Joana Fialho Instituto Politécnico de Viseu, Viseu, Portugal | Centro de Estudos em Educação e Inovação (CI&DEI), Viseu, Portugal https://orcid.org/0000-0002-3910-8292

DOI:

https://doi.org/10.29352/mill0221e.43168

Palabras clave:

diabetes mellitus; machine learning; deep learning; redes neuronales recurrentes; selección de características

Resumen

Introducción: La diabetes mellitus es una de las enfermedades crónicas de más rápido crecimiento a nivel mundial. Las técnicas de Machine Learning (ML) ofrecen un potencial significativo para identificar patrones útiles para el control de la enfermedad.

Objetivo: Analizar el impacto de las técnicas de ML y el uso de técnicas de selección de características en la predicción de la diabetes, utilizando el conjunto de datos ≪Diabetes Health Indicators≫.

Métodos: Se aplicó la metodología CRISP-DM. Los datos se equilibraron con la técnica de submuestreo NearMiss. Se utilizaron la eliminación recursiva de características (RFE) y el análisis de componentes principales (PCA) para la selección de atributos. Se probaron seis modelos: Random Forest, Gradient Boosting, KNN, Regresión Logística, Perceptrón Multicapa (MLP) y Redes Neuronales Recurrentes (RNN).

Resultados: El equilibrio de clases mejoró significativamente los resultados. La RNN obtuvo el mejor rendimiento, con un 86,8 % de precisi´on y una puntuacio´n F1 de 0,868. La combinación de RFE con MLP también mostró un buen rendimiento. La selección de características (RFE y PCA) redujo la dimensionalidad sin pérdida de precision.

Conclusión: Las técnicas de ML y DL son prometedoras para priorizar el seguimiento clínico e informar las políticas de salud pública. La mejora de la representatividad de los datos, la integración de técnicas de IA explicable y el ajuste de los umbrales para reducir los falsos negativos son esenciales para las aplicaciones prácticas.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Alzyoud, M., Alazaidah, R., Aljaidi, M., Samara, G., Qasem, M. H., Khalid, M., & Al-Shanableh, N. (2024). Diagnosing diabetes mellitus using machine learning techniques. International Journal of Data and Network Science, 8(1), 179–188. https://doi.org/10.5267/j.ijdns.2023.10.006

Daghistani, T., & Alshammari, R. (2020). Comparison of statistical logistic regression and random forest machine learning techniques in predicting diabetes. Journal of Advances in Information Technology, 11(2), 78–83. https://doi.org/10.12720/jait.11.2.78-83

International Diabetes Federation (2019). IDF diabetes atlas (9th ed.). The Diabetes Atlas. Consultado a 14 de março de 2025. https://diabetesatlas.org/

Khan, Q.W., Iqbal, K., Ahmad, R., Rizwan, A., Khan, A.N., & Kim, D. (2024). An intelligent diabetes classification and perception framework based on ensemble and deep learning method. PeerJ Computer Science, 10:e1914. https://doi.org/10.7717/peerj-cs.1914

Olisah, C.C., Smith, L., & Smith, M. (2022). Diabetes mellitus prediction and diagnosis from a data preprocessing and machine learning perspective. Computer Methods and Programs in Biomedicine, 22, 106773. https://doi.org/10.1016/j.cmpb.2022.106773

Srinivasu, P. N., Shafi, J., Krishna, T. B., Sujatha, C. N., Praveen, S. P., & Ijaz, M. F. (2022). Using recurrent neural networks for predicting type-2 diabetes from genomic and tabular data. Diagnostics, 12(12), 3067. https://doi.org/10.3390/diagnostics12123067

Sterlin, E. (2024). Health spending takes up 10% of the global economy: How can tech help reduce costs and improve lives? World Economic Forum. Consultado a 14 de março de 2025. https://www.weforum.org/stories/2024/08/healthcare-costs-digital-tech/

Sujon, K. M., Hassan, R. B., Towshi, Z. T., Othman, M. A., Samad, M. A., & Choi, K. (2024). When to use standardization and normalization: Empirical evidence from machine learning models and XAI. IEEE Access, 12, 135300–135314. https://doi.org/10.1109/ACCESS.2024.3461234

Tanimoto, A., Yamada, S., Takenouchi, T., Sugiyama, M., & Kashima, H. (2022). Improving imbalanced classification using near-miss instances. Expert Systems with Applications, 201, 117130. https://doi.org/10.1016/j.eswa.2022.117130

Teboul, A. Diabetes health indicators dataset. Kaggle. Consultado a 14 de março de 2025. https://encurtador.com.br/dKan

Wee, B.F., Sivakumar, S., Lim, K.H., Wong, W.K., & Juwono, F.H. (2024). Diabetes detection based on machine learning and deep learning approaches. Multimedia Tools and Applications, 83, 24153–24185. https://doi.org/10.1007/s11042-023-16407-5

Descargas

Publicado

2026-01-16

Cómo citar

Lopes, M. A., Lacerda, C., & Fialho, J. (2026). El uso de Machine Learning en la prevención de la diabetes. Millenium - Journal of Education, Technologies, and Health, 2(21e), e43168. https://doi.org/10.29352/mill0221e.43168

Número

Sección

Ingenierías, Tecnología, Gestión y Turismo