El uso de Machine Learning en la prevención de la diabetes
DOI:
https://doi.org/10.29352/mill0221e.43168Palabras clave:
diabetes mellitus; machine learning; deep learning; redes neuronales recurrentes; selección de característicasResumen
Introducción: La diabetes mellitus es una de las enfermedades crónicas de más rápido crecimiento a nivel mundial. Las técnicas de Machine Learning (ML) ofrecen un potencial significativo para identificar patrones útiles para el control de la enfermedad.
Objetivo: Analizar el impacto de las técnicas de ML y el uso de técnicas de selección de características en la predicción de la diabetes, utilizando el conjunto de datos ≪Diabetes Health Indicators≫.
Métodos: Se aplicó la metodología CRISP-DM. Los datos se equilibraron con la técnica de submuestreo NearMiss. Se utilizaron la eliminación recursiva de características (RFE) y el análisis de componentes principales (PCA) para la selección de atributos. Se probaron seis modelos: Random Forest, Gradient Boosting, KNN, Regresión Logística, Perceptrón Multicapa (MLP) y Redes Neuronales Recurrentes (RNN).
Resultados: El equilibrio de clases mejoró significativamente los resultados. La RNN obtuvo el mejor rendimiento, con un 86,8 % de precisi´on y una puntuacio´n F1 de 0,868. La combinación de RFE con MLP también mostró un buen rendimiento. La selección de características (RFE y PCA) redujo la dimensionalidad sin pérdida de precision.
Conclusión: Las técnicas de ML y DL son prometedoras para priorizar el seguimiento clínico e informar las políticas de salud pública. La mejora de la representatividad de los datos, la integración de técnicas de IA explicable y el ajuste de los umbrales para reducir los falsos negativos son esenciales para las aplicaciones prácticas.
Descargas
Citas
Alzyoud, M., Alazaidah, R., Aljaidi, M., Samara, G., Qasem, M. H., Khalid, M., & Al-Shanableh, N. (2024). Diagnosing diabetes mellitus using machine learning techniques. International Journal of Data and Network Science, 8(1), 179–188. https://doi.org/10.5267/j.ijdns.2023.10.006
Daghistani, T., & Alshammari, R. (2020). Comparison of statistical logistic regression and random forest machine learning techniques in predicting diabetes. Journal of Advances in Information Technology, 11(2), 78–83. https://doi.org/10.12720/jait.11.2.78-83
International Diabetes Federation (2019). IDF diabetes atlas (9th ed.). The Diabetes Atlas. Consultado a 14 de março de 2025. https://diabetesatlas.org/
Khan, Q.W., Iqbal, K., Ahmad, R., Rizwan, A., Khan, A.N., & Kim, D. (2024). An intelligent diabetes classification and perception framework based on ensemble and deep learning method. PeerJ Computer Science, 10:e1914. https://doi.org/10.7717/peerj-cs.1914
Olisah, C.C., Smith, L., & Smith, M. (2022). Diabetes mellitus prediction and diagnosis from a data preprocessing and machine learning perspective. Computer Methods and Programs in Biomedicine, 22, 106773. https://doi.org/10.1016/j.cmpb.2022.106773
Srinivasu, P. N., Shafi, J., Krishna, T. B., Sujatha, C. N., Praveen, S. P., & Ijaz, M. F. (2022). Using recurrent neural networks for predicting type-2 diabetes from genomic and tabular data. Diagnostics, 12(12), 3067. https://doi.org/10.3390/diagnostics12123067
Sterlin, E. (2024). Health spending takes up 10% of the global economy: How can tech help reduce costs and improve lives? World Economic Forum. Consultado a 14 de março de 2025. https://www.weforum.org/stories/2024/08/healthcare-costs-digital-tech/
Sujon, K. M., Hassan, R. B., Towshi, Z. T., Othman, M. A., Samad, M. A., & Choi, K. (2024). When to use standardization and normalization: Empirical evidence from machine learning models and XAI. IEEE Access, 12, 135300–135314. https://doi.org/10.1109/ACCESS.2024.3461234
Tanimoto, A., Yamada, S., Takenouchi, T., Sugiyama, M., & Kashima, H. (2022). Improving imbalanced classification using near-miss instances. Expert Systems with Applications, 201, 117130. https://doi.org/10.1016/j.eswa.2022.117130
Teboul, A. Diabetes health indicators dataset. Kaggle. Consultado a 14 de março de 2025. https://encurtador.com.br/dKan
Wee, B.F., Sivakumar, S., Lim, K.H., Wong, W.K., & Juwono, F.H. (2024). Diabetes detection based on machine learning and deep learning approaches. Multimedia Tools and Applications, 83, 24153–24185. https://doi.org/10.1007/s11042-023-16407-5
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2026 Millenium - Journal of Education, Technologies, and Health

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Los autores que sometan propuestas para esta revista estarán de acuerdo con los siguientes términos:
a) Los artículos serán publicados según la licencia Licença Creative Commons (CC BY 4.0), conforme el régimen open-access, sin cualquier coste para el autor o para el lector.
b) Los autores conservan los derechos de autor y conceden a la revista el derecho de la primera publicación, se permite la divulgación libre del trabajo, desde que sea correctamente atribuida la autoría y la publicación inicial en esta revista.
c) Los autores están autorización para firmar contratos adicionales separadamente, para la distribución no exclusiva de la versión del trabajo publicada en esta revista (ej.: publicar en un repositorio institucional o como capítulo de un libro), con reconocimiento de la autoría y publicación inicial e esta revista.
d) Los autores tienen permiso y son alentados a publicar y distribuir su trabajo on-line (ej.: en repositorios instituciones o en su página personal) ya que eso podrá generar alteraciones productivas, así como aumentar el impacto y la citación del trabajo publicado.
Documentos necesarios para la sumisión
Plantilla del artículo (formato editable)


