O uso de Machine Learning na prevenção da diabetes

Autores

  • Maria Alice Lopes Instituto Politécnico de Viseu, Viseu, Portugal
  • Cristina Lacerda Instituto Politécnico de Viseu, Viseu, Portugal | Centro de Estudos em Educação e Inovação (CI&DEI), Viseu, Portugal https://orcid.org/0000-0002-8921-4747
  • Joana Fialho Instituto Politécnico de Viseu, Viseu, Portugal | Centro de Estudos em Educação e Inovação (CI&DEI), Viseu, Portugal https://orcid.org/0000-0002-3910-8292

DOI:

https://doi.org/10.29352/mill0221e.43168

Palavras-chave:

diabetes mellitus; machine learning; deep learning; redes neurais recorrentes; seleção de atributos

Resumo

Introdução: A Diabetes Mellitus é uma das doenças crónicas que mais crescem no mundo. Diante disso, técnicas de Aprendizagem de Máquina (Machine Learning - ML) oferecem potencial para a identificação de padrões relevantes ao controle da doença.

Objetivo: Analisar o impacto de técnicas de ML e a utilização de técnicas de seleção de características na predição da diabetes, utilizando o conjunto de dados “Diabetes Health Indicators”.

Métodos: Aplicou-se a metodologia CRISP-DM. Os dados foram equilibrados com a técnica de subamostragem NearMiss. Utilizaram-se a Eliminação Recursiva de Características (RFE) e a Análise de Componentes Principais (PCA) para a seleção de atributos. Foram testados seis modelos: Random Forest, Gradient Boosting, KNN, Regressão Logística, Perceptron Multicamadas (MLP) e Redes Neurais Recorrentes (RNN).

Resultados: A RNN destacou-se com acurácia de 86,8% e F1-score de 0,868 em dados balanceados. A combinação de RFE com MLP também apresentou desempenho robusto. O equilíbrio de classes melhorou significativamente os resultados.

Conclusão: As técnicas de ML e DL são promissoras para a triagem clínica e políticas públicas. É necessário aumentar a representatividade dos dados, incorporar IA explicável e calibrar limiares para reduzir os falsos negativos, que são essenciais para aplicações práticas.

Downloads

Não há dados estatísticos.

Referências

Alzyoud, M., Alazaidah, R., Aljaidi, M., Samara, G., Qasem, M. H., Khalid, M., & Al-Shanableh, N. (2024). Diagnosing diabetes mellitus using machine learning techniques. International Journal of Data and Network Science, 8(1), 179–188. https://doi.org/10.5267/j.ijdns.2023.10.006

Daghistani, T., & Alshammari, R. (2020). Comparison of statistical logistic regression and random forest machine learning techniques in predicting diabetes. Journal of Advances in Information Technology, 11(2), 78–83. https://doi.org/10.12720/jait.11.2.78-83

International Diabetes Federation (2019). IDF diabetes atlas (9th ed.). The Diabetes Atlas. Consultado a 14 de março de 2025. https://diabetesatlas.org/

Khan, Q.W., Iqbal, K., Ahmad, R., Rizwan, A., Khan, A.N., & Kim, D. (2024). An intelligent diabetes classification and perception framework based on ensemble and deep learning method. PeerJ Computer Science, 10:e1914. https://doi.org/10.7717/peerj-cs.1914

Olisah, C.C., Smith, L., & Smith, M. (2022). Diabetes mellitus prediction and diagnosis from a data preprocessing and machine learning perspective. Computer Methods and Programs in Biomedicine, 22, 106773. https://doi.org/10.1016/j.cmpb.2022.106773

Srinivasu, P. N., Shafi, J., Krishna, T. B., Sujatha, C. N., Praveen, S. P., & Ijaz, M. F. (2022). Using recurrent neural networks for predicting type-2 diabetes from genomic and tabular data. Diagnostics, 12(12), 3067. https://doi.org/10.3390/diagnostics12123067

Sterlin, E. (2024). Health spending takes up 10% of the global economy: How can tech help reduce costs and improve lives? World Economic Forum. Consultado a 14 de março de 2025. https://www.weforum.org/stories/2024/08/healthcare-costs-digital-tech/

Sujon, K. M., Hassan, R. B., Towshi, Z. T., Othman, M. A., Samad, M. A., & Choi, K. (2024). When to use standardization and normalization: Empirical evidence from machine learning models and XAI. IEEE Access, 12, 135300–135314. https://doi.org/10.1109/ACCESS.2024.3461234

Tanimoto, A., Yamada, S., Takenouchi, T., Sugiyama, M., & Kashima, H. (2022). Improving imbalanced classification using near-miss instances. Expert Systems with Applications, 201, 117130. https://doi.org/10.1016/j.eswa.2022.117130

Teboul, A. Diabetes health indicators dataset. Kaggle. Consultado a 14 de março de 2025. https://encurtador.com.br/dKan

Wee, B.F., Sivakumar, S., Lim, K.H., Wong, W.K., & Juwono, F.H. (2024). Diabetes detection based on machine learning and deep learning approaches. Multimedia Tools and Applications, 83, 24153–24185. https://doi.org/10.1007/s11042-023-16407-5

Downloads

Publicado

2026-01-16

Como Citar

Lopes, M. A., Lacerda, C., & Fialho, J. (2026). O uso de Machine Learning na prevenção da diabetes . Millenium - Journal of Education, Technologies, and Health, 2(21e), e43168. https://doi.org/10.29352/mill0221e.43168

Edição

Secção

Engenharias, tecnologia, gestão e turismo