Utilização de modelos de aprendizado de máquina baseados em árvore para predição de baixo peso ao nascer
Resumo
A falta de acesso a um acompanhamento de saúde de qualidade durante a gestação pode resultar em desfechos negativos, incluindo o baixo peso ao nascer (BPN), que pode incorrer em alto risco de morte ou morbidades ao longo do seu crescimento. Predizer o BPN pode garantir maior qualidade de vida no desenvolvimento da criança e evitar que essas gestações tenham um desfecho negativo, tanto para a mãe quanto para o bebê. O objetivo desta pesquisa consiste em avaliar dois modelos de aprendizado de máquina para a predição de BPN. A avaliação foi composta por um conjunto de dados, dos anos de 2018 a 2020, do Sistema de Informações de Nascidos Vivos (SINASC) do Brasil. Dois modelos de aprendizado de máquina baseados em árvore foram escolhidos para a avaliação e os principais atributos sobre a gestante, o pré-natal e o neonato também foram escolhidos, de acordo com a literatura. O modelo AdaBoost em relação ao XGBoost apresentou um melhor desempenho em cinco das seis métricas de avaliação, com o f1-score resultando em 56.05%, perdendo apenas na sensibilidade. Apesar dos modelos apresentarem métricas com valores baixos e muito próximos, os modelos podem ser aprimorados por meio de novas fontes de dados e seleção de atributos com análise de especialistas, a fim de oferecer uma tomada de decisão precisa ao longo do acompanhamento gestacional.