RECOMENDAÇÃO DE UM MODELO DE APRENDIZADO DE MÁQUINA PARA PREDIÇÃO DE RISCO CARDIOVASCULAR COM BIOMARCADORES DA SÍNDROME METABÓLICA E ESCORE DE FRAMINGHAM
Aprendizado de Máquina; Modelo de Predição; Síndrome Metabólica; Risco CardioVascular; Escore de Risco Global (ERG) de Framingham.
A previsão de eventos cardiovasculares em pacientes diagnosticados com Síndrome Metabólica
(SM) é um tema de grande relevância para a área da Saúde, em geral, e fundamental para a
da Endocrinologia. Esta dissertação objetiva recomendar um modelo de Machine Learning
(ML) para estimar os riscos de eventos cardiovasculares em pacientes com SM, explorando
os marcadores do escore de Framingham (FRS) e da SM. Metodologicamente, utilizamos um
modelo de regressão logística e análises com árvore de decisão, floresta aleatória, impulsiona-
mento de gradiente, máquina de vetores de suporte e k-vizinhos mais próximos para testar nossa
hipótese central de que os bioindicadores (variáveis relacionadas à SM) exercem um impacto
positivo, forte e significativo nos eventos cardiovasculares em pacientes com SM. Tecnicamente a
pesquisa foi conduzida por meio de experimentos realizados em diferentes cenários. No primeiro
cenário, um algoritmo foi desenvolvido para avaliar o risco cardiovascular em pacientes com e
sem SM. Nos cenários subsequentes, foram analisados pacientes com e sem SM, considerando
os marcadores de SM e FRS como variáveis dependentes, enquanto a condição de Síndrome
Metabólica foi adotada como variável independente. No quinto cenário, uma análise foi realizada
para selecionar o modelo de regressão e classificação mais adequado para a predição do risco
cardiovascular em um conjunto de dados combinado de doenças cardíacas. No sexto cenário,
o modelo desenvolvido foi fundamentado no Escore de Risco Global (ERG) de Framingham,
incorporando os marcadores da SM nos experimentos. Os dados foram obtidos a partir do
repositório do National Center for Health Statistics (NHANES), um conjunto de dados combi-
nados de doenças cardíacas do Repositório de aprendizado de máquina UCI. e da plataforma
Kaggle. Em resumo, os principais achados desta dissertação são os seguintes: (1) No primeiro
cenário, uma diferença percentual de 81,74% foi observada nas médias de Risco ECV entre as
populações com e sem Síndrome Metabólica, evidenciando um aumento significativo do risco
cardiovascular na população com SM; (2) nos cenários subsequentes, o modelo Random Forest
(RF) se destacou, alcançando alta acurácia em todas as combinações de variáveis, especialmente
na combinação dos marcadores da SM com o marcador de sexo; (3) no quinto cenário, o modelo
RF foi identificado como o mais indicado, destacando a importância das variáveis relacionadas
à SM na predição do risco cardiovascular e ressaltando a necessidade de aprimoramentos nos
modelos para melhor identificação dos casos positivos; (4) tanto o modelo com três marcadores
da SM quanto o modelo com cinco marcadores da SM combinados ao escore de Framingham
(SM + FRS) apresentaram desempenho considerável, com correlações e acurácias significativas
(0.80 e 0.84, respectivamente). Essas combinações mais simples de variáveis podem ser uma
abordagem interessante, uma vez que fornecem informações relevantes para a predição do risco
cardiovascular de forma menos invasiva, evitando a necessidade de exames mais complexos.