Portal de Programas de Pós-Graduação (UFAL)

SIGAA - Sistema Integrado de Gestão de Atividades Acadêmicas

PPGI PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA INSTITUTO DE COMPUTAÇÃO Telefone/Ramal: 82 99632-4920 E-mail: rian@ic.ufal.br https://sigaa.sig.ufal.br/ppgi

Banca de QUALIFICAÇÃO: TIAGO LIMA MARINHO

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE : TIAGO LIMA MARINHO
DATA : 31/05/2021
HORA: 14:30
LOCAL: Google Meet
TÍTULO:

Otimização de hiperparâmetros do XGBoost utilizando meta-aprendizagem

PALAVRAS-CHAVES:

Meta-aprendizagem, aprendizagem de máquina, custo, ciência de dados, XGBoost

PÁGINAS: 40
RESUMO:

Com o crescimento dos algoritmos de aprendizagem de máquina nos últimos tempos, tanto

no sentido de otimização dos mesmos, quanto no surgimento de novos algorítmos para proble-

mas de classificação e de regressão, houve uma atenção maior no que se refere à "qual algoritmo tem uma precisão melhor em um dado conjunto de dados". Em paralelo, há também o problema em encontrar hiperparâmetros para cada algoritmo com o intuito de aumentar a precisão no resultado de cada um deles; o que não é uma tarefa trivial. Isso acaba afetando as empresas de alguma forma, já que elas estão tendo que lidar com o grande crescimento de dados e no ajuste dos seus modelos para lidar com esses dados. Um exemplo de algoritmo de aprendizagem de máquina que surgiu em 2014 e que também tem relação com este tipo de problema, é o XGBoost. De forma geral, os algoritmos apresentam uma ampla quantidade de hiperparâmetros e dependendo do tamanho do conjunto de dados que o algoritmo será aplicado, isso pode ser uma tarefa bastante custosa; tanto em questão de memória quanto de complexidade. O mesmo acontece com o XGBoost, para utilizá-lo tanto para regressão e classificação, é necessário a configuração de uma ampla quantidade de hiperparâmetros e por conta de algumas heurísticas utilizadas por ele, faz com que o algoritmo seja um pouco mais custoso que os demais. Sendo assim, é evidente que é necessário a otimização neste passo de otimização a este tipo de algoritmo. Tendo como finalidade resolver este problema, a meta-aprendizagem utiliza a ideia de experiência, ou seja, se o algoritmo foi aplicado em um conjunto de dados e já foi encontrado uma boa combinação de hiperparâmetros para um certo conjunto de dados; a meta-aprendizagem visa utilizar estes hiperparâmetros já encontrados em algum conjunto de dados com características semelhantes, fazendo com que se reduza o custo de achar uma nova combinação de hiperparâmetros utilizando um Grid Search, por exemplo, onde é necessário testar uma larga combinação de hiperparâmetros que pode se tornar uma tarefa custosa, principalmente a depender do tamanho de conjunto de dados. Tendo assim como vantagem, ao invés de aplicar uma procura profunda, testar apenas com hiperparâmetros que já foram encontrados em outros conjuntos de dados. Por fim, este trabalho visa a criação de um modelo para a utilização da meta-aprendizagem em novos conjuntos de dados; a fim de que haja uma redução de custos computacionais, visando também a redução de custo para empresas, já que a área de aprendizagem de máquina vem crescendo cada vez mais. Por agora, estão sendo feitos experimentos em torno de 198 conjuntos de dados, encontrando hiperparâmetros que dão resultados melhores do que os hiperparâmetros padrões da literatura e comparando os resultados utilizando o modelo que utiliza a meta-aprendizagem.

MEMBROS DA BANCA:
Presidente - 1388993 - BRUNO ALMEIDA PIMENTEL
Interno - 1121007 - EVANDRO DE BARROS COSTA
Externa ao Programa - 2257553 - ROBERTA VILHENA VIEIRA LOPES

Notícia cadastrada em: 28/05/2021 08:47