Detalhes da Orientação
Mapeamento Sistemático de Técnicas Emergentes de Pré- Processamento para Mitigação de Viés em Dados de Treinamento
Graduação em Ciência da Computação
O presente trabalho apresenta um mapeamento sistemático da literatura que identifica técnicas emergentes de mitigação de viés em dados de treinamento para aprendizado de máquina, aplicadas durante o pré-processamento, entre o período de 2020 e 2024. Dada a crescente popularidade do campo de estudo de inteligência artificial e de diferentes áreas dependerem cada vez mais desses modelos, é fundamental o controle e monitoramento dos vieses presentes em meio a estes. A pesquisa teve como base metodológica os critérios estabelecidos por Kitchenham e Charters (2007), com string de busca refinada e definição de critérios de inclusão/exclusão aplicados sobre as bases IEEE Xplore e ACM Digital Library. 85 estudos primários foram analisados, resultando em 244 técnicas identificadas, classificadas em sete categorias principais, sendo estas: balanceamento de dados, transformação de labels, modificação de atributos sensíveis, reponderação, geradores de dados justos, censura de score/feature e normalização e transformações de feature. Os resultados apontam para uma crescente adoção de abordagens híbridas e relevantes ao contexto, além da utilização de múltiplas métricas para a avaliação do desempenho e equidade. O estudo conclui que o pré-processamento permanecerá como uma etapa crítica para a construção de sistemas mais justos, e que a vigilância contínua das técnicas emergentes é essencial para o avanço ético e técnico da área.