Please use this identifier to cite or link to this item: http://repositorio.ufersa.edu.br/handle/prefix/5549
metadata.dc.type: Dissertação
Title: Análise das correlações entre as métricas de avaliação de desempenho de classificadores multirrótulo
metadata.dc.creator: Nascimento Junior, Serafim do
metadata.dc.contributor.advisor1: Silva, Patrício de Alencar
metadata.dc.contributor.referee1: Cintra, Marcos Evandro
metadata.dc.contributor.referee2: Winck, 82019274000
metadata.dc.description.resumo: A classificação multirrótulo é uma tarefa de aprendizado de máquina em que objetos podem estar associados a mais de uma classe. É uma tarefa que necessita de algoritmos de classificação os quais requerem a utilização de métricas para avaliar o desempenho. Na literatura de aprendizado de máquina não foram identificados estudos na área os quais apontam a existência de correlações entre as métricas de avaliação de desempenho de classificadores multirrótulo. Tais estudos são importantes, pois podem auxiliar os pesquisadores da área no suporte a tomada de decisão sobre quais algoritmos podem ser escolhidos ou considerados para determinados métodos de transformação do problema. Neste contexto, este trabalho apresenta um estudo sobre as métricas de avaliação de desempenho dos algoritmos de classificação multirrótulo e as correlações existentes entre elas. O objetivo principal desta pesquisa foi identificar as correlações entre as métricas de avaliação de desempenho dos classificadores multirrótulo. Para que o objetivo fosse atingido foram utilizadas dez bases de dados multirrótulo; cinco métodos de transformação do problema multirrótulo para monorrótulo (BR, CC, LP, PS e RAkEL); cinco classificadores base (J48, KNN, NB, SVM e RIPPER); e doze métricas de avaliação de desempenho (HLoss, SAcc, Prec, Rec, FM, Acc, AvPrec, Cov, 1-Err, IsErr, ErrSS e RLoss). A metodologia de validação utilizada foi a validação cruzada com dez folds. Para a execução dos experimentos e o cálculo das métricas, a linguagem de programação JAVA e a biblioteca MULAN foram utilizadas. As correlações foram calculadas por meio dos coeficientes de correlação linear de Pearson e de correlação não linear de Spearman. Após a análise dos resultados, foi possível concluir que existem tanto correlações lineares quanto correlações não lineares entre as métricas selecionadas. As correlações encontradas possibilitaram identificar potenciais algoritmos de classificação os quais são mais apropriados para serem utilizados juntamente com os métodos de transformação do problema
Abstract: In the field of machine learning, multi-label classification is a variant of the classification problem in which multiple labels may be associated with each instance. Multi-label classification requires classification algorithms which need the use of measures to evaluate their performance. In the literature of machine learning, it was not found studies which point to the existence of correlations between performance measures for multi-label classifiers. Such studies are important because they can assist researchers in the field in order to support decision making on which algorithms may be chosen or considered for certain problem transformation approaches. In this context, this thesis presents a study of performance measures for multi-label classification algorithms and their correlations. The main goal of this research was to identify correlations between the performance measures for multi-label classifiers. In order to reach the main goal, it was necessary to use: ten multi-label datasets; five problem transformation approaches (BR, CC, LP, PS, and RAkEL); five base classifiers (J48, KNN, NB, SVM, and RIPPER); and, twelve performance measures (HLoss, SAcc, Prec, Rec, FM, Acc, AvPrec, Cov, 1-Err, IsErr, ErrSS, e RLoss). The machine learning validation technique used for experiments was the 10-fold cross-validation. In order to run experiments and calculate performance measures, the JAVA programming language and the MULAN library was used. Correlations were calculated by both Pearson's and Spearman's correlation coefficients. After analyzing the results, it was possible to conclude that there are as linear as non-linear correlations between the selected performance measures. Thus, all correlations found made it possible to identify classification algorithms which are more suitable to be used together with the problem transformation approaches in experiments related to multi-label classification problems
Keywords: : Métricas de Avaliação de Desempenho
Métodos de Transformação do Problema
Classificadores Multirrótulo
Correlação de Pearson
Correlação de Spearman
Performance Measures
Correlation Analysis, Multi-label Classification
Pearson Correlation Coefficient
Spearman Correlation Coefficient.
metadata.dc.subject.cnpq: CNPQ::CIENCIAS EXATAS E DA TERRA
metadata.dc.language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal Rural do Semi-Árido
metadata.dc.publisher.initials: UFERSA
metadata.dc.publisher.department: Centro de Ciências Exatas e Naturais - CCEN
metadata.dc.publisher.program: Programa de Pós-Graduação em Ciência da Computação
Citation: Nascimento Junior (2020) (NASCIMENTO JUNIOR, 2020)
metadata.dc.rights: Acesso Aberto
URI: http://repositorio.ufersa.edu.br/handle/prefix/5549
Issue Date: 28-May-2020
Appears in Collections:MESTRADO EM CIÊNCIA DA COMPUTAÇÃO

Files in This Item:
File Description SizeFormat 
SerafimNJ_DISSERT.pdf2.71 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.