Please use this identifier to cite or link to this item: http://repositorio.ufersa.edu.br/handle/prefix/830
Type: Dissertação
Title: Utilizando aprendizado emissupervisionado multidescrição em problemas de classificação hierárquica multirrótulo
Authors: Araújo, Hiury Nogueira de
First Advisor: Santos, Araken de Medeiros
First member of the board: Araújo, Daniel Sabino Amorim de
Second member of the board: Canuto, Anne Magaly de Paula
Resume: classificação de dados é uma tarefa aplicada em diversas áreas do conhecimento, sendo assim, foco de constantes pesquisas. A classificação de dados pode ser dividida de acordo com a disposição dos dados, sendo estes rotulados ou não rotulados. Uma abordagem vem se mostrando bastante eficiente ao se trabalhar com conjuntos de dados contendo dados rotulados e não rotulados, esta chamada de aprendizado semissupervisionado, seu objetivo é classificar os dados não rotulados através da quantidade de dados rotulados contidos no conjunto, melhorando sua taxa de acerto. Tais dados podem ser classificados com mais de um rótulo, conhecida como classificação multirrótulo. Além disso, estes dados podem estar organizados de forma hierárquica, contendo assim, uma relação entre os mesmos, esta, por sua vez, denominada classificação hierárquica. Neste trabalho é proposto a utilização do aprendizado semissupervisionado multidescrição, que é uma das vertentes do aprendizado semissupervisionado, em problemas de classificação hierárquica multirrótulo, com o objetivo de investigar se o aprendizado semissupervisionado é uma abordagem apropriada para resolver o problema de baixa dimensionalidade de dados. Uma análise experimental dos métodos verificou que o aprendizado supervisionado obteve melhor desempenho contra as abordagens semissupervisionadas, contudo, o aprendizado semissupervisionado pode vir a ser uma abordagem amplamente utilizada, pois, há bastante o que ser contribuído nesta área
Abstract: Data classification is a task applied in various areas of knowledge, therefore, the focus of ongoing research. Data classification can be divided according to the available data, which are labeled or not labeled. One approach has proven very effective when working with data sets containing labeled and unlabeled data, this called semi-supervised learning, your objective is to label the unlabeled data by using the amount of labeled data in the data set, improving their success rate. Such data can be classified with more than one label, known as multi-label classification. Furthermore, these data can be organized hierarchically, thus containing a relation therebetween, this called hierarchical classification. This work proposes the use of multi-view semi-supervised learning, which is one of the semissupervisionado learning aspects, in problems of hierarchical multi-label classification, with the objective of investigating whether semi-supervised learning is an appropriate approach to solve the problem of low dimensionality of data. An experimental analysis of the methods found that supervised learning had a better performance than semi-supervised approaches, however, semi-supervised learning may be a widely used approach, because, there is plenty to be contributed in this area
Keywords: Aprendizado semissupervisionado
Classificação hierárquica
Multirrótulo
Co-training
Self-training
Semi-supervised learning
Hierarchical multi-label classification
Co-training
Self-training
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA
Language: por
Country: Brasil
Publisher: Universidade Federal Rural do Semi-Árido
Institution Initials: UFERSA
Program Name: Programa de Pós-graduação em Ciência da Computação
Citation: ARAÚJO, Hiury Nogueira de. Utilizando aprendizado emissupervisionado multidescrição em problemas de classificação hierárquica multirrótulo. 2017. 128 f. Dissertação (Mestrado em Ciência da Computação), Universidade Federal Rural do Semi-Árido, Mossoró, 2017.
Access Type: Acesso Aberto
URI: http://repositorio.ufersa.edu.br/handle/prefix/830
Issue Date: 17-Nov-2017
License Term: CC-BY-SA
Appears in Collections:Mestrado em Ciência da Computação

Files in This Item:
File Description SizeFormat 
HiuryNA_DISSERT.pdf3.11 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.