Please use this identifier to cite or link to this item: http://repositorio.ufersa.edu.br/handle/prefix/2960
metadata.dc.type: Trabalho de Conclusão de Curso
Title: Análise do programa bag of tools na sua funcionalidade sobre conceitos matemáticos, linguísticos e computacionais
metadata.dc.creator: Nogueira, Iara Cristina Araújo
metadata.dc.contributor.advisor1: Carvalho, Cid Ivan da Costa
metadata.dc.contributor.referee1: Muniz, Liebert de Abreu
metadata.dc.contributor.referee2: Santiago, Landerson Bezerra
metadata.dc.description.resumo: A Bag of Tools é um programa desenvolvido pelo grupo de estudo em linguística computacional (GELC), da Universidade Federal Rural do semi-Árido (UFERSA), a qual contém sistemas para processamento de linguagem natural. Neste trabalho, apresento os sistemas que integram esse programa, o wordlist: organiza o texto adicionado em forma de lista de palavras; separador silábico: sistema que separa palavras em sílabas da língua brasileira; o grapheme to phoneme: conversor gráfico fônico que faz a transcrição das formas ortográficas para forma fonética ou fonológica; e, o etiquetador morfossintático: decompõe o texto em itens lexicais e atribui uma etiqueta a cada palavra de um texto. Para o desenvolvimento desse software, utilizou-se o Foma, uma biblioteca e uma linguagem de programação de uso múltiplo que agiliza a criação de algoritmos para o processamento de linguagem natural, devido ao suporte de expressões regulares, à agilidade na manipulação de caracteres e à facilidade no uso de sua sintaxe. Com o intuito de distribuir o software e facilitar sua utilização, o programa foi implementado à linguagem de programação Java, que possibilitou a adição de novas funções ao software e o desenvolvimento de uma interface gráfica, a qual deixou a usabilidade do algoritmo mais intuitiva. Após o desenvolvimento, A partir dos resultados obtidos e analisados, concluímos que o sistema Bag of tools apresenta um bom desempenho como um todo, pois em cada uma de suas funções foi obtido mais de 90% de acertos em seu desempenho, mas apresentando alguns erros.
Abstract: The Bag of Tools is a program developed by the study group in computational linguistics (GELC) of the Federal Rural University of the Semi-Arid (UFERSA), which contains systems for natural language processing. In this work, I present the systems that integrate this program, wordlist: organizes the added text as a list of words; syllabic separator: system that separates words in syllables from the Brazilian language; grapheme to phoneme: phonic graphic converter that transcribes the orthographic forms into a phonetic or phonological form; and, the morphosyntactic labeler: decomposes the text into lexical items and assigns a label to each word in a text. For the development of this software, we used Foma, a library and a multi-language programming language that speeds up the creation of algorithms for the natural language processing, due to the support of regular expressions, the agility in the manipulation of characters and the ease in the use of its syntax. In order to distribute the software and facilitate its use, the program was implemented in the Java programming language, which allowing the addition of new functions to the software and the development of a graphical interface, which made the usability of the algorithm more intuitive. After the development, from the results obtained and analyzed, we conclude that the Bag of tools system presents a good performance as a whole, because in each one of its functions more than 90% of hits were obtained in its performance, but with some errors.
Keywords: Bag of tools
Transcrição fonológica
Separador silábico
Etiquetador
Desempenho
metadata.dc.subject.cnpq: CNPQ::CIENCIAS EXATAS E DA TERRA
metadata.dc.language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal Rural do Semi-Árido
metadata.dc.publisher.initials: UFERSA
metadata.dc.publisher.department: Centro Multidisciplinar de Caraúbas
Citation: Nogueira (2019) (NOGUEIRA, 2019)
metadata.dc.rights: Acesso Aberto
URI: http://repositorio.ufersa.edu.br/handle/prefix/2106
http://repositorio.ufersa.edu.br/handle/prefix/2960
Issue Date: 11-Mar-2019
Appears in Collections:Ciência e Tecnologia

Files in This Item:
File Description SizeFormat 
IARACAN_MONO.pdf1.63 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.