Use este identificador para citar ou linkar para este item: http://hdl.handle.net/123456789/5578
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.authorSILVA, Arthur Azevedo da-
dc.date.accessioned2022-09-01T13:31:33Z-
dc.date.available2022-09-01T13:31:33Z-
dc.date.issued2022-07-18-
dc.identifier.urihttp://hdl.handle.net/123456789/5578-
dc.descriptionThe present research has the goal of developing a grammatical error correction (GEC) system for the analysis and correction of verbal agreement in the portuguese language. Writing has made and still makes possible to greatly contribute with the development of human civilization. The importance of proper writing is essential for studies, records, among others, that are beneficial to society as a whole, since grammatical errors can cause serious damage to the correct under standing, causing the loss of the benefits already obtained. However, human methods of text correction are very costly. For that reason, within natural language processing (NLP), a field that computationally studies natural languages, there is GEC, which aims to detect and correct grammatical errors. GEC typically has three main approaches: statistical, grammar rule-based, and hybrid. The hybrid approach, which brings together the best of the other two, is a salutary so lution to the problem presented. In this research, the rule-based, subject-verb-concordance (SVC) approach was employed for the analysis of verb agreement errors and n-gram statistical approach with a machine learning classifier. This system uses three libraries from python language for the NLP tasks: spaCy, mlconjug3 and NLTK. The hybrid approach proved to be effective in the error analysis task, for simple sentences, obtaining a recall of 94%, a precision of 89% and an f-score of 91%. The correction, even having a precision below 50%, ended up having a good performance, since in languages like portuguese, there are several correction options.pt_BR
dc.description.abstractEste trabalho de conclusão de curso tem como objetivo desenvolver um sistema de correção de erros gramaticais (CEG) para a análise e correção de concordância verbal na língua portuguesa. A escrita possibilitou e ainda possibilita uma importante contribuição para o desenvolvimento da civilização humana. A importância de uma escrita correta é fundamental para que estudos, registros e entre outros, sejam benéficos para a sociedade, visto que erros gramaticais podem causar sérios danos ao correto entendimento, eliminando os benefícios obtidos. Porém são bastante custosos os métodos de correção de texto realizados por humanos. Por conta disso, dentro do processamento de linguagem natural (PLN), área que estuda de maneira computacional as linguagens naturais, existe a CEG, que se propõe para detectar e corrigir erros gramaticais. A CEG tipicamente tem três abordagens: estatística, baseada em regras gramaticais e híbrida. A abordagem híbrida, que une o melhor das outras duas abordagens, é uma solução salutar para esse problema. Neste trabalho, a abordagem baseada em regra, sujeito-verbo-concordância (SVC), foi empregada para a análise de erros de concordância verbal e a abordagem estatística n-grama com um classificador de aprendizado de máquina, para a correção dos erros. Este sistema usa três bibliotecas da linguagem python para as tarefas de PLN: spaCy, mlconjug3 e NLTK. A abordagem híbrida mostrou-se eficaz na tarefa de análise de erros, para frases simples, obtendo um recall de 94%, uma precisão de 89% e um f-score de 91%. Já a correção, mesmo tendo uma precisão abaixo de 50%, acabou tendo um bom desempenho, visto que em línguas como o português, existe mais de uma correção.pt_BR
dc.publisherUFMApt_BR
dc.subjectCorreção de Erros Gramatical;pt_BR
dc.subjectProcessamento de Linguagens Naturais;pt_BR
dc.subjectLíngua Portuguesa;pt_BR
dc.subjectAbordagem híbrida;pt_BR
dc.subjectSujeito-Verbo-Objeto;pt_BR
dc.subjectN-grama;pt_BR
dc.subjectClassificador;pt_BR
dc.subjectAprendizado de Máquinapt_BR
dc.subjectGrammatical Error Correction;pt_BR
dc.subjectNatural Language Processing;pt_BR
dc.subjectPortuguese Language;pt_BR
dc.subjectHybrid Approach;pt_BR
dc.subjectSubject-Verb-Objectpt_BR
dc.titleUMA ABORDAGEM HÍBRIDA DE CORREÇÃO GRAMATICAL DE CONTEÚDOS PRODUZIDOS NA LÍNGUA PORTUGUESApt_BR
dc.title.alternativeA HYBRID APPROACH TO GRAMMATICALLY CORRECT CONTENT PRODUCED IN THE PORTUGUESE LANGUAGEpt_BR
dc.typeOtherpt_BR
Aparece nas coleções:TCCs de Graduação em Ciência da Computação do Campus do Bacanga

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Arthur Azevedo TCC.pdfTCC de Graduação16,83 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.