Use este identificador para citar ou linkar para este item:
http://hdl.handle.net/123456789/7557
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.author | BERNHARD, Pedro Vinnícius | - |
dc.date.accessioned | 2024-06-25T16:42:30Z | - |
dc.date.accessioned | 2024-06-25T16:42:33Z | - |
dc.date.accessioned | 2024-06-25T16:42:35Z | - |
dc.date.available | 2024-06-25T16:42:30Z | - |
dc.date.available | 2024-06-25T16:42:33Z | - |
dc.date.available | 2024-06-25T16:42:35Z | - |
dc.date.issued | 2023 | - |
dc.identifier.uri | http://hdl.handle.net/123456789/7557 | - |
dc.description.abstract | Resumo: O Tribunal de Contas do Estado do Maranhão (TCE/MA) desempenha um papel essencial no controle das contas públicas, utilizando o Sistema de Prestação de Contas Anual eletrônica (e-PCA). Nesse processo, os fiscalizados enviam documentos eletrônicos relacionados às prestações de contas de governo e de gestores, classificados conforme normativas estabelecidas. É importante, portanto, a correta classificação dos documentos para assegurar a conformidade com os padrões estabelecidos pelo tribunal. A utilização de tecnologias avançadas, como Large Language Models (LLMs), tem se destacado como uma abordagem promissora para otimizar esse processo. Neste estudo, a investigação concentrou-se na utilização de LLMs para a classificação de documentos referentes às prestações de contas anuais de gestores recebidos pelo TCE/MA. Três modelos de LLMs foram examinados: mBERT, XLM-RoBERTa e mT5. Essas LLMs foram aplicadas a um conjunto de dados de textos extraídos, especificamente compilado para a pesquisa, com base em documentos fornecidos pelo TCE/MA, e avaliadas com base no F1-score. Os resultados revelaram que o modelo XLM-RoBERTa atingiu um F1-score de 98,99%±0,12%, enquanto o mBERT alcançou 98,65% ± 0,29% e a mT5 apresentou 98,71% ± 0,75%. Esses resultados destacam a eficácia das LLMs na classificação de documentos de prestação de contas, proporcionando contribuições para os avanços no campo do processamento de linguagem natural. Essas abordagens têm o potencial de serem exploradas para aprimorar a automação e a precisão nas classificações de documentos.__Abstract: The Tribunal de Contas do Estado do Maranhão (TCE/MA) plays an essential role in controlling public accounts, using the electronic annual accountability system (e-PCA). In this process, the auditees send electronic documents related to the rendering of government and management accounts, classified according to established regulations. It is therefore important to classify documents correctly to ensure compliance with the standards set by the court. The use of advanced technologies, such as Large Language Models (LLMs), has been highlighted as a promising approach to the optimization of this process. In this study, the research focused on the use of LLMs to classify documents relating to the annual accounts of managers received by the TCE/MA. Three LLM models were examined: mBERT, XLM-RoBERTa and mT5. These LLMs were applied to a dataset of extracted texts specifically compiled for the research, based on documents provided by the TCE/MA, and evaluated based on the F1-score. The results strongly suggested that the XLM-RoBERTa model achieved an F1-score of 98,99% ± 0,12%, while mBERT achieved 98,65% ± 0,29% and mT5 showed 98,71% ± 0,75%. These results highlight the effectiveness of LLMs in classifying accountability documents, providing contributions to advances in the field of natural language processing. These approaches have the potential to be exploited to improve automation and accuracy in document classifications. | pt_BR |
dc.language.iso | other | pt_BR |
dc.publisher | Universidade Federal do Maranhão | pt_BR |
dc.subject | large language models; | pt_BR |
dc.subject | processamento de linguagem natural; | pt_BR |
dc.subject | classificação de documentos; | pt_BR |
dc.subject | prestação de contas; | pt_BR |
dc.subject | TCE/MA; | pt_BR |
dc.subject | large language models; | pt_BR |
dc.subject | natural language processing; | pt_BR |
dc.subject | document classification; | pt_BR |
dc.subject | accountability; | pt_BR |
dc.subject | TCE/MA. | pt_BR |
dc.title | Estudo Comparativo de Large Language Models aplicados à classificação de documentos de Prestação de Contas Públicas | pt_BR |
dc.title.alternative | Comparative Study of Major Language Models applied to the classification of Public Accountability documents | pt_BR |
dc.type | Other | pt_BR |
Aparece nas coleções: | TCCs de Graduação em Ciência da Computação do Campus do Bacanga TCCs de Graduação em Ciência da Computação do Campus do Bacanga TCCs de Graduação em Ciência da Computação do Campus do Bacanga |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Pedro_Bernhard.pdf | Trabalho de Concclusão de Curso | 2,28 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.