Use este identificador para citar ou linkar para este item:
http://hdl.handle.net/123456789/8354
Título: | Avanços na Resolução de Problemas de Programação: Uma Comparação entre Chat GPT 3.5 e Chat GPT 4 através de Desafios da BeeCrowd |
Título(s) alternativo(s): | Advances in Programming Problem Solving: A Comparison Between Chat GPT 3.5 and Chat GPT 4 via BeeCrowd Challenges |
Autor(es): | ALMEIDA, Ednildo Cunha |
Palavras-chave: | Análise Comparativa; Chat GPT 3.5; Chat GPT 4; plataforma BeeCrowd Comparative Analysis; Chat GPT 3.5; Chat GPT 4; BeeCrowd Platform |
Data do documento: | 11-Set-2024 |
Editor: | UFMA |
Resumo: | O presente trabalho apresenta uma análise comparativa entre os modelos de linguagem natural Chat GPT 3.5 e Chat GPT 4, focando na resolução de problemas de programação na plataforma BeeCrowd. O objetivo central é avaliar a eficácia das duas versões do modelo na resolução de 50 problemas categorizados em níveis de dificuldade (fácil, intermediário e difícil), replicando um experimento realizado anteriormente com o Chat GPT 3.5. A pesquisa utiliza uma metodologia de submissão de problemas à plataforma, comparando os resultados obtidos pelas duas versões do Chat GPT. O estudo abrange aspectos como a taxa de acertos e erros, a quantidade de tentativas necessárias para a resolução correta e tipos de erros encontrados. Além disso, o trabalho explora as limitações do Chat GPT 4, especialmente na interpretação de exemplos de entrada e saída nas questões de programação, o que resultou em um desempenho inferior ao do Chat GPT 3.5. Os resultados mostraram que o Chat GPT 3.5 obteve uma taxa de acerto de 42%, enquanto o Chat GPT 4 alcançou apenas 2% de sucesso. A pesquisa também levanta hipóteses sobre o baixo desempenho do Chat GPT 4, bem como realiza experimentos adicionais para discutir tais hipóteses, destacando a importância de fornecer instruções explícitas sobre os exemplos nas questões para melhorar a precisão das respostas geradas. Conclui-se que, apesar dos avanços tecnológicos incorporados no Chat GPT 4, seu desempenho na resolução de problemas de programação não superou o de seu antecessor. |
Descrição: | The present work presents a comparative analysis between the natural language models Chat GPT 3.5 and Chat GPT 4, focusing on solving programming problems on the BeeCrowd platform. The main objective is to evaluate the effectiveness of the two versions of the model in solving 50 problems categorized by difficulty levels (easy, intermediate, and hard), replicating a previously conducted experiment with Chat GPT 3.5. The research employs a problem submission methodology to the platform, comparing the results obtained by both versions of Chat GPT. The study covers aspects such as success and failure rates, the number of attempts required for correct resolution, and types of errors encountered. Additionally, the work explores the limitations of Chat GPT 4, particularly in interpreting input and output examples in programming problems, which resulted in a lower performance compared to Chat GPT 3.5. The results showed that Chat GPT 3.5 achieved a success rate of 42%, while Chat GPT 4 only reached a 2% success rate. The research also raises hypotheses about Chat GPT 4’s low performance and conducts additional experiments to discuss these hypotheses, highlighting the importance of providing explicit instructions regarding examples in the questions to improve the accuracy of the generated responses. It concludes that, despite the technological advances incorporated into Chat GPT 4, its performance in solving programming problems did not surpass that of its predecessor. |
URI: | http://hdl.handle.net/123456789/8354 |
Aparece nas coleções: | TCCs de Graduação de Engenharia da Computação do Campus do Bacanga |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Ednildo Cunha Almeida.pdf | TCC de Graduação | 2,7 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.