Avanços na Resolução de Problemas de Programação: Uma Comparação entre Chat GPT 3.5 e Chat GPT 4 através de Desafios da BeeCrowd

ALMEIDA, Ednildo Cunha

Use este identificador para citar ou linkar para este item: http://hdl.handle.net/123456789/8354

Título:	Avanços na Resolução de Problemas de Programação: Uma Comparação entre Chat GPT 3.5 e Chat GPT 4 através de Desafios da BeeCrowd
Título(s) alternativo(s):	Advances in Programming Problem Solving: A Comparison Between Chat GPT 3.5 and Chat GPT 4 via BeeCrowd Challenges
Autor(es):	ALMEIDA, Ednildo Cunha
Palavras-chave:	Análise Comparativa; Chat GPT 3.5; Chat GPT 4; plataforma BeeCrowd Comparative Analysis; Chat GPT 3.5; Chat GPT 4; BeeCrowd Platform
Data do documento:	11-Set-2024
Editor:	UFMA
Resumo:	O presente trabalho apresenta uma análise comparativa entre os modelos de linguagem natural Chat GPT 3.5 e Chat GPT 4, focando na resolução de problemas de programação na plataforma BeeCrowd. O objetivo central é avaliar a eficácia das duas versões do modelo na resolução de 50 problemas categorizados em níveis de dificuldade (fácil, intermediário e difícil), replicando um experimento realizado anteriormente com o Chat GPT 3.5. A pesquisa utiliza uma metodologia de submissão de problemas à plataforma, comparando os resultados obtidos pelas duas versões do Chat GPT. O estudo abrange aspectos como a taxa de acertos e erros, a quantidade de tentativas necessárias para a resolução correta e tipos de erros encontrados. Além disso, o trabalho explora as limitações do Chat GPT 4, especialmente na interpretação de exemplos de entrada e saída nas questões de programação, o que resultou em um desempenho inferior ao do Chat GPT 3.5. Os resultados mostraram que o Chat GPT 3.5 obteve uma taxa de acerto de 42%, enquanto o Chat GPT 4 alcançou apenas 2% de sucesso. A pesquisa também levanta hipóteses sobre o baixo desempenho do Chat GPT 4, bem como realiza experimentos adicionais para discutir tais hipóteses, destacando a importância de fornecer instruções explícitas sobre os exemplos nas questões para melhorar a precisão das respostas geradas. Conclui-se que, apesar dos avanços tecnológicos incorporados no Chat GPT 4, seu desempenho na resolução de problemas de programação não superou o de seu antecessor.
Descrição:	The present work presents a comparative analysis between the natural language models Chat GPT 3.5 and Chat GPT 4, focusing on solving programming problems on the BeeCrowd platform. The main objective is to evaluate the effectiveness of the two versions of the model in solving 50 problems categorized by difficulty levels (easy, intermediate, and hard), replicating a previously conducted experiment with Chat GPT 3.5. The research employs a problem submission methodology to the platform, comparing the results obtained by both versions of Chat GPT. The study covers aspects such as success and failure rates, the number of attempts required for correct resolution, and types of errors encountered. Additionally, the work explores the limitations of Chat GPT 4, particularly in interpreting input and output examples in programming problems, which resulted in a lower performance compared to Chat GPT 3.5. The results showed that Chat GPT 3.5 achieved a success rate of 42%, while Chat GPT 4 only reached a 2% success rate. The research also raises hypotheses about Chat GPT 4’s low performance and conducts additional experiments to discuss these hypotheses, highlighting the importance of providing explicit instructions regarding examples in the questions to improve the accuracy of the generated responses. It concludes that, despite the technological advances incorporated into Chat GPT 4, its performance in solving programming problems did not surpass that of its predecessor.
URI:	http://hdl.handle.net/123456789/8354
Aparece nas coleções:	TCCs de Graduação de Engenharia da Computação do Campus do Bacanga

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
Ednildo Cunha Almeida.pdf	TCC de Graduação	2,7 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas