Use este identificador para citar ou linkar para este item: http://hdl.handle.net/123456789/7629
Título: Evolução das fake news no Brasil no decorrer da pandemia
Título(s) alternativo(s): Evolution of fake news in Brazil during the pandemic
Autor(es): NEVES, Daniela Carvalho Ferraz Nolasco
Palavras-chave: COVID-19;
Fake News;
Mineração de Texto;
Agrupamento;
Categorias
COVID-19;
Fake News;
Text Mining;
Clustering;
Categories
Data do documento: 3-Jan-2023
Editor: UFMA
Resumo: No início da pandemia do coronavírus, outro fenômeno foi observado: o disseminação de informações falsas (popularmente conhecidas como fake news) em larga escala no os mais diversos períodos, reconhecida como “infodemia” pelo diretor da Organização Saúde Mundial. Para estudar a disseminação de informações falsas, foi criada uma base de dados relacionada ao tema Foi utilizado o COVID-19, com informações de 2020 a 2022 coletadas em Boatos.org. De dados coletados, foi realizado tratamento e análise dos dados obtidos. Além disso, foi necessário aplicar técnicas de mineração de texto para realizar o pré-processamento de as falsas manchetes obtidas - remoção de palavras vazias, normalização morfológica, filtragem e ponderação com técnica TF-IDF e análise de componentes principais (PCA). Por fim, utilizou-se o K-Means para agrupar as informações coletadas, definindo o número de clusters necessários por meio do método Elbow. Dos grupos definidos, para visualizar os mais frequentes termos, nuvens de palavras de cada cluster foram exibidas. Dados os termos mais frequentes em cada grupo em cada semestre de 2020 a 2022, as notícias falsas foram classificadas em uma ou mais 9 possíveis grupos de categorias de notícias falsas relacionadas à COVID-19. Da categorização de das notícias falsas obtidas, foi realizado um levantamento dos grupos de categorias mais frequentes em cada semestre e em cada ano, a fim de verificar o andamento das falsas narrativas conforme novas informações foram dadas a cada semestre e a cada ano da pandemia no Brasil.
Descrição: At the beginning of the coronavirus pandemic, another phenomenon was observed: the dissemination of false information (popularly known as fake news) on a large scale in the most diverse periods, recognized as an ”infodemic”by the director of the Organization World Health. To study the spread of false information, a database related to the topic of COVID-19 was used, with information from 2020 to 2022 collected at Boatos.org. From the collected data, a treatment and analysis of the obtained data were carried out. Furthermore, it was necessary to apply text mining techniques in order to perform pre-processing of the false news headlines obtained - removal of empty words, morphological normalization, filtering and weighting with TF-IDF technique, and principal componente analysis (PCA). Finally, K-Means was used to group the collected information, defining the number of clusters needed via the Elbow method. From the defined groups, to view the most frequent terms, word clouds of each cluster were displayed. Given the most frequent terms in each group in each semester from 2020 to 2022, fake news were classified into one or more 9 possible groups of fake news categories related to COVID-19. From the categorization of the fake news obtained, a survey was carried out of the most frequent groups of categories in each semester and in each year, in order to verify the progress of the false narratives as new information was given in each semester and in each year of the pandemic in Brazil
URI: http://hdl.handle.net/123456789/7629
Aparece nas coleções:TCCs de Graduação de Engenharia da Computação do Campus do Bacanga

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DANIELA CARVALHO FERRAZ NOLASCO NEVES.pdfTCC de Graduação6,44 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.