Use este identificador para citar ou linkar para este item: http://hdl.handle.net/123456789/6379
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.authorPAIVA, Thiago Gustavo Vieira de-
dc.date.accessioned2023-05-24T18:08:53Z-
dc.date.available2023-05-24T18:08:53Z-
dc.date.issued2021-
dc.identifier.urihttp://hdl.handle.net/123456789/6379-
dc.descriptionAbstract In this work we present a novel approach for query expansion. This approach incorporates word embedding features and expressions to build a query expansion model, in order to retrieve relevant documents considering the similarity of terms to the original query. By using Word2Vec’s CBOW embedding approach, we select terms that are semantically related to the expressions and keywords from the document URLs, title and document content. The scores obtained by Word2Vec are used to select the best candidate terms for the expanded queries. We also re-rank documents based on where the relevant context was found in each document. The proposed method is evaluated using a dataset containing news articles, The New York Times Annotated Corpus which demonstrates the features used for the query expansion to increase the precision of retrieved documents in comparison to the retrieved documents from the original query.pt_BR
dc.description.abstractResumo Neste trabalho, uma nova abordagem para expansão de queries é apresentada usando word embeddings. Esta abordagem incorpora recursos presentes em expressões para construir um modelo de expansão de queries, a fim de recuperar documentos relevantes considerando a similaridade entre os termos e a query original. Através do modelo CBOW do Word2Vec, os termos selecionados são semanticamente relacionados às expressões, além de keywords extraídas de URLs, títulos e dentro do próprio conteúdo de texto dos documentos. Os scores obtidos pelo Word2Vec para esses termos são usados para selecionar os melhores termos candidatos para compor as queries expandidas. Também realizamos o re-ranqueamento dos documentos baseado no local de contexto onde os termos foram encontrados em cada documento. O método proposto é avaliado num dataset de artigos de notícias, The New York Times Annotated Corpus e demonstra que os recursos propostos usados para expansão podem efetivamente aumentar a precisão dos documentos recuperados em comparação com os documentos recuperados pela query original.pt_BR
dc.language.isootherpt_BR
dc.publisherUniversidade Federal do Maranhãopt_BR
dc.subjectrecuperação de Informação;pt_BR
dc.subjectword embeddings;pt_BR
dc.subjectexpansão de queries.pt_BR
dc.subjectinformation retrieval;pt_BR
dc.subjectword embeddings;pt_BR
dc.subjectquery expansion.pt_BR
dc.titleExpansão de queries com word embeddingspt_BR
dc.title.alternativeExpanding queries with word embeddingspt_BR
dc.typeOtherpt_BR
Aparece nas coleções:TCCs de Graduação em Ciência da Computação do Campus do Bacanga

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
ThiagoGustavoVieiradePaiva.pdfTrabalho de Conclusão de Curso1,19 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.