Use este identificador para citar ou linkar para este item: http://hdl.handle.net/123456789/3267
Título: Mineração de dados usando o algoritmo Chaid
Título(s) alternativo(s): Data Mining Using the Chaid Algorithm
Autor(es): SÁ, Jefferson Ferreira
Palavras-chave: KDD
Classificação
Método CHAID
Árvore de decisão
KDD
Classification
CHAID method
Decision tree
Data do documento: 13-Jul-2012
Editor: Universidade Federal do Maranhão
Resumo: O processo de Descoberta de Conhecimento em Bases de Dados ou Knowledge Discovery in Database (KDD) é a técnica de identificar padrões úteis em dados não processados. Essa técnica possui diversas etapas, sendo o processo de Mineração de Dados a mais importante na extração de conhecimento. Entre os diversos algoritmos usados nessa etapa, explicamos a fundo uma das técnicas de classificação de dados mais antigas, o método CHAID. Esse trabalho, além de esclarecer o algoritmo CHAID, buscou aplicá-lo a um estudo de caso que usando os registros presentes na base de dados da Pesquisa Nacional por Amostra de Domicílios (PNAD), realizada em todo Brasil pelo Instituto Brasileiro de Geografia e Estatística (IBGE) no ano de 2008, gerou uma Árvore de Decisão que traçou o perfil socioeconômico dos entrevistados relacionando o nível de escolaridade com a situação econômica dos mesmos. Com os resultados percebemos que entre os entrevistados com as menores rendas, a maioria possui apenas o ensino fundamental, sendo que o aumento do rendimento mensal das pessoas está diretamente relacionado ao grau de instrução delas, onde aquelas que apresentam os maiores rendimentos do Brasil, grande parte tem nível superior completo.
Descrição: ABSTRACT The process of Descoberta de Conhecimento em Bases de Dados or Knowledge Discovery in Database (KDD) is the technique to identify useful patterns in unprocessed data. This technique has several stages, the process of Data Mining in the most important knowledge extraction. Among the various algorithms used in this step, we explain the background of the techniques for data classification older method CHAID. This work, besides clarifying the CHAID algorithm, we tried to apply it to a case study using the records present in the database from the Pesquisa Nacional por Amostra de Domicílios (PNAD), conducted throughout Brazil by the Instituto Brasileiro de Geografia e Estatística (IBGE) in 2008, generated a Decision Tree that traced the socioeconomic profile of respondents relating to educational level with the economic situation of the same. With the results we see that among those with the lowest incomes, most have only primary education, and increasing the monthly income of people is directly related to schooling of them, where those with the highest yields in Brazil, a large part has college degrees.
URI: http://hdl.handle.net/123456789/3267
Aparece nas coleções:TCCs de Graduação em Ciência da Computação do Campus do Bacanga

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
JEFFERSON-SA.pdfTrabalho de Conclusão de Curso1,49 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.