Mineração de dados usando o algoritmo Chaid

SÁ, Jefferson Ferreira

Use este identificador para citar ou linkar para este item: http://hdl.handle.net/123456789/3267

Título:	Mineração de dados usando o algoritmo Chaid
Título(s) alternativo(s):	Data Mining Using the Chaid Algorithm
Autor(es):	SÁ, Jefferson Ferreira
Palavras-chave:	KDD Classificação Método CHAID Árvore de decisão KDD Classification CHAID method Decision tree
Data do documento:	13-Jul-2012
Editor:	Universidade Federal do Maranhão
Resumo:	O processo de Descoberta de Conhecimento em Bases de Dados ou Knowledge Discovery in Database (KDD) é a técnica de identificar padrões úteis em dados não processados. Essa técnica possui diversas etapas, sendo o processo de Mineração de Dados a mais importante na extração de conhecimento. Entre os diversos algoritmos usados nessa etapa, explicamos a fundo uma das técnicas de classificação de dados mais antigas, o método CHAID. Esse trabalho, além de esclarecer o algoritmo CHAID, buscou aplicá-lo a um estudo de caso que usando os registros presentes na base de dados da Pesquisa Nacional por Amostra de Domicílios (PNAD), realizada em todo Brasil pelo Instituto Brasileiro de Geografia e Estatística (IBGE) no ano de 2008, gerou uma Árvore de Decisão que traçou o perfil socioeconômico dos entrevistados relacionando o nível de escolaridade com a situação econômica dos mesmos. Com os resultados percebemos que entre os entrevistados com as menores rendas, a maioria possui apenas o ensino fundamental, sendo que o aumento do rendimento mensal das pessoas está diretamente relacionado ao grau de instrução delas, onde aquelas que apresentam os maiores rendimentos do Brasil, grande parte tem nível superior completo.
Descrição:	ABSTRACT The process of Descoberta de Conhecimento em Bases de Dados or Knowledge Discovery in Database (KDD) is the technique to identify useful patterns in unprocessed data. This technique has several stages, the process of Data Mining in the most important knowledge extraction. Among the various algorithms used in this step, we explain the background of the techniques for data classification older method CHAID. This work, besides clarifying the CHAID algorithm, we tried to apply it to a case study using the records present in the database from the Pesquisa Nacional por Amostra de Domicílios (PNAD), conducted throughout Brazil by the Instituto Brasileiro de Geografia e Estatística (IBGE) in 2008, generated a Decision Tree that traced the socioeconomic profile of respondents relating to educational level with the economic situation of the same. With the results we see that among those with the lowest incomes, most have only primary education, and increasing the monthly income of people is directly related to schooling of them, where those with the highest yields in Brazil, a large part has college degrees.
URI:	http://hdl.handle.net/123456789/3267
Aparece nas coleções:	TCC de Graduação em Ciência da Computação do Campus do Bacanga

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
JEFFERSON-SA.pdf	Trabalho de Conclusão de Curso	1,49 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas