Use este identificador para citar ou linkar para este item:
http://hdl.handle.net/123456789/3267
Título: | Mineração de dados usando o algoritmo Chaid |
Título(s) alternativo(s): | Data Mining Using the Chaid Algorithm |
Autor(es): | SÁ, Jefferson Ferreira |
Palavras-chave: | KDD Classificação Método CHAID Árvore de decisão KDD Classification CHAID method Decision tree |
Data do documento: | 13-Jul-2012 |
Editor: | Universidade Federal do Maranhão |
Resumo: | O processo de Descoberta de Conhecimento em Bases de Dados ou Knowledge Discovery in Database (KDD) é a técnica de identificar padrões úteis em dados não processados. Essa técnica possui diversas etapas, sendo o processo de Mineração de Dados a mais importante na extração de conhecimento. Entre os diversos algoritmos usados nessa etapa, explicamos a fundo uma das técnicas de classificação de dados mais antigas, o método CHAID. Esse trabalho, além de esclarecer o algoritmo CHAID, buscou aplicá-lo a um estudo de caso que usando os registros presentes na base de dados da Pesquisa Nacional por Amostra de Domicílios (PNAD), realizada em todo Brasil pelo Instituto Brasileiro de Geografia e Estatística (IBGE) no ano de 2008, gerou uma Árvore de Decisão que traçou o perfil socioeconômico dos entrevistados relacionando o nível de escolaridade com a situação econômica dos mesmos. Com os resultados percebemos que entre os entrevistados com as menores rendas, a maioria possui apenas o ensino fundamental, sendo que o aumento do rendimento mensal das pessoas está diretamente relacionado ao grau de instrução delas, onde aquelas que apresentam os maiores rendimentos do Brasil, grande parte tem nível superior completo. |
Descrição: | ABSTRACT The process of Descoberta de Conhecimento em Bases de Dados or Knowledge Discovery in Database (KDD) is the technique to identify useful patterns in unprocessed data. This technique has several stages, the process of Data Mining in the most important knowledge extraction. Among the various algorithms used in this step, we explain the background of the techniques for data classification older method CHAID. This work, besides clarifying the CHAID algorithm, we tried to apply it to a case study using the records present in the database from the Pesquisa Nacional por Amostra de Domicílios (PNAD), conducted throughout Brazil by the Instituto Brasileiro de Geografia e Estatística (IBGE) in 2008, generated a Decision Tree that traced the socioeconomic profile of respondents relating to educational level with the economic situation of the same. With the results we see that among those with the lowest incomes, most have only primary education, and increasing the monthly income of people is directly related to schooling of them, where those with the highest yields in Brazil, a large part has college degrees. |
URI: | http://hdl.handle.net/123456789/3267 |
Aparece nas coleções: | TCCs de Graduação em Ciência da Computação do Campus do Bacanga |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
JEFFERSON-SA.pdf | Trabalho de Conclusão de Curso | 1,49 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.