Use este identificador para citar ou linkar para este item: http://hdl.handle.net/123456789/3254
Título: Classificação de dados usando técnicas de dataminig e aprendizado de máquina
Título(s) alternativo(s): Classification of data using dataminig techniques and machine learning
Autor(es): VIEIRA JUNIOR, Valdecy
Palavras-chave: KDD
Classificação
Método SVM.
KDD
Ranking.
SVM method
Data do documento: 28-Fev-2013
Editor: Universidade Federal do Maranhão
Resumo: O Knowledge Discovery in Database é uma técnica de descoberta de conhecimento em Base de Dados que identifica padrões úteis em dados não processados. O KDD é uma técnica que possui várias etapas, sendo o processo de Mineração de Dados a mais importante na extração de conhecimento. Entre os diversos algoritmos usados nessa etapa, explicamos um das técnicas de classificação de dados mais antigas, o método SVM. Esse trabalho, além de esclarecer o algoritmo de SVM (Support Vector Machine), buscou aplicá-lo a um estudo de caso, onde um pesquisador médico obteve um conjunto de dados que contém as características de um certo número de amostras de células humanas extraídas de pacientes que se acreditava estar em risco de desenvolver câncer. Essa base de dados esta disponível na UCI Repositório (Assunção e Newman, 2007), além disso consta com exemplo no repositório do software Clementine, onde este gerou uma classificação dessas. Esta classsificação foi feita pelos Kernels do SVM, ou seja, o Kernel Sibmoidal, Linear, RBF (Gausiano) e o Polynomial, além da comparação feita entre Kernels, foi feita também uma analise entre diversos algoritmos, tais como: QUEST, CHAID e o Neural Network
Descrição: ABSTRACT The Knowledge Discovery in Database is a technique for knowledge discovery in database identifying useful patterns in raw data. KDD is a technique that has several stages, the process of Data Mining in the most important knowledge extraction. Among the different algorithms used in this step, explained one of the techniques of data classification oldest, the SVM method. This work, as well as clarifying algorithm SVM (Support Vector Machine), we attempted to apply it to a case where a medical researcher obtained a data set that contains the characteristics of a number of samples extracted from human cells patients believed to be at risk of developing cancer. This database is available at the UCI Repository (Asuncion and Newman, 2007) also appears in the example with Clementine software repository, where it generated a classification of these. This was done by CLASSIFICATION SVM kernels, namely the Kernel Sibmoidal, Linear, RBF (Gausiano) and polynomial, and the comparison made between kernels, an analysis was also made between different algorithms, such as QUEST, CHAID and Neural Network.
URI: http://hdl.handle.net/123456789/3254
Aparece nas coleções:TCCs de Graduação em Ciência da Computação do Campus do Bacanga

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
ValdecyJunior.pdfTrabalho de Conclusão de Curso1,69 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.