O tema da pesquisa foi o funcionamento do sistema WEKA, cujo objetivo é oferecer de forma simples várias ferramentas de mineração de dados, disponibilizando uma série de algoritmos desenvolvidos para fazer com que computadores sejam capazes de aprender e descobrir padrões em grandes conjuntos de dados. Ele é capaz de analisar dados utilizando mais de cem algoritmos diferentes e exibir os resultados graficamente.
O WEKA começou a ser planejado em 1992, mas só começou a ser desenvolvido em 1993, quando o governo da Nova Zelândia aprovou o financiamento do projeto do professor universitário Ian Witten e teve sua primeira versão pública lançada em 1996. Por ser um sistema de código fonte aberto, já existem vários projetos que acrescentam funcionalidade ao WEKA e/ou que utilizam sua tecnologia para alcançar objetivos ainda mais ambiciosos.
Os objetivos da pesquisa foram definir mineração de dados; expor o funcionamento do programa WEKA, demonstrando como é feita a mineração de dados utilizando sistema; e analisar um estudo de caso de uso do sistema, expondo quais foram os resultados de um trabalho de mineração de dados que utilizou o WEKA.
O referencial teórico para a pesquisa foi a segunda edição do livro Data Mining: Practical Machine Learning Tools and Techniques, escrito por Ian Witten e Eibe Frank. O livro explica o que é mineração de dados e ensina como utilizar o WEKA para analisar fontes de dados.
Ian Witten é professor de Ciência da Computação da Universidade de Waikato. Nascido na Inglaterra, vive e trabalha na Nova Zelândia desde 1991. Iniciou o projeto do WEKA porque desejava fomentar atividades de pesquisa na Universidade.
Eibe Frank é professor associado na Universidade de Waikato e coordenador de pesquisas no curso de graduação. Nascido na Alemanha, foi para a Nova Zelândia em 1996 para realizar um curso de doutorado em aprendizagem de máquina, um ramo da inteligência artificial. Lá, foi aluno de Ian Witten, onde envolveu-se com o desenvolvimento do WEKA, projeto do qual participa desde então.
A motivação para a execução desta pesquisa foi o fato de que, atualmente, aumenta cada vez mais o número de empresas proprietárias de bancos de dados cujos tamanhos crescem exponencialmente e, ao lado disso, surge a curiosidade sobre padrões de dados que podem estar ocultos em tanta informação. Acreditamos que divulgar e explicar o funcionamento de um sistema de mineração de dados pode contribuir tanto para suprir a demanda destas empresas quanto para despertar o interesse de estudantes de tecnologia para uma ferramenta e um assunto cada vez mais procurados e discutidos.
A pesquisa foi realizada com enfoque fenomenológico, utilizando a abordagem qualitativa sobre as informações disponíveis, realizando pesquisa bibliográfica e descritiva de trabalho já realizado sobre o assunto.
Nenhum comentário:
Postar um comentário