Minha Monografia VII - Capítulo 2, parte 1

CAPÍTULO 2 - COMO O WEKA FUNCIONA


2.1 - HISTÓRIA


O WEKA começou a ser planejado em 1992, mas só começou a ser desenvolvido em 1993, quando o governo da Nova Zelândia aprovou o financiamento do projeto do professor universitário Ian Witten, e teve sua primeira versão pública lançada em 1996. Ian Witten decidiu iniciar o projeto porque, em sua opinião, o Departamento de Ciências da Computação da Universidade de Waikato não possuía muitos projetos voltados para pesquisa.

Sua primeira versão foi escrita em C, mas em 1997 foi iniciada a sua reescrita utilizando Java. A nova versão foi lançada em 1999.

Por ser um software de código aberto e por fornecer uma biblioteca em Java, existem hoje vários projetos que foram criados tendo como base o motor do WEKA.

Seu nome é a abreviação de Waikato Environment for Knowledge Analysis - Ambiente para Análise de Conhecimento de Waikato.


2.2 - O SISTEMA


O WEKA é um sistema de mineração de dados que fornece várias funcionalidades para o usuário. Ele provê dezenas de algoritmos de mineração de dados diferentes, a maioria deles amplamente parametrizáveis. Além disso, é possível comparar a performance de algoritmos diferentes.

À parte suas ferramentas de mineração de dados, o WEKA provê, ainda, ferramentas para pré-processamento dos dados, que incluem ferramentas de filtragem de dados e de auxílio para a escolha dos atributos que devem ser levados em consideração durante a mineração propriamente dita.

Todas estas características tornam o WEKA uma ferramenta útil tanto para o aprendiz da disciplina de mineração de dados que ainda esteja aprendendo os seus princípios fundamentais quanto para o pesquisador experiente que deseja utilizar uma plataforma robusta mas ainda assim simples de se trabalhar.


2.3 - INTERFACE


A utilização do WEKA pode ser feita através de quatro interfaces diferentes. A Explorer (Exploradora) é a mais simples de todas, permitindo que o usuário acesse os recursos do sistema através de menus e do preenchimento de formulários.

Knowledge Flow (Fluxo de Conhecimento) é a interface através da qual pode-se realizar processamento de bases de dados muito extensas, sendo possível determinar mais de uma fonte de dados e a sequência de passos a serem tomados pelo WEKA na mineração de dados.

A interface Experimenter (Experimentadora) foi criada com a intenção de servir como uma facilitadora do processo de decidir qual algoritmo trabalha melhor com uma determinada base de dados, podendo ser possível configurar vários algoritmos (ou o mesmo algoritmo com diferentes parâmetros) e executá-los de uma vez só.

Por fim, a interface de linha de comando permite que as funcionalidades do WEKA sejam executadas e controladas através do envio de comandos de texto.

Quando o usuário executa o WEKA, a primeira janela exibida para ele é aquela na qual ele pode escolher qual das interfaces ele deseja utilizar. As seções a seguir detalham cada uma destas interfaces.

Nenhum comentário: