Minha Monografia IX - Capítulo 2, parte 3

2.3.3 - Experimenter


Mesmo que disponibilizem ao usuário todas as ferramentas necessárias para a mineração de uma determinada base de dados, as interfaces Explorer e Knowledge Flow não são amigáveis para experimentos investigativos de grande porte, o que inclui executar várias diferentes configurações de determinados algoritmos de mineração sobre uma base de dados e sua posterior validação com bases de dados extras.

Para esta finalidade o WEKA disponibiliza a interface Experimenter, que permite ao usuário configurar estas definições de grande porte e longa duração, automatizando o processo de execução e sumarização de seus resultados. Os resultados e suas estatísticas podem, inclusive, ser exportados como arquivos .arff para que posteriormente, eles mesmos possam atuar como objeto de mineração.

Além disso, a interface Experimenter permite ao usuário distribuir o processamento da mineração dos dados para mais de uma máquina.

Ela é dividida em três painéis distintos. No primeiro deles o usuário tem à sua disposição todas as ferramentas necessárias para configurar seu experimento. Nele é possível definir qual é a base de dados sobre a qual os algoritmos de mineração de dados irão trabalhar, quais serão os algoritmos que serão executados e onde serão gravados os resultados do experimento. Assim como nas outras interfaces, o usuário pode configurar cada um dos algoritmos de acordo com suas necessidades. Alternativamente, o usuário pode definir mais de uma fonte de dados e configurar qual delas os algoritmos irão utilizar. Todas as configurações de um experimento podem ser salvas para que o usuário possa recuperá-las futuramente ou para transferi-las para outro computador.

O segundo painel, através do qual o experimento é posto em execução, é o mais simples de todos os existentes no WEKA. Ele contém apenas dois botões, que permitem iniciar e parar o processamento, e uma grande área de texto através da qual o usuário é informado sobre o andamento da execução.

Finalmente, o terceiro painel permite ao usuário analisar o resultado do último experimento executado ou então abrir um arquivo de resultado de algum experimento realizado anteriormente. Neste painel o usuário pode realizar análises comparativas dos resultados dos algoritmos de mineração de dados configurados para o experimento, levando em consideração dezenas de variáveis e estatísticas diferentes geradas pelo WEKA durante a execução do experimento.

Quando um experimento é configurado para ser executado em mais de um máquina, o resultado do processamento de cada uma das máquinas pode ser gravado diretamente em um banco de dados disponível na rede ou então cada uma delas pode gerar um arquivo .arff local. Estes arquivos .arff devem, ao fim do processamento, ser reunidos em um só. Além disso, para que um experimento distribuído funcione, é preciso que todas as máquinas que vão realizar o processamento estejam executando o servidor de experimentos remotos fornecido pelo WEKA e que todas sejam capazes de acessar a base de dados que será usada na mineração.


2.3.4 - Linha de Comando


Por trás das interfaces gráficas do WEKA roda o seu motor, que é onde todo o processamento realmente acontece. As interfaces gráficas, como seu próprio nome já indica, são apenas fachadas visuais que têm como objetivo fazer com que a utilização do motor do WEKA seja mais amigável para o usuário. Assim sendo, é possível utilizar o motor do WEKA sem utilizar nenhuma das interfaces, através do envio de comandos de texto diretamente para ele.

Composta apenas de uma grande área de texto e uma pequena área para inserção de comandos, a interface de linha de comando tem um uso extremamente simplificado. Basta que o usuário digite um comando e pressione a tecla enter. Após o envio de cada comando, a área de texto da janela da interface de linha de comando exibe o seu resultado. Para o caso de algoritmos de mineração, por exemplo, ela exibe os mesmos valores que são exibidos na área de resultados dos painéis de execução de algoritmos da interface Explorer.

Todas as ferramentas do WEKA, sejam de mineração de dados, sejam de pré-processamento, que permitem a configuração de parâmetros através das interfaces gráficas também podem ser parametrizadas na interface de linha de comando. As próprias interfaces gráficas exibem como os parâmetros devem ser utilizados na linha de comando.


2.4 - BIBLIOTECA ACESSÁVEL EXTERNAMENTE


Outra qualidade útil do WEKA é a possibilidade de programas de terceiros utilizarem seu motor de mineração de dados diretamente, através de sua biblioteca de funções. Todas as ferramentas existentes nas interfaces gráficas do WEKA estão disponíveis através desta biblioteca. Tendo em vista que a biblioteca do WEKA é programada em Java, é necessário que o programa que vá acessá-la também seja escrito nesta linguagem.

A utilização da biblioteca dentro de um programa em Java é feita da mesma forma com que qualquer outra biblioteca: importa-se a biblioteca para o projeto e utiliza-se os objetos disponibilizados por ela e seus respectivos métodos.

Desta forma, aplicativos que precisem utilizar recursos de mineração precisam apenas utilizar a biblioteca do WEKA como se fosse mais um de seus módulos.

Todas as classes da biblioteca estão documentadas, e a documentação é instalada no computador do usuário juntamente com o WEKA.


2.5 - EXTENSIBILIDADE


Outra facilidade fornecida pelo WEKA, útil para usuários que têm conhecimentos de programação em Java, é a sua extensibilidade através da inclusão de novos algoritmos.

Um algoritmo programado pelo próprio usuário deve definir classes que herdem das classes primárias que se encontram nos pacotes da biblioteca do WEKA e se comunicar com o motor de acordo com padrões, convenções e procedimentos definidos pela documentação do WEKA.

Nenhum comentário: