Vivemos na ânsia constante de multiplicar nossas posses, mas reduzimos nossos valores. (...) Aprendemos como ganhar nosso sustento, mas não como construir em torno de nós uma vida que valha a pena ser vivida. Adicionamos anos a essa vida, quando talvez devêssemos inverter essa equação, adicionando vida aos anos.
Leitoras queridas, façam um favor às suas vidas e leiam na íntegra este primoroso texto do Carlos Alberto Teixeira.
Constatação
A maioria das pessoas quer conhecer os pensamentos das outras não para entender como as outras são, mas para descobrir a melhor maneira de mudá-los e torná-los iguais aos seus.
Lembranças de um Tecladista Amador
Tenho três lembranças de infância ligadas ao meu relacionamento com os teclados. Sei qual é a mais recente delas, mas não sei dizer qual é a mais antiga das outras duas.
Uma das mais antigas é a de um pequeno teclado que uma prima me emprestou. Ele tinha as teclas bem menores que as de um teclado de verdade e trazia embutidas quatro músicas relativamente simples de serem executadas. Quando postas para tocar, pequenas luzes que haviam sobre cada uma das teclas se acendiam, indicando as notas.
Além disso, esse teclado tinha um modo de aprendizado, que usava como base as tais quatro músicas. Quando ativado, apenas as pequenas lâmpadas acendiam, cabendo ao aspirante a músico pressionar as teclas certas na hora certa. Pelo que me lembro, havia também um modo em que as lâmpadas só se apagavam quando a tecla correspondente fosse apertada e a música parava até você acertar a nota. Em pelo menos uma das músicas eu fiquei fera, tocando-a com perfeição. Só lamento nem mesmo lembrar da melodia.
A segunda memória é de quando eu estava na quarta série do primeiro grau, hoje quinto ano do ensino fundamental. Era época de estudar sobre folclore e um dos professores dividiu a turma em vários grupos, que deveriam fazer apresentações culturais. Meu grupo decidiu se apresentar cantando Asa Branca, sugestão de um dos integrantes*, já que ele sabia tocar a música no teclado. Ele tocaria e o restante cantaria. Calhou de que nos ensaios eu aprendi a tocar a música também. Mal sabia eu que aquelas notas ficariam gravadas na minha mente para sempre.
A terceira e mais recente memória é de quando eu ia para a casa de uma outra prima porque ela tinha um teclado dos grandes. Eu sei que esta é a memória mais recente porque eu ia pra lá porque tinha gostado de tocar teclado antes (só não consigo lembrar se era por causa do tecladinho da primeira prima ou por causa da cantoria do colégio).
Mas sei que eu sentava lá em frente ao teclado e ficava apertando as teclas a esmo, trocando os tipos de sons, sem tocar nada realmente que prestasse. Havia apenas o prazer de apertar botões e produzir barulho. Ficava lá por cerca de uma hora, várias vezes por semana. Não lembro mais o motivo, se enjoei ou se não tive mais tempo, mas um dia deixei de ir lá e passei anos sem ver aquele teclado
Voltei a vê-lo quando resolvi aprender música, mas isso é história pra outro dia.
***
* Nota: É assunto para uma tese o fato de um bando de moleques de 10 anos sugerir Asa Branca para um trabalho de colégio, algo praticamente impossível de acontecer hoje em dia, mas vamos deixar isso pra outra hora.
***
Uma das mais antigas é a de um pequeno teclado que uma prima me emprestou. Ele tinha as teclas bem menores que as de um teclado de verdade e trazia embutidas quatro músicas relativamente simples de serem executadas. Quando postas para tocar, pequenas luzes que haviam sobre cada uma das teclas se acendiam, indicando as notas.
Além disso, esse teclado tinha um modo de aprendizado, que usava como base as tais quatro músicas. Quando ativado, apenas as pequenas lâmpadas acendiam, cabendo ao aspirante a músico pressionar as teclas certas na hora certa. Pelo que me lembro, havia também um modo em que as lâmpadas só se apagavam quando a tecla correspondente fosse apertada e a música parava até você acertar a nota. Em pelo menos uma das músicas eu fiquei fera, tocando-a com perfeição. Só lamento nem mesmo lembrar da melodia.
A segunda memória é de quando eu estava na quarta série do primeiro grau, hoje quinto ano do ensino fundamental. Era época de estudar sobre folclore e um dos professores dividiu a turma em vários grupos, que deveriam fazer apresentações culturais. Meu grupo decidiu se apresentar cantando Asa Branca, sugestão de um dos integrantes*, já que ele sabia tocar a música no teclado. Ele tocaria e o restante cantaria. Calhou de que nos ensaios eu aprendi a tocar a música também. Mal sabia eu que aquelas notas ficariam gravadas na minha mente para sempre.
A terceira e mais recente memória é de quando eu ia para a casa de uma outra prima porque ela tinha um teclado dos grandes. Eu sei que esta é a memória mais recente porque eu ia pra lá porque tinha gostado de tocar teclado antes (só não consigo lembrar se era por causa do tecladinho da primeira prima ou por causa da cantoria do colégio).
Mas sei que eu sentava lá em frente ao teclado e ficava apertando as teclas a esmo, trocando os tipos de sons, sem tocar nada realmente que prestasse. Havia apenas o prazer de apertar botões e produzir barulho. Ficava lá por cerca de uma hora, várias vezes por semana. Não lembro mais o motivo, se enjoei ou se não tive mais tempo, mas um dia deixei de ir lá e passei anos sem ver aquele teclado
Voltei a vê-lo quando resolvi aprender música, mas isso é história pra outro dia.
* Nota: É assunto para uma tese o fato de um bando de moleques de 10 anos sugerir Asa Branca para um trabalho de colégio, algo praticamente impossível de acontecer hoje em dia, mas vamos deixar isso pra outra hora.
Da Honestidade do Detran
Eu tinha um Fusca 67 que era do meu pai. Por conta de revezes que não cabem contar aqui, o Fusquinha ficou parado numa garagem por quase uma década, largado à degradação. Durante anos, desde a morte do meu pai, eu sempre tive vontade de consertá-lo para podermos, eu e a esposa, passear por aí, assim como meus pais faziam quando eu era criança. Nostalgia pura.
Acontece que depois que vim morar em Niterói, a cada dia eu me convencia um pouco mais de que não teria condições de estar consertá-lo. Não porque faltaria dinheiro, mas sim por falta de oportunidade de estar perto do mecânico enquanto ele fizesse os reparos.
Pior ainda, como eu não entendo xongas de carros, é certo que o safado iria tirar uma peça boa do Fusca, polir e me mostrar a dita cuja dizendo que precisou comprar outra daquelas. Minha ignorância e inocência, com certeza iriam garantir uns bons churrascos de fim de semana para o mecânico.
Decidi, então, vendê-lo. Foi uma decisão triste mas sensata. Além do que, quem o comprou foi um primo que se comprometeu a vendê-lo de volta para mim caso um dia ele não o queira mais.
Como o Fusca iria ser levado para outra cidade e sua documentação ainda estava toda atrasada, com o carro ainda em nome do meu pai e mais de uma dezena de IPVAs atrasados, fui eu correr atrás de uma orientação no Detran para saber o que fazer para que meu primo pudesse levá-lo sem problemas.
Depois de muitas idas e vindas à repartição, a cada uma recebendo uma informação diferente, fui conversar com um amigo para ver se ele poderia me ajudar a levar o carro ao Detran. Vendo o estado deplorável do carro, ele disse que se eu quisesse passá-lo na vistoria teria que consertá-lo primeiro. Expliquei a ele que o carro já estava vendido exatamente por eu não querer gastar meu tempo consertando-o.
Foi aí que ele, conhecendo um pouco mais da história e das minhas intenções, me disse que, se o carro iria ser levado para outra cidade em cima de um caminhão-reboque, não haveria a necessidade de fazê-lo passar por uma vistoria. Bastaria levar junto com o Fusca qualquer documento, mesmo antigo, que provasse que o carro era do meu pai.
Quase totalmente aliviado com a aparente solução para o imbróglio, fui mais uma vez ao Detran para perguntar se a informação dada por meu amigo estava correta. Chegando lá, expliquei toda a história ao cara, e perguntei se o carro realmente poderia ser levado para outra cidade sem estar com os documentos em dia. Nesta hora ouvi a frase mais escabrosa que ouvi nos últimos tempos e, acredito, demorarei a ouvir outra tão absurda. Conselho do funcionário:
- Olha, amigo, eu acho que você vai ter que arriscar a sorte e ir acertando com os policiais na estrada.
Não foi à toa que prenderam algumas cabeças no Detran de Cachoeiras há uns anos.
Acontece que depois que vim morar em Niterói, a cada dia eu me convencia um pouco mais de que não teria condições de estar consertá-lo. Não porque faltaria dinheiro, mas sim por falta de oportunidade de estar perto do mecânico enquanto ele fizesse os reparos.
Pior ainda, como eu não entendo xongas de carros, é certo que o safado iria tirar uma peça boa do Fusca, polir e me mostrar a dita cuja dizendo que precisou comprar outra daquelas. Minha ignorância e inocência, com certeza iriam garantir uns bons churrascos de fim de semana para o mecânico.
Decidi, então, vendê-lo. Foi uma decisão triste mas sensata. Além do que, quem o comprou foi um primo que se comprometeu a vendê-lo de volta para mim caso um dia ele não o queira mais.
Como o Fusca iria ser levado para outra cidade e sua documentação ainda estava toda atrasada, com o carro ainda em nome do meu pai e mais de uma dezena de IPVAs atrasados, fui eu correr atrás de uma orientação no Detran para saber o que fazer para que meu primo pudesse levá-lo sem problemas.
Depois de muitas idas e vindas à repartição, a cada uma recebendo uma informação diferente, fui conversar com um amigo para ver se ele poderia me ajudar a levar o carro ao Detran. Vendo o estado deplorável do carro, ele disse que se eu quisesse passá-lo na vistoria teria que consertá-lo primeiro. Expliquei a ele que o carro já estava vendido exatamente por eu não querer gastar meu tempo consertando-o.
Foi aí que ele, conhecendo um pouco mais da história e das minhas intenções, me disse que, se o carro iria ser levado para outra cidade em cima de um caminhão-reboque, não haveria a necessidade de fazê-lo passar por uma vistoria. Bastaria levar junto com o Fusca qualquer documento, mesmo antigo, que provasse que o carro era do meu pai.
Quase totalmente aliviado com a aparente solução para o imbróglio, fui mais uma vez ao Detran para perguntar se a informação dada por meu amigo estava correta. Chegando lá, expliquei toda a história ao cara, e perguntei se o carro realmente poderia ser levado para outra cidade sem estar com os documentos em dia. Nesta hora ouvi a frase mais escabrosa que ouvi nos últimos tempos e, acredito, demorarei a ouvir outra tão absurda. Conselho do funcionário:
- Olha, amigo, eu acho que você vai ter que arriscar a sorte e ir acertando com os policiais na estrada.
Não foi à toa que prenderam algumas cabeças no Detran de Cachoeiras há uns anos.
Travessia São Lourenço x Castália I
No dia 10 de janeiro de 2010 eu e meu amigo Thiago Verde fizemos a travessia São Lourenço (em Nova Friburgo) x Castália (em Cachoeiras de Macacu). Esta é uma das muitas fotos que tiramos durante a longa caminhada.
Estes são os Três Picos, formação que dá nome ao Parque Estadual dos Três Picos, cuja sede fica em Cachoeiras de Macacu, em foto tirada no vilarejo de São Lourenço.
Estes são os Três Picos, formação que dá nome ao Parque Estadual dos Três Picos, cuja sede fica em Cachoeiras de Macacu, em foto tirada no vilarejo de São Lourenço.
Falando às Leitoras
Não é preciso ler muitos dos meus textos para perceber que trato as pessoas que me leem no feminino. Volta e meia eu despacho um "minhas leitoras" no meio de uma ou outra crônica. E com a mesma frequência eu sou questionado em relação a isso.
Já teve até mesmo um machista panacas que disse ter a sua masculinidade ofendida por causa disso. Este sujeito, quando comentei que escrever "meus leitores" iria ofender a feminilidade de algumas mulheres, deu a sexista explicação de que as mulheres estavam acostumadas e não se incomodariam com isso.
Para saciar a curiosidade dos leitores (aqui eu falo no masculino porque a maioria dos que perguntam são homens) eu explico porque escrevo assim.
Antes de mais nada, sim, eu sei que o português generaliza as coisas no masculino, mesmo que só haja um homem em meio a várias mulheres.
- Bianca, Diana, Flávia, Hilda, Joana, Laura e Zezinho são espertos.
Eu generalizo no feminino simplesmente para sair da mesmice. Não é por conta de nenhuma ideologia sexista ou coisa parecida, mas simplesmente para fazer algo diferente.
Entenderam, meninas?
Já teve até mesmo um machista panacas que disse ter a sua masculinidade ofendida por causa disso. Este sujeito, quando comentei que escrever "meus leitores" iria ofender a feminilidade de algumas mulheres, deu a sexista explicação de que as mulheres estavam acostumadas e não se incomodariam com isso.
Para saciar a curiosidade dos leitores (aqui eu falo no masculino porque a maioria dos que perguntam são homens) eu explico porque escrevo assim.
Antes de mais nada, sim, eu sei que o português generaliza as coisas no masculino, mesmo que só haja um homem em meio a várias mulheres.
- Bianca, Diana, Flávia, Hilda, Joana, Laura e Zezinho são espertos.
Eu generalizo no feminino simplesmente para sair da mesmice. Não é por conta de nenhuma ideologia sexista ou coisa parecida, mas simplesmente para fazer algo diferente.
Entenderam, meninas?
Ingredientes para uma noite excelente
Um disco novo de Elton John.
Uma porção de queijo provolone defumado.
Uma taça de bom vinho.
Uma porção de queijo provolone defumado.
Uma taça de bom vinho.
O Exterminador do Futuro
Há muito tempo eu tinha vontade de assistir novamente ao filme O Exterminador do Futuro I. Não apenas porque já não lembrava quase mais nada sobre ele, pois das vezes que o vi eu era apenas uma criança, mas também porque eu gostaria de rever as cenas com efeitos especiais, que ajudaram a tornar o filme um clássico cinematográfico de ficção científica.
Assim como quando eu assisti o seriado Changeman no YouTube e me acabei de rir com seus (d)efeitos especiais, eu sabia que iria me surpreender com quão primários eram as técnicas que deram vida ao robô exterminador que, em minhas vagas lembranças, era perfeitamente real.
Eis que numa noite insone do último janeiro, zapeando na TV, eu e a esposa paramos no SBT, onde estava passando um filme, do qual datei dos anos 80 logo de cara, por conta do estilo da trilha sonora e dos carros envolvidos numa perseguição. Bastaram alguns segundos para que percebêssemos que estávamos assistindo a, justamente, O Exterminador do Futuro I.
É interessante ver como as coisas mudaram nestes quase 30 anos: a narrativa - sua velocidade e a forma de contar a história - eram completamente diferentes e, vejam só, todas as pontas soltas são amarradas, sem deixas para futuras sequências. A intenção de continuações poderia até existir, mas não há no filme aquele ar de primeiro capítulo de uma trilogia que tanto vemos nos filmes de hoje em dia.
Chegando à parte final do filme, pude descobrir a verdade da "realidade" do andróide. Eu sabia que computação gráfica ainda fazia parte de um futuro distante, e fui incapaz de imaginar que uma técnica pra lá de antiga tinha sido usada: o stop motion.
Eis que o robô aterrorizante da minha infância transformou-se em um boneco desengonçado que se move de maneira errática e não-natural, quase cômica. Minha impressão sobre ele mudou tanto que talvez a idéia de assisti-lo tenha sido um erro.
De qualquer maneira, foi um ótimo final de noite, que ainda teve lição de moral: uma boa história faz efeitos especiais se tornarem mero detalhe.
Compre O Exterminador de Futuro no Submarino
Começando 2010
Terminado o período de limbo temporal que foram estas minhas férias de início de ano, 2010 vai finalmente começar pra mim.
Preparei para os próximos 11 meses uma lista de objetivos que desejo ter alcançado quando 2011 nascer. Mais do que uma patética lista de promessas para serem quebradas antes de março, estes objetivos são passos necessários para que eu considere este ano como excelente. São eles:
Ler ao menos 12 livros. Essa eu já faço há anos. Sempre procuro ler pelo menos um livro por mês. Ainda estou lendo o primeiro do ano e já há mais dois na fila.
Aprender 6 músicas no teclado. Quero, finalmente, aprender a tocar decentemente. É a único objetivo que tenho feito todos os anos e deixado de cumprir.
Ler e comentar o Gênese. Eu sei que um ano é muito tempo para ler apenas um capítulo da Bíblia, mas a demora vai se dar porque a minha Bíblia tem muitas informações de rodapé, as quais leio todas, e também muitas referências cruzadas, que também leio. Daí que às vezes um simples versículo me toma, às vezes mais de dez minutos para ser lido. E ainda tem a parte de comentar sobre o assunto e publicar aqui no Sarcófago, o que torna a tarefa ainda mais longa.
Pesar 80 quilos. Quisera eu dizer que preciso engordar para chegar a este peso, mas a verdade é que preciso perder alguns quilos para chegar ao peso que acho supimpa para mim.
Ir à academia três vezes por semana. Isso está relacionado com o objetivo anterior, mas tem a ver também com cuidar da minha saúde e sair do sedentarismo em que vivo há alguns anos. Já comecei e estou me divertindo.
Escrever o segundo livro. Ando tendo idéias para um romance e quero colocá-las no papel este ano. Publicar é uma segunda etapa, que não sei se sai em 2010, mas só o fato de ter escrito o livro já terá sido válido.
Operar a vista. Tirar os óculos será a grande coisa deste ano, com certeza. Afinal de contas, pra quem usa óculos há 25 anos, tirá-los será uma notícia e tanto. Se não fosse toda a burocracia da Amil talvez eu tivesse operado durante as férias, mas até agora nada. Vamos ver se até o final do ano sai.
E vocês, queridas leitoras, quais são os seus objetivos para o ano novo?
Preparei para os próximos 11 meses uma lista de objetivos que desejo ter alcançado quando 2011 nascer. Mais do que uma patética lista de promessas para serem quebradas antes de março, estes objetivos são passos necessários para que eu considere este ano como excelente. São eles:
Ler ao menos 12 livros. Essa eu já faço há anos. Sempre procuro ler pelo menos um livro por mês. Ainda estou lendo o primeiro do ano e já há mais dois na fila.
Aprender 6 músicas no teclado. Quero, finalmente, aprender a tocar decentemente. É a único objetivo que tenho feito todos os anos e deixado de cumprir.
Ler e comentar o Gênese. Eu sei que um ano é muito tempo para ler apenas um capítulo da Bíblia, mas a demora vai se dar porque a minha Bíblia tem muitas informações de rodapé, as quais leio todas, e também muitas referências cruzadas, que também leio. Daí que às vezes um simples versículo me toma, às vezes mais de dez minutos para ser lido. E ainda tem a parte de comentar sobre o assunto e publicar aqui no Sarcófago, o que torna a tarefa ainda mais longa.
Pesar 80 quilos. Quisera eu dizer que preciso engordar para chegar a este peso, mas a verdade é que preciso perder alguns quilos para chegar ao peso que acho supimpa para mim.
Ir à academia três vezes por semana. Isso está relacionado com o objetivo anterior, mas tem a ver também com cuidar da minha saúde e sair do sedentarismo em que vivo há alguns anos. Já comecei e estou me divertindo.
Escrever o segundo livro. Ando tendo idéias para um romance e quero colocá-las no papel este ano. Publicar é uma segunda etapa, que não sei se sai em 2010, mas só o fato de ter escrito o livro já terá sido válido.
Operar a vista. Tirar os óculos será a grande coisa deste ano, com certeza. Afinal de contas, pra quem usa óculos há 25 anos, tirá-los será uma notícia e tanto. Se não fosse toda a burocracia da Amil talvez eu tivesse operado durante as férias, mas até agora nada. Vamos ver se até o final do ano sai.
E vocês, queridas leitoras, quais são os seus objetivos para o ano novo?
Minha Monografia X - Capítulo 3 e Conclusão
CAPÍTULO 3 - ESTUDO DE CASO
3.1 - SOBRE O ESTUDO DE CASO
Durante o curso de Administração de Bancos de Dados, do qual este trabalho desempenha o papel de Trabalho de Conclusão de Curso, tivemos a oportunidade de sermos alunos da cadeira de Mineração de Dados, ministrada pelo professor Carlos Alberto Alves Lemos.
A disciplina tinha como objetivos definir e apresentar a mineração de dados, mostrar seu desenvolvimento e estado corrente, suas aplicações em situações reais e explicar diferentes métodos através dos quais a mineração de dados pode ser feita. Finalmente, nos foi exposto também o WEKA.
Como parte de nossa avaliação na cadeira de Mineração de Dados, o professor Carlos Lemos nos pediu para realizar uma mineração sobre uma base de dados utilizando o sistema WEKA e que o resultado da mesma fosse apresentado a ele na forma de um trabalho por escrito.
Para nos auxiliar na execução do trabalho, o professor Carlos Lemos nos informou o endereço de um sítio onde era possível obter bases de dados no formato de arquivos .arff, já preparadas para a mineração no WEKA, mas também nos permitiu criar nossas próprias bases de dados, caso assim desejássemos. Em nosso trabalho, utilizamos como base de dados os dados provenientes de um banco de dados particular contendo informações sobre uma coleção de discos.
3.2 - EXECUÇÃO E RESULTADOS
A base de dados era composta de 144 instâncias, cada uma com seis atributos, sendo um deles o classificador das instâncias, que representa a qualidade do disco representado pela instância (ruim, bom ou ótimo eram os valores nominais deste atributo), de acordo com o gosto do colecionador. Alguns destes atributos tiveram que ser normalizados, transformados e/ou discretizados.
O primeiro atributo indicava a quantidade de músicas existentes em cada disco. Nenhum pré-processamento foi necessário em relação a este atributo.
O segundo atributo indicava em qual terço do disco estava localizada a faixa preferida do colecionador. A base de dados original trazia neste atributo o número real da faixa dentro do disco, mas depois de algumas tentativas infrutíferas de mineração de dados, foi preciso que o alterássemos para que ele passasse a refletir em que porção do disco a faixa se encontrava.
O terceiro atributo indicava em qual terço do disco estava localizada a faixa que o colecionador menos gostava. Este atributo apresentou os mesmos problemas iniciais apresentados pelo segundo atributo, que foram resolvidos da mesma forma.
O quarto atributo era o já citado classificador de qualidade dos discos. Apesar de tê-lo mantido como textual, tivemos que tratá-lo através de um algoritmo de substituição de texto porque os valores estavam grafados de maneiras diversas (otimo e ótimo, por exemplo), o que levaria a resultados inadequados.
O quinto atributo indicava qual o estilo musical do disco em questão. Seus valores possíveis iam de 1 a 8, representando, respectivamente, os seguintes estilos: trilha sonora, MPB, pop, rock, new age, axé, jazz e rap. Na base de dados original, este atributo era textual, e optamos por torná-lo numérico tendo em vista que haviam estilos que estavam grafados de duas ou mais maneiras diferentes (rock e rock'n'roll, por exemplo), o que poderia atrapalhar o processo de mineração.
O sexto e último atributo indicava a duração do disco. Como na base de dados original ele estava armazenado no formato de horas:minutos, também necessitamos tratá-lo. Em uma primeira tentativa, utilizamos um algoritmo de discretização de dados para transformar todos os valores deste atributo em um número entre 0 e 1, sendo que o menor deles seria transformado em 0 e o maior deles transformado em 1. Porém, esta discretização não mostrou-se valiosa para a mineração de dados e decidimos, posteriormente, apenas converter os valores do atributo para minutos.
Estando com a base de dados já preparada, passamos à escolha o algoritmo de mineração de dados para geração de árvores de decisão que oferecesse o melhor índice de acerto quando utilizado para avaliar discos do colecionador que não faziam parte da base de dados.
Após algumas tentativas, ficamos satisfeitos com os resultados apresentados pelo algoritmo J48. Este algoritmo gerou a seguinte árvore de decisão:
duracao <= 53 | estilo = 1 | | qtdeFaixas <= 13: ruim | | qtdeFaixas > 13: bom
| estilo = 2
| | qtdeFaixas <= 11: bom | | qtdeFaixas > 11
| | | duracao <= 42: ruim | | | duracao > 42
| | | | melhorFaixa = 1: bom
| | | | melhorFaixa = 2: ruim
| | | | melhorFaixa = 3: bom
| estilo = 3
| | qtdeFaixas <= 11 | | | duracao <= 44: bom | | | duracao > 44: otimo
| | qtdeFaixas > 11: ruim
| estilo = 4: otimo
| estilo = 5: ruim
| estilo = 6: bom
| estilo = 7: bom
| estilo = 8: ruim
duracao > 53
| estilo = 1
| | melhorFaixa = 1: ruim
| | melhorFaixa = 2: otimo
| | melhorFaixa = 3
| | | duracao <= 57: ruim | | | duracao > 57: bom
| estilo = 2
| | qtdeFaixas <= 15: otimo | | qtdeFaixas > 15: bom
| estilo = 3: otimo
| estilo = 4: otimo
| estilo = 5: bom
| estilo = 6: ruim
| estilo = 7: bom
| estilo = 8: ruim
Esta árvore de decisão, quando utilizada para avaliar uma nova base de dados com outros discos do colecionador, que não faziam parte da primeira base, mostrou-se correta em aproximadamente 80% dos casos, o que demonstra a real aplicabilidade dos processos de mineração.
CONCLUSÃO
Em um mundo em que os bancos de dados crescem exponencialmente e estar sempre um passo à frente da concorrência tornou-se palavra de ordem, torna-se cada vez mais evidente a necessidade de descobrir maneiras de utilizar todo este ativo, as informações armazenadas nos bancos de dados, a nosso favor. Em resposta a este desejo surgiram as técnicas de mineração de dados.
Na verdade, não é correto dizer que surgiram, tendo em vista que os primeiros estudos do gênero datam de mais de meio século. O mais correto seria dizer que as técnicas de mineração de dados se aperfeiçoaram cada vez mais, tornando-se cada vez mais populares.
Durante a pesquisa realizada para este trabalho pudemos aprofundar nossos conhecimentos sobre o assunto, indo além do que já nos tinha sido ministrado durante a cadeira de Mineração de Dados. Pudemos, também, aprender ainda mais sobre o funcionamento do sistema WEKA, tendo, inclusive, a grata oportunidade de trocarmos alguns emails com os autores do livro que nos serviu de referencial teórico.
Se antes de iniciarmos o processo de elaboração deste trabalho já tínhamos consciência da importância do assunto e do valor prático do WEKA, depois de tê-lo terminado temos plena convicção de que a mineração de dados é uma ferramenta de inestimável valor para empresas que desejam transformar em algo valioso o que na maioria das vezes fica adormecido em backups e que, também, o WEKA é um sistema extremamente poderoso, provando-se útil, como já dissemos anteriormente, tanto para um iniciante entusiasta do assunto quanto para um pesquisador experiente.
Esperamos, sinceramente, que este trabalho, ao ser lido por aqueles que buscavam entender melhor a mineração de dados e o WEKA, possa tê-los influenciado no sentido de levá-los a desenvolver novas pesquisas e levar adiante este assunto tão interessante e rico de possibilidades.
3.1 - SOBRE O ESTUDO DE CASO
Durante o curso de Administração de Bancos de Dados, do qual este trabalho desempenha o papel de Trabalho de Conclusão de Curso, tivemos a oportunidade de sermos alunos da cadeira de Mineração de Dados, ministrada pelo professor Carlos Alberto Alves Lemos.
A disciplina tinha como objetivos definir e apresentar a mineração de dados, mostrar seu desenvolvimento e estado corrente, suas aplicações em situações reais e explicar diferentes métodos através dos quais a mineração de dados pode ser feita. Finalmente, nos foi exposto também o WEKA.
Como parte de nossa avaliação na cadeira de Mineração de Dados, o professor Carlos Lemos nos pediu para realizar uma mineração sobre uma base de dados utilizando o sistema WEKA e que o resultado da mesma fosse apresentado a ele na forma de um trabalho por escrito.
Para nos auxiliar na execução do trabalho, o professor Carlos Lemos nos informou o endereço de um sítio onde era possível obter bases de dados no formato de arquivos .arff, já preparadas para a mineração no WEKA, mas também nos permitiu criar nossas próprias bases de dados, caso assim desejássemos. Em nosso trabalho, utilizamos como base de dados os dados provenientes de um banco de dados particular contendo informações sobre uma coleção de discos.
3.2 - EXECUÇÃO E RESULTADOS
A base de dados era composta de 144 instâncias, cada uma com seis atributos, sendo um deles o classificador das instâncias, que representa a qualidade do disco representado pela instância (ruim, bom ou ótimo eram os valores nominais deste atributo), de acordo com o gosto do colecionador. Alguns destes atributos tiveram que ser normalizados, transformados e/ou discretizados.
O primeiro atributo indicava a quantidade de músicas existentes em cada disco. Nenhum pré-processamento foi necessário em relação a este atributo.
O segundo atributo indicava em qual terço do disco estava localizada a faixa preferida do colecionador. A base de dados original trazia neste atributo o número real da faixa dentro do disco, mas depois de algumas tentativas infrutíferas de mineração de dados, foi preciso que o alterássemos para que ele passasse a refletir em que porção do disco a faixa se encontrava.
O terceiro atributo indicava em qual terço do disco estava localizada a faixa que o colecionador menos gostava. Este atributo apresentou os mesmos problemas iniciais apresentados pelo segundo atributo, que foram resolvidos da mesma forma.
O quarto atributo era o já citado classificador de qualidade dos discos. Apesar de tê-lo mantido como textual, tivemos que tratá-lo através de um algoritmo de substituição de texto porque os valores estavam grafados de maneiras diversas (otimo e ótimo, por exemplo), o que levaria a resultados inadequados.
O quinto atributo indicava qual o estilo musical do disco em questão. Seus valores possíveis iam de 1 a 8, representando, respectivamente, os seguintes estilos: trilha sonora, MPB, pop, rock, new age, axé, jazz e rap. Na base de dados original, este atributo era textual, e optamos por torná-lo numérico tendo em vista que haviam estilos que estavam grafados de duas ou mais maneiras diferentes (rock e rock'n'roll, por exemplo), o que poderia atrapalhar o processo de mineração.
O sexto e último atributo indicava a duração do disco. Como na base de dados original ele estava armazenado no formato de horas:minutos, também necessitamos tratá-lo. Em uma primeira tentativa, utilizamos um algoritmo de discretização de dados para transformar todos os valores deste atributo em um número entre 0 e 1, sendo que o menor deles seria transformado em 0 e o maior deles transformado em 1. Porém, esta discretização não mostrou-se valiosa para a mineração de dados e decidimos, posteriormente, apenas converter os valores do atributo para minutos.
Estando com a base de dados já preparada, passamos à escolha o algoritmo de mineração de dados para geração de árvores de decisão que oferecesse o melhor índice de acerto quando utilizado para avaliar discos do colecionador que não faziam parte da base de dados.
Após algumas tentativas, ficamos satisfeitos com os resultados apresentados pelo algoritmo J48. Este algoritmo gerou a seguinte árvore de decisão:
duracao <= 53 | estilo = 1 | | qtdeFaixas <= 13: ruim | | qtdeFaixas > 13: bom
| estilo = 2
| | qtdeFaixas <= 11: bom | | qtdeFaixas > 11
| | | duracao <= 42: ruim | | | duracao > 42
| | | | melhorFaixa = 1: bom
| | | | melhorFaixa = 2: ruim
| | | | melhorFaixa = 3: bom
| estilo = 3
| | qtdeFaixas <= 11 | | | duracao <= 44: bom | | | duracao > 44: otimo
| | qtdeFaixas > 11: ruim
| estilo = 4: otimo
| estilo = 5: ruim
| estilo = 6: bom
| estilo = 7: bom
| estilo = 8: ruim
duracao > 53
| estilo = 1
| | melhorFaixa = 1: ruim
| | melhorFaixa = 2: otimo
| | melhorFaixa = 3
| | | duracao <= 57: ruim | | | duracao > 57: bom
| estilo = 2
| | qtdeFaixas <= 15: otimo | | qtdeFaixas > 15: bom
| estilo = 3: otimo
| estilo = 4: otimo
| estilo = 5: bom
| estilo = 6: ruim
| estilo = 7: bom
| estilo = 8: ruim
Esta árvore de decisão, quando utilizada para avaliar uma nova base de dados com outros discos do colecionador, que não faziam parte da primeira base, mostrou-se correta em aproximadamente 80% dos casos, o que demonstra a real aplicabilidade dos processos de mineração.
CONCLUSÃO
Em um mundo em que os bancos de dados crescem exponencialmente e estar sempre um passo à frente da concorrência tornou-se palavra de ordem, torna-se cada vez mais evidente a necessidade de descobrir maneiras de utilizar todo este ativo, as informações armazenadas nos bancos de dados, a nosso favor. Em resposta a este desejo surgiram as técnicas de mineração de dados.
Na verdade, não é correto dizer que surgiram, tendo em vista que os primeiros estudos do gênero datam de mais de meio século. O mais correto seria dizer que as técnicas de mineração de dados se aperfeiçoaram cada vez mais, tornando-se cada vez mais populares.
Durante a pesquisa realizada para este trabalho pudemos aprofundar nossos conhecimentos sobre o assunto, indo além do que já nos tinha sido ministrado durante a cadeira de Mineração de Dados. Pudemos, também, aprender ainda mais sobre o funcionamento do sistema WEKA, tendo, inclusive, a grata oportunidade de trocarmos alguns emails com os autores do livro que nos serviu de referencial teórico.
Se antes de iniciarmos o processo de elaboração deste trabalho já tínhamos consciência da importância do assunto e do valor prático do WEKA, depois de tê-lo terminado temos plena convicção de que a mineração de dados é uma ferramenta de inestimável valor para empresas que desejam transformar em algo valioso o que na maioria das vezes fica adormecido em backups e que, também, o WEKA é um sistema extremamente poderoso, provando-se útil, como já dissemos anteriormente, tanto para um iniciante entusiasta do assunto quanto para um pesquisador experiente.
Esperamos, sinceramente, que este trabalho, ao ser lido por aqueles que buscavam entender melhor a mineração de dados e o WEKA, possa tê-los influenciado no sentido de levá-los a desenvolver novas pesquisas e levar adiante este assunto tão interessante e rico de possibilidades.
Minha Monografia IX - Capítulo 2, parte 3
2.3.3 - Experimenter
Mesmo que disponibilizem ao usuário todas as ferramentas necessárias para a mineração de uma determinada base de dados, as interfaces Explorer e Knowledge Flow não são amigáveis para experimentos investigativos de grande porte, o que inclui executar várias diferentes configurações de determinados algoritmos de mineração sobre uma base de dados e sua posterior validação com bases de dados extras.
Para esta finalidade o WEKA disponibiliza a interface Experimenter, que permite ao usuário configurar estas definições de grande porte e longa duração, automatizando o processo de execução e sumarização de seus resultados. Os resultados e suas estatísticas podem, inclusive, ser exportados como arquivos .arff para que posteriormente, eles mesmos possam atuar como objeto de mineração.
Além disso, a interface Experimenter permite ao usuário distribuir o processamento da mineração dos dados para mais de uma máquina.
Ela é dividida em três painéis distintos. No primeiro deles o usuário tem à sua disposição todas as ferramentas necessárias para configurar seu experimento. Nele é possível definir qual é a base de dados sobre a qual os algoritmos de mineração de dados irão trabalhar, quais serão os algoritmos que serão executados e onde serão gravados os resultados do experimento. Assim como nas outras interfaces, o usuário pode configurar cada um dos algoritmos de acordo com suas necessidades. Alternativamente, o usuário pode definir mais de uma fonte de dados e configurar qual delas os algoritmos irão utilizar. Todas as configurações de um experimento podem ser salvas para que o usuário possa recuperá-las futuramente ou para transferi-las para outro computador.
O segundo painel, através do qual o experimento é posto em execução, é o mais simples de todos os existentes no WEKA. Ele contém apenas dois botões, que permitem iniciar e parar o processamento, e uma grande área de texto através da qual o usuário é informado sobre o andamento da execução.
Finalmente, o terceiro painel permite ao usuário analisar o resultado do último experimento executado ou então abrir um arquivo de resultado de algum experimento realizado anteriormente. Neste painel o usuário pode realizar análises comparativas dos resultados dos algoritmos de mineração de dados configurados para o experimento, levando em consideração dezenas de variáveis e estatísticas diferentes geradas pelo WEKA durante a execução do experimento.
Quando um experimento é configurado para ser executado em mais de um máquina, o resultado do processamento de cada uma das máquinas pode ser gravado diretamente em um banco de dados disponível na rede ou então cada uma delas pode gerar um arquivo .arff local. Estes arquivos .arff devem, ao fim do processamento, ser reunidos em um só. Além disso, para que um experimento distribuído funcione, é preciso que todas as máquinas que vão realizar o processamento estejam executando o servidor de experimentos remotos fornecido pelo WEKA e que todas sejam capazes de acessar a base de dados que será usada na mineração.
2.3.4 - Linha de Comando
Por trás das interfaces gráficas do WEKA roda o seu motor, que é onde todo o processamento realmente acontece. As interfaces gráficas, como seu próprio nome já indica, são apenas fachadas visuais que têm como objetivo fazer com que a utilização do motor do WEKA seja mais amigável para o usuário. Assim sendo, é possível utilizar o motor do WEKA sem utilizar nenhuma das interfaces, através do envio de comandos de texto diretamente para ele.
Composta apenas de uma grande área de texto e uma pequena área para inserção de comandos, a interface de linha de comando tem um uso extremamente simplificado. Basta que o usuário digite um comando e pressione a tecla enter. Após o envio de cada comando, a área de texto da janela da interface de linha de comando exibe o seu resultado. Para o caso de algoritmos de mineração, por exemplo, ela exibe os mesmos valores que são exibidos na área de resultados dos painéis de execução de algoritmos da interface Explorer.
Todas as ferramentas do WEKA, sejam de mineração de dados, sejam de pré-processamento, que permitem a configuração de parâmetros através das interfaces gráficas também podem ser parametrizadas na interface de linha de comando. As próprias interfaces gráficas exibem como os parâmetros devem ser utilizados na linha de comando.
2.4 - BIBLIOTECA ACESSÁVEL EXTERNAMENTE
Outra qualidade útil do WEKA é a possibilidade de programas de terceiros utilizarem seu motor de mineração de dados diretamente, através de sua biblioteca de funções. Todas as ferramentas existentes nas interfaces gráficas do WEKA estão disponíveis através desta biblioteca. Tendo em vista que a biblioteca do WEKA é programada em Java, é necessário que o programa que vá acessá-la também seja escrito nesta linguagem.
A utilização da biblioteca dentro de um programa em Java é feita da mesma forma com que qualquer outra biblioteca: importa-se a biblioteca para o projeto e utiliza-se os objetos disponibilizados por ela e seus respectivos métodos.
Desta forma, aplicativos que precisem utilizar recursos de mineração precisam apenas utilizar a biblioteca do WEKA como se fosse mais um de seus módulos.
Todas as classes da biblioteca estão documentadas, e a documentação é instalada no computador do usuário juntamente com o WEKA.
2.5 - EXTENSIBILIDADE
Outra facilidade fornecida pelo WEKA, útil para usuários que têm conhecimentos de programação em Java, é a sua extensibilidade através da inclusão de novos algoritmos.
Um algoritmo programado pelo próprio usuário deve definir classes que herdem das classes primárias que se encontram nos pacotes da biblioteca do WEKA e se comunicar com o motor de acordo com padrões, convenções e procedimentos definidos pela documentação do WEKA.
Mesmo que disponibilizem ao usuário todas as ferramentas necessárias para a mineração de uma determinada base de dados, as interfaces Explorer e Knowledge Flow não são amigáveis para experimentos investigativos de grande porte, o que inclui executar várias diferentes configurações de determinados algoritmos de mineração sobre uma base de dados e sua posterior validação com bases de dados extras.
Para esta finalidade o WEKA disponibiliza a interface Experimenter, que permite ao usuário configurar estas definições de grande porte e longa duração, automatizando o processo de execução e sumarização de seus resultados. Os resultados e suas estatísticas podem, inclusive, ser exportados como arquivos .arff para que posteriormente, eles mesmos possam atuar como objeto de mineração.
Além disso, a interface Experimenter permite ao usuário distribuir o processamento da mineração dos dados para mais de uma máquina.
Ela é dividida em três painéis distintos. No primeiro deles o usuário tem à sua disposição todas as ferramentas necessárias para configurar seu experimento. Nele é possível definir qual é a base de dados sobre a qual os algoritmos de mineração de dados irão trabalhar, quais serão os algoritmos que serão executados e onde serão gravados os resultados do experimento. Assim como nas outras interfaces, o usuário pode configurar cada um dos algoritmos de acordo com suas necessidades. Alternativamente, o usuário pode definir mais de uma fonte de dados e configurar qual delas os algoritmos irão utilizar. Todas as configurações de um experimento podem ser salvas para que o usuário possa recuperá-las futuramente ou para transferi-las para outro computador.
O segundo painel, através do qual o experimento é posto em execução, é o mais simples de todos os existentes no WEKA. Ele contém apenas dois botões, que permitem iniciar e parar o processamento, e uma grande área de texto através da qual o usuário é informado sobre o andamento da execução.
Finalmente, o terceiro painel permite ao usuário analisar o resultado do último experimento executado ou então abrir um arquivo de resultado de algum experimento realizado anteriormente. Neste painel o usuário pode realizar análises comparativas dos resultados dos algoritmos de mineração de dados configurados para o experimento, levando em consideração dezenas de variáveis e estatísticas diferentes geradas pelo WEKA durante a execução do experimento.
Quando um experimento é configurado para ser executado em mais de um máquina, o resultado do processamento de cada uma das máquinas pode ser gravado diretamente em um banco de dados disponível na rede ou então cada uma delas pode gerar um arquivo .arff local. Estes arquivos .arff devem, ao fim do processamento, ser reunidos em um só. Além disso, para que um experimento distribuído funcione, é preciso que todas as máquinas que vão realizar o processamento estejam executando o servidor de experimentos remotos fornecido pelo WEKA e que todas sejam capazes de acessar a base de dados que será usada na mineração.
2.3.4 - Linha de Comando
Por trás das interfaces gráficas do WEKA roda o seu motor, que é onde todo o processamento realmente acontece. As interfaces gráficas, como seu próprio nome já indica, são apenas fachadas visuais que têm como objetivo fazer com que a utilização do motor do WEKA seja mais amigável para o usuário. Assim sendo, é possível utilizar o motor do WEKA sem utilizar nenhuma das interfaces, através do envio de comandos de texto diretamente para ele.
Composta apenas de uma grande área de texto e uma pequena área para inserção de comandos, a interface de linha de comando tem um uso extremamente simplificado. Basta que o usuário digite um comando e pressione a tecla enter. Após o envio de cada comando, a área de texto da janela da interface de linha de comando exibe o seu resultado. Para o caso de algoritmos de mineração, por exemplo, ela exibe os mesmos valores que são exibidos na área de resultados dos painéis de execução de algoritmos da interface Explorer.
Todas as ferramentas do WEKA, sejam de mineração de dados, sejam de pré-processamento, que permitem a configuração de parâmetros através das interfaces gráficas também podem ser parametrizadas na interface de linha de comando. As próprias interfaces gráficas exibem como os parâmetros devem ser utilizados na linha de comando.
2.4 - BIBLIOTECA ACESSÁVEL EXTERNAMENTE
Outra qualidade útil do WEKA é a possibilidade de programas de terceiros utilizarem seu motor de mineração de dados diretamente, através de sua biblioteca de funções. Todas as ferramentas existentes nas interfaces gráficas do WEKA estão disponíveis através desta biblioteca. Tendo em vista que a biblioteca do WEKA é programada em Java, é necessário que o programa que vá acessá-la também seja escrito nesta linguagem.
A utilização da biblioteca dentro de um programa em Java é feita da mesma forma com que qualquer outra biblioteca: importa-se a biblioteca para o projeto e utiliza-se os objetos disponibilizados por ela e seus respectivos métodos.
Desta forma, aplicativos que precisem utilizar recursos de mineração precisam apenas utilizar a biblioteca do WEKA como se fosse mais um de seus módulos.
Todas as classes da biblioteca estão documentadas, e a documentação é instalada no computador do usuário juntamente com o WEKA.
2.5 - EXTENSIBILIDADE
Outra facilidade fornecida pelo WEKA, útil para usuários que têm conhecimentos de programação em Java, é a sua extensibilidade através da inclusão de novos algoritmos.
Um algoritmo programado pelo próprio usuário deve definir classes que herdem das classes primárias que se encontram nos pacotes da biblioteca do WEKA e se comunicar com o motor de acordo com padrões, convenções e procedimentos definidos pela documentação do WEKA.
TOEFL V
The creation of the Real currency and the monetary plan which it was part of has had a major effect on in Brazilian History. First of all, it has put and end on a long era of prices getting higher day by day, which allowed citizens to be able to save money. Also, it has made Brazilian currency, at last at first, be more valuable than the American dollar. It favoured Brazilian industry, that could grow faster than it grew in previous years. Those consequences put Brazil back on to the path to a nation-wide financial development and let it to the world's list of leading nations.
***
Esta é uma das várias pequenas redações que fiz durante o meu curso preparatório para o TOEFL. Trechos riscados são os erros originais, seguidos pelas correções feitas pela professora.
Esta é uma das várias pequenas redações que fiz durante o meu curso preparatório para o TOEFL. Trechos riscados são os erros originais, seguidos pelas correções feitas pela professora.
Assinar:
Postagens (Atom)