terça-feira, 14 de setembro de 2010

Weka

Já que estamos trabalhando atualmente com o KNIME, a seguir posto um pouco sobre o Weka, outro software relacionado à Inteligência Computacional. O Weka é um software muito popular de aprendizagem de máquina (machine learning) e mineração de dados totalmente desenvolvida em Java e desenvolvida pela Universidade de Waikato na Nova Zelândia. O nome Weka é o acrônimo de "Waikato Environment for Knowledge Analysis" e também é o nome de uma espécie de pássaro neozelandês.



Uma breve história do Weka:
-Em 1993 pesquisadores da Universidade de Waikato começaram o desenvolvimento de um software que implementasse algoritmos de mineração de dados e machine learning. O Weka foi desenvolvido em C e TCL/TK.
-Em 1997 o Weka teve seu código totalmente reescrito, dessa vez em Java e com a implementação de alguns algoritmos de modelagem de dados.
-Em 2005 o Weka recebe o prêmio Data Mining and Knowledge Discovery Service do SIGKDD (Special Interest Group on Knowledge Discovery and Data Mining), que é um grupo especial da ACM. [1]

De acordo com o próprio site do Weka os objetivos do projeto são:
-Tornar geralmente disponíveis técnicas de ML (machine learning);
-Aplicá-las a problemas que interessem à indústria da Nova Zelândia;
-Desenvolver novos algoritmos de aprendizagem de máquina e entregá-los ao mundo;
-E contribuir para um framework teórico para o campo. [2]


Alguns motivos especiais fizeram com que o Weka possuísse boa aceitação entre aqueles envolvidos nesta área de aprendizagem de máquina, mineração de dados e inteligência artificial tais como o fato de estar distribuído sob licença GNU General Public License, ser implementado em Java (o que permite sua execução em quase todas as plataformas modernas) e sua interface gráfica agradável que facilita a utilização pelos iniciantes.

O Weka contém uma extensa coleção de técnicas de pré-processamento de dados e modelagem de dados, além de suportar várias tarefas comuns em mineração de dados como clusterização, classificação, regressão, vizualização e seleção. Uma área considerada importante que não é coberta pelo algoritmos do Weka é a de modelagem de sequências. [1]

Para mais informações:

2 comentários:

  1. Muito legal Luiz. Em 2006 o Projeto Weka passou a ser patrocinado pela Pentaho, que fornece uma plataforma open source de BI. O Weka continua a ser desenvolvido e distribuído como software livre. O interessante é que esse é o mesmo modelo de negócio do KNIME e do Rapid-i, o software é aberto mas as empresas vendem o serviço de customização e treinamento.

    ResponderExcluir
  2. Alexandre, grande post, sou apaixonado pelo WEKA desenvolvo minerações nele e possuo um curso sobre o mesmo, gostaria de estar passando aos seus leitores, valeu mesmo!!!.

    Grimaldo Oliveira
    www.bicomvatapa.blogspot.com

    ResponderExcluir