Ir ao conteúdo

O que é Machine Learning?

Nesse post, vou abordar o conceito básico do que é Machine Learning.  

 

O que Machine Learning ? 

Com certeza, você já deve ter ouvido falar sobre Machine Learning (Aprendizado de Máquina) e se perguntou… “O que é isso?”. Machine Learning é um subcampo da Inteligência Artificial que utiliza técnicas de estatística e matemática associadas à tecnologia para compreender padrões (características) de um conjunto de dados.  

O conceito de Machine Learning (Aprendizado de Máquina) foi criado por Artur Samuel em 1959, de forma que ele afirmar: “aprendizado de máquina é um campo de estudo que da á computadores a capacidade de aprender sem ser programado de forma explícita” [1].

Por exemplo, neste momento que você esta lendo este artigo, está utilizando algum tipo de computador (SmartPhone, Notebook ou Desktop) e deve está afirmando que essa máquina “sabe” fazer muitas tarefas! Realmente, ela “sabe”! Contudo, a maioria do “saber” dela, vêm das instruções programadas por desenvolvedores, como: “Se você clicar em um botão, abre tal janela…”! Assim, caracterizando uma programação explicita da capacidade de aprender deste computador. No aprendizado de máquina, não é necessário programar de forma explícita o “saber” do computador! Vamos ao exemplo de identificar e-mails de spam:

 

Exemplo

Se um desenvolvedor fosse programar um identificador de spams, no melhor caso, ele vai fazer uma Expressão Regular com expressões que contenham informações de site ou conteúdos que ele entende ser spam. Contudo, imagina desenvolver uma expressão regular que contenham a maioria dos sites e conteúdos que existam…vai ser uma expressão MUITO grande! Beirando quase a inviabilidade de programar algo assim…

Já no aprendizado de máquina, o desenvolvedor precisará de uma amostra dos dados (uma parte do conjunto de dados) contendo os e-mails de spams e os e-mails que não são spams. Realizar uma limpeza nesses dados, retirando termos (chamados stopwords) que não são relevantes para a identificação dos dois tipos (spams e não-spams) de e-mails. Depois dos dados estarem limpos, “apresentam-os” à qualquer um algoritmo de aprendizado de máquina para que seja extraído as características dos dois tipos de e-mails  (spams e não-spams) e gerado um modelo matemático ou estatístico que representam estas características.

Parece ser difícil, mas não! É simples! Vou postar em breve como solucionar esse problema com Aprendizado de Máquina!

Desta forma, é possível concluir que o objetivo do aprendizado de máquina é construir modelos computacionais que podem adaptar-se e aprender a partir da experiência contida nos dados (MITCHELL, 1997) [2]. Em termos práticos, algoritmos de aprendizado de máquina têm como objetivo descobrir o relacionamento entre as variáveis de um sistema (entrada/saída) a partir de dados amostrais (CHERKASSKY & MULIER, 2007) [3].

 

É isso pessoal! É uma pequena introdução, mas vou postar mais conteúdos para um melhor esclarecimento. Abaixo têm as referencias das citações e do livro do Tom Mitchell, que recomendo muito!

Até a próxima!

 

Livro:

O livro Machine Learning, por Tom M. Mitchell (Autor), Thomas Mitchell (Autor), Mitchell Thomas (Autor) – 1997 é uma das literaturas base dos estudos de Machine Learning.

 

Bibliografia

[1] Samuel, Arthur L. “Some Studies in Machine Learning Using the Game of Checkers”. IBM Journal of Research and Development. – 1959

[2] Machine Learning, por Tom M. Mitchell (Autor), Thomas Mitchell (Autor), Mitchell Thomas (Autor) – 1997

[3] Learning from Data: Concepts, Theory, and Methods – Vladimir Cherkassky, Filip M. Mulier – 2007

Publicado emInteligência ArtificialMachine Learning