Desmistificando termos de Inteligência Artificial

Desmistificando IA

A sopa de letrinhas é grande

e as vezes é difícil de  entender o que significam

Quando se lê publicações sobre IA é comum ter um monte de terminologia complexa, mas quando se escreve algo desmistificando os termos da Inteligência Artificial, é esperado que as dúvidas e confusão sejam minimizadas. Estamos passando por um hype muito grande com a IA, como já tivemos em 2003/2004 com o SAP e em 2012/2013 com Big Data. Faz parte, e vamos superar este também. Até lá, contudo, precisamos diminuir as cofusões causadas por algumas terminologias.

Podemos começar entendendo a diferença entre Inteligência Artificial, Machine Learning, Ciência de Dados e Big Data. Apesar de serem termos comuns de aparecerem juntos, há uma linha tênue de complemento entre si.

Desmistificando termos de Inteligência Artificial

Inteligência Artificial

Muita gente pode ter começado a ouvir sobre IA nos ultimos anos ou meses, mas essa linha de pesquisa da Ciência da Computação já tem muitas décadas de estrada. Esta é uma área que busca solucionar problemas de natureza biológica, através de soluções matemáticas. A observação do comportamento de um enxame de abelhas, os padrões de fala e entendimento de conversa, o funcionamento do cérebro. Estes são alguns exemplos de comportamento biológico que são representados computacionalmente que a Inteligência Artificial procura reproduzir. No livro A Revolução do Aprendizado Profundo que li recentemente o autor comenta que se alguma pesquisa está acontecendo na área de IA, é porque ela foi observada na natureza e está tentando ser reproduzida.

Diversas técnicas mais genéricas podem ser aceleradas em projetos, para se complementarem e resolver um problema específico do seu negócio. Imagine a situação onde é necessário reconhecer o rosto de um profissional, por exemplo, que faz limpeza externa de prédio. O rosto não muda, todos os seres humanos possuem as mesmas características nos rostos. Você não precisa desenvolver do zero a sua aplicação que fará o reconhecimento do rosto, você pode usar uma solução mais genérica que faz o reconhecimento da face e então você trabalha no problema do seu negócio, que é saber se aquele profissional está capacitado ou não para realizar a tarefa.

Machine Learning

A área de Aprendizagem de Máquina é gigante por si só e está caminhando lado a lado da Inteligência Artificial. O principal destaque da área de Machine Learning é o fato de aprender com exemplos. Não existe aprendizagem de máquina sem exemplo, e as respostas retornadas pelo seu algoritmo de Machine Learning terá uma probabilidade de acerto, não uma resposta determinística.

Para exemplificar, imagine que você está apresentando um prato de arroz a primeira vez para uma criança de 3 anos. Você apresenta o alimento e ensina que é arroz. No dia seguinte, você apresenta um belo prato de macarronada com molho vermelho. Os padrões visuais dos alimentos são bastante distintos, em termos de cor, tamanho e forma. No terceiro dia você apresenta feijão. Mas, no quarto dia você apresenta uma lazanha com molho vermelho, e pergunta qual é o nome daquele alimento. A probabilidade da criança responder que é macarronada é grande. Este é o aprendizado que mais se parece com o que ela está vendo naquele momento. Contudo, se repetir o experimento com a lentilha, terá a resposta que é feijão.

É através de exemplo como estes que a máquina aprende. São apresentados diversos exemplos de elementos, e se aplicam os algoritmos que destacam/descobrem os padrões naqueles elementos do exemplo. Porque é com isso que é desenvolvido o modelo. No futuro, ao apresentar uma nova amostra que não havia sido apresentada antes, o modelo de Machine Learning responderá o que provavelmente é aquela amostra.

Ciência de Dados

Este termo trás uma percepção de que é uma área muito recente. Realmente, o termo tem poucos anos e ganhou ainda mais relevância depois de 2010/2011. Porém, os estatísticos já trabalham com estas técnicas e algoritmos há muitas décadas. Só para um exemplo disso, o teorema de Bayes é da primeira metade dos anos 1700 e trata de probabilidade condicional. Mas a ciência de dados não é só estatística, apesar desta área ser uma das mais importante.

A área de Mineração de Dados, com foco principal em reconhecimento de padrões, também faz parte desta frente de trabalho. Em termos gerais, quando se fala de Ciência de Dados, é esperado que se aplique as técnicas científicas em cima dos dados. Porque o objetivo é cada vez mais diminuir os possíveis erros. É esperado que a pessoa seja questionadora, cética, não confie nos pares só por confiar. E principalmente, deve ter a cabeça aberta sabendo que vai errar bastante, e que isso faz parte do cotidiano de um cientista de dados.

Big Data

Talvez a área mais distante das outras três, mas mesmo assim, muito próxima. Digo distante porque não precisam trabalhar juntas, elas podem ser aplicadas de forma isolada, contudo, continuam com muito valor para o projeto. No início dos anos 2000 o termo foi apresentado a primeira vez em um artigo do Gartner que falava sobre os três Vs que formaram os pilares do Big Data: Volume, Variedade e Velocidade. Sempre pensando nestes três Vs e sua relação com os dados.

Quando se pensa no Volume, a medida analisada é o quanto de espaço os dados que precisam ser analisados ocupam. Quando se passa da casa de alguns Petabytes de dados, a relação de volume começa a considerar as tecnologias de Big Data.

Já para a variedade dos dados trabalhados em soluções de Big Data, é esperado que a solução não fique somente com dados estruturados. Espera-se que uma parcela dos dados necessários para o trabalho seja não estruturado, como arquivos de imagem, vídeo, audio, etc.

Por fim, a velocidade é pertinente ao quão rápido uma decisão é tomada. A resposta do sistema de Big Data está processando os sinais de entrada e tomando a decisão em tempo hábil para melhorar a experiência do usuário? Se envolver uma resposta rápida, que processe muitos tipos de dados necessários e que estão armazenados em um volume monstruoso, você pode dizer que está trabalhando com Big Data.

Outras terminologias

É possível derivar em muitos outros termos a conversa de Inteligência Artificial, Machine Learning, Ciência de Dados e Big Data. Mas neste momento vou deixar desta forma. Em próximas postagens fico com o compromisso de entrar mais a fundo nestas áreas e derivar as terminologias. Se inscreva na newsletter para receber as novidades.

 

 

 

Sobre Diego Nogare 350 Artigos
Diego Nogare é Gerente Técnico de Engenharia de Machine Learning no Itaú-Unibanco. Também é professor em programas de pós graduação no Mackenzie e na FIAP, em São Paulo. Foi nomeado como Microsoft MVP por 11 anos seguidos, e hoje faz parte do programa Microsoft Regional Director.