Aprendizado de Máquinas com Azure Machine Learning e R

Fala galera, na última sexta-feira (03/07) fiz uma apresentação de mais de 1h30 sobre Aprendizado de Máquinas com Azure Machine Learning e R. Nesta apresentação explico sobre o conceito de aprendizado supervisionado e não supervisionado, e também falo um pouco sobre a importancia de entender a matriz de confusão e seus elementos. Acompanhe abaixo o vídeo e os slides da apresentação.

Vídeo:

Slides:

Espero que esta pequena introdução ao Machine Learning abra a mente de todos para os benefícios do uso de inteligência artificial no desenvolvimento de software…

0  

Participação no Keynote do //Build/ Tour em São Paulo

Fala galera, dia 21/05/2014 aconteceu em São Paulo o evento //Build/ Tour que apresenta os lançamentos mais recentes de produtos Microsoft para desenvolvedores. Este evento vai rodar o mundo passando em diversas cidades, e tivemos a oportunidade de sediar em São Paulo o único evento do Brasil.

O Alexandre Tarifa (twitter|blog) e eu pudemos demonstrar rapidamente umas das tecnologias que estamos utilizando aqui no Dieta e Saúde que é o Azure Machine Learning para classificação de alimentos com base na informação nutricional. Veja o vídeo desta demonstração:

Aproveitamos que estavamos lá no Allianz Parque e fizemos dois Lives pro Codificando… Um sobre o evento em sí, e outro com o Claudenir Andrade sobre IoT – Internet of Things. Acompanhe os vídeos abaixo:

E este:

0  

Livro – SQL Server Além do Conceito: Blog Post Collection

Fala galera, praticamente um ano após o lançamento do meu primeiro livro Do Banco de Dados Relacional à Tomada de Decisão, estou publicando mais um. Este em especial é um livro que não é exatamente um livro, apesar de toda a formatação e carinho de um livro, esta publicação não possui textos originais. É uma coletânea de blog posts de 15 autores. O SQL Server Além do Conceito: Blog Post Collection reune 330 páginas contemplando todas as áreas da Plataforma de Dados da Microsoft, com materiais de Administração, Desenvolvimento e Business Intelligence.

Esta publicação, desde o inicio do projeto, já tinhamos a intenção de entregar gratuitamente. Para isso, você pode acessar o site www.livrosdonogare.com.br e clicar pra fazer download.

Veja alguns tópicos que você encontra neste livro, escrito por este pessoal: Diego Nogare, Edvaldo Castro, Demetrio Silva, Marcel Inowe, Marcos Freccia, Ivan Lima, Fabiano Amorim, Sulamita Dantas, Marcelo Fernandes, Cibelle Castro, Leandro Ribeiro, Luciano Moreira, Nilton Pinheiro, Tiago Balabuch e Felipe Ferreira.

  • Níveis de Isolamento;
  • Particionamento de Tabelas;
  • Tuning de Sharepoint e SQL;
  • Protheus;
  • T-SQL no SQL Server 2012;
  • Join Reordering e Bushy Plans;
  • Policy Based Management;
  • SQL Audit;
  • SSIS;
  • Fragmentação de Transaction Log;
  • Triggers causando Deadlock;
  • Trabalhando com Datas e Conversões;
  • Análise e detecção de problemas;
  • Como montar um Data Warehouse pra testes;

Aproveite e baixe agora mesmo sua cópia, é de graça J

3  

Especialização em Ensino Virtual pela UCI – University of California, Irvine

Fala galera, recentemente terminei uma especialização de Ensino Virtual com a UCI – Univesity of California, Invine (Universidade da Califórnia, Irvine). Foi um curso baseado em 5 módulos, sendo:

  1. Foundation of Virtual Instruction (Os Fundamentos da Educação Virtual) – 82.7%
  2. Emerging Trends & Technologies in the Virtual K-12 Classroom (Tendências e Novas Tecnologias para Aulas Virtuais do Ensino Primário e Secundário – K-12) – 81.5%
  3. Advanced Instructional Strategies in the Virtual Classroom (Estratégias de ensino avançado na sala de aula virtual) – 84.8%
  4. Performance and Assessment in the Virtual Classroom (Avaliação de Desempenho na Sala de Aula Virtual) – 81.4%
  5. Virtual Teacher Final Project (Professor Virtual – Projeto Final)

Os módulos me ajudaram bastante a abrir a cabeça e descobrir ferramentas para ensino para formato síncrono ou assincrono, como também forma de prender a atenção dos alunos e até algumas técnicas pra avaliação de desempenho. Escolhi fazer a especialização no formato pago, que garantia um certificado de participação para quem concluísse todos os módulos com uma pontuação acima de 70%. Consegui concluir todos os módulos com uma média acima de 80%. Fiquei bastante feliz!

Este curso me ajudará a melhorar cada vez mais os treinamentos que faço para a NGR Solutions, e também me deu inspiração pra fazer algumas coisas assincronas e disponibilizar para vocês. Fiquem ligados nas novidades da NGR para os próximos meses J

Quero dedicar este certificado de conclusão à você, que acompanha o meu trabalho e me motiva a continuar gerando conteúdo.

Queria conseguir expressar em palavras o quanto isso é gratificante pra mim, mas não sei qual palavra usar nem por onde começar, então deixo um simples e direto MUITO OBRIGADO.

1  

Azure Machine Learning – Matriz de Confusão – Parte 4

Fala galera, a primeira publicação do ano é realtiva à Matriz de Confusão, também chamada em algumas literaturas de tabela de contingência. Basicamente esta tabela valida o aprendizado supervisionado, comparando sua base de testes com a base treinada, e indica o quanto de acerto e erro ela teve. Este resultado é o que apresenta a acuracia do seu experimento.

Voltando ao exemplo que fiz para o Codificando Live de Edição #43, onde analisamos uma base de alimentos e definimos alguns itens da amostra como misturas ou não. A matrix aparece aos 20m32s de vídeo onde é rapidamente apresentada a acuracia, logo abaixo da curva ROC, no item Evaluation Model Result.

Se reparar no vídeo, o treino do modelo é feito com 80% da base que fizemos o upload e é mantido 20% para testes (esta divisão acontece na tarefa de split). É com esta base de testes, que já temos conhecimento do resultado, que a matriz vai validar a coluna de predição informada no treino. Ela aplica o que treinou em cima desta base de teste, e compara se o resultado que ela obteve é igual ao que está nos dados originais. Resultando na seguinte estrutura:

Onde alguns valores são absolutos, baseados na classificação binária de erro ou acerto, que são:

True Positive:

Ele entende que as misturas foram analisadas e classificadas como mistura (acertou a mistura). Neste caso, é 16.

False Positive:

Ele entende que as misturas foram analisadas e classificadas como não mistura (errou a mistura, classificando como outro prato). Neste caso, é 5.

True Negative:

Ele entendeu o que não era mistura (era outro prato) e classificou como outro prato (acertou que não era uma mistura). Neste caso, é 54.

False Negative:

Ele entende que os outros pratos (não misturas) foram classificados como mistura (errou o outro prato). Neste caso, é 0.

 

Já outros são baseados em cálculos matemáticos simples, como estes abaixo:

∑ Positivos = Acertos = True Positive + False Negative

∑ Negativos = Erros = False Positive + True Negative

Acuracy (acurácia):

(True Positive + True Negative) / (∑ Positivos + ∑ Negativos)

Com nossos números: (16 + 54) / ((16+0) + (5+54)) => 70 / 75 = 0.9333

Precision (precisão):

(True Positive) / (True Positive + False Positive)

Com nossos números: (16) / (16 + 5) => 16 / 21 = 0.7619

Recall:

True Positive / ∑ Positivos

Com nossos números: 16 / (16+0) => 16 / 16 = 1

F1 Score:

(2* True Positive) / (2* True Positive + False Positive + False Negative)

Com nossos números: (2*16) / (2*16 + 5 + 0) => 32 / 37 = 0.8648

 

Com estes números, e mais a curva ROC e o AUC, é possível validar os valores do seu experimento e saber se está aceitável ou não. Quanto mais exemplos tiver na base de treino, mais precisa será a coluna de predição porque o computador vai aprender com mais exemplos.

0