<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Arquivos Aprendizado de Máquina - Diego Nogare</title>
	<atom:link href="https://diegonogare.net/tags/aprendizado-de-maquina/feed/" rel="self" type="application/rss+xml" />
	<link>https://diegonogare.net/tags/aprendizado-de-maquina/</link>
	<description>Consultor Executivo de IA &#38; ML</description>
	<lastBuildDate>Tue, 15 Apr 2025 13:50:53 +0000</lastBuildDate>
	<language>pt-BR</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://i0.wp.com/diegonogare.net/wp-content/uploads/2025/06/cropped-cropped-DN-Black-300x300-1.png?fit=32%2C32&#038;ssl=1</url>
	<title>Arquivos Aprendizado de Máquina - Diego Nogare</title>
	<link>https://diegonogare.net/tags/aprendizado-de-maquina/</link>
	<width>32</width>
	<height>32</height>
</image> 
<site xmlns="com-wordpress:feed-additions:1">247556142</site>	<item>
		<title>Review do Livro &#8220;50 Algorithms Every Programmer Should Know &#8211; 2nd edition&#8221;</title>
		<link>https://diegonogare.net/2024/03/50-algoritmos-que-deve-conhecer/</link>
		
		<dc:creator><![CDATA[Diego Nogare]]></dc:creator>
		<pubDate>Mon, 18 Mar 2024 14:00:39 +0000</pubDate>
				<category><![CDATA[Review de Livro]]></category>
		<category><![CDATA[Algoritmos]]></category>
		<category><![CDATA[Aprendizado de Máquina]]></category>
		<category><![CDATA[Ciência da Computação]]></category>
		<category><![CDATA[criptografia]]></category>
		<category><![CDATA[estrutura de dados]]></category>
		<category><![CDATA[Livro]]></category>
		<category><![CDATA[processamento de dados]]></category>
		<category><![CDATA[redes neurais]]></category>
		<category><![CDATA[review]]></category>
		<guid isPermaLink="false">https://diegonogare.net/?p=3822</guid>

					<description><![CDATA[<p>Review do livro &#8220;50 Algorithms Every Programmer Should Know &#8211; 2nd edition&#8220;, que foi escrito por Imran Ahmad e publicado pela Packt Pub. Neste livro você aprenderá (ou relembrará) 50 algoritmos que deve conhecer na ciência da computação. Contudo, é uma versão atualizada, contando inclusive com assunto atuais como Large Language Models e discussões sobre...</p>
<p>O post <a href="https://diegonogare.net/2024/03/50-algoritmos-que-deve-conhecer/">Review do Livro &#8220;50 Algorithms Every Programmer Should Know &#8211; 2nd edition&#8221;</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></description>
										<content:encoded><![CDATA[<p>Review do livro &#8220;<em>50 Algorithms Every Programmer Should Know &#8211; 2nd edition</em>&#8220;, que foi escrito por Imran Ahmad e publicado pela Packt Pub. Neste livro você aprenderá (ou relembrará) 50 algoritmos que deve conhecer na ciência da computação. Contudo, é uma versão atualizada, contando inclusive com assunto atuais como Large Language Models e discussões sobre transparência e ética nos algoritmos.</p>
<h2>O livro e com seus 50 algoritmos que deve conhecer</h2>
<p>Vou compartilhar minhas impressões desta obra, e já de partida quero avisar que nem todos os algoritmos são para todos nós. Digo isso porque há uma amplitude de assuntos que, dependendo do que você trabalha ou estuda, não vão lhe chamar muita atenção. No meu caso, o capítulo 3 é de ordenação e o capítulo 14 que é de criptografia&#8230; Não são exatamente os assuntos que mais me chamam atenção e acabei passando rapidamente por ali. Porém, a seção II que é de Machine Learning eu li com muito mais atenção, como também o capítulo 16.</p>
<p>Com uma abordagem direta em cada capítulo, o livro ensina de forma prática (programando em Python) como aplicar o que está estudando. É bem balanceado entre teoria e prática, certamente o que é bom para materializar a teoria na prática. O livro está organizado em 16 capítulos separados em três seções, e trás os 50 algoritmos que deve conhecer.</p>
<p>Vamos aos capítulos&#8230;</p>
<h3><strong>Cap 1 &#8211; Visão geral de algoritmos</strong></h3>
<p>No capítulo 1 mergulhamos no universo dos algoritmos. É uma introdução aos seus fundamentos, mostrando como eles são essenciais desde a formulação de problemas até a execução de soluções. O capítulo destaca a evolução do uso dos algoritmos e suas limitações. Para os entusiastas de Python, tem um guia de como preparar o ambiente para rodar os exemplos do livro, mas se você quiser ver isso em vídeo, <a href="https://www.youtube.com/watch?v=56keUCxiXPE&amp;list=PLrakQQfctUYXKi7SX0klbE4NiqKHbrnk2" target="_blank" rel="noopener">gravei essa playlist há algum tempo</a>. E não para por aí: o capítulo também aborda como medir e comparar o desempenho dos algoritmos. É um começo importante para quem quer entender a base do que vem a seguir no livro.</p>
<h3><strong>Cap 2 &#8211; </strong>Estruturas de dados</h3>
<p>No capítulo 2 a conversa é sobre as estruturas de dados e como elas são a espinha dorsal de algoritmos. O capítulo, de fato, é um prato cheio para quem usa Python, detalhando como a linguagem gerencia estruturas de dados complexas e quais são as mais indicadas para cada tipo de dado. Mas não se preocupe se você é fã de Java ou C++, os conceitos são universais e vão te ajudar independentemente da linguagem que você curte programar. É o tipo de capítulo que faz você querer mergulhar no código e ver a mágica acontecer.</p>
<h3>Cap3 &#8211; Ordenação e Busca</h3>
<p>E aí, no capítulo 3, é apresentada a parte de algoritmos de ordenação e busca. O capítulo, a princípio, trás diferentes abordagens e tipos de algoritmos de ordenação, cada um com seu próprio estilo e estratégia de solução de problema. E para não deixar a busca de lado, tem exemplos práticos que mostram como esses algoritmos percorrem atrás dos dados.</p>
<h3>Cap 4 &#8211; Projetando algoritmos</h3>
<div class="content" tabindex="0" aria-description="">
<div class="ac-container ac-adaptiveCard">
<div class="ac-textBlock">
<p>Chegando no capítulo 4, a gente entra na parte de Projetando Algoritmos. O capítulo, antes de mais nada, é uma verdadeira aula sobre como dar vida aos algoritmos, começando (obviamente) por entender o problema que você quer resolver. E para deixar tudo mais interessante, ocasionalmente, relembra o famoso Problema do Caixeiro Viajante (TSP), muito visto em cursos de Ciência da COmputação, e joga na mesa como um exemplo real de como aplicar essas técnicas de design. E não para por aí, ainda tem um pouco de programação linear para materializar a discussão com suas aplicações práticas. O capítulo faz bem o papel de ponte entre a teoria e a prática.</p>
</div>
</div>
</div>
<h3>Cap 5 &#8211; Grafos</h3>
<p>No Capítulo 5, a parada é nos Algoritmos de Grafos. O capítulo é um guia que mostra como navegar em grafos para representar estruturas de dados. Ele não só cobre o básico, mas também detalha teorias e técnicas mais profundas, como análise de redes e busca de grafos. E para colocar a teoria em prática, há um estudo de caso que usa grafos para desvendar fraudes.</p>
<h3>Cap 6 &#8211; Aprendizado não supervisionado</h3>
<div class="content" tabindex="0" aria-description="">
<div class="ac-container ac-adaptiveCard">
<div class="ac-textBlock">
<p>Aqui no capítulo 6, sobretudo, começam os assuntos de <a href="https://diegonogare.net/tag/machine-learning/" target="_blank" rel="noopener">Machine Learning</a>, e esses eu li com muito mais carinho e dedicação por questões óbvias, ao propósito, de interesse pessoal <img src="https://s.w.org/images/core/emoji/17.0.2/72x72/1f642.png" alt="🙂" class="wp-smiley" style="height: 1em; max-height: 1em;" /></p>
</div>
</div>
</div>
<div class="content" tabindex="0" aria-description="">
<div class="ac-container ac-adaptiveCard">
<div class="ac-textBlock">
<p>Este capítulo fala sobre o aprendizado de máquina não supervisionado. O capítulo é um convite para explorar como essa área do aprendizado de máquina pode ser usada para decifrar problemas do cotidiano. Ao mesmo tempo é apresentada uma introdução aos principais algoritmos e metodologias, como os de agrupamento, que encontram dados semelhantes; redução de dimensionalidade, que simplifica a complexidade diminuindo o espaço de busca; e de regras de associação, que descobre relações ocultas entre eventos e transações.</p>
<h3>Cap 7 &#8211; Aprendizado Supervisionado</h3>
</div>
</div>
</div>
<p>Neste capítulo a gente coloca a mão na massa com aprendizado supervisionado. O capítulo tem laboratório, onde são explorados os algoritimos de classificação e regressão. O Autor explica seis algoritmos de classificação e três de regressão, ele não só apresenta, mas também coda com esses algoritmos resolvendo problemas reais. E no final ainda compara os resultados para ver o que teve melhor performance.</p>
<h3>Cap 8 &#8211; Redes Neurais Artificiais</h3>
<p>No capítulo 8, antes de mais nada, o foco é pelo mundo das Redes Neurais. O capítulo abre as portas para os conceitos-chave e componentes que formam uma rede neural, explicando sobre suas várias formas e as funções de ativação. O algoritmo de backpropagation, peça central no treinamento de redes neurais, é explicado ems detalhes. Da mesma forma, no final do capítulo ainda tem um exemplo prático de como o Deep Learning pode ser usado para detectar documentos fraudulentos, trazendo a teoria para o chão da realidade.</p>
<h3>Cap 9 &#8211; NLP Natural Language Processing</h3>
<div class="content" tabindex="0" aria-description="">
<div class="ac-container ac-adaptiveCard">
<div class="ac-textBlock">
<p>Aqui o autor aprofunda nos algoritmos para Processamento de Linguagem Natural (NLP). O capítulo é um guia completo que vai desde os fundamentos da NLP até a preparação dos dados para as tarefas mais complexas. Ele detalha o processo de vetorização de dados textuais e a técnica de incorporação de palavras. E, ao mesmo tempo, para não ficar só na teoria, apresenta um caso de uso detalhado mostrando como NLP se aplica no mundo real.</p>
</div>
</div>
</div>
<h3>Cap10 &#8211; Modelos sequenciais</h3>
<div class="content" tabindex="0" aria-description="">
<div class="ac-container ac-adaptiveCard">
<div class="ac-textBlock">
<p>Aqui no capítulo 10, o autor leva a conversa sobre o treinamento de redes neurais para lidar com dados que seguem uma sequência. O capítulo serve como uma introdução aos modelos sequenciais, desvendando suas técnicas e metodologias. Ao mesmo tempo ainda tem uma discussão sobre como o Deep Learning pode elevar o nível das técnicas de Processamento de Linguagem Natural (que vimos no capítulo anterior). O capítulo te prepara para entender como as máquinas trabalham a partir de dados que têm uma ordem, um ritmo, uma cadência, e como isso pode revolucionar a maneira como interagimos com a tecnologia.</p>
</div>
</div>
</div>
<h3>Cap11 &#8211; Modelos sequenciais avançados</h3>
<div class="content" tabindex="0" aria-description="">
<div class="ac-container ac-adaptiveCard">
<div class="ac-textBlock">
<p>O capitulo apresenta, contudo, limitações dos modelos sequenciais e descobre como eles têm evoluído para avançar na resolução de problemas. O autor mergulha nos aspectos mais sofisticados desses modelos, apresentando a criação de configurações que são verdadeiras &#8220;relíquias&#8221; em complexidade. Cobre assuntos como os autoencoders e modelos Sequence-to-Sequence (Seq2Seq), passando pelos mecanismos de atenção e transformers (<a href="https://research.google/pubs/attention-is-all-you-need/" target="_blank" rel="noopener">attention is all you need</a>), o capítulo prepara o terreno para os Large Language Models (LLMs), super atuais em questões de estado da arte da Inteligência Artificial.</p>
</div>
</div>
</div>
<h3>Cap12 &#8211; Sistemas de Recomendação</h3>
<div class="content" tabindex="0" aria-description="">
<div class="ac-container ac-adaptiveCard">
<div class="ac-textBlock">
<p>Neste capítulo o assunto discutido são sistemas de recomendação (<a href="https://diegonogare.net/2020/05/explicando-o-algoritmo-de-regra-de-associacao/" target="_blank" rel="noopener">regras de associação</a>), que parecem ler nossas mentes e sabem exatamente o que queremos antes mesmo de clicarmos. O capítulo explora os diferentes tipos de sistemas de recomendação e como eles funcionam por dentro, revelando tanto seus superpoderes quanto os desafios que enfrentam. E para fechar, o capítulo nos guia através de um problema do mundo real, mostrando como esses mecanismos podem ser a solução que estávamos procurando.</p>
<p>E é neste capítulo que se encerram os assuntos de <a href="https://diegonogare.net/tag/machine-learning/" target="_blank" rel="noopener">Machine Learning</a>!</p>
<h3>Cap 13 &#8211; Tratamento de dados</h3>
</div>
</div>
</div>
<p>Aqui o autor explica a arte de lidar com dados. O capítulo é um guia para entender os algoritmos de dados e os princípios que ajudam a resolver problemas de classificação de dados. Ele nos guia pelos algoritmos de armazenamento e compactação de dados, que são fundamentais para gerenciar informações de maneira eficiente. E como em qualquer boa estratégia, o capítulo nos mostra as vantagens e desvantagens de projetar e implementar algoritmos focados em dados.</p>
<h3>Cap 14 &#8211; Criptografia</h3>
<p>Confesso que passei bem rapido por aqui, não é um assunto que me atrai muito&#8230;</p>
<div class="content" tabindex="0" aria-description="">
<div class="ac-container ac-adaptiveCard">
<div class="ac-textBlock">
<p>Mesmo assim, o capítulo apresenta uma visão histórica da criptografia antes de mergulhar nos algoritmos que guardam nossos segredos. O capítulo começa com os algoritmos de criptografia simétrica, (MD5 e SHA), apontando suas limitações e vulnerabilidades. Depois, avança para o mundo da criptografia assimétrica, essencial para a criação de certificados digitais que autenticam e protegem em operações online. E para amarrar tudo, o capítulo trás um exemplo prático mostrando como todas essas técnicas se encaixam no assunto de segurança digital.</p>
</div>
</div>
</div>
<h3>Cap 15 &#8211; Algoritmo em grande escala</h3>
<div class="content" tabindex="0" aria-description="">
<div class="ac-container ac-adaptiveCard">
<div class="ac-textBlock">
<p>Neste capítulo o autor aborda algoritmos que operam em larga escala. O capítulo desvenda os bastidores para mostrar a infraestrutura necessária para dar suportar estas iniciativas. Apresenta também estratégias para gerenciar o processamento de múltiplos recursos, e as limitações impostas pela lei de Amdahl são examinadas (eu nem sabia que isso existia). E ao se falar em grande escala, não poderia faltar falar sobre as GPUs. Ele mostra seu papel no universo do processamento paralelo.</p>
<h3>Cap 16 &#8211; Explicabilidade e Ética</h3>
</div>
</div>
</div>
<div class="content" tabindex="0" aria-description="">
<div class="ac-container ac-adaptiveCard">
<div class="ac-textBlock">
<p>O Capítulo 16 trás algumas considerações práticas, convidando a gente para o desafio de tornar os algoritmos transparentes e compreensíveis. O capítulo trata da explicabilidade dos algoritmos, ou seja, até que ponto podemos entender o que acontece por trás do código? A ética no uso dos algoritmos também entra em cena, com uma discussão sobre como evitar vieses que podem surgir na implementação. Além disso, o capítulo explora técnicas para lidar com os temidos problemas NP-difíceis e reflete sobre os fatores importantes na hora de escolher um algoritmo.</p>
<p>&nbsp;</p>
</div>
</div>
</div>
<h2>Minha opinião sobre estes 50 algoritmos que deve conhecer</h2>
<p>Na minha humilde opinião o livro é completo e poderia facilmente servir de base complementar para cursos de graduação em ciência da computação. É um material útil para aprender ou aprimorar suas habilidades em algoritmos com Python.</p>
<p>Como comentei no começo do post, é leitura seletiva para quem se interessa pelos assuntos. Vale o investimento! Para mim, os capítulos entre 6 e 12, que falam de Machine Laerning, além do 16 que fala sobre transparência dos algoritmos, foram os que me chamaram mais atenção.<br />
A versão digital está na <a href="https://amzn.to/4cvyKD8" target="_blank" rel="noopener">Amazon por um pouco mais de 200 reais</a> enquanto escrevo esse texto.</p>
<p>&nbsp;</p>
<h2>Códigos do &#8220;50 Algorithms Every Programmer Should Know &#8211; 2nd edition&#8221;</h2>
<p>No <a href="https://github.com/cloudanum/50Algorithms" target="_blank" rel="noopener">Github da editora</a> você pode acompanhar os códigos do livro e reproduzir o que estudou para fixar o aprendizado com os 50 algoritmos que todo desenvolvedor deve conhecer.</p>
<p>&nbsp;</p>
<p>Bons estudos!</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>O post <a href="https://diegonogare.net/2024/03/50-algoritmos-que-deve-conhecer/">Review do Livro &#8220;50 Algorithms Every Programmer Should Know &#8211; 2nd edition&#8221;</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">3822</post-id>	</item>
		<item>
		<title>LinkedIn Community Top Voices</title>
		<link>https://diegonogare.net/2024/01/linkedin-community-top-voicer/</link>
		
		<dc:creator><![CDATA[Diego Nogare]]></dc:creator>
		<pubDate>Mon, 29 Jan 2024 13:30:58 +0000</pubDate>
				<category><![CDATA[Inteligência Artificial]]></category>
		<category><![CDATA[Aprendizado de Máquina]]></category>
		<category><![CDATA[ciência de dados]]></category>
		<category><![CDATA[comunidade]]></category>
		<category><![CDATA[linkedin]]></category>
		<guid isPermaLink="false">https://diegonogare.net/?p=3740</guid>

					<description><![CDATA[<p>O LinkedIn Community Top Voices é um programa exclusivo que reúne especialistas de todo o mundo para compartilhar conhecimentos valiosos sobre uma variedade de tópicos relevantes para os usuários do LinkedIn. O programa é dividido em duas categorias: LinkedIn Top Voices e Community Top Voices. O primeiro é um programa apenas para convidados, enquanto o...</p>
<p>O post <a href="https://diegonogare.net/2024/01/linkedin-community-top-voicer/">LinkedIn Community Top Voices</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></description>
										<content:encoded><![CDATA[<p>O LinkedIn Community Top Voices é um programa exclusivo que reúne especialistas de todo o mundo para compartilhar conhecimentos valiosos sobre uma variedade de tópicos relevantes para os usuários do LinkedIn. O programa é dividido em duas categorias: <strong>LinkedIn Top Voices</strong> e <strong>Community Top Voices</strong>. O primeiro é um programa apenas para convidados, enquanto o segundo é aberto a todos os usuários que contribuem com artigos colaborativos notáveis. Ambos os programas concedem selos de perfil exclusivos que reconhecem a experiência e o conhecimento dos usuários.</p>
<p>Caso queiram mais detalhes, aqui neste link tem a explicação completa direto do Linkedin: <a href="https://www.linkedin.com/help/linkedin/answer/a776208" target="_blank" rel="noopener">https://www.linkedin.com/help/linkedin/answer/a776208</a></p>
<h2>Reconhecimento</h2>
<p>Fiquei surpreso em ser reconhecido como Community Top Voices na categoria de <strong>Machine Learning</strong> e na de <strong>Data Science</strong>. Pelo que entendi, recebi o selo por reconhecimento da comunidade que considerou útil alguns comentários que fiz em posts sobre ML e Data Science que o Linkedin me apresentava&#8230; O curioso é que eu comentei somente em posts que me faziam sentido e eu tinha conhecimento e vontade de comentar.</p>
<p><img data-recalc-dims="1" fetchpriority="high" decoding="async" class="wp-image-3741 size-medium alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2024/01/TopVoicer-e1706535139547-300x219.jpeg?resize=300%2C219&#038;ssl=1" alt="LInkedin Top Voicer" width="300" height="219" /></p>
<p>Alguns de vocês já acompanham as contribuições que faço para a comunidade de dados no Brasil há anos, outros estão chegando agora. Independente de quando você começou a acompanhar o trabalho de divulgação que faço, vale dar uma passada por esse post de quase 10 anos atrás, onde explico sobre essas contribuições voluntárias: <a href="https://diegonogare.net/2015/09/reconhecimento-como-outstanding-pass-volunteer-agosto2015/" target="_blank" rel="noopener">Reconhecimento como Outstanding PASS Volunteer – Agosto/2015</a>. Ou este outro que é um pouco mais antigo, de 2010, que conto sobre um recorte da trajetória que estava trilhando: <a href="https://diegonogare.net/2010/07/comunidade-reconhecimento-e-conquistas/" target="_blank" rel="noopener">Comunidade, reconhecimento e conquistas!</a></p>
<p>O que busco fazer é uma contribuição legítima, tento ajudar o próximo sem esperar nada em troca. Mesmo assim, ser reconhecido pela comunidade global como um especialista <strong>Machine Learning</strong> e na de <strong>Data Science</strong>, é realmente muito gratificante.</p>
<p>Acredito que ao voltar à pergunta de quase 15 anos atrás: &#8220;Nossa Diego, o que você ganha com isso?!&#8221;, posso responder com propriedade que &#8220;Não ganho nada&#8230; mas ganho tudo!&#8221;.</p>
<p>Obrigado galera, vocês são incríveis! Espero, de coração, que as coisas que publico ajudem de alguma forma.</p>
<p>O post <a href="https://diegonogare.net/2024/01/linkedin-community-top-voicer/">LinkedIn Community Top Voices</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">3740</post-id>	</item>
		<item>
		<title>Desenvolvendo seus projetos em R no Visual Studio 2017</title>
		<link>https://diegonogare.net/2017/07/desenvolvendo-seus-projetos-em-r-no-visual-studio-2017/</link>
		
		<dc:creator><![CDATA[Diego Nogare]]></dc:creator>
		<pubDate>Mon, 10 Jul 2017 00:22:46 +0000</pubDate>
				<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[Aprendizado de Máquina]]></category>
		<category><![CDATA[big data]]></category>
		<category><![CDATA[business analytics]]></category>
		<category><![CDATA[Data Science]]></category>
		<category><![CDATA[linguagem R]]></category>
		<category><![CDATA[visual studio]]></category>
		<guid isPermaLink="false">http://diegonogare.net/?p=1503</guid>

					<description><![CDATA[<p>Fala galera! Depois de mais 1 ano e meio sem escrever para cá por causa do projeto do livro Análise Preditiva com Azure Machine Learning e R e o foco no crescimento da NGR, hoje volto a escrever para o blog. O direcionamento da escrita será o mesmo de sempre, olhar para tecnologias focadas em...</p>
<p>O post <a href="https://diegonogare.net/2017/07/desenvolvendo-seus-projetos-em-r-no-visual-studio-2017/">Desenvolvendo seus projetos em R no Visual Studio 2017</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></description>
										<content:encoded><![CDATA[<p>Fala galera! Depois de mais 1 ano e meio sem escrever para cá por causa do projeto do livro <a href="http://www.livrosdonogare.com.br/produto/analise-preditiva-com-azure-machine-learning-e-r/" target="_blank" rel="noopener noreferrer">Análise Preditiva com Azure Machine Learning e R</a> e o foco no crescimento da <a href="http://www.ngrsolutions.com.br/" target="_blank" rel="noopener noreferrer">NGR</a>, hoje volto a escrever para o blog.</p>
<p>O direcionamento da escrita será o mesmo de sempre, olhar para tecnologias focadas em dados!</p>
<p>Para voltar, escolhi contar como pode-se desenvolver scripts e projetos usando Linguagem R dentro do Visual Studio, tanto 2015 quanto 2017. E o melhor, pode-se usar a versão Community do Visual Studio, que é gratuita. Esta pode ser uma alternativa ao RStudio (que também é gratuito se não for usado para fins lucrativos), caso tenha o ambiente de desenvolvimento baseado em Microsoft já configurado.</p>
<p>Vamos lá, a primeira coisa a se fazer é baixar os softwares necessários. Caso já tenha o .Net Framework instalado, pode pular o download. Se estiver na dúvida, baixe.</p>
<ol>
<li><a href="https://www.microsoft.com/download/details.aspx?id=42642">.Net Framework 4.5.2</a> (+ &#8211; 70MB)</li>
<li><a href="http://aka.ms/rclient/">Microsoft R Client</a> (+ &#8211; 300 MB)</li>
<li><a href="https://www.visualstudio.com/pt-br/downloads/">Visual Studio Community 2017</a> (+ &#8211; 4.7Gb)</li>
</ol>
<p>Todos os links acima são de distribuições gratuitas. Lembrando que o terceiro link, o do Visual Studio, você pode manter uma versão paga caso tenha a licença do produto.</p>
<p>Para começar o processo, faça a instalação do .Net Framework. Provavelmente se você mantém seu Windows atualizado, você não precisará instalar o .Net Framework e terá uma mensagem de alerta como a seguir. Caso precise instalar, é só avançar até concluir.</p>
<p><img data-recalc-dims="1" decoding="async" src="https://i0.wp.com/blogdiegonogare.azurewebsites.net/wp-content/uploads/2017/07/071017_0026_Desenvolven1-2.png?w=640" alt="" /></p>
<p>Seguindo o processo, entendendo que o .Net Framework já está instalado e rodando no seu ambiente, é o momento de instalar o Microsoft R Client. Faça a instalação agora, já tiver o Visual Studio em seu ambiente ou não. Ao iniciar a instalação, uma imagem como a seguir é apresentada, e solicita quais são os elementos que gostaria de instalar no ambiente. Eu desmarquei o Pre-Trained Models, mas se quiser estudar por eles, pode marcar a seguir a instalação.</p>
<p><img data-recalc-dims="1" decoding="async" src="https://i0.wp.com/blogdiegonogare.azurewebsites.net/wp-content/uploads/2017/07/071017_0026_Desenvolven2-1.png?w=640" alt="" /></p>
<p>Ao final da instalação, a tela avisa que finalizou e é só clicar em Finish.</p>
<p><img data-recalc-dims="1" decoding="async" src="https://i0.wp.com/blogdiegonogare.azurewebsites.net/wp-content/uploads/2017/07/071017_0026_Desenvolven3-1.png?w=640" alt="" /></p>
<p>O passo seguinte é iniciar a instalação do Visual Studio.</p>
<p><img data-recalc-dims="1" decoding="async" src="https://i0.wp.com/blogdiegonogare.azurewebsites.net/wp-content/uploads/2017/07/071017_0026_Desenvolven4-1.png?w=640" alt="" /></p>
<p>Ao iniciar o instalador atual do Visual Studio, existem vários <em>presets</em> de ambiente configurado. Cada uma destas pré configurações agiliza o processo de setup do ambiente para aquele Workload que pretende trabalhar.</p>
<p><img data-recalc-dims="1" decoding="async" src="https://i0.wp.com/blogdiegonogare.azurewebsites.net/wp-content/uploads/2017/07/071017_0026_Desenvolven5-1.png?w=640" alt="" /></p>
<p>Assegure-se de marcar a opção &#8220;Data Science and Analytical applications&#8221; e, nas opções da lateral direita, verifique se está marcado o R Language Support e Microsoft R Client dentro das opções de Individual Components. Repare que neste momento o setup faz a instalação do Microsoft R Client, que foi instalado manualmente no passo anterior. A instalação manual é justamente para deixar a ultima versão da publicação no ambiente. Manualmente foi instalado o Microsoft R Client 3.3.3 e a instalação de agora coloca a versão 3.3.2</p>
<p><img data-recalc-dims="1" decoding="async" src="https://i0.wp.com/blogdiegonogare.azurewebsites.net/wp-content/uploads/2017/07/071017_0026_Desenvolven6-1.png?w=640" alt="" /></p>
<p>Ao avançar, a instalação do ambiente começa a trabalhar. No final,</p>
<p><img data-recalc-dims="1" decoding="async" src="https://i0.wp.com/blogdiegonogare.azurewebsites.net/wp-content/uploads/2017/07/071017_0026_Desenvolven7-1.png?w=640" alt="" /></p>
<p>Após alguns instantes, a instalação termina e é possível abrir o Visual Studio. Para abrir, clique em Launch.</p>
<p><img data-recalc-dims="1" decoding="async" src="https://i0.wp.com/blogdiegonogare.azurewebsites.net/wp-content/uploads/2017/07/071017_0026_Desenvolven8-1.png?w=640" alt="" /></p>
<p>Se for a primeira execução do Visual Studio, poderá ser solicitado o seu e-mail de conta Microsoft. É só informar e avançar.</p>
<p>Neste momento, se tudo ocorrer bem, você terá uma versão funcional e totalmente gratuita do Visual Studio 2017 em seu ambiente.</p>
<p>Ao criar um novo projeto (File &gt;&gt; New &gt;&gt; Project)) e informar que será um projeto em R. Você será lançado ao editor do R no Visual Studio.</p>
<p>Escrevi o código abaixo há alguns anos (para outros exemplos). O resultado é criar um gráfico com 10 barras, indo em um dégradé de cores entre vermelho e verde, passando por amarelo.</p>
<p style="background: #bfbfbf;"><em>color &lt;- colorRampPalette(c(&#8220;red&#8221;, &#8220;yellow&#8221;, &#8220;green&#8221;)) </em></p>
<p style="background: #bfbfbf;"><em style="font-size: 1.5rem;">color(10)</em></p>
<p style="background: #bfbfbf;"><em>a &lt;- c(1:10)<br />
</em></p>
<p style="background: #bfbfbf;"><em>barplot(a, col = color(10), main = &#8220;R no Visual Studio 2017 &#8211; Diego Nogare&#8221;)<br />
</em></p>
<p>Ao executar o script, o resultado deverá ser como o da imagem abaixo.</p>
<p><img data-recalc-dims="1" decoding="async" src="https://i0.wp.com/blogdiegonogare.azurewebsites.net/wp-content/uploads/2017/07/071017_0026_Desenvolven9-2.png?w=640" alt="" /></p>
<p>Simples assim você tem um ambiente funcional (e gratuito) para escrever códigos em R no seu Visual Studio.</p>
<p>O post <a href="https://diegonogare.net/2017/07/desenvolvendo-seus-projetos-em-r-no-visual-studio-2017/">Desenvolvendo seus projetos em R no Visual Studio 2017</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">1503</post-id>	</item>
		<item>
		<title>Open Data Science Conference – São Francisco/2015</title>
		<link>https://diegonogare.net/2015/11/open-data-science-conference-sao-francisco2015/</link>
		
		<dc:creator><![CDATA[Diego Nogare]]></dc:creator>
		<pubDate>Mon, 16 Nov 2015 02:43:15 +0000</pubDate>
				<category><![CDATA[Negócios e Tecnologia]]></category>
		<category><![CDATA[Aprendizado de Máquina]]></category>
		<category><![CDATA[big data]]></category>
		<category><![CDATA[cortana analytics]]></category>
		<category><![CDATA[Data Science]]></category>
		<category><![CDATA[linguagem R]]></category>
		<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[Palestra]]></category>
		<category><![CDATA[python]]></category>
		<category><![CDATA[sql server]]></category>
		<guid isPermaLink="false">http://diegonogare.net/?p=1407</guid>

					<description><![CDATA[<p>Fala galera, no fim de semana dos dias 14 e 15/Novembro estive em São Francisco para acompanhar o evento Open Data Science Conference. Este evento já aconteceu em Boston também em 2015 e a agenda pra 2016 é que aconteça em mais alguns lugares aqui dos Estados Unidos e também vá para Inglaterra e Japão....</p>
<p>O post <a href="https://diegonogare.net/2015/11/open-data-science-conference-sao-francisco2015/">Open Data Science Conference – São Francisco/2015</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></description>
										<content:encoded><![CDATA[<p>Fala galera, no fim de semana dos dias 14 e 15/Novembro estive em São Francisco para acompanhar o evento <a href="opendatascicon.com" target="_blank" rel="noopener noreferrer">Open Data Science Conference</a>. Este evento já aconteceu em Boston também em 2015 e a agenda pra 2016 é que aconteça em mais alguns lugares aqui dos Estados Unidos e também vá para Inglaterra e Japão. A localização do evento é ótima, ao lado do aeroporto de São Francisco, isso facilitou demais a logistica pra quem veio de fora.</p>
<p><img data-recalc-dims="1" decoding="async" src="https://i0.wp.com/blogdiegonogare.azurewebsites.net/wp-content/uploads/2015/11/111615_0243_OpenDataSci1-1.png?w=640" alt="" /></p>
<p>O evento foi MUITO superior ao que esperava, a estrutura do evento foi impecável. As salas comportaram todos os participantes, workshops e palestras relevantes, interação com os patrocinadores ocorreu naturalmente por serem patrocinadores com importância pro evento e pra nós, participantes. No fim do primeiro dia tivemos um momento pra fazer network (com cerveja na faixa!) no hotel mesmo, e foi interessante conversar com alguns cientistas de dados aqui dos Estados Unidos.</p>
<p>Fiz algumas anotações das palestras/workshops que achei mais interessantes durante o evento, veja abaixo:</p>
<h2>Dia 1 &#8211; Sábado</h2>
<h4><strong>Keynote<br />
</strong></h4>
<p><strong>Brian Granger</strong> &#8211; Criador do IPython e Project Jupyter</p>
<p>O Jupyter é um compilador/interpretador online para Python (e mais 40 outras linguagens) que permite trabalhar em soluções narrativas com outros profissionais. Parecido com o Knirt (para R), mas ao invés de só renderizar na tela no formato escolhido, ele permite que o script que é escrito seja processador pelo server através do navegador. Jupyter é uma plataforma aberta, desenvolvida pela comunidade e com um time de estrelas por trás, a facilidade do crescimento se dá pelo uso do GitHub como repositório. Empresas como Microsoft, Google, IBM e varias outras estão desenvolvendo soluções para o Jupyter Notebook ou Kernel. JupyterHub permite empresas usar o Jupyter em suas organizações (pelo que entendi, como um repositório privado do github). Num futuro próximo pode ser que mude o nome para Jupyter Workbench, e também estão trabalhando para entregar Real-Time Colaboration, e na tentativa de permitir em uma única janela do navegador ter um console, graficos interativos, e várias outras coisas de UX para os desenvolvedores ficarem só em uma janela e aumentar a produtividade.</p>
<p>O Brian deu um exemplo de dois jornalistas que escrevem sobre ciência no BuzzFeed, que entregam seus experimentos no github e permite que nós possamos reproduzir as pesquisas. Caso queiram ver, este é o link: <a href="https://github.com/BuzzFeedNews/everything" target="_blank" rel="noopener noreferrer">https://github.com/BuzzFeedNews/everything</a></p>
<p>&nbsp;</p>
<h4><strong>Palestras<br />
</strong></h4>
<p><strong>Claudia Perlich</strong> &#8211; Big Data matou o click | heróis de métricas não celebrados</p>
<p>40% dos clicks são acidentais ou fraudes! Fraudes são fáceis de gerar através de robos (bots) em eventos de conversão, principalmente nos retargets para aumentar o CTR e o contratante pagar mais pelo serviço. O comportamento de robos são mais fáceis de prever do que humanos, nosso comportamento é quase impossível de prever. Em uma análise focada, quando se analisa um dataset atrás de padrão de comportamento, deve-se conhecer o que procura para eliminar problemas gerados por randomização. Quando se tem uma precisão/acurácia de aproximadamente 50%, isso significa uma randomização. O objetivo é conseguir um valor de limiar acima de 70 ou 80%. Uma técnica que pode ajudar, é coletar para análise alguns registros randomicamente dos 1 ou 2% mais importantes do universo que tem, e analisar o comportamento desta amostra. A chance desta técnica apresentar um padrão de comportamento diferente do comportamento geral é muito grande, e diversos estudos mostram que este comportamento pode ser mais próximo do real do que se imagina.</p>
<p>&nbsp;</p>
<p><strong>Richard Socher</strong>, PhD &#8211; Metamind.io &#8211; Deep Learning for Enterprise</p>
<p>Esta foi a palestra mais foda e que eu mais me impressionei. Richard apresentou diversos problemas do mundo e as soluções que sua empresa criou utilizando Deep Learning. Esta palestra me fez mudar a agenda e participar de um Workshop de Deep Learning no segundo dia do evento ao invés de assistir às palestras que tinha me planejado. Não sei como descrever as técnicas que ele apresentou, e não teve quase nenhuma teoria, só que o reconhecimento de voz e de imagem são complexos para se executar com algoritmos convencionais de Data Science. O uso de técnicas de Deep Learning ajuda muito nestas tarefas. Processar isso é muito custos e usa-se o CPU pra procesamento de texto e a GPU pra processar imagens.</p>
<p>&nbsp;</p>
<h4><strong>Workshop<br />
</strong></h4>
<p><strong>John Mount / Nina Zumel</strong> &#8211; Preparando dados para análise usando R: Técnicas avançadas através das básicas</p>
<p>Workshop de 2 horas com diversas técnicas para se trabalhar com dados, limpar e processar as análises. Foi disponibilizado um repositório no github pra gente configurar a máquina antes e acompanhar o workshop com tudo o que foi discutido (<em>repo garfado</em>): <a href="https://github.com/diegonogare/PreparingDataWorkshop" target="_blank" rel="noopener noreferrer">https://github.com/diegonogare/PreparingDataWorkshop</a></p>
<p>&nbsp;</p>
<h2>Dia 2 &#8211; Domingo</h2>
<h4><strong>Workshop<br />
</strong></h4>
<p><strong>Markus Beissinger</strong> – Intro to Deep Learning with Theano and OpenDeep</p>
<p>Deep Learning segmenta a análise em hierarquia, encontrando item a item treinado separadamente para encontrar o objeto que quer depois. Por exemplo, imagine o reconhecimento de um rosto: em Deep Learning a tecnica começa com uma camada reconhecimento elementos separados, como nariz, orelha, olho, boca, etc; na sequencia a proxima camada reconhece um pouco mais de coisas, como as posições de olhos próximos ao nariz. Boca próximo ao nariz. Orelhas ao lado dos olhos, e assim por diante. Por fim, neste exemplo, ele consegue reconhecer um rosto completo em uma terceira camada de classificação.</p>
<p>O processo interno usa algebra linear, porque tudo dentro de Deep Learning é calculado com matrizes e vetores. Um dos calculos mais básicos ainda é a Regressão Logistica para analisar as probabilidades.</p>
<p>Mesmo a Regressão Logistica sendo a estrutura mais básica, uma das mais usadas é a Rede Neural, que possibilita executar muitas Regressões Logisticas em paralelo e encontrar uma melhor solução para a análise que está fazendo com Deep Learning. Muitas outras técnicas, como Convolutional Nets, por exemplo, devem combinar com as redes neurais artificiais para conseguir fazer o reconhecimento de imagem.</p>
<p>Códigos usados para os exemplos, estão disponíveis nestes dois repositórios garfados <a href="https://github.com/diegonogare/odsc" target="_blank" rel="noopener noreferrer">https://github.com/diegonogare/odsc</a> e <a href="https://github.com/diegonogare/OpenDeep" target="_blank" rel="noopener noreferrer">https://github.com/diegonogare/OpenDeep</a></p>
<p>&nbsp;</p>
<p><strong>Fidan Boylu / Muxi Li</strong> &#8211; How to build and operationalize data science solutions with Cortana Analytics</p>
<p>Fidan apresentou um overview interessante de AzureML utilizando alguns modelos nativos de algoritmos existentes dentro do AzureML, avançou expandindo as possibilidades utilizando R. Um tour guiado para analisar dados que fizemos upload, com certeza todos conseguiram acompanhar. Na sequência Mixu mostrou integração entre AzureML e scripts em Python, analisando tudo nos Workbooks do Jupyter que possui integração com o AzureML. Esta segunda parte eu não acompanhei, e pelo visto, a galera que estava acompanhando também se perdeu.</p>
<p>PS. Não falaram nada de Cortana Analytics! <img src="https://s.w.org/images/core/emoji/17.0.2/72x72/1f641.png" alt="🙁" class="wp-smiley" style="height: 1em; max-height: 1em;" /></p>
<p>Dá pra acompanhar depois, passo a passo, com os dados que foram disponibilizados neste repositório garfado: <a href="https://github.com/diegonogare/Azure-Machine-Learning-Lab" target="_blank" rel="noopener noreferrer">https://github.com/diegonogare/Azure-Machine-Learning-Lab</a></p>
<p>&nbsp;</p>
<p><strong>Ted Kwartler</strong> &#8211; Introduction to text mining using R</p>
<p>Existem muitos problemas na interpretação de texto: O dado não é estruturado, expressões são individualistas, implicações culturais, e vários outros fatores. É possível trabalhar com Text Mining de duas formas, uma é usando validação sintatica e outra é usando &#8220;bag of words&#8221;. O foco desta sessão é trabalhar com o bag of words. A análise de sentimentos é sempre lembrada quando se fala de mineração de texto, o Ted ainda está estudando esta disciplina e mostrou algumas coisas utilizando técnicas de Score baseada em dicionários. Em resumo, várias técnicas foram apresentadas, e podem ser acompanhadas no repositório do Github que garfei, não do github do Ted, e sim de uma pasta no Amazon Drive dele: <a href="https://github.com/diegonogare/DataScience/tree/master/Text%20Mining" target="_blank" rel="noopener noreferrer">https://github.com/diegonogare/DataScience/tree/master/Text%20Mining</a></p>
<p>O post <a href="https://diegonogare.net/2015/11/open-data-science-conference-sao-francisco2015/">Open Data Science Conference – São Francisco/2015</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">1407</post-id>	</item>
		<item>
		<title>Implementar o algoritmo K-Means com linguagem R</title>
		<link>https://diegonogare.net/2015/08/implementar-o-algoritmo-k-means-com-linguagem-r/</link>
		
		<dc:creator><![CDATA[Diego Nogare]]></dc:creator>
		<pubDate>Mon, 17 Aug 2015 18:30:56 +0000</pubDate>
				<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[Aprendizado de Máquina]]></category>
		<category><![CDATA[Cluster]]></category>
		<category><![CDATA[Data Science]]></category>
		<category><![CDATA[K-Means]]></category>
		<guid isPermaLink="false">http://diegonogare.net/?p=1291</guid>

					<description><![CDATA[<p>Implementando o algoritmo K-Means com linguagem R O conceito do algoritmo K-Means já foi explicado aqui. Nesta publicação vamos implementar o algoritmo K-Means com linguagem R, mas com objetivo de tentar entender um pouco mais esse método de aprendizado de máquinas não supervisionado. Para este experimento vou usar um dataset público existente no diretório da...</p>
<p>O post <a href="https://diegonogare.net/2015/08/implementar-o-algoritmo-k-means-com-linguagem-r/">Implementar o algoritmo K-Means com linguagem R</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></description>
										<content:encoded><![CDATA[<h1>Implementando o algoritmo K-Means</h1>
<h2>com linguagem R</h2>
<p>O conceito do <a href="https://diegonogare.net/2015/08/entendendo-como-funciona-o-algoritmo-de-cluster-k-means/" target="_blank" rel="noopener noreferrer">algoritmo K-Means já foi explicado aqui</a>. Nesta publicação vamos implementar o algoritmo K-Means com linguagem R, mas com objetivo de tentar entender um pouco mais esse método de aprendizado de máquinas não supervisionado.</p>
<p>Para este experimento vou usar um dataset público existente no diretório da UC Irvine. Tive o prazer de conhecer esse repositório quando fiz uma <a href="https://diegonogare.net/2015/02/especializacao-em-ensino-virtual-pela-uci-university-of-california-irvine/">Especialização de Ensino Virtual</a>. Para acessar o repositório e encontrar as dezenas de dataset disponíveis, acesse este link: <a href="http://archive.ics.uci.edu/ml/datasets.html">http://archive.ics.uci.edu/ml/datasets.html</a>. O dataset que vamos usar será <a href="http://archive.ics.uci.edu/ml/datasets/Daily+and+Sports+Activities">Daily and Sports Activities Data Set</a>. Acima de tudo é importante entender que ele apresenta informações de 8 pessoas, entre 20 e 30 anos que realizaram 19 atividades físicas. Sensores de Acelerómetro, Magnetómetro e Giroscópio coletaram dados dos eixos X, Y e Z, ou seja, totalizando 9 registros de dados de cada uma das 5 partes do corpo. Os sensores estavam no Dorso, Braço Direito, Braço Esquerdo, Perna Direita e Perna Esquerda. O arquivo com os dados coletados está no link: <a href="http://archive.ics.uci.edu/ml/machine-learning-databases/00256/">http://archive.ics.uci.edu/ml/machine-learning-databases/00256/</a>. Para exemplificar, vamos analisar somente os dados coletados dos sensores das pernas e de um único exercício, mas fique a vontade para fazer com qualquer sensor ou exercício.</p>
<p>Vou entender que você já tem o RStudio em sua máquina, mas caso não tenha, <a href="https://diegonogare.net/2015/08/instalando-o-r-e-o-rstudio-para-comecar-a-trabalhar-com-data-science/">recomendo fortemente que leia isso</a>.</p>
<h2>Acessando e recebendo os dados externos</h2>
<p>Usando R é possível trabalhar com a leitura e tratamento de dados externos em diversas origens. Pode ser um JSON, um XML, ZIP, e mais uma porção de outros formatos de dados. Neste caso vamos baixar um arquivo Zip e extrair seu conteúdo, em seguida vamos ler os dados e trabalhar com um pouco de descoberta em cima disso com os clusters.</p>
<p>Para baixar o arquivo via código e poder replicar o experimento sempre que precisar, para isso, vamos informar qual será o diretório de trabalho e quais os dados do arquivo que deve ser baixado. Depois de baixar o aquivo de 160MB, é necessário extrair os dados e ver o que aparece.</p>
<p>Em primeiro lugar, veja o código abaixo para saber como fazer isso:</p>
<pre class="EnlighterJSRAW" data-enlighter-language="null">setwd("C:/Temp/KMeans")
url &lt;- "http://archive.ics.uci.edu/ml/machine-learning-databases/00256/data.zip"
destfile &lt;- "data.zip"
download.file(url, destfile, mode="wb")
unzip("data.zip")</pre>
<p>O resultado é um conjunto de pastas com diversos arquivos dentro. Entretanto, se navegar pra dentro das pastas, vai encontrar 60 arquivos txt em cada uma das pastas p* (que é uma pra cada das 8 pessoas) e por sua vez estão dentro das pastas a* (que representam as atividades).</p>
<p><img data-recalc-dims="1" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081715_1801_Implementan1-2.png?resize=567%2C148&#038;ssl=1" alt="arquivos1" width="567" height="148" /></p>
<p><img data-recalc-dims="1" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081715_1801_Implementan2-2.png?resize=567%2C135&#038;ssl=1" alt="arquivos2" width="567" height="135" /></p>
<p>&nbsp;</p>
<p>Se abrir um dos arquivos txt, irá encontrar as 45 colunas com as coletas de cada um dos sensores. Não se assuste com esse monte de números, tudo ficará mais claro no decorrer do texto.</p>
<p><img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081715_1801_Implementan3-1.png?resize=567%2C393&#038;ssl=1" alt="arquivoTexto" width="567" height="393" /></p>
<h2>Transformando os dados do arquivo em um DataFrame do R</h2>
<p>Quando se abre o arquivo txt bruto não é tão simples de identificar o que são esses números. Contudo, lendo a documentação do Dataset fornecido no link lá em cima, entendemos a estrutura de como os dados são armazenados e quais são as colunas. Para este experimento, vamos usar a atividade número 15 – Pedalar na bicicleta ergométrica na horizontal – e analisar somente os sensores de pernas. Veja o código abaixo:</p>
<pre class="EnlighterJSRAW" data-enlighter-language="no-highlight">atividade &lt;- 15

DadosDeOrigem &lt;- gsub(" ","",paste(getwd(), "/data/a", atividade))

setwd(DadosDeOrigem)

Diretorios &lt;- list.files()

TotalPessoas &lt;- length(Diretorios)

DadoBruto &lt;- NULL

i &lt;- 1

while (i &lt;= TotalPessoas) {
  setwd( gsub(" ","",paste(DadosDeOrigem, "/", Diretorios[i])) ) 
  LerArquivos &lt;- list.files()
  j &lt;- 1
  while (j &lt;= length(LerArquivos)) {
    DadoBruto &lt;- rbind(DadoBruto, read.table(LerArquivos[j], sep=","))
    j &lt;- j+1
  }
  i &lt;- i+1
}

#Colocar as colunas que são interessantes analisar
SoPernas &lt;- DadoBruto[,28:45]
colnames(SoPernas) &lt;- c("DAX", "DAY", "DAZ", "DGX", "DGY", "DGZ", "DMX", "DMY", "DMZ", "EAX", "EAY", "EAZ", "EGX", "EGY", "EGZ", "EMX", "EMY", "EMZ")</pre>
<p>Para terminar esta parte de acesso, todos os dados de pernas (coluna 28 até 45) da atividade 15 foram armazenados em um novo Dataframe chamado SoPernas. Foi dado um nome para coluna, seguindo a lógica:</p>
<ul>
<li>D = Direita</li>
<li>E = Esquerda</li>
<li>A = Acelerómetro</li>
<li>G = Giroscópio</li>
<li>M = Magnetómetro</li>
</ul>
<p>A coluna DAX significa D (direita) A (acelerómetro) X (eixo X). A coluna EGZ significa E (esquerda) G (Giroscópio) Z (eixo Z). E assim por diante.</p>
<h2>Implementar o algoritmo K-Means com linguagem R</h2>
<p>Depois dos dados tratados, usar o algoritmo de K-Means é certamente simples. Ele recebe o dataset que deve ser consultado e o conjunto de segmentos que deve criar. Como já sabemos que são 8 pessoas que fazem parte da amostragem, não precisamos rodar aquele algoritmo de <em>Elbow Method</em> para descobrir quando grupos é possível criar. Veja, por exemplo, o código simples abaixo que recebe o processamento do K-Means e depois mostra a quantidade de elementos do dataframe que foi classificado em cada um dos clusters.</p>
<pre class="EnlighterJSRAW" data-enlighter-language="no-highlight">Resultado &lt;- kmeans(SoPernas[1:2], 8)
Resultado$size</pre>
<p>Após a execução do K-Means, por exemplo, pode-se plotar os dados em um gráfico e ver como o algoritmo separou os dados nos 8 grupos que foram solicitados. Para facilitar o entendimento, vou plotar somente os dados de DAX e DAY, para um gráfico simples de duas dimensões, usando o recurso de poder plotar cada grupo em uma cor diferente para facilitar a análise de quem está observando.</p>
<pre class="EnlighterJSRAW" data-enlighter-language="no-highlight">plot(SoPernas[1:2], col = Resultado$cluster, pch= 19)</pre>
<p>Se quiser colocar cada ponto central de um centroide, pode usar este exemplo de código abaixo na sequência da plotagem do gráfico:</p>
<pre class="EnlighterJSRAW" data-enlighter-language="no-highlight">points(Resultado$centers[,1:2], col="orange", pch=8, cex=2)</pre>
<p>Após plotar o gráfico com os 8 segmentos, é possível identificar facilmente os grupos que o K-Means separou.</p>
<p><img data-recalc-dims="1" decoding="async" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081715_1801_Implementan4-1.png?w=640&#038;ssl=1" alt="" /></p>
<p>Quando um novo item for inserido no dataset, ele ficará associado a algum dos clusters. Por exemplo, você não precisa necessariamente saber se o dado é de uma mulher de 20 anos ou de um homem de 30, simplesmente ao analisar o dado novo contra os dados já processados, o computador vai entender onde estes dados se enquadram e vai te retornar qual é o gênero e a idade que ele estima que seja. Simples, não?!</p>
<p>O post <a href="https://diegonogare.net/2015/08/implementar-o-algoritmo-k-means-com-linguagem-r/">Implementar o algoritmo K-Means com linguagem R</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">1291</post-id>	</item>
		<item>
		<title>Entenda o algoritmo de agrupamento K-Means</title>
		<link>https://diegonogare.net/2015/08/entendendo-como-funciona-o-algoritmo-de-cluster-k-means/</link>
		
		<dc:creator><![CDATA[Diego Nogare]]></dc:creator>
		<pubDate>Wed, 12 Aug 2015 20:24:53 +0000</pubDate>
				<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[Aprendizado de Máquina]]></category>
		<category><![CDATA[Cluster]]></category>
		<category><![CDATA[Data Science]]></category>
		<category><![CDATA[K-Means]]></category>
		<guid isPermaLink="false">http://diegonogare.net/?p=1246</guid>

					<description><![CDATA[<p>Entenda como funciona o algoritmo de Cluster K-Means Em uma forma lúdica para explicar o conceito Fala galera, entenda o funcionamento do algoritmo de agrupamento K-Means, que é uma das formas que existe para se trabalhar com aprendizagem de máquinas (machine learning) no paradigma de aprendizado não supervisionado. Isso é diferente do aprendizado supervisionado, onde...</p>
<p>O post <a href="https://diegonogare.net/2015/08/entendendo-como-funciona-o-algoritmo-de-cluster-k-means/">Entenda o algoritmo de agrupamento K-Means</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></description>
										<content:encoded><![CDATA[<h1>Entenda como funciona o algoritmo de Cluster K-Means</h1>
<h2>Em uma forma lúdica para explicar o conceito</h2>
<p>Fala galera, entenda o funcionamento do algoritmo de agrupamento K-Means, que é uma das formas que existe para se trabalhar com aprendizagem de máquinas (<em>machine learning</em>) no paradigma de aprendizado não supervisionado. Isso é diferente do aprendizado supervisionado, onde você informa ao computador o que ele deve procurar e aprender, com exemplos contendo os rótulos previamente. No aprendizado não supervisionado a gente não sabe exatamente o que estamos tentando ensinar ao computador. Por causa disso precisamos recorrer à agrupadores lógicos de segmentação, com foco em encontrar similaridade entre os dados da amostra.</p>
<p>O resultado esperado é que seja encontrado um padrão e assumir que este padrão é o que estamos tentando ensinar ao computador, que por sua vez, vai reproduzir e encontrar esse padrão sempre quando for solicitado. Depois de descoberto o padrão, qualquer item novo que tenha uma similaridade com aquele segmento (agrupamento [<em>cluster</em>, em inglês]) pode ser inferido como &#8220;fazendo parte daquilo&#8221;.</p>
<p>A proposta deste post é mostrar, com um certo nível de detalhes, como segmentar a amostragem em grupos e descobrir padrões nos dados. No final do texto você conseguirá ver uma referência para a implementação em Linguagem R, mas nesta publicação teremos o foco no entendendo o algoritmo.</p>
<h2>Agrupando os dados</h2>
<p>Para exemplificar, pense em um <em>dataset</em> com algumas amostras dispostas nos eixo X e Y, como o gráfico abaixo. Seu objetivo é agrupar estes dados baseado em sua similaridades (ou aproximação). Consegue fazer isso?</p>
<p><img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081215_2050_UsandoKMean1-1.png?resize=369%2C200&#038;ssl=1" alt="conjunto de dados" width="369" height="200" /></p>
<p>É possível bater o olho neste gráfico e ver a separação em alguns grupos. Mas cada um de nós que olhar o gráfico pode tentar criar um número diferente de grupos (<em>clusters</em>). Até mesmo quando a quantidade de <em>cluster</em> que pensarmos for igual, pode-se pensar em agrupamentos de formas diferentes. Por exemplo, alguns de nós podem ver a separação com apenas 2 <em>clusters</em>, e o gráfico poderia ser assim:</p>
<p><img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081215_2050_UsandoKMean2-1.png?resize=374%2C202&#038;ssl=1" alt="conjunto de dados com 2 grupos" width="374" height="202" /></p>
<p>Ou assim&#8230;<br />
<img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081215_2050_UsandoKMean3-1.png?resize=371%2C204&#038;ssl=1" alt="conjunto de dados com 2 grupos" width="371" height="204" /></p>
<p>Alguém também poderia pensar em separar os dados assim&#8230;<br />
<img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081215_2050_UsandoKMean4-1.png?resize=367%2C199&#038;ssl=1" alt="conjunto de dados com 2 grupos" width="367" height="199" /></p>
<p>Qual é o certo? Todos estão certos! Isso pode acontecer de acordo com a interpretação de cada um dos observadores que encontraram apenas 2 grupos nestes dados.</p>
<p>&nbsp;</p>
<p>Outras pessoas podem encontrar 3 grupos, e não apenas dois, podendo chegar a definições como esta:</p>
<p><img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081215_2050_UsandoKMean5-1.png?resize=368%2C202&#038;ssl=1" alt="conjunto de dados com 3 grupos" width="368" height="202" /></p>
<p>Ou esta<br />
<img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081215_2050_UsandoKMean6-1.png?resize=372%2C202&#038;ssl=1" alt="conjunto de dados com 3 grupos" width="372" height="202" /></p>
<p>Ou então essa<br />
<img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081215_2050_UsandoKMean7-1.png?resize=371%2C199&#038;ssl=1" alt="conjunto de dados com 3 grupos" width="371" height="199" /></p>
<p>E aqui, qual dos gráficos é o certo? O certo é com 2 grupos ou com 3 grupos? Mais uma vez isso é difícil de responder, todos os 6 gráficos estão corretos de acordo com a visão de cada observador.</p>
<h2>Entendendo como funciona o algoritmo de agrupamento K-Means</h2>
<p>Para entender o funcionamento vamos separar os dados em 2 <em>clusters</em> e entender os passos que o algoritmo de agrupamento K-Means faz para convergir em um resultado. Neste caso o K será igual a 2, criando os 2 <em>clusters</em> que estamos buscando. O K, de K-Means, é a quantidade de centroides (pontos centrais dos grupos) que serão criados e ajudará a encontrará a similaridade dos dados.</p>
<p>Uma das formas de iniciar o processo é o algoritmo inserir o K pontos (centroides) aleatórios iniciais. Pode ser qualquer lugar do plano, para em seguida começar as iterações e encontrar os resultados.</p>
<p>Veja dois pontos aleatórios criados no gráfico, e uma linha tracejada que é calculada aproximadamente na metade da distância dos pontos Vermelho e Azul. Com este segmento, os itens que estão plotados acima da linha tracejada fazem parte do grupo vermelho e os de baixo da linha fazem parte do grupo azul.</p>
<p><img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081215_2050_UsandoKMean8-2.png?resize=367%2C198&#038;ssl=1" alt="conjunto de dados com 2 centroides" width="367" height="198" /></p>
<p>A primeira iteração do algoritmo é medir a distância de todos os pontos que estão atrelados ao centroide e então calcular sua média. O resultado gera uma nova coordenada de X e Y, e vai mudar a posição do centroide para o novo ponto que foi calculado, que é a distância média de todos os pontos que se ligaram à aquele centroide. Essa mudança de posição do centroide pode alterar os itens que fazem parte daquele grupo. Veja isso nas imagens abaixo:</p>
<p>&nbsp;</p>
<p>O ponto vermelho e azul se moveram baseados na distância média dos elementos que estavam atrelados à aqueles centroides.</p>
<p><img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081215_2050_UsandoKMean9-2.png?resize=369%2C197&#038;ssl=1" alt="conjunto de dados com 2 centroides" width="369" height="197" /></p>
<p>Após essa movimentação, a linha tracejada muda sua posição e inclinação.<br />
<img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081215_2050_UsandoKMean10-1.png?resize=372%2C201&#038;ssl=1" alt="conjunto de dados com 2 centroides" width="372" height="201" /></p>
<p>Reparem que alguns pontos pretos que faziam parte de um grupo na iteração anterior, como resultado, mudaram-se para o outro grupo.<br />
<img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081215_2050_UsandoKMean11-1.png?resize=367%2C207&#038;ssl=1" alt="conjunto de dados com 2 centroides" width="367" height="207" /></p>
<h2>E quando ele vai convergir?</h2>
<p>Com essa mudança de grupos, os pontos que estão marcados em verde passaram do centroide azul para o vermelho, e o que está marcado em azul passou do centroide vermelho para o azul. É possível reparar que a iteração de cálculo da média da distância dos pontos até o centroide ocorre em <em>loop,</em> até que nenhum ponto mude mais de centroide. Em outras palavras, isso acontece quando os centroides param de atualizar suas posições, porque já estão na posição central da distância entre os pontos. Chamamos isso de convergir!</p>
<p>Repare mais algumas possíveis iterações dos centroides e sua linha tracejada imaginária.</p>
<p><img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081215_2050_UsandoKMean12-1.png?resize=365%2C202&#038;ssl=1" alt="conjunto de dados com 2 centroides" width="365" height="202" /><br />
<img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081215_2050_UsandoKMean13-1.png?resize=368%2C197&#038;ssl=1" alt="conjunto de dados com 2 centroides" width="368" height="197" /><br />
<img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081215_2050_UsandoKMean14-1.png?resize=369%2C198&#038;ssl=1" alt="conjunto de dados com 2 centroides" width="369" height="198" /></p>
<p>Veja que entre a penúltima iteração e esta não ouve mais mudança de pontos entre o gráfico e o centroide, portanto o algoritmo de agrupamento K-Means encerra sua execução chegando ao resultado esperado e criando dois grupos. Por exemplo, quando um novo item for incluído no gráfico, ele já terá um grupo que atende aquela região e o computador já saberá do que se trata o dado novo.</p>
<h2>Escolhendo a quantidade de K (<em>clusters</em>) no algoritmo de agrupamento K-Means</h2>
<p>O <em>Elbow Method</em> é uma das formas usadas para descobrir a quantidade ideal de <em>clusters</em> naquele conjunto de dados. Ele tem esse nome por se parecer com o formato de um &#8220;braço&#8221; e nós sempre procurarmos o &#8220;cotovelo&#8221; pra definir que este é o número aceitável de K (grupos) a serem criados com base nos dados da amostra. Este método vai aumentando a quantidade de <em>clusters</em> a partir de 1 e analisando o resultado melhorado a cada incremento. Quando o benefício parar de ser relevante (um salto entre uma quantidade de <em>cluster</em> e a próxima quantidade) ele entra em um modelo platô, no qual a diferença da distância é quase insignificante. Ou seja, é neste momento que entende-se que o algoritmo é relevante com aquela quantidade de K e então ele deve ser usado pra segmentar os dados do gráfico.</p>
<p>Depois de executar o código do algoritmo do <em>Elbow Method</em> e olhando para os dados que estamos apresentando como exemplo, um bom número de K para ele é o número 4.</p>
<p><img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081215_2050_UsandoKMean15-1.png?resize=359%2C209&#038;ssl=1" alt="escolha do numero de centroides" width="359" height="209" /></p>
<p>Rodando o algoritmo com 4 centroides, foi possível ver a transformação acontecendo e gerando esta segmentação:</p>
<p>Conjunto inicial de dados</p>
<p><img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081215_2050_UsandoKMean16-1.png?resize=363%2C196&#038;ssl=1" alt="conjunto de dados" width="363" height="196" /></p>
<p>Após a execução do algoritmo e cada grupo representando uma cor<br />
<img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081215_2050_UsandoKMean17-2.png?resize=370%2C197&#038;ssl=1" alt="conjunto de dados com 4 grupos" width="370" height="197" /></p>
<p>A posição dos centroides finais, para cada grupo<br />
<img data-recalc-dims="1" loading="lazy" decoding="async" class="alignnone" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2015/08/081215_2050_UsandoKMean18-2.png?resize=372%2C196&#038;ssl=1" alt="conjunto de dados com 4 grupos" width="372" height="196" /></p>
<p>&nbsp;</p>
<h2>Para continuar os estudos&#8230;</h2>
<p>A proposta desta publicação foi explicar de forma lúdica como o algoritmo de agrupamento <em>K-Means</em> funciona, mas você pode acompanhar uma <a href="https://diegonogare.net/2015/08/implementando-o-algoritmo-k-means-com-linguagem-r/" target="_blank" rel="noopener noreferrer">implementação em R</a> e depois ler sobre as possibilidades de implementar também com <a href="https://diegonogare.net/2014/11/azure-machine-learning-introducao-parte-2/" target="_blank" rel="noopener noreferrer">Azure Machine Learning</a>.</p>
<p>Para ajudar a responder a questão de quantos grupos devem existir neste conjunto de dados, alguns métodos são bem aceitos no meio científico, leia mais sobre eles aqui: <a href="https://en.wikipedia.org/wiki/Determining_the_number_of_clusters_in_a_data_set">https://en.wikipedia.org/wiki/Determining_the_number_of_clusters_in_a_data_set</a>.</p>
<p>O post <a href="https://diegonogare.net/2015/08/entendendo-como-funciona-o-algoritmo-de-cluster-k-means/">Entenda o algoritmo de agrupamento K-Means</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">1246</post-id>	</item>
		<item>
		<title>Aprendizado de Máquinas com Azure Machine Learning e R</title>
		<link>https://diegonogare.net/2015/07/aprendizado-de-maquinas-com-azure-machine-learning-e-r/</link>
		
		<dc:creator><![CDATA[Diego Nogare]]></dc:creator>
		<pubDate>Mon, 06 Jul 2015 18:21:15 +0000</pubDate>
				<category><![CDATA[Negócios e Tecnologia]]></category>
		<category><![CDATA[Aprendizado de Máquina]]></category>
		<category><![CDATA[azure]]></category>
		<category><![CDATA[AzureML]]></category>
		<category><![CDATA[Classificação Binária]]></category>
		<category><![CDATA[Cluster]]></category>
		<category><![CDATA[inteligencia artificial]]></category>
		<category><![CDATA[linguagem R]]></category>
		<guid isPermaLink="false">http://diegonogare.net/?p=1176</guid>

					<description><![CDATA[<p>Fala galera, na última sexta-feira (03/07) fiz uma apresentação de mais de 1h30 sobre Aprendizado de Máquinas com Azure Machine Learning e R. Nesta apresentação explico sobre o conceito de aprendizado supervisionado e não supervisionado, e também falo um pouco sobre a importancia de entender a matriz de confusão e seus elementos. Acompanhe abaixo o...</p>
<p>O post <a href="https://diegonogare.net/2015/07/aprendizado-de-maquinas-com-azure-machine-learning-e-r/">Aprendizado de Máquinas com Azure Machine Learning e R</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></description>
										<content:encoded><![CDATA[<p>Fala galera, na última sexta-feira (03/07) fiz uma apresentação de mais de 1h30 sobre Aprendizado de Máquinas com Azure Machine Learning e R. Nesta apresentação explico sobre o conceito de aprendizado supervisionado e não supervisionado, e também falo um pouco sobre a importancia de entender a matriz de confusão e seus elementos. Acompanhe abaixo o vídeo e os slides da apresentação.</p>
<p>Vídeo:</p>
<p><a href="https://www.youtube.com/watch?v=AHlrSwiCzUg"><img data-recalc-dims="1" decoding="async" src="https://i0.wp.com/blogdiegonogare.azurewebsites.net/wp-content/uploads/2015/07/070615_1818_Aprendizado1-1.jpg?w=640" alt="" border="0" /></a></p>
<p>Slides:</p>
<p><iframe loading="lazy" style="border: 1px solid #CCC; border-width: 1px; margin-bottom: 5px; max-width: 100%;" src="//pt.slideshare.net/slideshow/embed_code/key/3JFEeKPG4ZoE8B" width="525" height="435" frameborder="0" marginwidth="0" marginheight="0" scrolling="no"></iframe></p>
<p>Espero que esta pequena introdução ao Machine Learning abra a mente de todos para os benefícios do uso de inteligência artificial no desenvolvimento de software&#8230;</p>
<p>O post <a href="https://diegonogare.net/2015/07/aprendizado-de-maquinas-com-azure-machine-learning-e-r/">Aprendizado de Máquinas com Azure Machine Learning e R</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">1176</post-id>	</item>
		<item>
		<title>Aprendizado de Máquina &#8211; Azure Machine Learning</title>
		<link>https://diegonogare.net/2014/06/aprendizado-de-mquina-azure-machine-learning/</link>
		
		<dc:creator><![CDATA[Diego Nogare]]></dc:creator>
		<pubDate>Mon, 16 Jun 2014 20:03:32 +0000</pubDate>
				<category><![CDATA[Artigo]]></category>
		<category><![CDATA[Business Intelligence]]></category>
		<category><![CDATA[Cloud Computing]]></category>
		<category><![CDATA[MVTech]]></category>
		<category><![CDATA[SQL Server]]></category>
		<category><![CDATA[Virtual PASS BR]]></category>
		<category><![CDATA[Aprendizado de Máquina]]></category>
		<category><![CDATA[azure]]></category>
		<category><![CDATA[cloud computing]]></category>
		<category><![CDATA[data mining]]></category>
		<category><![CDATA[Machine Learning]]></category>
		<guid isPermaLink="false">http://diegonogare.net/?p=897</guid>

					<description><![CDATA[<p>Fala galera, hoje (16/Junho) a Microsoft anunciou o Azure Machine Learning, a oferta para trabalhar com Aprendizado de Máquinas diretamente dentro do Azure. Mesmo com o anuncio de hoje, a ferramenta só estará disponível para teste a partir de 14/Julho. Como o foco da Microsoft é estar cada vez mais estar presente em soluções de...</p>
<p>O post <a href="https://diegonogare.net/2014/06/aprendizado-de-mquina-azure-machine-learning/">Aprendizado de Máquina &#8211; Azure Machine Learning</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></description>
										<content:encoded><![CDATA[<p>Fala galera, hoje (16/Junho) a Microsoft anunciou o Azure Machine Learning, a oferta para trabalhar com Aprendizado de Máquinas diretamente dentro do Azure. Mesmo com o anuncio de hoje, a ferramenta só estará disponível para teste a partir de 14/Julho.</p>
<p>Como o foco da Microsoft é estar cada vez mais estar presente em soluções de nuvem, esta nova feature do Azure é altamente importante. Também faz todo sentido para os negócios que se baseiam em Big Data, visto que algoritmos de Machine Learning precisam de dados para realizar suas análises preditivas. Quem encabeçou este projeto na Microsoft é Joseph Sirosh, que estava a 8 anos na Amazon e veio pra Microsoft à pedido do novo CEO, Satya Nadella, em Outubro/2013.</p>
<p>Veja o que dá pra fazer, já legendado em ptBR.</p>
<div id="scid:5737277B-5D6D-4f48-ABFC-DD9C333F4C5D:17d8c5b3-168b-438a-ba07-d2fe7757f422" class="wlWriterEditableSmartContent" style="float: none; padding-bottom: 0px; padding-top: 0px; padding-left: 0px; margin: 0px; display: inline; padding-right: 0px">
<div><object width="448" height="252"><param name="movie" value="http://www.youtube.com/v/w3nD97GsfFA?hl=en&amp;hd=1"></param></object></div>
<div style="width:448px;clear:both;font-size:.8em">Microsoft Azure Machine Learning</div>
</div>
<p>&nbsp;</p>
<p>Ainda não tenho detalhes de quais algoritmos de aprendizado de máquina está por trás do Microsoft Azure Machine Learning, nem qual é o tipo de aprendizado que está sendo suportado. Mas não vejo a hora de chegar logo 14/Julho para poder brincar com alguns dados e ver o resultado.</p>
<p>O post <a href="https://diegonogare.net/2014/06/aprendizado-de-mquina-azure-machine-learning/">Aprendizado de Máquina &#8211; Azure Machine Learning</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">2170</post-id>	</item>
	</channel>
</rss>
