<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Arquivos Análise de Dados - Diego Nogare</title>
	<atom:link href="https://diegonogare.net/tags/analise-de-dados/feed/" rel="self" type="application/rss+xml" />
	<link>https://diegonogare.net/tags/analise-de-dados/</link>
	<description>Consultor Executivo de IA &#38; ML</description>
	<lastBuildDate>Tue, 15 Apr 2025 12:54:58 +0000</lastBuildDate>
	<language>pt-BR</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://i0.wp.com/diegonogare.net/wp-content/uploads/2025/06/cropped-cropped-DN-Black-300x300-1.png?fit=32%2C32&#038;ssl=1</url>
	<title>Arquivos Análise de Dados - Diego Nogare</title>
	<link>https://diegonogare.net/tags/analise-de-dados/</link>
	<width>32</width>
	<height>32</height>
</image> 
<site xmlns="com-wordpress:feed-additions:1">247556142</site>	<item>
		<title>Review do livro &#8220;Extending Power BI with Python and R &#8211; Second Edition&#8221;</title>
		<link>https://diegonogare.net/2024/06/review-do-livro-extending-power-bi-with-python-and-r-second-edition/</link>
		
		<dc:creator><![CDATA[Diego Nogare]]></dc:creator>
		<pubDate>Mon, 03 Jun 2024 23:18:38 +0000</pubDate>
				<category><![CDATA[Review de Livro]]></category>
		<category><![CDATA[Análise de Dados]]></category>
		<category><![CDATA[business intelligence]]></category>
		<category><![CDATA[Power BI]]></category>
		<category><![CDATA[python]]></category>
		<category><![CDATA[R]]></category>
		<category><![CDATA[sql server]]></category>
		<guid isPermaLink="false">https://diegonogare.net/?p=3920</guid>

					<description><![CDATA[<p>Fala galera! Fiz mais um review de livro, mas desta vez foi o &#8220;Extending Power BI with Python and R &#8211; Second Edition&#8221;, do meu amigo Luca Zavarella, que publicou pela Packt Pub. Me senti muito feliz com o convite dele para fazer esse review e compartilhar no blog, afinal, espero que você também estenda...</p>
<p>O post <a href="https://diegonogare.net/2024/06/review-do-livro-extending-power-bi-with-python-and-r-second-edition/">Review do livro &#8220;Extending Power BI with Python and R &#8211; Second Edition&#8221;</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></description>
										<content:encoded><![CDATA[<div class="content user-select-text" tabindex="0" role="heading" aria-level="6" aria-description="" aria-label="Enviado por Copilot: **Introdução ao Power BI: Desvendando Recursos e Funcionalidades** O Power BI é uma ferramenta poderosa para visualização de dados, mas vai muito além disso. Nos 18 capítulos deste livro, exploraremos desde a integração de scripts R e Python até técnicas avançadas de análise e otimização. Aprenda a configurar R e Python, lidar com grandes conjuntos de dados, detectar outliers, usar expressões regulares e até incorporar machine learning. Seja você um iniciante ou um usuário experiente, este guia abrangente irá aprimorar suas habilidades no Power BI e ampliar suas possibilidades de análise de dados. Vamos mergulhar nessa jornada! &#x1f680;">
<div class="ac-container ac-adaptiveCard">
<div class="ac-textBlock">
<p>Fala galera! Fiz mais um review de livro, mas desta vez foi o &#8220;Extending Power BI with Python and R &#8211; Second Edition&#8221;, do meu amigo <a href="https://www.linkedin.com/in/lucazavarella/" target="_blank" rel="noopener">Luca Zavarella</a>, que publicou pela Packt Pub. Me senti muito feliz com o convite dele para fazer esse review e compartilhar no blog, afinal, espero que você também estenda o Power BI com Python e R após ler este livro.</p>
<p>Bom, o Power BI é uma ferramenta da Microsoft poderosa para visualização de dados, mas vai muito além disso. Dessa forma, vasculhando alguns posts antigos, achei esse de 2013, <a href="https://diegonogare.net/2013/07/o-que-esperar-para-bi-no-sql-server-2014/" target="_blank" rel="noopener">falando sobre as novidades de BI no SQL Server 2014</a> e ainda nem tinha o Power BI.</p>
<p>Primeiramente, nos 22 capítulos deste livro, é possível explorar desde a integração de scripts R e Python até técnicas avançadas de análise e otimização. Em segundo lugar você irá aprender a configurar o R e o Python, a trabalhar com grandes conjuntos de dados, a detectar outliers e valores ausentes, a usar expressões regulares (o que é bem trabalhoso, vamos combinar!) e até incorporar Machine Learning em seus projetos. Aliás, independente de você ser um iniciante ou um usuário experiente, este livro completo com praticamente 800 paginas irá aprimorar suas habilidades no Power BI e ampliar suas possibilidades de análise de dados. Contudo, vou compartilhar contigo minhas impressões, para que você estenda o poder do Power BI com Python e R.</p>
</div>
</div>
</div>
<div class="ad-container">
<div class="content user-select-text" tabindex="0" role="heading" aria-level="6" aria-description="" aria-label="Enviado por Copilot: **Resumo dos Capítulos do Livro sobre Power BI** 1. **Integração de R e Python com o Power BI**: Este capítulo abrange a integração de scripts R e Python com o Power BI, destacando sua utilidade além da simples visualização de dados. Explora como injetar scripts R ou Python no Power BI, as ferramentas específicas para essa integração e as limitações desses scripts em diferentes produtos do Power BI. 2. **Configuração do R no Power BI**: Foca na configuração do R com o Power BI, incluindo instalação, configuração de motores R e ambientes de desenvolvimento. 3. **Configuração do Python no Power BI**: Explora a integração do Python com o Power BI, abordando instalação, configuração de motores Python e uso de ambientes virtuais. 4. **Solução de Problemas Comuns com Python e R no Power BI**: Oferece soluções para problemas frequentes ao usar Python e R no Power BI. 5. **Importação de Objetos de Dados Não Tratados**: Aborda a importação de arquivos RDS e PKL no Power BI, útil para dados processados externamente. 6. **Uso de Expressões Regulares no Power BI**: Explora o uso de regex para busca e substituição em strings no Power BI, melhorando a limpeza de dados. 7. **Anonimização e Pseudonimização de Dados no Power BI**: Técnicas para proteger a privacidade dos dados usando scripts Python e R. 8. **Registro de Dados do Power BI em Fontes Externas**: Como extrair e registrar dados do Power BI em arquivos externos ou sistemas. 9. **Carregamento de Grandes Conjuntos de Dados no Power BI**: Técnicas para trabalhar com arquivos grandes usando Python e R. 10. **Aceleração do Carregamento de Dados com o Formato Parquet**: Conversão de dados do formato CSV para Parquet para otimizar o desempenho. 11. **Chamando APIs Externas para Enriquecer seus Dados**: Extensão de dados usando APIs externas. 12. **Cálculo de Colunas com Algoritmos Complexos: Distâncias**: Uso de algoritmos para cálculos de distâncias. 13. **Cálculo de Colunas com Algoritmos Complexos: Correspondência Fuzzy**: Técnicas avançadas de correspondência fuzzy. 14. **Cálculo de Colunas com Algoritmos Complexos: Problemas de Otimização**: Abordagem de problemas de otimização usando Python e R. 15. **Inclusão de Insights Estatísticos: Associações**: Exploração de associações entre variáveis usando estatísticas. 16. **Inclusão de Insights Estatísticos: Outliers e Valores Ausentes**: Detecção de outliers e imputação de valores ausentes. 17. **Uso de Aprendizado de Máquina sem Capacidade Premium ou Incorporada**: Integração de ML no Power BI. 18. **Uso de Linguagens Externas do SQL Server para Análise Avançada e Integração de ML no Power BI**: Uso de motores analíticos Python e R no SQL Server e Azure SQL Managed Instance para o Power BI .">
<div class="ac-container ac-adaptiveCard">
<div class="ac-textBlock">
<h2><strong>Vamos aos capítulos</strong></h2>
<p><strong>1 &#8211; Integração de R e Python com o Power BI</strong>: Este capítulo abrange a integração de scripts R e Python com o Power BI, destacando sua utilidade além da simples visualização de dados. Explora como adicionar scripts R ou Python no Power BI, as ferramentas específicas para essa integração e as limitações desses scripts em diferentes produtos do Power BI.</p>
<p><strong>2 &#8211; Configuração do R no Power BI</strong>: Foca na configuração do R com o Power BI, incluindo instalação, configuração de kernel R e ambientes de desenvolvimento.</p>
<p><strong>3 &#8211; Configuração do Python no Power BI</strong>: Explora a integração do Python com o Power BI, abordando instalação, configuração de kernel Python e uso de ambientes virtuais.</p>
<p><strong>4 &#8211; Solução de problemas comuns com Python e R no Power BI</strong>: Oferece soluções para problemas frequentes ao usar Python e R no Power BI.</p>
<p><strong>5 &#8211; Importação de objetos de dados não tratados</strong>: Aborda a importação de arquivos RDS e PKL no Power BI, útil para dados processados externamente.</p>
<p><strong>6 &#8211; Uso de expressões regulares no Power BI</strong>: Explora o uso de regex para busca e substituição em strings no Power BI, melhorando a limpeza de dados.</p>
<p><strong>7 &#8211; Anonimização e pseudo-anonimização de dados no Power BI</strong>: Técnicas para proteger a privacidade dos dados usando scripts Python e R.</p>
<p><strong>8 &#8211; Registro de dados do Power BI em fontes externas</strong>: Como extrair e registrar dados do Power BI em arquivos externos ou sistemas.</p>
<p><strong>9 &#8211; Carregamento de grandes conjuntos de dados no Power BI</strong>: Técnicas para trabalhar com arquivos grandes usando Python e R.</p>
<p><strong>10 &#8211; Aceleração do carregamento de dados com formato Parquet</strong>: Conversão de dados do formato CSV para Parquet para otimizar o desempenho.</p>
<p><strong>11 &#8211; Chamando APIs externas para enriquecer seus dados</strong>: Extensão de dados usando APIs externas.</p>
<p><strong>12 &#8211; Cálculo de colunas com algoritmos complexos: Distâncias</strong>: Uso de algoritmos para cálculos de distâncias.</p>
<p><strong>13 &#8211; Cálculo de colunas com algoritmos complexos: Fuzzy Match</strong>: Técnicas avançadas de fuzzy match.</p>
<p><strong>14 &#8211; Cálculo de colunas com algoritmos complexos: Problemas de otimização</strong>: Abordagem de problemas de otimização usando Python e R.</p>
<p><strong>15 &#8211; Inclusão de insights estatísticos: Associações</strong>: Exploração de associações entre variáveis usando estatísticas.</p>
<p><strong>16 &#8211; Inclusão de insights estatísticos: Outliers e valores ausentes</strong>: Detecção de outliers e imputação de valores ausentes.</p>
<p><strong>17 &#8211; Uso de aprendizado de máquina sem licença premium ou incorporada</strong>: Integração de ML no Power BI.</p>
<p><strong>18 &#8211; Uso de linguagens externas do SQL Server para análise avançada e integração de ML no Power BI</strong>: Uso de motores analíticos do Python e R no SQL Server e Azure SQL Managed Instance para o Power BI.</p>
<p><strong>19 &#8211; Análise Exploratória de Dados (EDA)</strong>: Foca na importância de compreender profundamente as características inerentes dos dados antes de aplicar modelos de ML. Introduz técnicas de EDA que ajudam na seleção de modelos adequados e na engenharia de features. Aborda limpeza de dados, relacionamentos entre variáveis e insights significativos para construir modelos precisos.</p>
<p><strong>20 &#8211; Uso da gramática de gráficos em Python com plotnine (não achei uma tradução melhor, então fiz quase que literal)</strong>: Guia abrangente sobre o pacote plotnine em Python, com paralelos ao popular ggplot2 em R. Explora a análise do conjunto de dados Titanic usando técnicas do plotnine, como criação de gráficos de barras e histogramas. Também aborda a integração do plotnine com o Power BI, incluindo instruções detalhadas para uso dessas visualizações no ambiente do Power BI.</p>
<p><strong>21 &#8211; Visualizações avançadas</strong>: Criação de gráficos personalizados avançados, com foco em gráficos de barras circulares. Esses gráficos são úteis para exibir dados periódicos ou cíclicos de forma clara e eficiente. O capítulo aborda seleção e implementação de gráficos de pizza no R e no Power BI, além da integração de scripts R para renderizar gráficos complexos do ggplot2.</p>
<blockquote><p>Só lembrando que não se deve usar gráficos com nome de comida, sejam eles pizza ou rosca. rss</p></blockquote>
<p><strong>22 &#8211; Visualizações interativas e personalizadas em R</strong>: Aprimoramento das visualizações de dados com interatividade, explorando a transição de gráficos estáticos para melhor interpretabilidade.</p>
</div>
</div>
<h2> Minha opinião</h2>
<p>Pessoalmente eu considero o Power BI uma ótima ferramenta. Afinal, o capítulo 17 e 18 trazem mais proximidade ao que tenho trabalhado nos últimos anos, e gostei realmente do que li. Na minha opinião é um material sólido para quem pretende aplicar as possibilidades que o R e o Python oferecem para seus projetos de DataViz. Embora o livro ofereca uma visão ampla, prática e aplicada, de como você poderá construir e utilizar estas técnicas. Nesse sentido, as referências e leituras adicionais te ajudarão aprofundar no contexto explicado no cap´tulo. Com o propósito de ajudar a validar o que você aprendeu, todo final de capítulo tem algumas perguntinhas que ajudam a fixar o conteúdo.</p>
<p>Em linhas gerais recomendo sim a leitura, principalmente para quem se interessa pelo assunto de DataViz. Enquanto escrevo esse texto, <a href="https://amzn.to/3RbIOIu" target="_blank" rel="noopener">a versão digital está a venda na Amazon por um pouco mais de 250 reais</a>.</p>
<h2>Estenda o poder do Power BI com Python e R</h2>
<p>A atualização do <a href="https://github.com/PacktPublishing/Extending-Power-BI-with-Python-and-R-2nd-edition" target="_blank" rel="noopener">Github contendo os códigos</a> não é tão frequente, afinal, há materiais com mais de 2 anos lá no repo. O que não é um problema, já que outros códigos são mais recentes.</p>
<p>Bons estudos!</p>
</div>
</div>
<p>O post <a href="https://diegonogare.net/2024/06/review-do-livro-extending-power-bi-with-python-and-r-second-edition/">Review do livro &#8220;Extending Power BI with Python and R &#8211; Second Edition&#8221;</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">3920</post-id>	</item>
		<item>
		<title>Tendências em Engenharia de Machine Learning e MLOps em 2024</title>
		<link>https://diegonogare.net/2024/02/tendencias-em-engenharia-de-machine-learning-e-mlops-em-2024/</link>
		
		<dc:creator><![CDATA[Diego Nogare]]></dc:creator>
		<pubDate>Mon, 19 Feb 2024 18:57:12 +0000</pubDate>
				<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[Análise de Dados]]></category>
		<category><![CDATA[Engenharia de Machine Learning]]></category>
		<category><![CDATA[IA]]></category>
		<category><![CDATA[MLOps]]></category>
		<category><![CDATA[tendências tecnológicas]]></category>
		<guid isPermaLink="false">https://diegonogare.net/?p=3788</guid>

					<description><![CDATA[<p>A inteligência artificial (IA) está em constante evolução e as tendências para 2024 prometem transformar a forma como interagimos com essa tecnologia. Neste artigo, apesar de não gostar de falar sobre futurologia, quero explorar possíveis caminhos que moldarão o cenário da Engenharia de Machine Learning e MLOps em 2024 e nos próximos anos. Ao navegar...</p>
<p>O post <a href="https://diegonogare.net/2024/02/tendencias-em-engenharia-de-machine-learning-e-mlops-em-2024/">Tendências em Engenharia de Machine Learning e MLOps em 2024</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></description>
										<content:encoded><![CDATA[<p>A inteligência artificial (IA) está em constante evolução e as tendências para 2024 prometem transformar a forma como interagimos com essa tecnologia. Neste artigo, apesar de não gostar de falar sobre futurologia, quero explorar possíveis caminhos que moldarão o cenário da Engenharia de Machine Learning e MLOps em 2024 e nos próximos anos.</p>
<p>Ao navegar no linkedin, não é novidade que essas são áreas que estão em constante evolução e que trazem soluções inovadoras para diversos setores da indústria. Principalmente agora, onde a IA está se tornando cada vez mais presente em nossas vidas, impulsionando avanços significativos em produtividade e qualidade.</p>
<h2>O que é Engenharia de Machine Learning e MLOps?</h2>
<p>Para não ficar exaustivo e extenso demais esse texto, vou fazer uma ligação sobre o que é Engenharia de Machine Learning e MLOps com o texto que escrevi anteriormente para o blog, chamado <a href="https://diegonogare.net/2024/01/mlops-e-engenharia-de-machine-learning-descomplicados/" target="_blank" rel="noopener">MLOps e Engenharia de Machine Learning descomplicados</a>. Convido vocês a lerem o texto que dá a base para o que vamos discutir a seguir.</p>
<h2>Algumas apostas de Machine Learning para 2024</h2>
<p>Tentei separar essa seção em dois sub-grupos, um focado em ferramentas e produtos, e outro engloba as outras coisas.</p>
<h3>Ferramentas / Produtos</h3>
<p><strong>IA de Machine Learning mais sofisticada</strong><br />
O Machine Learning tradicional é a base da IA moderna e continuará a se aprimorar. Mesmo com os avanços da IA Generativa, o ML é uma área que não vai parar tão cedo. Contudo, isso significa, que os sistemas de IA aprenderão e se adaptarão mais rapidamente, abrindo novas possibilidades em diversos setores. O aprimoramento do aprendizado de máquina e a acessibilidade tecnológica são fatores fundamentais para termos soluções de ML mais sofisticadas.</p>
<p><strong>Engenharia de Machine Learning no mercado de dados</strong><br />
O crescimento da IA e as falhas associadas à sua produtização de forma manual e sem padrões corporativos geraram a necessidade de profissionais especializados. Aliás, foi por causa disso que surgiu a área de MLOps e a demanda por pessoas que trabalham com Engenharia de Machine Learning. Sobretudo, essas pessoas garantem a operacionalização dos modelos, permitindo que os Cientistas de Dados foquem na resolução de problemas, na geração de insights e no desenvolvimento de modelos de ML.</p>
<p><strong>Avanço das plataformas e ferramentas de MLOps</strong>: Outra tendência que aposto para 2024 é o avanço das plataformas e ferramentas que facilitam a implementação do MLOps nas empresas. Eventualmente, essas soluções permitem gerenciar todo o ciclo de vida de ML de forma integrada, automatizada e padronizada, reduzindo os custos, os riscos e o tempo dos projetos. Inclusive, quem tiver interesse em um livro curtinho e gratuito em português sobre MLOps, a Databricks está distribuindo um. Clique aqui para acessar <a href="https://www.databricks.com/br/resources/ebook/the-big-book-of-mlops" target="_blank" rel="noopener">O livro completo de MLOps</a>. Faça um cadastro rápido e tenha direito de baixar o livro.</p>
<p><strong>Análise Aumentada (Augmented Analytics)</strong><br />
A análise de dados tradicional está evoluindo, chegando a patamares de explicabilidade bem distintos. Agora, o aprendizado de máquina combinado com o Processamento de Linguagem Natural geram relatórios analíticos automaticamente, permitindo insights instantâneos para consultas ad hoc. Grande parte desta evolução tem a ver com questões de IA Generativa utilizando transformers.</p>
<h3>Outras coisas</h3>
<p><strong>Aumento da demanda por profissionais qualificados:</strong> com o crescimento do uso do machine learning em diversos setores, como saúde, educação, finanças, varejo e indústria, a demanda por profissionais capacitados em Engenharia de Machine Learning e MLOps também deve aumentar. Por isso, investir em formação e atualização nessas áreas pode ser uma ótima oportunidade para quem quer se destacar no mercado.</p>
<p>Inclusive, acompanhe o aumento global sobre as buscas destes termos (em inglês) desde 2015:</p>
<figure id="attachment_3789" aria-describedby="caption-attachment-3789" style="width: 678px" class="wp-caption alignnone"><img data-recalc-dims="1" fetchpriority="high" decoding="async" class="wp-image-3789 size-mh-magazine-lite-content" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2024/02/google_trends.jpg?resize=640%2C360&#038;ssl=1" alt="Tendência de Engenharia de Machine Learning e MLOps" width="640" height="360" /><figcaption id="caption-attachment-3789" class="wp-caption-text"><a href="https://trends.google.com/trends/explore?date=2015-01-01%202024-01-01&amp;q=MLOps,Machine%20Learning%20Engineering&amp;hl=pt" target="_blank" rel="noopener">Google Trends &#8211; MLOps e Machine Learning Engineering</a></figcaption></figure>
<p><strong>Expansão do uso da computação em nuvem e da computação distribuída</strong>: Outra tendência que vejo para 2024 é a expansão do uso da computação em nuvem e da computação distribuída para o desenvolvimento e implantação de sistemas de machine learning. Afinal, a computação em nuvem permite acessar recursos computacionais sob demanda, sem a necessidade de investir em infraestrutura própria. Por outro lado, a computação distribuída permite processar grandes volumes de dados em paralelo, utilizando vários nós ou máquinas conectadas em rede. Essas tecnologias possibilitam criar modelos mais complexos, robustos e escaláveis, além de reduzir os custos operacionais.</p>
<p><strong>Crescimento de padrões de IA Ética, Explicável e Responsável</strong>: Assim como o Marco Civil da Internet e a LGPD foram conquistados para proteger os usuários, está em discussão no Senado Federal um projeto para <a href="https://www12.senado.leg.br/noticias/materias/2023/10/26/regulamentacao-da-ia-exige-foco-na-centralidade-humana-aponta-debate" target="_blank" rel="noopener">regulamentação da IA</a>. Até a data de publicação deste texto, ainda tem muita discussão para ser feita. Mas, independente disso, vejo uma tendência para 2024 como sendo o crescimento da adoção de padrões que estão diretamente relacionados à IA Ética, IA Explicável e IA Responsável nas organizações.</p>
<p>Inclusive, em Setembro/2023, participei de um evento no <a href="http://www.ita.br/" target="_blank" rel="noopener"><strong><em>ITA &#8211;</em> Instituto Tecnológico de Aeronáutica</strong></a>, e uma das apresentações foi sobre IA Ética e Responsável. Baita aula da <a href="https://www.linkedin.com/in/danielaamericadasilva/" target="_blank" rel="noopener">Dra Daniela América da Silva</a>. Em linhas gerais estas frentes consideram os aspectos sociais, ambientais e legais envolvidos no uso do machine learning. Buscando evitar ou mitigar os possíveis impactos negativos que essa tecnologia pode causar.</p>
<h2>Mas, e ai?</h2>
<p>Estas são algumas tendências em Engenharia de Machine Learning e MLOps que eu acredito que faz sentido olhar com carinho, principalmente, se estas áreas de atuação estão no seu objetivo profissional. Pode ser que nada disso se fortaleça? Pode! Mas, na minha visão, são bons caminhos para investir um tempinho.</p>
<p>&nbsp;</p>
<blockquote><p><a href="https://www.bing.com/images/create/an-image-in-orange-and-purple-colors-that-represen/1-65d3a38a7e7d4f7c87aea8c7606ebb58?id=b9GYmcSeTK1Xt%2bDUi1upVg%3d%3d&amp;view=detailv2&amp;idpp=genimg&amp;idpclose=1&amp;thId=OIG2.791yebPJMSeNTzIWwZ_p&amp;FORM=SYDBIC" target="_blank" rel="noopener">Imagem de capa criada com IA pelo Bing</a>: Utilizei o prompt: &#8220;An image in orange and purple colors that represents AI technologies. The image should have the words &#8216;Trend 2024&#8217;, &#8216;EngML&#8217; and &#8216;MLOps&#8217; written explicitly. The style of the image should be digital illustration.&#8221;.</p></blockquote>
<p>O post <a href="https://diegonogare.net/2024/02/tendencias-em-engenharia-de-machine-learning-e-mlops-em-2024/">Tendências em Engenharia de Machine Learning e MLOps em 2024</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">3788</post-id>	</item>
		<item>
		<title>Análise e visualização de dados para ML e Ciência de Dados</title>
		<link>https://diegonogare.net/2024/01/analise-e-visualizacao-de-dados-para-ml-e-ciencia-de-dados/</link>
		
		<dc:creator><![CDATA[Diego Nogare]]></dc:creator>
		<pubDate>Mon, 22 Jan 2024 19:45:42 +0000</pubDate>
				<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[Análise de Dados]]></category>
		<category><![CDATA[ciência de dados]]></category>
		<category><![CDATA[python]]></category>
		<category><![CDATA[visualização de dados]]></category>
		<guid isPermaLink="false">https://diegonogare.net/?p=3734</guid>

					<description><![CDATA[<p>A Ciência de Dados é uma área em constante crescimento, e no momento em que há um aumento da quantidade de dados disponíveis, a necessidade de Análise e visualização de dados para ML e Ciência de Dados de maneira eficiente tornou-se cada vez mais importante. Neste post, quero explorar como o Machine Learning pode ser...</p>
<p>O post <a href="https://diegonogare.net/2024/01/analise-e-visualizacao-de-dados-para-ml-e-ciencia-de-dados/">Análise e visualização de dados para ML e Ciência de Dados</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></description>
										<content:encoded><![CDATA[<p>A Ciência de Dados é uma área em constante crescimento, e no momento em que há um aumento da quantidade de dados disponíveis, a necessidade de Análise e visualização de dados para ML e Ciência de Dados de maneira eficiente tornou-se cada vez mais importante. Neste post, quero explorar como o Machine Learning pode ser usado para essa finalidade, utilizando a linguagem de programação Python.</p>
<h2><em>Machine Learning e Ciência de Dados</em></h2>
<p>Machine Learning é um subcampo da Inteligência Artificial que se concentra em desenvolver algoritmos que permitem que os computadores aprendam a partir dos dados. Contudo, na Ciência de Dados, esses algoritmos são usados para descobrir padrões e insights nos dados. Anteriormente expliquei neste texto como a <a href="https://diegonogare.net/2020/01/uso-da-inteligencia-artificial-no-cotidiano/" target="_blank" rel="noopener">Inteligência Artificial está presente no nosso cotidiano</a>. Aliás, esse texto também faz uma referência à uma outra publicação que conto um pouco da <a href="https://diegonogare.net/2020/01/historia-da-inteligencia-artificial/" target="_blank" rel="noopener">história da Inteligência Artificial</a>.</p>
<h2>Analise e Visualização de dados</h2>
<h3>Análise de Dados</h3>
<p>A análise é o coração da ciência de dados, pois engloba o processo de inspecionar, limpar e transformar dados. Tem o objetivo de descobrir informações úteis, informar conclusões e apoiar os gestores nas tomada de decisões. A análise de dados pode ser dividida em muitas sub-áreas, e quero destacar quatro delas aqui:</p>
<ul>
<li><strong>Descoberta de Informações:</strong> A análise de dados ajuda a descobrir padrões e tendências nos dados que podem não ser imediatamente aparentes. Aliás, isso pode levar a insights valiosos que podem ser usados para informar estratégias de negócios ou direcionar decisões.</li>
<li><strong>Tomada de Decisões Baseada em Dados:</strong> Com a análise de dados, as decisões podem ser baseadas em dados, em contraste com decisões com base em intuição, suposições ou com o famoso &#8220;eu que mando aqui&#8221;. Isso pode levar a melhores resultados e maior eficiência.</li>
<li><strong>Previsão e Modelagem:</strong> A análise de dados permite a criação de modelos preditivos que podem ser usados para prever comportamentos ou tendências do futuro. Isso é particularmente útil em campos como vendas, marketing e finanças. Lembrando que, em virtude de ter resultados probabilísticos e não serem resultados determinísticos, a predição está associada à uma probabilidade do resultado acontecer.</li>
<li><strong>Melhoria da Precisão:</strong> A análise de dados pode ajudar a melhorar a precisão das previsões e decisões ao fornecer uma base sólida de evidências em que se basear. Ou seja, melhora a tomada de decisão baseada em dados.</li>
</ul>
<h3>Visualização de Dados</h3>
<p>Já a visualização de dados, que também é uma parte essencial da ciência de dados, permite que dados complexos sejam transformados em gráficos, facilitando a compreensão e interpretação dos dados. No Dataviz também podemos destacar muitos pontos importantes, mas quero manter o padrão e trazer quatro que entendo ser imporatnte:</p>
<ul>
<li><strong>Compreensão Rápida:</strong> Gráficos e imagens são processados pelo cérebro humano muito mais rápido do que texto, por consequência, a  visualização de dados permite que as pessoas entendam os dados rapidamente.</li>
<li><strong>Descoberta de Padrões:</strong> A visualização de dados pode revelar padrões, tendências e correlações nos dados que podem não ser evidentes em dados brutos, visto que nosso cérebro funciona melhor ao ver uma imagem do que ao ver um monte de numero amontoado.</li>
<li><strong>Comunicação Eficaz:</strong> A visualização de dados é uma maneira eficaz de comunicar informações complexas de maneira clara e concisa. Ela pode ser usada com o intuito de contar histórias com dados, tornando as informações mais acessíveis e memoráveis. Leve em consideração o publico que vai consumir o seu gráfico, comunique com o seu publico de forma que eles entendam o que você está transmitindo.</li>
<li><strong>Tomada de Decisão Informada:</strong> A visualização de dados pode ajudar na tomada de decisões ao fornecer uma representação visual clara dos dados. Isso pode levar a melhores decisões baseadas em dados. Um exemplo disso são os acompanhamentos com KPIs em reuniões executivas, os gestores normalmente olham para alguns faróis e ao bater o olho já sabem o que está indo bem e o que está indo mal.</li>
</ul>
<p>Consegui te explicar a importância da Análise e Visualização de dados para Machine Learning e Ciência de Dados ?</p>
<h2>Quer ver código?</h2>
<p>Python é uma linguagem de programação popular na Ciência de Dados, isso se dá, acima de tudo, pela sua simplicidade e à variedade de bibliotecas disponíveis. As mais comuns são Pandas e NumPy para análise de dados, e Matplotlib e Seaborn para criar gráficos e visualizações interativas.</p>
<p>O Pandas é uma biblioteca Python que permite manipular estruturas de dados de forma rápida, flexível e expressiva. Foi desenvolvida pensando em pessoas que trabalham com dados relacionais ou rotulados, deixando a manipulação fácil e intuitivo. Da mesma forma, o NumPy, que é um pacote de processamento de arrays de forma geral, pois ele fornece um objeto de array multidimensional de alto desempenho e ferramentas para trabalhar com esses arrays.</p>
<p>O Matplotlib é uma biblioteca Python focada na criação de visualizações estáticas, animadas e interativas. Ela permite criar figuras de qualidade para consumir em vários formatos. Já o Seaborn é uma biblioteca baseada em Matplotlib e é particularmente útil para visualizar dados complexos. Não posso falar muito do Seaborn porque não trabalhei com ele ainda&#8230;</p>
<p>Estes pacotes Python que comentei são muito úteis para se trabalhar com Machine Learning e Ciência de Dados, aliás, acredito que usá-los vai te ajudar a resolver problemas de analise e visualização grandes conjuntos de dados e transformar os dados brutos em insights valiosos. Inclusive, durante uma disciplina do doutorado, eu criei um <a href="https://github.com/diegonogare/MachineLearning" target="_blank" rel="noopener">Repo no Github</a> e coloquei alguns códigos lá dentro.</p>
<p>Eu ficaria muito feliz com sua contribuição nesse repo, no final da página do Github explico como você pode contribuir <img src="https://s.w.org/images/core/emoji/17.0.2/72x72/1f642.png" alt="🙂" class="wp-smiley" style="height: 1em; max-height: 1em;" /></p>
<p>&nbsp;</p>
<blockquote><p><a href="https://www.bing.com/images/create/um-macbook-com-grc3a1ficos-coloridos-em-azul2c-vermelh/1-65aec3c0cc4b4636839d833253f4f8d2?id=e3U55EU%2fvftgjlq5K6%2bLSQ%3d%3d&amp;view=detailv2&amp;idpp=genimg&amp;idpclose=1&amp;FORM=SYDBIC" target="_blank" rel="noopener">Imagem de capa criada com IA pelo Bing</a>. Utilizei o prompt: &#8220;Um macbook com gráficos coloridos em Azul, Vermelho, Verde e Amarelo e um copo de café na mesa, o macbook está em cima de uma mesa de escritório com o fundo de escritório desfocado. Os gráficos são como um dashboard para tomada de decisão&#8221; para a criação.</p></blockquote>
<p>O post <a href="https://diegonogare.net/2024/01/analise-e-visualizacao-de-dados-para-ml-e-ciencia-de-dados/">Análise e visualização de dados para ML e Ciência de Dados</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">3734</post-id>	</item>
	</channel>
</rss>
