<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Arquivos CRISP-DM - Diego Nogare</title>
	<atom:link href="https://diegonogare.net/tags/crisp-dm/feed/" rel="self" type="application/rss+xml" />
	<link>https://diegonogare.net/tags/crisp-dm/</link>
	<description>Consultor Executivo de IA &#38; ML</description>
	<lastBuildDate>Tue, 15 Apr 2025 12:37:57 +0000</lastBuildDate>
	<language>pt-BR</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://i0.wp.com/diegonogare.net/wp-content/uploads/2025/06/cropped-cropped-DN-Black-300x300-1.png?fit=32%2C32&#038;ssl=1</url>
	<title>Arquivos CRISP-DM - Diego Nogare</title>
	<link>https://diegonogare.net/tags/crisp-dm/</link>
	<width>32</width>
	<height>32</height>
</image> 
<site xmlns="com-wordpress:feed-additions:1">247556142</site>	<item>
		<title>Projetos com CRISP-DM e Machine Learning Canvas</title>
		<link>https://diegonogare.net/2024/05/projetos-com-crisp-dm-e-machine-learning-canvas/</link>
		
		<dc:creator><![CDATA[Diego Nogare]]></dc:creator>
		<pubDate>Mon, 13 May 2024 20:00:50 +0000</pubDate>
				<category><![CDATA[Inteligência Artificial]]></category>
		<category><![CDATA[CRISP-DM]]></category>
		<category><![CDATA[data mining]]></category>
		<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[Machine Learning Canvas]]></category>
		<category><![CDATA[Metodologia]]></category>
		<category><![CDATA[Projetos de ML]]></category>
		<guid isPermaLink="false">https://diegonogare.net/?p=3899</guid>

					<description><![CDATA[<p>Se você quer desenvolver projetos de Machine Learning, então você precisa conhecer o CRISP-DM e o Machine Learning Canvas. Ambas são metodologias bem fundadas para projetos de ML. Assim, a metodologia CRISP-DM, ou Cross-Industry Standard Process for Data Mining, é uma metodologia confiável, desenvolvida há mais de 20 anos, para criar projetos no mundo de...</p>
<p>O post <a href="https://diegonogare.net/2024/05/projetos-com-crisp-dm-e-machine-learning-canvas/">Projetos com CRISP-DM e Machine Learning Canvas</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></description>
										<content:encoded><![CDATA[<div class="content" tabindex="0" aria-description="" aria-label="Enviado por Copilot: **Título:** &quot;CRISP-DM: A Bússola para Projetos de Machine Learning&quot; **Introdução** A metodologia CRISP-DM, ou Cross-Industry Standard Process for Data Mining, é uma bússola confiável para navegar no mundo complexo dos projetos de Machine Learning. Este artigo irá guiá-lo através de cada um dos seis elementos do CRISP-DM, iluminando o caminho para o sucesso do seu projeto. **Desenvolvimento** *Entendimento do Negócio* O primeiro passo é entender o negócio. Aqui, definimos os objetivos, avaliamos a situação e criamos um plano de mineração de dados. &lt;div class=">
<p>Se você quer desenvolver projetos de Machine Learning, então você precisa conhecer o CRISP-DM e o Machine Learning Canvas. Ambas são metodologias bem fundadas para projetos de ML. Assim, a metodologia CRISP-DM, ou <em>Cross-Industry Standard Process for Data Mining</em>, é uma metodologia confiável, desenvolvida há mais de 20 anos, para criar projetos no mundo de Machine Learning. Enquanto o Machine Learning Canvas é uns 15 anos mais novo, consegue apresentar algumas estruturas mais detalhadas para criar modelos.</p>
</div>
<p>O Machine Learning é um subcampo da inteligência artificial que, primordialmente, usa algoritmos e modelos estatísticos para realizar tarefas sem programação explícita. Em contrapartida, eles dependem de padrões e inferências. A importância do ML não pode ser subestimada, ele tem o potencial de transformar quase todos os aspectos de nossas vidas, desde a saúde até as finanças, passando pela educação e <a href="https://diegonogare.net/2020/01/uso-da-inteligencia-artificial-no-cotidiano/" target="_blank" rel="noopener">muito mais</a>. Além disso, está desempenhando um papel cada vez mais importante em <a href="https://aws.amazon.com/pt/solutions/case-studies/itau-ml-case-study/" target="_blank" rel="noopener">entrega de valor nas empresas</a>, e ajuda a identificar padrões, fazer previsões e otimizar processos, tornando os projetos mais eficientes e eficazes.</p>
<p>Este artigo é o primeiro que entra em detalhes na série de <a href="https://diegonogare.net/2024/05/roadmap-mlops-2024/" target="_blank" rel="noopener">Roadmap MLOps 2014</a>, e com toda a certeza, irá lhe guiar através de cada um dos seis elementos do CRISP-DM e do Machine Learning Canvas.</p>
<div class="ac-container ac-adaptiveCard">
<h3>CRISP-DM</h3>
<p>O CRISP-DM orienta as equipes através de cada etapa do processo, desde a compreensão do problema de negócio até a implantação do modelo, garantindo que todas as considerações importantes sejam abordadas. Isso resulta em modelos mais precisos, implementações mais suaves e, finalmente, em decisões de negócios mais informadas e eficazes.</p>
</div>
<figure id="attachment_3891" aria-describedby="caption-attachment-3891" style="width: 450px" class="wp-caption aligncenter"><img data-recalc-dims="1" fetchpriority="high" decoding="async" class="wp-image-3891" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2024/05/CRISP-DM-e1715040390202.png?resize=450%2C450&#038;ssl=1" alt="CRISP-DM" width="450" height="450" /><figcaption id="caption-attachment-3891" class="wp-caption-text">CRISP-DM</figcaption></figure>
<div class="content" tabindex="0" aria-description="" aria-label="Enviado por Copilot: **Título:** &quot;CRISP-DM: A Bússola para Projetos de Machine Learning&quot; **Introdução** A metodologia CRISP-DM, ou Cross-Industry Standard Process for Data Mining, é uma bússola confiável para navegar no mundo complexo dos projetos de Machine Learning. Este artigo irá guiá-lo através de cada um dos seis elementos do CRISP-DM, iluminando o caminho para o sucesso do seu projeto. **Desenvolvimento** *Entendimento do Negócio* O primeiro passo é entender o negócio. Aqui, definimos os objetivos, avaliamos a situação e criamos um plano de mineração de dados. &lt;div class=">
<ol>
<li><strong>Entendimento do Negócio: </strong>Primeiramente, é necessário entender o negócio. Aqui, definimos os objetivos, avaliamos a situação e criamos um plano de mineração de dados. É essencial ter uma compreensão clara do problema que estamos tentando resolver.</li>
<li><strong>Entendimento dos Dados:</strong> Em seguida, precisamos entender os dados. Isso envolve coletar os dados, descrevê-los, explorá-los e verificar sua qualidade. Uma boa compreensão dos dados nos ajudará a construir modelos mais eficazes.</li>
<li><strong>Preparação dos Dados:</strong> A preparação dos dados é onde passamos a maior parte do tempo. Inclui todas as atividades necessárias para construir o conjunto de dados final, desde a limpeza dos dados até a formatação correta para modelagem.</li>
<li><strong>Modelagem:</strong> Na fase de modelagem, aplicamos várias técnicas de modelagem e calibramos seus parâmetros para a melhor solução. O objetivo é selecionar o modelo que melhor atende aos objetivos do negócio.</li>
<li><strong>Avaliação:</strong> A avaliação é o estágio em que avaliamos, de maneira completa e criteriosa, o modelo construído. São verificados se os objetivos do negócio, que foram definidos na primeira fase, foram alcançados.</li>
<li><strong>Implantação:</strong> Finalmente, chegamos à fase de implantação. Aqui, colocamos o modelo em prática, monitoramos seu desempenho e fazemos os ajustes necessários.</li>
</ol>
</div>
<p>&nbsp;</p>
<div class="content" tabindex="0" aria-description="" aria-label="Enviado por Copilot: **Título:** &quot;Machine Learning: Transformando o Mundo dos Projetos&quot; **Introdução** Machine Learning está transformando o mundo dos projetos. Neste artigo, vamos explorar os detalhes e a importância do Machine Learning em projetos no mundo de hoje. Vamos mergulhar no coração desta revolução tecnológica e descobrir como ela está moldando nosso futuro. **Desenvolvimento** *O que é Machine Learning?* Machine Learning é um subcampo da inteligência artificial que usa algoritmos e modelos estatísticos para realizar tarefas sem instruções explícitas. Em vez disso, eles dependem de padrões e inferências. *A Importância do Machine Learning* A importância do Machine Learning não pode ser subestimada. Ele tem o potencial de transformar quase todos os aspectos de nossas vidas, desde a saúde até as finanças, passando pela educação e muito mais. *Machine Learning em Projetos* Machine Learning está desempenhando um papel cada vez mais importante em projetos. Ele pode ajudar a identificar padrões, fazer previsões e otimizar processos, tornando os projetos mais eficientes e eficazes. **Conclusão** Machine Learning está aqui para ficar. À medida que continuamos a explorar seu potencial, é claro que ele desempenhará um papel cada vez mais importante em nossas vidas e em nossos projetos. O futuro é brilhante para o Machine Learning. **TAGs:** Machine Learning, Projetos, Inteligência Artificial, Tecnologia **Referências:** 1. Samuel, A. L. (1959). Some Studies in Machine Learning Using the Game of Checkers. IBM Journal of Research and Development, 3(3), 210-229. 2. Mitchell, T. M. (1997). Machine Learning. McGraw Hill. **Frase-Chave:** &quot;Machine Learning em Projetos&quot; **Meta descrição:** &quot;Descubra como o Machine Learning está transformando o mundo dos projetos e moldando nosso futuro.&quot;">
<div class="ac-container ac-adaptiveCard">
<div class="ac-textBlock">
<h3>Machine Learning Canvas</h3>
</div>
</div>
</div>
<p>Para facilitar esse trabalho, o pesquisador <strong>Louis Dorard</strong> criou um framework baseado no <em>Business Model Canvas</em>, porém voltado a Aprendizagem de Máquinas. O trabalho foi <a href="https://www.ownml.co/machine-learning-canvas" target="_blank" rel="noopener">publicado em seu site</a> e é constituído de um eBook que pode ser baixado gratuitamente, também fornece acesso a um modelo editável do canvas em PPT. Veja abaixo os detalhes para preencher o Canvas e conseguir desenvolver seus modelos de <em>Machine Learning</em> de forma mais assertiva e com menos “achismos”.</p>
<blockquote><p>Se você não conseguir baixar o canvas, nem o PPT, me mande uma mensagem e eu lhe encaminho&#8230;</p></blockquote>
<p>&nbsp;</p>
<figure id="attachment_3902" aria-describedby="caption-attachment-3902" style="width: 450px" class="wp-caption aligncenter"><img data-recalc-dims="1" decoding="async" class="wp-image-3902" src="https://i0.wp.com/diegonogare.net/wp-content/uploads/2024/05/canvas_exemplo.jpg?resize=450%2C375&#038;ssl=1" alt="Machine Learning Canvas" width="450" height="375" srcset="https://i0.wp.com/diegonogare.net/wp-content/uploads/2024/05/canvas_exemplo.jpg?w=768&amp;ssl=1 768w, https://i0.wp.com/diegonogare.net/wp-content/uploads/2024/05/canvas_exemplo.jpg?resize=300%2C250&amp;ssl=1 300w" sizes="(max-width: 450px) 100vw, 450px" /><figcaption id="caption-attachment-3902" class="wp-caption-text">Machine Learning Canvas</figcaption></figure>
<p>Para preenchimento, é importante entender o que há em cada parte do template. Vou usar um dos exemplos que existe no e-book, que fala sobre o desenvolvimento de uma priorização para cliente de e-mail.</p>
<div class="content" tabindex="0" aria-description="" aria-label="Enviado por Copilot: **Machine Learning Canvas: Etapas e Expectativas** 1. **Proposta de Valor**: Define o que estamos tentando fazer, por que é importante e quem vai usar e ser impactado. Exemplo: tornar mais fácil para os usuários de um cliente de e-mail identificar novas mensagens importantes em sua caixa de entrada. 2. **Fontes de Dados**: Identifica as fontes de dados brutas que serão trabalhadas para resolver o problema. Exemplo: Mensagens de e-mail anteriores, Livro de endereços e Calendário. 3. **Coleta de Dados**: Descreve como podemos obter novos dados para aprender (entradas e saídas). Exemplo: os usuários podem rotular manualmente os e-mails como importantes ou não. 4. **Seleção de Características**: Define quais itens das variáveis existentes nos dados brutos serão utilizadas para criar o modelo. Exemplo: Recursos de conteúdo (assunto, corpo, anexos, tamanho), Funcionalidades sociais (informações sobre o remetente, interações anteriores), Rótulos de e-mail. 5. **Construção de Modelos**: Define como serão feitas as extrações dos dados da base de origem, e quais dados serão utilizados para a construção ou atualização do modelo. Exemplo: criar um modelo por usuário, inicialmente construído com os últimos 12 meses de dados dos e-mails. 6. **Tarefa de Machine Learning**: Define a família de algoritmos que será utilizada para resolver o problema, as entradas e o resultado esperado. Exemplo: resolver problemas de Classificação Binária. 7. **Decisões**: Deixa claro como as previsões que retornam do modelo serão aproveitadas pelo usuário final. Exemplo: mover e-mails recebidos com uma pontuação de importância acima de um determinado limite, para uma seção dedicada na parte superior da caixa de entrada. 8. **Fazer Previsões**: Discute o momento no qual o modelo será acionado para responder às chamadas. Exemplo: toda vez que recebemos um e-mail endereçado ao nosso usuário, que há o inicio de uma nova thread. 9. **Avaliação Offline**: Descreve quais métodos e métricas serão utilizados para avaliar a maneira de como as previsões são feitas e utilizadas, antes de ser implantado. Exemplo: usar os últimos 3 meses de e-mails para teste e 12 meses antes para Treinamento. 10. **Avaliação e Monitoramento ao Vivo**: Mede o funcionamento do modelo e monitora se o valor de acertos continua aceitável. Exemplo: avaliar semanalmente os pontos: Ratio: Quantidade de erros explicitamente sinalizado pelo usuário dividido pela quantidade de e-mails recebidos.">
<div class="ac-container ac-adaptiveCard">
<div class="ac-textBlock">
<ol>
<li><strong>Proposta de valor (value propositions)</strong>: Primeiramente, define o que se fazer, por que é importante e quem vai usar e ter impacta. <em>Exemplo: tornar mais fácil para os usuários de um cliente de e-mail identificar novas mensagens importantes em sua caixa de entrada.</em></li>
<li><strong>Fontes de dados (data sources)</strong>: Identifica as fontes de dados brutas que irá utilizar para resolver o problema. <em>Exemplo: Mensagens de e-mail anteriores, Livro de endereços e Calendário.</em></li>
<li><strong>Coleta de dados (collecting data)</strong>: Descreve como podemos obter novos dados para aprender (entradas e saídas). <em>Exemplo: os usuários podem rotular manualmente os e-mails como importantes ou não.</em></li>
<li><strong>Seleção de características (features)</strong>: Define quais itens das variáveis existentes nos dados brutos irá utilizar para criar o modelo. <em>Exemplo: Recursos de conteúdo (assunto, corpo, anexos, tamanho), Funcionalidades sociais (informações sobre o remetente, interações anteriores), Rótulos de e-mail.</em></li>
<li><strong>Construção de modelos (building models)</strong>: Em seguida, define como serão feitas as extrações dos dados da base de origem, e quais dados serão utilizados para a construção ou atualização do modelo. <em>Exemplo: criar um modelo por usuário, inicialmente construído com os últimos 12 meses de dados dos e-mails.</em></li>
<li><strong>Tarefa de Machine Learning (ML tasks)</strong>: Define a <a href="https://diegonogare.net/2020/04/como-funciona-a-aprendizagem-de-maquina/" target="_blank" rel="noopener">família de algoritmos</a> que irá utilizar para resolver o problema, as entradas e o resultado esperado. <em>Exemplo: resolver problemas de Classificação Binária.</em></li>
<li><strong>Decisões (decisions)</strong>: Deixa claro como o usuário final irá aproveitar retorno das previsões do modelo. <em>Exemplo: mover e-mails recebidos com uma pontuação de importância acima de um determinado limite, para uma seção dedicada na parte superior da caixa de entrada.</em></li>
<li><strong>Fazer previsões (making predictions)</strong>: Discute o momento no qual o modelo será acionado para responder às chamadas. <em>Exemplo: toda vez que receber um e-mail endereçado ao usuário, que há o inicio de uma nova thread.</em></li>
<li><strong>Avaliação offline (offline evaluation)</strong>: Finalmente, descreve quais métodos e métricas serão utilizados para avaliar a maneira de como as previsões são feitas e utilizadas, antes de ser implantado. <em>Exemplo: usar os últimos 3 meses de e-mails para teste e 12 meses antes para Treinamento.</em></li>
<li><strong>Avaliação e monitoramento ao vivo (live evaluation and monitoring)</strong>: Mede o funcionamento do modelo e monitora se o valor de acertos continua aceitável. <em>Exemplo: avaliar semanalmente os pontos, como o Ratio, que seria a quantidade de erros explicitamente sinalizado pelo usuário dividido pela quantidade de e-mails recebidos.</em></li>
</ol>
</div>
</div>
</div>
<h3>CRISP-DM e Machine Learning Canvas para projetos de ML</h3>
<div class="content" tabindex="0" aria-description="" aria-label="Enviado por Copilot: **Título:** &quot;CRISP-DM: A Bússola para Projetos de Machine Learning&quot; **Introdução** A metodologia CRISP-DM, ou Cross-Industry Standard Process for Data Mining, é uma bússola confiável para navegar no mundo complexo dos projetos de Machine Learning. Este artigo irá guiá-lo através de cada um dos seis elementos do CRISP-DM, iluminando o caminho para o sucesso do seu projeto. **Desenvolvimento** *Entendimento do Negócio* O primeiro passo é entender o negócio. Aqui, definimos os objetivos, avaliamos a situação e criamos um plano de mineração de dados. &lt;div class=">
<p>Machine Learning está aqui para ficar, se bem que falo disso há bastante tempo. Contudo, a  medida que continuamos a explorar seu potencial, fica claro que ele desempenhará um papel cada vez mais importante em nossas vidas e em nossos projetos. O futuro é brilhante para o Machine Learning, e seja como for, se você estiver preparado para desenvolver projetos envolvendo essa disciplina irá lhe trazer bons frutos. Existem duas metodologias interessantes para se seguir. O CRISP-DM é uma metodologia robusta e flexível que pode se adaptar para qualquer projeto de Machine Learning. O Machine Learning Canvas também é uma metodologia, que explica com um pouco mais de passos as necessidades existentes em projetos. Seguir os passos destas metodologias irá direcionar para que seu projeto esteja no caminho certo para o sucesso. Independente do que escolher para utilizar, não deixe de considerar o CRISP-DM e Machine Learning Canvas para projetos de ML.</p>
</div>
<p>Bons projetos!</p>
<p>O post <a href="https://diegonogare.net/2024/05/projetos-com-crisp-dm-e-machine-learning-canvas/">Projetos com CRISP-DM e Machine Learning Canvas</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">3899</post-id>	</item>
		<item>
		<title>Roadmap MLOps 2024</title>
		<link>https://diegonogare.net/2024/05/roadmap-mlops-2024/</link>
		
		<dc:creator><![CDATA[Diego Nogare]]></dc:creator>
		<pubDate>Tue, 07 May 2024 00:07:21 +0000</pubDate>
				<category><![CDATA[Machine Learning]]></category>
		<category><![CDATA[CRISP-DM]]></category>
		<category><![CDATA[Desenvolvimento de Modelos]]></category>
		<category><![CDATA[Implantação de Modelos]]></category>
		<category><![CDATA[MLOps]]></category>
		<category><![CDATA[Monitoramento de Modelos]]></category>
		<guid isPermaLink="false">https://diegonogare.net/?p=3885</guid>

					<description><![CDATA[<p>Em cima do que venho pesquisando para o doutorado montei um roadmap de MLOps para 2024. A ideia é descrever o que existe em um ambiente de publicação de modelos de Machine Learning, para que você saiba o que precisa quando for construir o seu. Vou escrever sobre as etapas que vão desde o acesso...</p>
<p>O post <a href="https://diegonogare.net/2024/05/roadmap-mlops-2024/">Roadmap MLOps 2024</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></description>
										<content:encoded><![CDATA[<p>Em cima do que venho pesquisando para o doutorado montei um roadmap de MLOps para 2024. A ideia é descrever o que existe em um ambiente de publicação de modelos de Machine Learning, para que você saiba o que precisa quando for construir o seu. Vou escrever sobre as etapas que vão desde o acesso aos dados até a observabilidade dos logs do modelo publicado, detalhando as fases de desenvolvimento, implantação e monitoramento de modelos. Espero, assim, que no fim dessa série de postagens, e ao consolidar os conteúdos, você tenha a visão completa da plataforma.</p>
<p>Antes de mais nada, vamos embarcar nessa jornada?</p>
<p>Vou aproveitar e compartilhar alguns posts que fiz recentemente, pois estão diretamente conectados a este assunto.</p>
<blockquote><p><a href="https://diegonogare.net/2024/01/mlops-e-engenharia-de-machine-learning-descomplicados/" target="_blank" rel="noopener">Jan/24 &#8211; MLOps e Engenharia de Machine Learning descomplicados</a></p>
<p><a href="https://diegonogare.net/2024/01/review-do-livro-machine-learning-engineering-with-python-mlops-ciclo-vida-modelos/" target="_blank" rel="noopener">Jan/24 &#8211; Review do Livro “Machine Learning Engineering with Python – 2nd edition”</a></p>
<p><a href="https://diegonogare.net/2024/02/ferramentas-e-plataformas-essenciais-para-projetos-de-ia-e-ml/" target="_blank" rel="noopener">Fev/24 &#8211; Ferramentas e plataformas essenciais para projetos de IA e ML</a></p>
<p><a href="https://diegonogare.net/2024/02/melhores-praticas-para-testar-e-monitorar-modelos-de-ml/" target="_blank" rel="noopener">Fev/24 &#8211; Melhores práticas para testar e monitorar modelos de ML</a></p>
<p><a href="https://diegonogare.net/2024/02/tendencias-em-engenharia-de-machine-learning-e-mlops-em-2024/" target="_blank" rel="noopener">Fev/24 &#8211; Tendências em Engenharia de Machine Learning e MLOps em 2024</a></p>
<p><a href="https://diegonogare.net/2024/02/aprenda-engenharia-de-machine-learning-e-mlops-online/" target="_blank" rel="noopener">Fev/24 &#8211; Aprenda Engenharia de Machine Learning e MLOps online</a></p>
<p><a href="https://diegonogare.net/2024/04/ia-etica-ia-responsavel-e-explicabilidade-de-ia/" target="_blank" rel="noopener">Abr/24 &#8211; IA Ética, IA Responsável e Explicabilidade de IA</a></p></blockquote>
<p>Ah, não posso deixar de dizer que MLOps e CRISP-DM são dois componentes fundamentais no desenvolvimento de modelos de machine learning. Enquanto o MLOps fornece a visão macro do processo, o CRISP-DM entra nos detalhes de cada etapa.</p>
<h3>CRISP-DM</h3>
<p>O MLOps, com as fases de desenvolvimento, implantação e monitoramento de modelos, fornece uma estrutura base para o ciclo de vida do modelo. Por outro lado, o CRISP-DM oferece uma metodologia detalhada para cada fase, desde a compreensão do negócio até a implantação do modelo. O paper do CRISP-DM foi publicado nos anos 2000, e os primeiros artigos de MLOps, por volta de 2015! É importante destacar que, independente da idade, eles se complementam perfeitamente!</p>
<blockquote><p>Esta é a referência ao artigo original do CRISP-DM:</p>
<p>Shearer, C. (2000). The CRISP-DM model: the new blueprint for data mining. <i>Journal of data warehousing</i>, <i>5</i>(4), 13-22.</p></blockquote>
<p>O <em>Cross-Industry Standard Process for Data Mining</em> (CRISP-DM) é uma metodologia amplamente aceita que fornece uma estrutura para o desenvolvimento de modelos de machine learning. É um processo cíclico que consiste em seis fases: <em>compreensão do negócio</em>, <em>compreensão dos dados</em>, <em>preparação dos dados</em>, <em>modelagem</em>, <em>avaliação</em> e <em>implantação</em>. Cada fase tem um papel bem definido no desenvolvimento de modelos de ML, e sua importância edstá diretamente ligada a uma abordagem estruturada e iterativa. Ele permite que as equipes de dados compreendam melhor os problemas de negócios, preparem os dados de maneira adequada, construam modelos eficazes e os implantem com sucesso. Mesmo depois de mais de 20 anos, continua sendo uma metodologia valiosa para o desenvolvimento de modelos de ML.</p>
<h3>Etapas macro de MLOps</h3>
<p>O MLOps é um campo em rápida evolução, isso já venho falando há algum tempo&#8230; Espero que você também possa perceber isso. Em linhas gerais, pode-se dividir o processo de MLOps em três etapas, sendo: Desenvolvimento, Implantação e Monitoramento.</p>
<ul>
<li>Desenvolvimento: Esta é a primeira etapa do processo de MLOps e envolve a criação de modelos de machine learning. Durante esta fase, os cientistas de dados coletam e preparam os dados, selecionam os algoritmos apropriados, treinam o modelo e, finalmente, validam o modelo para garantir que ele esteja funcionando conforme o esperado. Esta etapa é crucial, pois a qualidade do modelo desenvolvido afeta diretamente o desempenho do sistema de machine learning;</li>
<li>Implantação: Uma vez que o modelo é desenvolvido e validado, a próxima etapa é a implantação do modelo. Esta etapa envolve a integração do modelo em um sistema de produção existente, onde ele pode começar a fazer previsões (<em>scoring</em> do modelo). A implantação de modelos é um processo complexo que requer uma estreita colaboração entre as equipes de dados e engenharia para garantir que o modelo seja implementado corretamente e possa operar de forma eficiente e eficaz;</li>
<li>Monitoramento: Após a implantação do modelo, a etapa final do processo de MLOps é o monitoramento/observabilidade do modelo. Esta etapa envolve o rastreamento contínuo do desempenho do modelo para garantir que ele continue a fornecer resultados precisos. Se o desempenho do modelo começar a degradar, o modelo pode precisar ser re-treinado com novos dados ou ajustado para melhorar seu desempenho. O monitoramento em si deve ser realizado durante todo o período do ciclo de vida do modelo, mas só depois de entrar em produção é que podemos começar a ter observabilidade da sua operação.</li>
</ul>
<h3>Próximos passos</h3>
<p>Posso dizer que o processo CRISP-DM se encaixa perfeitamente nessas três etapas do MLOps. A fase de “compreensão do negócio” e “compreensão dos dados” do CRISP-DM se alinha com a etapa de desenvolvimento de modelos do MLOps. A fase de “modelagem” e “avaliação” do CRISP-DM coincide com a etapa de implantação de modelos do MLOps. Finalmente, a fase de “implantação” do CRISP-DM se conecta com a etapa de monitoramento de modelos do MLOps. Assim, o CRISP-DM e o MLOps juntos formam uma estrutura robusta e completa para o ciclo de vida de modelos de machine learning. Apesar de eu ter feito uma associação direta do monitoramento com a implantação, lembre-se que o monitoramento é contínuo e deve aparecer em todas as fases do CRISP-DM.</p>
<p>A combinação de MLOps e CRISP-DM oferece uma abordagem robusta e completa para o desenvolvimento de modelos de machine learning, lendo esse material, espero que você tenha uma melhor compreensão das etapas envolvidas e da importância de cada uma delas. Acompanhe os próximos posts para ver mais os desdobramentos e detalhes de cada etapa do Roadmap de MLOps em 2024.</p>
<p>Contudo, não se dê por satisfeito só com as postagens aqui, lhe convido a acompanhar estes livros:</p>
<p><a href="https://amzn.to/3Tfdiux" target="_blank" rel="noopener">Projetando sistemas de Machine Learning: processo interativo para aplicações prontas para produção, por Chip Huyen</a></p>
<p><a href="https://amzn.to/4bUolka" target="_blank" rel="noopener">Machine Learning Engineering with Python &#8211; Second Edition: Manage the lifecycle of machine learning models using MLOps with practical examples, de Andrew McMahon</a></p>
<p><a href="https://amzn.to/3IcIpjN" target="_blank" rel="noopener">Mãos à obra aprendizado de máquina com Scikit-Learn, Keras &amp; TensorFlow: conceitos, ferramentas e técnicas para a construção de sistemas inteligentes</a></p>
<p><a href="https://amzn.to/48Bzcwb" target="_blank" rel="noopener">Estatística prática para cientistas de dados: 50 conceitos essenciais</a></p>
<p><a href="https://amzn.to/3UZQlwn" target="_blank" rel="noopener">Estatística: O que é, para que serve, como funciona</a>.</p>
<p>&nbsp;</p>
<blockquote><p><a href="https://www.bing.com/images/create/diagrama-circular-com-trc3aas-cc3adrculos-um-ao-lado-do-/1-663972e9f2024a62b465ae00d248990f?id=%2fmPvr6Ntiv4Mwhb9wujVgA%3d%3d&amp;view=detailv2&amp;idpp=genimg&amp;idpclose=1&amp;thId=OIG3.HQfBTriXV5A0OD1zSMgJ&amp;FORM=SYDBIC" target="_blank" rel="noopener">Imagem de capa criada com IA pelo Bing</a>. Utilizei o prompt: &#8220;<span class="ptitle nolink">Diagrama circular com três círculos um ao lado do outro, dividido em três segmentos principais representando Machine Learning em verde, Desenvolvimento em laranja e Operações em roxo, sem texto, com ícones de um cérebro, um computador com colchetes de código e uma pessoa sob um guarda-chuva, interconectados para representar o ciclo contínuo entre esses domínios</span>&#8221; para a criação (o prompt entregou errado porque não era para ter texto e as cores não foram as que pedi, mas gostei do resultado).</p></blockquote>
<p>O post <a href="https://diegonogare.net/2024/05/roadmap-mlops-2024/">Roadmap MLOps 2024</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">3885</post-id>	</item>
	</channel>
</rss>
