<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Arquivos decision tree - Diego Nogare</title>
	<atom:link href="https://diegonogare.net/tags/decision-tree/feed/" rel="self" type="application/rss+xml" />
	<link>https://diegonogare.net/tags/decision-tree/</link>
	<description>Consultor Executivo de IA &#38; ML</description>
	<lastBuildDate>Sat, 24 Apr 2021 23:12:53 +0000</lastBuildDate>
	<language>pt-BR</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://i0.wp.com/diegonogare.net/wp-content/uploads/2025/06/cropped-cropped-DN-Black-300x300-1.png?fit=32%2C32&#038;ssl=1</url>
	<title>Arquivos decision tree - Diego Nogare</title>
	<link>https://diegonogare.net/tags/decision-tree/</link>
	<width>32</width>
	<height>32</height>
</image> 
<site xmlns="com-wordpress:feed-additions:1">247556142</site>	<item>
		<title>Algoritmo de Árvore de Decisão (Decision Tree) no Data Mining do SQL Server 2014</title>
		<link>https://diegonogare.net/2014/08/algoritmo-de-arvore-de-decisao-decision-tree-no-data-mining-do-sql-server-2014/</link>
		
		<dc:creator><![CDATA[Diego Nogare]]></dc:creator>
		<pubDate>Wed, 06 Aug 2014 01:34:32 +0000</pubDate>
				<category><![CDATA[Artigo]]></category>
		<category><![CDATA[Big Data]]></category>
		<category><![CDATA[Business Intelligence]]></category>
		<category><![CDATA[MVTech]]></category>
		<category><![CDATA[SQL Server]]></category>
		<category><![CDATA[Tech Ed Brasil]]></category>
		<category><![CDATA[Virtual PASS BR]]></category>
		<category><![CDATA[arvore de decisao]]></category>
		<category><![CDATA[bi]]></category>
		<category><![CDATA[BigData]]></category>
		<category><![CDATA[business intelligence]]></category>
		<category><![CDATA[data mining]]></category>
		<category><![CDATA[decision tree]]></category>
		<category><![CDATA[inteligencia artificial]]></category>
		<category><![CDATA[sql server]]></category>
		<guid isPermaLink="false">http://diegonogare.net/?p=946</guid>

					<description><![CDATA[<p>Fala galera, como prometido algumas semanas atrás vou escrever uma série de posts falando sobre os algoritmos de Data Mining existentes no SQL Server 2014. Hoje vamos cobrir o uso do algoritmo de Árvore de Decisão, que implementa o algoritmo Microsft Decision Tree. Como já foi falado no primeiro post, este algoritmo de classificação é...</p>
<p>O post <a href="https://diegonogare.net/2014/08/algoritmo-de-arvore-de-decisao-decision-tree-no-data-mining-do-sql-server-2014/">Algoritmo de Árvore de Decisão (Decision Tree) no Data Mining do SQL Server 2014</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></description>
										<content:encoded><![CDATA[<p>Fala galera, como <a href="https://diegonogare.net/2014/06/data-mining-com-sql-server-2014/">prometido algumas semanas atrás</a> vou escrever uma série de posts falando sobre os algoritmos de Data Mining existentes no SQL Server 2014. Hoje vamos cobrir o uso do algoritmo de Árvore de Decisão, que implementa o algoritmo Microsft Decision Tree.</p>
<p>Como já foi falado no primeiro post, este algoritmo de classificação é responsável por criar uma representação visual que chamamos de árvore por contem um nó raíz, nós intermediários que são as ramificações e os últimos nós representados que são as folhas.</p>
<p>É importante conhecer os dados que serão trabalhados para poder definir o que são atributos de entrada e o que são atributos preditivos. Basicamente, os atributos de entradas são colunas do banco de dados que podem influenciar o resultado final, e o resultado final é a coluna preditiva. Imagine um cenário onde o objetivo é classificar pessoas que são possíveis compradores do livro <a href="http://www.livrariasaraiva.com.br/produto/7697935">Do Banco de Dados Relacional à Tomada de Decisão</a>. Então neste caso a coluna preditiva do banco é se o cara comprou ou não o livro. As colunas de input são as colunas que tem alguma influência sobre a compra do livro, por exemplo, o idioma, a área de atuação, interesse técnico, etc. O algoritmo, com base nestas informações de input e predição, estrutura os nós da árvore classificando o que é relevante nas ramificações e entregando um (ou mais) caminhos ideais para chegar até as folhas. Pensando por esse lado, foi constatado que das 10 vendas que o livro teve, 8 falam idioma Português, 7 trabalham na área de Banco de Dados e somente 3 tem interesse técnico. Quando estes dados são processados pelo algoritmo e apresentado através da Árvore de Decisão, é possível ver claramente qual é o melhor caminho para segmentar o público que compraria o livro. São profissionais que falam Português e que trabalham na área de Banco de Dados, mas o interesse técnico não importa. Se fizer uma campanha de marketing direcionada para este público, a chance de vender o livro é muito maior do que enviar para um grupo de pessoas que falam Inglês e trabalham na área de Nutrição.</p>
<p>Bom, depois desse exemplo para entender o funcionamento do algoritmo, vamos começar um exemplo utilizando o Adventure Works.</p>
<p>Primeira coisa é necessário criar um novo projeto do tipo SSAS com Data Mining. Vou levar em conta que você sabe criar um <strong>Data Source</strong> apontando para o <em>AdventureWorksDW2012</em> e um <strong>Data Source View</strong> apontando para a <em>vTargetMail</em>.</p>
<p><img decoding="async" src="/wp-content/uploads/2014/08/080614_0131_Algoritmode1-1.png" alt="" /></p>
<p>O próximo passo é onde começa a mineração de dados, procure na Solution Explorer o item de Mining Structure e clique com o botão direito do mouse, em seguida, aponte para New Mining Structure.</p>
<p><img decoding="async" src="/wp-content/uploads/2014/08/080614_0131_Algoritmode2-1.png" alt="" /></p>
<p>Neste momento uma tela de abre e permite que você informe onde estão os dados de origem. Como utilizaremos o Data Warehouse para consumir os dados, deixe marcada a opção que é apresentada.</p>
<p><img decoding="async" src="/wp-content/uploads/2014/08/080614_0131_Algoritmode3-1.png" alt="" /></p>
<p>Ao avançar para a próxima tela, você deve escolher qual algoritmo vai utilizar para sua mineração. No caso deste exemplo, mantenha escolhido o default, que é Decision Tree.</p>
<p><img decoding="async" src="/wp-content/uploads/2014/08/080614_0131_Algoritmode4-1.png" alt="" /></p>
<p>Na tela seguinte, você informa qual é o Data Source View que possui a conexão com sua base de dados de origem. Como foi criado somente um Data Source View, somente ele é apresentado.</p>
<p><img decoding="async" src="/wp-content/uploads/2014/08/080614_0131_Algoritmode5-1.png" alt="" /></p>
<p>Ao avançar, o wizard pergunta quais tabelas são Case e quais são Nested. Mantenha a tabela (eu sei que é uma view!!!!) vTargetMail marcada como Case e avance.</p>
<p><img decoding="async" src="/wp-content/uploads/2014/08/080614_0131_Algoritmode6-1.png" alt="" /></p>
<p>Neste momento é hora de selecionar quais colunas são de entrada e quais são preditivas. Ao bater o olho na tela, é intuitivo marcar as linhas definidas para cada coluna. Garanta que seu ambiente está marcado com:</p>
<p>Key <span style="font-family: Wingdings;">à</span> CustomerKey</p>
<p>Input <span style="font-family: Wingdings;">à</span> Age e CommuteDistance</p>
<p>Predictable <span style="font-family: Wingdings;">à</span> BikeBuyer</p>
<p>Como apresentado a seguir</p>
<p><img decoding="async" src="/wp-content/uploads/2014/08/080614_0131_Algoritmode7-1.png" alt="" /></p>
<p>Avance para a próxima tela, e informe quais são valores Continuous ou então Discrete. Lembrando que valores contínuos apresentam uma grande variação de ocorrencias dentro da coluna e os discretos variam pouco. Por exemplo um campo do tipo CPF é um valor contínuo (varia muito de individuo para individuo) e uma coluna do tipo sexo é discreto (varia só um pouco). Caso não esteja a vontade, ou não conhece a base, pode clicar em Detect e o SQL Server analisa e lhe dá o resultado.</p>
<p><img decoding="async" src="/wp-content/uploads/2014/08/080614_0131_Algoritmode8-1.png" alt="" /></p>
<p>O próximo passo é finalizar e informar o nome. Como não estou com criatividade hoje, vou deixar o nome sugerido pelo SQL Server e vou manter <strong>v Target Mail</strong>.</p>
<p>Um novo item é criado dentro da Solution Explorer, e é neste objeto que a Mineração de Dados ocorre. Para encontrar a Árvore de Decisão, é preciso processar os dados. É possível processar somente o modelo ou então o projeto como um todo. No caso, vamos processar todo o projeto. Para isso, vá na Solution Explorer, clique com o botão direito no projeto e aponte para Process. Lembrando de apontar para o <em>deploy</em> para o servidor correto.</p>
<p><img decoding="async" src="/wp-content/uploads/2014/08/080614_0131_Algoritmode9-2.png" alt="" /></p>
<p>Se tudo ocorrer bem ao processamento, será apresenta o status Process Succeeded.</p>
<p><img decoding="async" src="/wp-content/uploads/2014/08/080614_0131_Algoritmode10-2.png" alt="" /></p>
<p>Para encontrar a <strong>Árvore de Decisão</strong>, vá até a área central do <em>SQL Server Data Tools</em> no objeto <strong>v Target Mail</strong>, e abra a aba <em>Mining Model Viewer</em>.</p>
<p><img decoding="async" src="/wp-content/uploads/2014/08/080614_0131_Algoritmode11-2.png" alt="" /></p>
<p>Reparem que os nós Raiz [1], Ramificações [2] e Folha [3] são apresentados, e pode-se seguir o caminho da predição com base nas variáveis de entrada. Um ponto importante para seguir com a análise, é entender essa graduação de cores, na qual o item mais escuro representa o resultado mais impactante com base na predição esperada. A base do AdventureWorks é de uma empresa fictícia de venda de acessórios para bicicletas, então, olhando esta árvore, é possível predizer que os melhores clientes para realizar possíveis compras futuras seguindo o fluxo com as cores mais escuras.</p>
<p>Agora é com vocês, apliquem estas técnicas de mineração de dados em seu ambiente e façam com que seus resultados sejam mais assertivos!</p>
<p>O post <a href="https://diegonogare.net/2014/08/algoritmo-de-arvore-de-decisao-decision-tree-no-data-mining-do-sql-server-2014/">Algoritmo de Árvore de Decisão (Decision Tree) no Data Mining do SQL Server 2014</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">2178</post-id>	</item>
	</channel>
</rss>
