<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Arquivos RAG - Diego Nogare</title>
	<atom:link href="https://diegonogare.net/tags/rag/feed/" rel="self" type="application/rss+xml" />
	<link>https://diegonogare.net/tags/rag/</link>
	<description>Consultor Executivo de IA &#38; ML</description>
	<lastBuildDate>Tue, 15 Apr 2025 12:22:23 +0000</lastBuildDate>
	<language>pt-BR</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://i0.wp.com/diegonogare.net/wp-content/uploads/2025/06/cropped-cropped-DN-Black-300x300-1.png?fit=32%2C32&#038;ssl=1</url>
	<title>Arquivos RAG - Diego Nogare</title>
	<link>https://diegonogare.net/tags/rag/</link>
	<width>32</width>
	<height>32</height>
</image> 
<site xmlns="com-wordpress:feed-additions:1">247556142</site>	<item>
		<title>Review do livro &#8220;The LLM Engineer&#8217;s Handbook&#8221;</title>
		<link>https://diegonogare.net/2024/12/review-do-livro-the-llm-engineers-handbook/</link>
		
		<dc:creator><![CDATA[Diego Nogare]]></dc:creator>
		<pubDate>Mon, 30 Dec 2024 14:03:30 +0000</pubDate>
				<category><![CDATA[Review de Livro]]></category>
		<category><![CDATA[Engenharia de Machine Learning]]></category>
		<category><![CDATA[IA Generativa]]></category>
		<category><![CDATA[LLM]]></category>
		<category><![CDATA[MLOps]]></category>
		<category><![CDATA[python]]></category>
		<category><![CDATA[RAG]]></category>
		<guid isPermaLink="false">https://diegonogare.net/?p=3929</guid>

					<description><![CDATA[<p>Fiz mais um review, desta vez, do livro &#8220;The LLM Engineer&#8217;s Handbook&#8221; escrito por Paul Iusztin e Maxime Labonne e publicado pela Packt. A obra aborda um assunto que vem crescendo muito nos ultimos meses que é a Engenharia LLM para implementar, otimizar e implantar grandes modelos de linguagem em situações do mundo real. Tem...</p>
<p>O post <a href="https://diegonogare.net/2024/12/review-do-livro-the-llm-engineers-handbook/">Review do livro &#8220;The LLM Engineer&#8217;s Handbook&#8221;</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></description>
										<content:encoded><![CDATA[<p>Fiz mais um review, desta vez, do livro &#8220;The LLM Engineer&#8217;s Handbook&#8221; escrito por Paul Iusztin e Maxime Labonne e publicado pela Packt. A obra aborda um assunto que vem crescendo muito nos ultimos meses que é a Engenharia LLM para implementar, otimizar e implantar grandes modelos de linguagem em situações do mundo real. Tem como objetivo fornecer um guia abrangente para as melhores práticas neste campo, cobrindo de ponta a ponta o ciclo de vida de desenvolvimento de IA Generativa, passando desde a aquisição e preparação dos dados à implantação em produção.</p>
<p>Ele também destaca a importância do Machine Learning Operations (MLOps) para gerenciar a complexidade e a escala dos projetos LLM. Para minha surpresa positiva, o livro também fornece uma base inicial nos princípios de MLOps (no apêndice do livro).</p>
<p>O livro foi escrito com uma abordagem prática, desenvolvendo um projeto de ponta a ponta chamado LLM Twin, que é um aplicativo que imita o estilo de escrita e a personalidade de uma pessoa. Este projeto serve como um exemplo do mundo real ao longo do livro para solidificar os principais conceitos e técnicas estudados, além de ter o objetivo fornecer práticas e dicas de especialistas para cada estágio do ciclo de vida do LLM.</p>
<h2>Review dos capítulos do livro</h2>
<p>São 11 capítulos mais o apêndice, e aqui está um review do livro separado pelo que é abordado em cada capítulo:</p>
<ul>
<li>O <strong>Capítulo 1</strong> apresenta o projeto LLM Twin e primeiramente define a arquitetura FTI (Feature, Train, Inference) para construir sistemas ML escaláveis.</li>
<li>O <strong>Capítulo 2</strong> apresenta as ferramentas essenciais para construir aplicativos LLM. Inclui Python, ferramentas MLOps e recursos de nuvem (mas até nos orienta a instalá-los localmente para teste e desenvolvimento).</li>
<li>O <strong>Capítulo 3</strong> se concentra na engenharia de dados, embora ensine como implementar um pipeline de coleta de dados de várias fontes. Ele destaca a importância de coletar dados dinâmicos do mundo real.</li>
<li>O <strong>Capítulo 4</strong> apresenta os fundamentos da Retrieval-Augmented Generation (RAG), incluindo embeddings, bancos de dados vetoriais e estratégias de otimização.</li>
<li>O <strong>Capítulo 5</strong> explora de fato o ajuste fino supervisionado, abrangendo a criação de conjuntos de dados de alta qualidade e técnicas de ajuste fino, como ajuste fino completo, LoRA e QLoRA. Ele também inclui uma demonstração prática usando um modelo Llama 3.1 8B.</li>
<li>O <strong>Capítulo 6</strong> se aprofunda no ajuste fino com alinhamento de preferências, focando especificamente na Otimização de Preferência Direta (DPO). Ele inclui como criar conjuntos de dados de preferências personalizados e uma demonstração prática do alinhamento do modelo TwinLlama-3.1-8B.</li>
<li>O <strong>Capítulo 7</strong> detalha vários métodos para avaliar o desempenho do LLM, abrangendo avaliações de uso geral e específicas de domínio. Mas também demonstra uma avaliação do modelo Llama 3.1 8B ajustado.</li>
<li>O <strong>Capítulo 8</strong> abrange estratégias de otimização de inferência, como decodificação especulativa, paralelismo de modelo e quantização de peso para melhorar a velocidade e reduzir a latência.</li>
<li>O <strong>Capítulo 9</strong> explora técnicas avançadas de RAG implementando métodos como, por exemplo, autoconsulta, reclassificação e pesquisa vetorial filtrada.</li>
<li>O <strong>Capítulo 10</strong> apresenta estratégias de implantação de ML, incluindo inferência online, assíncrona e em lote. Embora também mostra como implantar o modelo no <a href="https://diegonogare.net/2024/04/temos-mais-de-3200-usuarios-no-sagemaker-studio/" target="_blank" rel="noopener">Sagemaker</a>, construir um microsserviço FastAPI para expor o pipeline de inferência do RAG.</li>
<li>O <strong>Capítulo 11</strong> explica o LLMOps, começando com suas raízes no DevOps e MLOps, incluindo como implantar o projeto LLM Twin na nuvem. Embora também explique como conteinerizar o código usando o Docker e construir um pipeline de CI/CD/CT (Integração, Implantação e Treinamento Contínuos), além do mais, também ensina como adicionar uma camada de monitoramento rápido ao pipeline.</li>
</ul>
<h2>Minhas impressões</h2>
<p>Se você estudar seriamente, ao final do livro, de fato entenderá como coletar e preparar dados para LLMs, ajustar modelos, otimizar inferência e implementar pipelines RAG. Mas também aprenderá como avaliar desempenho, alinhar modelos com preferências humanas e implantar aplicativos baseados em LLM. Mesmo eu considerando que é util ter o básico de Python, o livro explica conceitos do zero, fazendo a leitura ser acessível para todos, inclusive os que são novos em IA e machine learning.</p>
<p>Não posso deixar de mencionar que a qualidade da produção é realmente bonita e útil. As imagens coloridas nos ajudam a entender melhor os diagramas e o design da arquitetura.</p>
<p>A versão digital do livro está na Amazon por volta de 250 reais reais: <a href="https://amzn.to/4a16Deg" target="_blank" rel="noopener">https://amzn.to/4a16Deg</a>. Já na Packt você consegue por menos de 10 dólares: <a href="https://www.packtpub.com/en-us/product/llm-engineers-handbook-9781836200062" target="_blank" rel="noopener">https://www.packtpub.com/en-us/product/llm-engineers-handbook-9781836200062</a></p>
<p>Bons estudos!</p>
<p>O post <a href="https://diegonogare.net/2024/12/review-do-livro-the-llm-engineers-handbook/">Review do livro &#8220;The LLM Engineer&#8217;s Handbook&#8221;</a> apareceu primeiro em <a href="https://diegonogare.net">Diego Nogare</a>.</p>
]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">3929</post-id>	</item>
	</channel>
</rss>
