Review do livro “Generative AI on Google Cloud with LangChain”
Por
Diego Nogare
em
O post da semana, mais uma vez, é de um review… desta vez é o review do livro “Generative AI on Google Cloud with LangChain: Design scalable generative AI solutions with Python, LangChain, and Vertex AI on Google Cloud” escrito por Leonid Kuligin, Jorge Zaldívar e Maximilian Tschochohei, e publicado pela Packt. Os três autores são AI Engineer no Google e na minha visão prepararam este livro para ser um guia prático separados em 13 capítulos, vejo como um bom ponto de partida para quem deseja construir aplicações de IA Generativa robustas e escaláveis utilizando GCP, a Gloud da Google, combinado com a flexibilidade do framework LangChain. Inclusive o prefácio foi escrito por Harrison Chase, CEO da LangChain.
Se você está pensando em comprar este livro, ou está apenas curioso sobre seu conteúdo, leia até este post porque eu preparei um resumo do que esperar de cada capítulo.
Review dos capítulos do livro
São 13 capítulos, separados em 4 partes, além de dois apêndices:
Capítulo 1: Using LangChain with Google Cloud – Este capítulo estabelece a base, introduzindo o LangChain, seus pilares como chains e runnables (incluindo a LangChain Expression Language – LCEL), e os principais elementos para trabalhar com isso. Ele foca especificamente em como integrar e utilizar o LangChain com os serviços do Google Cloud, preparando o terreno para as aplicações práticas;
Capítulo 2: Foundational Models on Google Cloud – Aqui, o foco muda para os modelos de linguagem grandes (LLMs) disponíveis no ecossistema do Google Cloud, principalmente através do Vertex AI (como os modelos Gemini). Você aprenderá sobre o Vertex AI Model Garden, como usar templates de prompt, interagir com modelos de chat, utilizar callbacks e os fundamentos da engenharia de prompts para otimizar as respostas desses modelos;
Capítulo 3: Grounding Responses – Este capítulo aborda o desafio crítico das “alucinações” em LLMs. Ele introduz o conceito de Retrieval-Augmented Generation (RAG) como uma possível solução, explicando como funciona e como construir aplicações RAG customizadas, utilizando também o Vertex AI Agent Builder para criar DataStores e agentes que fornecem respostas baseadas em fontes de dados confiáveis;
Capítulo 4: Vector Search on Google Cloud – Fundamental para RAG, a busca vetorial é aprofundada neste capitulo. O texto explora o conceito de Vector Stores e embeddings, demonstrando como implementar e usar soluções de busca vetorial no Google Cloud, incluindo o Vertex AI Vector Search, PGVector (o PG vem do PostGres) no Cloud SQL e capacidades de busca vetorial no BigQuery;
Capítulo 5: Ingesting Documents – Para que o RAG funcione, os dados precisam ser ingeridos, processados e indexados. Este capítulo explica sobre as técnicas e ferramentas para ingestão de documentos usando LangChain (loaders, parsers, chunking), como aproveitar o Document AI do Google Cloud para análise de documentos mais complexa e como usar o Vertex AI Agent Builder para simplificar o processo de ingestão;
Capítulo 6: Multimodality – Indo além do texto, este capítulo explora as capacidades multimodais dos modelos mais recentes, como o Gemini. Você aprenderá como usar LangChain para processar e gerar conteúdo que combina texto e imagem, e potencialmente outros formatos, incluindo o uso do Imagen (modelo proprietário do Google para trabalhar com geração de imagem) e a construção de RAGs multimodais;
Capítulo 7: Working with Long Context – LLMs têm limitações quanto ao tamanho do contexto que podem processar. Este capítulo aborda estratégias para lidar com documentos longos, como diferentes técnicas de sumarização e métodos para realizar perguntas e respostas (Q&A) sobre textos extensos sem perder informação crucial;
Capítulo 8: Building Chatbots – Este capítulo foca na criação de interfaces conversacionais. Abrange conceitos essenciais como gerenciamento de memória de conversa, diferentes tipos de memória e como construir chatbots que podem interagir de forma coerente ao longo de múltiplas trocas de mensagens, inclusive integrando RAG para respostas mais informadas;
Capítulo 9: Tools and Function Calling – Aqui é explorado como capacitar LLMs a interagir com o mundo exterior. O capítulo ensina como definir e usar “ferramentas” (APIs, bancos de dados, etc.) que o LLM pode invocar para obter informações atualizadas ou executar ações, um conceito crucial para agentes autônomos;
Capítulo 10: Agents – Este capítulo mergulha no conceito de agentes de IA generativa. Explica o que são, os diferentes tipos (como ReAct, Plan-and-Execute), como eles usam LLMs para raciocinar e tomar decisões, e como construí-los usando LangChain para realizar tarefas complexas de forma autônoma;
Capítulo 11: Agentic Workflows – Expandindo o capítulo anterior, este aborda como orquestrar múltiplos agentes ou etapas complexas de raciocínio. Cobre tópicos como planejamento, decomposição de tarefas e explica como criar sistemas mais sofisticados onde agentes que colaboram ou seguem fluxos de trabalho predefinidos (fala superficialmente sobre o LangGraph);
Capítulo 12: Evaluating GenAI Applications – Construir o modelo é apenas uma parte do desafio; avaliar sua performance é essencial. Este capítulo discute métricas e técnicas para avaliar a qualidade, precisão, segurança e desempenho de aplicações de IA generativa, um passo essencial antes de levar para produção;
Capítulo 13: Generative AI System Design – Este capítulo oferece uma visão de mais alto nível sobre o design de sistemas complexos de IA generativa, considerando escalabilidade, confiabilidade, custos e integração com a infraestrutura existente no Google Cloud.
Apêndice 1 – Overview of Generative AI – Este apêndice funciona como um nivelamento conceitual, ideal para quem busca solidificar ou revisar os fundamentos da IA Generativa antes de mergulhar nas implementações práticas com LangChain e Google Cloud. Ele trás de forma rápida e direta uma definição de IA Generativa, os tipos de modelos mais comuns (LLMs e modelos de difusão), explica termos essenciais como prompts, tokens e embeddings, e contextualiza as principais aplicações e o impacto dessa tecnologia, garantindo uma introdução para acompanhar os capítulos principais. Se for seu primeiro contato com o assunto, talvez valha a pena começar por aqui.
Apêndice 2 – Google Cloud Foundations – É uma introdução ao GCP, ajuda quem não tem experiência prévia com a plataforma de Cloud da Google. Este trás um panorama dos principais serviços utilizados ao longo do livro. Ele introduz componentes importantes da infraestrutura do GCP (Compute Engine, Cloud Storage), serviços de dados relevantes (BigQuery, Cloud SQL) e, para surpresa de zero pessoas, entra em mais detalhes dos produtos da Vertex AI, incluindo seus recursos específicos para IA Generativa como o Model Garden, Pipelines e Vector Search, fornecendo o conhecimento básico necessário sobre a plataforma da nuvem.
Minhas impressões
Posso dizer que este review do livro “Generative AI on Google Cloud with LangChain” realmente parece ser um guia abrangente e prático, ele cobre desde os fundamentos do LangChain e dos modelos encontrados no Vertex AI, até arquiteturas complexas como RAG e Agentes. Não deixa de fora aspectos importantes de projetos como avaliação de performance e MLOps. O foco exclusivo no ecossistema Google Cloud (lembra que foi escrito por especialistas da Google??) torna o livro útil para quem trabalha, ou planeja trabalhar, com GCP.
A imagem de capa desta publicação foi feita com ChatGPT pedindo para transformar a foto original no estilo da Turma da Monica. Também pedi pra fazer no estilo dpo Shiryu de Dragão dos Cavaleiros do Zodiaco. Abaixo estão as duas imagens, tanto a original quanto a versão do Shiryu.
Imagem original do review do livro Generative AI on Google Cloud with LangChain
Imagem no estilo Cavaleiros do Zodiaco, mas ignorou o livro
Imagem no estilo Cavaleiros do Zodiaco, porém, com o livro