Arquivos python - Diego Nogare

Review do Livro “Generative AI with Python and PyTorch – 2nd edition”

Diego Nogare — Wed, 02 Jul 2025 20:12:49 +0000

Fiz mais um review de livro da Editora Packt, desta vez foi do Generative AI with Python and PyTorch – 2nd edition, escrito por Joseph Babcock e Raghav Bali. É um livro que trás uma abordagem prática , principalmente, para aprender a usar LLM com Python. O livro cobre a construção de aplicações de IA Generativa, tanto para texto quanto para imagem, além de falar do futuro da IA Generativa.

Pode-se considerar um guia completo, bem como, apresenta desde os fundamentos teóricos até a implementação de projetos práticos e relevantes no cenário atual da IA. Diferente da primeira edição (de 2021) que usava TensorFlow, esta nova versão foi totalmente atualizada para PyTorch, que é um dos frameworks mais populares em pesquisa e desenvolvimento de deep learning.

Aprenda a usar LLM com Python

O livro está dividido em 15 capítulos, e é possível identificar implicitamente (diferente de algumas obras da O’Reilly que são explícitos) os agrupamento sobre os tópicos dos capítulos. Coloquei a minha percepção de separação dos grupos e os capítulos dentro destas partes, mas lembre-se, isso é implícito e eu fiz a partir das vozes da minha cabeça.

Parte 1 – Fundamentos

Capítulo 1: Introduction to Generative AI: Drawing data from models

Este capítulo é a base de tudo. O mais interessante aqui é como os autores distinguem de forma clara os modelos generativos dos discriminativos, não apenas na teoria, mas mostrando o porquê de os modelos generativos serem tão poderosos para tarefas como aumento de dados e criação de conteúdo. Esta base estabelece o cenário para todo o resto do livro.

Capítulo 2: Building blocks of deep neural network

Para quem está assumindo que é um capítulo de NoCode/LowCode, contudo, pode mudar essa expectativa! Este capítulo faz o trabalho de um excelente nivelamento de conteúdo. Trás as Redes Neurais desde lá o princípio, explica a ideia do Perceptron e depois do Multi-Layer Perceptron. O ponto alto é que ele não se limita ao básico, mas avança rapidamente para arquiteturas mais robustas como Redes Neurais Convolucionais (CNNs) para visão computacional, e a arquitetura de Transformers, preparando o leitor com o ferramental teórico necessário para entender os modelos que são explicados nos capítulos seguintes.

Parte 2 – Operações com texto

Capítulo 3: The rise of method for text generation

Aqui a jornada prática na geração de texto começa. O interessante é ver a evolução, partindo das representações de palavras (com BagOfWords e Word2Vec) e chegando, principalmente, às redes LSTMs. O capítulo traz um projeto prático de um modelo de linguagem em nível de caractere, permitindo que o leitor sinta os desafios da geração de texto antes de saltar para os modelos mais complexos.

Capítulo 4: NLP 2.0: Using transformers to generate text

Este é um capítulo que desmistifica a tecnologia por trás dos LLMs. O foco, principalmente, é o mecanismo de atenção (attention) e como ele permitiu a criação da arquitetura Transformers. Explica sobre a arquitetura de Encoding, Decoding e Encoding-Decoding. Além disso apresenta aquela imagem conhecida da árvore de evolução dos modelos de NLP que tem no material de Yang et al. (2024).

Yang, J., Jin, H., Tang, R., Han, X., Feng, Q., Jiang, H., Zhong, S., Yin, B. and Hu, X., 2024. Harnessing the power of llms in practice: A survey on chatgpt and beyond. ACM Transactions on Knowledge Discovery from Data, 18(6), pp.1-32.

Que pode ser acessado diretamente em https://dl.acm.org/doi/full/10.1145/3649506

Árvore de evolução de LLM

Tem alguns Hands-On para implementação usando modelos como BERT e GPT.

Parte 3 – Operações com LLMs

Capítulo 5: LLM Foundations

Aqui o livro mergulha nos Large Language Models. O ponto de interesse é a abordagem prática de técnicas de treinamento avançadas, como o Instruction Fine-Tuning e o Reinforcement Learning with Human Feedback (RLHF), que são exatamente os métodos usados para refinar modelos como o ChatGPT, inclusive com hands-on pra estas duas técnicas. Há um projeto prático que mostra como aplicar o RLHF, o que é um diferencial enorme.

Capítulo 6: Open-Source LLMs

Este capítulo é relativamente atual (afinal, o livro é de Março/2025 e eu escrevo esse texto em Julho/2025) e relevante. Ele funciona como um guia prático pelo zoológico de LLMs open-source, como Llama, Mixtral e Falcon. O interessante é que ele não apenas lista os modelos, mas discute suas arquiteturas e pontos fortes, capacitando o leitor a escolher o modelo certo para seu projeto sem depender de APIs pagas.

Parte 3.1 – Técnicas para LLMs

Capítulo 7: Prompt Engineering

Mais do que apenas “como conversar com a IA”, este capítulo aborda a engenharia de prompts como uma disciplina técnica. O destaque vai para a exploração de técnicas avançadas como CoT (Chain-of-Thought – Cadeia de Pensamentos) e ReAct (Reasoning in Action – Raciocínio em Ação), mostrando como estruturar prompts para que os LLMs possam resolver problemas complexos passo a passo.

Capítulo 8: LLM Toolbocx

O ponto alto deste capítulo é a introdução à ferramentas que orbitam os LLMs, principalmente LangChain. Ele ensina DEvs a como construir aplicações complexas que integram LLMs com fontes de dados externas, criando sistemas mais especializados nos seus negócios com o uso de Retrieval-Augmented Generation (RAG).

Capítulo 9: LLM Optimization techniques

Treinar e rodar LLMs é caro (Muito caro! Já falei que treinar um LLM é muito caro?). Mas o grande valor deste capítulo é o foco em soluções práticas para este problema (Lembra, treinar um modelo de LLM é caro!). Ele explora técnicas de otimização de fine-tuning, como Parameter Efficient Fine Tuning (PEFT) e Low-Rank Approximation (LoRA), que permitem adaptar modelos enormes com muito menos recursos computacionais, tornando a tecnologia mais acessível para devs e pequenas empresas.

Parte 4 – Aplicações emergentes em GenAI

Capítulo 10: Emerging applications in Generative AI

Este capítulo começa a olhar para o futuro, contudo, trás uma discussão sobre para onde o esta disciplina está indo, explorando novos usos para os LLMs e os avanços que estão na fronteira da pesquisa. Ele serve como uma fonte de inspiração, mostrando o vasto potencial ainda inexplorado (segundo os autores) da IA Generativa.

Parte 5 – Manipulação de Imagens

Capítulo 11: Neural Networks using VAEs

Mudando o foco de texto para imagens, este capítulo apresenta os Variational Autoencoders (VAEs). O mais fascinante é entender como esses modelos aprendem a comprimir dados (como imagens) em uma representação latente e, em seguida, usam essa representação para gerar novos dados. É a base para muitas tarefas de geração e manipulação de imagens. Ah, não se assuste com a parte matemática, é importante para não achar que é tudo mágica!

Parte 5.1 – Gans

Capítulo 12: Image generation with GANs

As Generative Adversarial Networks (GANs) são uma das ideias mais elegantes em Machine Learning. Principalmente porque este capítulo explica a dinâmica de “competição” entre o gerador e o discriminador. Ele vai além da teoria, mostrando como implementar uma GAN na prática para gerar imagens realistas.

Se quiser ver uma GAN, com dígitos numéricos, dá uma olhada aqui no meu Github.

Capítulo 13: Style transfer with GANs

Este capítulo é interessante, dá pra fazer várias coisas divertidas com transferência de estilos em visão computacional. Os autores mostram, principalmente, uma aplicação com GANs para transferência de estilo. Você conseguirá criar um modelo que pode pegar o conteúdo de uma foto e, do mesmo modo, redesenhá-lo no estilo de um pintor famoso, como Van Gogh, uma demonstração visualmente impressionante do poder desses modelos. Ah, a discussão sobre direitos autorais não entra aqui no jogo!

Capítulo 14: Deep fake with GANs

Apesar do nome remeter à coisas ruins (principalmente por influência dos portais de notícias que vendem caos pra conseguir uns cliques a mais nas matérias), a tecnologia de deepfake tem aplicações legítimas. Este capítulo permite entender a arquitetura por trás da troca de rostos em vídeos. Ele aborda a tecnologia de forma teórica, mas, mostrando como as GANs são usadas para manipulação de imagem em um nível avançado e também discutindo as implicações éticas. Tem parte de código para você reproduzir no seu ambiente com GPUs.

Parte 5.2 – Arquitetura Diffusion

Capítulo 15: Diffusion modelos and AI art

Este capítulo aborda a tecnologia por trás de geradores de imagem como DALL-E 2 e arquitetura Stable Diffusion. Contudo, o mais interessante é desmistificar o processo de difusão, que funciona “destruindo” e depois “reconstruindo” uma imagem. Ele traz a teoria e a prática dos modelos que definem o estado da arte na geração de imagens no período de escrita do livro (publicado em março/2025).

Para encerrar

Minha impressão do livro é grande, principalmente, porque cobre muitas técnicas e apresenta código para reproduzir nos nossos ambiente. Com isso, você aprende a usar LLM com Python. Apresenta técnicas para texto, bem como, para imagem.

A versão digital deste livro, na Amazon, está um pouco menos de R$200. Mas na Packt, você consegue comprá-lo por volta de R$80.

Bons estudos e que sua jornada de aprendizado seja tão enriquecedora quanto as soluções que você pode criar com IA Generativa!

O post Review do Livro “Generative AI with Python and PyTorch – 2nd edition” apareceu primeiro em Diego Nogare.

Review do livro “Generative AI on Google Cloud with LangChain”

Diego Nogare — Sun, 13 Apr 2025 23:28:38 +0000

O post da semana, mais uma vez, é de um review… desta vez é o review do livro “Generative AI on Google Cloud with LangChain: Design scalable generative AI solutions with Python, LangChain, and Vertex AI on Google Cloud” escrito por Leonid Kuligin, Jorge Zaldívar e Maximilian Tschochohei, e publicado pela Packt. Os três autores são AI Engineer no Google e na minha visão prepararam este livro para ser um guia prático separados em 13 capítulos, vejo como um bom ponto de partida para quem deseja construir aplicações de IA Generativa robustas e escaláveis utilizando GCP, a Gloud da Google, combinado com a flexibilidade do framework LangChain. Inclusive o prefácio foi escrito por Harrison Chase, CEO da LangChain.

Se você está pensando em comprar este livro, ou está apenas curioso sobre seu conteúdo, leia até este post porque eu preparei um resumo do que esperar de cada capítulo.

Review dos capítulos do livro

São 13 capítulos, separados em 4 partes, além de dois apêndices:

Capítulo 1: Using LangChain with Google Cloud – Este capítulo estabelece a base, introduzindo o LangChain, seus pilares como chains e runnables (incluindo a LangChain Expression Language – LCEL), e os principais elementos para trabalhar com isso. Ele foca especificamente em como integrar e utilizar o LangChain com os serviços do Google Cloud, preparando o terreno para as aplicações práticas;

Capítulo 2: Foundational Models on Google Cloud – Aqui, o foco muda para os modelos de linguagem grandes (LLMs) disponíveis no ecossistema do Google Cloud, principalmente através do Vertex AI (como os modelos Gemini). Você aprenderá sobre o Vertex AI Model Garden, como usar templates de prompt, interagir com modelos de chat, utilizar callbacks e os fundamentos da engenharia de prompts para otimizar as respostas desses modelos;

Capítulo 3: Grounding Responses – Este capítulo aborda o desafio crítico das “alucinações” em LLMs. Ele introduz o conceito de Retrieval-Augmented Generation (RAG) como uma possível solução, explicando como funciona e como construir aplicações RAG customizadas, utilizando também o Vertex AI Agent Builder para criar DataStores e agentes que fornecem respostas baseadas em fontes de dados confiáveis;

Capítulo 4: Vector Search on Google Cloud – Fundamental para RAG, a busca vetorial é aprofundada neste capitulo. O texto explora o conceito de Vector Stores e embeddings, demonstrando como implementar e usar soluções de busca vetorial no Google Cloud, incluindo o Vertex AI Vector Search, PGVector (o PG vem do PostGres) no Cloud SQL e capacidades de busca vetorial no BigQuery;

Capítulo 5: Ingesting Documents – Para que o RAG funcione, os dados precisam ser ingeridos, processados e indexados. Este capítulo explica sobre as técnicas e ferramentas para ingestão de documentos usando LangChain (loaders, parsers, chunking), como aproveitar o Document AI do Google Cloud para análise de documentos mais complexa e como usar o Vertex AI Agent Builder para simplificar o processo de ingestão;

Capítulo 6: Multimodality – Indo além do texto, este capítulo explora as capacidades multimodais dos modelos mais recentes, como o Gemini. Você aprenderá como usar LangChain para processar e gerar conteúdo que combina texto e imagem, e potencialmente outros formatos, incluindo o uso do Imagen (modelo proprietário do Google para trabalhar com geração de imagem) e a construção de RAGs multimodais;

Capítulo 7: Working with Long Context – LLMs têm limitações quanto ao tamanho do contexto que podem processar. Este capítulo aborda estratégias para lidar com documentos longos, como diferentes técnicas de sumarização e métodos para realizar perguntas e respostas (Q&A) sobre textos extensos sem perder informação crucial;

Capítulo 8: Building Chatbots – Este capítulo foca na criação de interfaces conversacionais. Abrange conceitos essenciais como gerenciamento de memória de conversa, diferentes tipos de memória e como construir chatbots que podem interagir de forma coerente ao longo de múltiplas trocas de mensagens, inclusive integrando RAG para respostas mais informadas;

Capítulo 9: Tools and Function Calling – Aqui é explorado como capacitar LLMs a interagir com o mundo exterior. O capítulo ensina como definir e usar “ferramentas” (APIs, bancos de dados, etc.) que o LLM pode invocar para obter informações atualizadas ou executar ações, um conceito crucial para agentes autônomos;

Capítulo 10: Agents – Este capítulo mergulha no conceito de agentes de IA generativa. Explica o que são, os diferentes tipos (como ReAct, Plan-and-Execute), como eles usam LLMs para raciocinar e tomar decisões, e como construí-los usando LangChain para realizar tarefas complexas de forma autônoma;

Capítulo 11: Agentic Workflows – Expandindo o capítulo anterior, este aborda como orquestrar múltiplos agentes ou etapas complexas de raciocínio. Cobre tópicos como planejamento, decomposição de tarefas e explica como criar sistemas mais sofisticados onde agentes que colaboram ou seguem fluxos de trabalho predefinidos (fala superficialmente sobre o LangGraph);

Capítulo 12: Evaluating GenAI Applications – Construir o modelo é apenas uma parte do desafio; avaliar sua performance é essencial. Este capítulo discute métricas e técnicas para avaliar a qualidade, precisão, segurança e desempenho de aplicações de IA generativa, um passo essencial antes de levar para produção;

Capítulo 13: Generative AI System Design – Este capítulo oferece uma visão de mais alto nível sobre o design de sistemas complexos de IA generativa, considerando escalabilidade, confiabilidade, custos e integração com a infraestrutura existente no Google Cloud.

Apêndice 1 – Overview of Generative AI – Este apêndice funciona como um nivelamento conceitual, ideal para quem busca solidificar ou revisar os fundamentos da IA Generativa antes de mergulhar nas implementações práticas com LangChain e Google Cloud. Ele trás de forma rápida e direta uma definição de IA Generativa, os tipos de modelos mais comuns (LLMs e modelos de difusão), explica termos essenciais como prompts, tokens e embeddings, e contextualiza as principais aplicações e o impacto dessa tecnologia, garantindo uma introdução para acompanhar os capítulos principais. Se for seu primeiro contato com o assunto, talvez valha a pena começar por aqui.

Apêndice 2 – Google Cloud Foundations – É uma introdução ao GCP, ajuda quem não tem experiência prévia com a plataforma de Cloud da Google. Este trás um panorama dos principais serviços utilizados ao longo do livro. Ele introduz componentes importantes da infraestrutura do GCP (Compute Engine, Cloud Storage), serviços de dados relevantes (BigQuery, Cloud SQL) e, para surpresa de zero pessoas, entra em mais detalhes dos produtos da Vertex AI, incluindo seus recursos específicos para IA Generativa como o Model Garden, Pipelines e Vector Search, fornecendo o conhecimento básico necessário sobre a plataforma da nuvem.

Minhas impressões

Posso dizer que este review do livro “Generative AI on Google Cloud with LangChain” realmente parece ser um guia abrangente e prático, ele cobre desde os fundamentos do LangChain e dos modelos encontrados no Vertex AI, até arquiteturas complexas como RAG e Agentes. Não deixa de fora aspectos importantes de projetos como avaliação de performance e MLOps. O foco exclusivo no ecossistema Google Cloud (lembra que foi escrito por especialistas da Google??) torna o livro útil para quem trabalha, ou planeja trabalhar, com GCP.

Hoje o livro na Amazon está por pouco mais de 200 reais e pode ser comprado neste link. Já direto no site da Packt, o valor hoje está em R$ 80 e pode ser comprado neste link. Ah, as duas versões são em formato digital.

Caso queira ver todos os outros reviews de livros, acesse a tag: Review de Livros.

A imagem de capa desta publicação foi feita com ChatGPT pedindo para transformar a foto original no estilo da Turma da Monica. Também pedi pra fazer no estilo dpo Shiryu de Dragão dos Cavaleiros do Zodiaco. Abaixo estão as duas imagens, tanto a original quanto a versão do Shiryu.

Imagem original do review do livro Generative AI on Google Cloud with LangChain

Imagem no estilo Cavaleiros do Zodiaco, mas ignorou o livro

Imagem no estilo Cavaleiros do Zodiaco, porém, com o livro

O post Review do livro “Generative AI on Google Cloud with LangChain” apareceu primeiro em Diego Nogare.

Review do livro “The LLM Engineer’s Handbook”

Diego Nogare — Mon, 30 Dec 2024 14:03:30 +0000

Fiz mais um review, desta vez, do livro “The LLM Engineer’s Handbook” escrito por Paul Iusztin e Maxime Labonne e publicado pela Packt. A obra aborda um assunto que vem crescendo muito nos ultimos meses que é a Engenharia LLM para implementar, otimizar e implantar grandes modelos de linguagem em situações do mundo real. Tem como objetivo fornecer um guia abrangente para as melhores práticas neste campo, cobrindo de ponta a ponta o ciclo de vida de desenvolvimento de IA Generativa, passando desde a aquisição e preparação dos dados à implantação em produção.

Ele também destaca a importância do Machine Learning Operations (MLOps) para gerenciar a complexidade e a escala dos projetos LLM. Para minha surpresa positiva, o livro também fornece uma base inicial nos princípios de MLOps (no apêndice do livro).

O livro foi escrito com uma abordagem prática, desenvolvendo um projeto de ponta a ponta chamado LLM Twin, que é um aplicativo que imita o estilo de escrita e a personalidade de uma pessoa. Este projeto serve como um exemplo do mundo real ao longo do livro para solidificar os principais conceitos e técnicas estudados, além de ter o objetivo fornecer práticas e dicas de especialistas para cada estágio do ciclo de vida do LLM.

Review dos capítulos do livro

São 11 capítulos mais o apêndice, e aqui está um review do livro separado pelo que é abordado em cada capítulo:

O Capítulo 1 apresenta o projeto LLM Twin e primeiramente define a arquitetura FTI (Feature, Train, Inference) para construir sistemas ML escaláveis.
O Capítulo 2 apresenta as ferramentas essenciais para construir aplicativos LLM. Inclui Python, ferramentas MLOps e recursos de nuvem (mas até nos orienta a instalá-los localmente para teste e desenvolvimento).
O Capítulo 3 se concentra na engenharia de dados, embora ensine como implementar um pipeline de coleta de dados de várias fontes. Ele destaca a importância de coletar dados dinâmicos do mundo real.
O Capítulo 4 apresenta os fundamentos da Retrieval-Augmented Generation (RAG), incluindo embeddings, bancos de dados vetoriais e estratégias de otimização.
O Capítulo 5 explora de fato o ajuste fino supervisionado, abrangendo a criação de conjuntos de dados de alta qualidade e técnicas de ajuste fino, como ajuste fino completo, LoRA e QLoRA. Ele também inclui uma demonstração prática usando um modelo Llama 3.1 8B.
O Capítulo 6 se aprofunda no ajuste fino com alinhamento de preferências, focando especificamente na Otimização de Preferência Direta (DPO). Ele inclui como criar conjuntos de dados de preferências personalizados e uma demonstração prática do alinhamento do modelo TwinLlama-3.1-8B.
O Capítulo 7 detalha vários métodos para avaliar o desempenho do LLM, abrangendo avaliações de uso geral e específicas de domínio. Mas também demonstra uma avaliação do modelo Llama 3.1 8B ajustado.
O Capítulo 8 abrange estratégias de otimização de inferência, como decodificação especulativa, paralelismo de modelo e quantização de peso para melhorar a velocidade e reduzir a latência.
O Capítulo 9 explora técnicas avançadas de RAG implementando métodos como, por exemplo, autoconsulta, reclassificação e pesquisa vetorial filtrada.
O Capítulo 10 apresenta estratégias de implantação de ML, incluindo inferência online, assíncrona e em lote. Embora também mostra como implantar o modelo no Sagemaker, construir um microsserviço FastAPI para expor o pipeline de inferência do RAG.
O Capítulo 11 explica o LLMOps, começando com suas raízes no DevOps e MLOps, incluindo como implantar o projeto LLM Twin na nuvem. Embora também explique como conteinerizar o código usando o Docker e construir um pipeline de CI/CD/CT (Integração, Implantação e Treinamento Contínuos), além do mais, também ensina como adicionar uma camada de monitoramento rápido ao pipeline.

Minhas impressões

Se você estudar seriamente, ao final do livro, de fato entenderá como coletar e preparar dados para LLMs, ajustar modelos, otimizar inferência e implementar pipelines RAG. Mas também aprenderá como avaliar desempenho, alinhar modelos com preferências humanas e implantar aplicativos baseados em LLM. Mesmo eu considerando que é util ter o básico de Python, o livro explica conceitos do zero, fazendo a leitura ser acessível para todos, inclusive os que são novos em IA e machine learning.

Não posso deixar de mencionar que a qualidade da produção é realmente bonita e útil. As imagens coloridas nos ajudam a entender melhor os diagramas e o design da arquitetura.

A versão digital do livro está na Amazon por volta de 250 reais reais: https://amzn.to/4a16Deg. Já na Packt você consegue por menos de 10 dólares: https://www.packtpub.com/en-us/product/llm-engineers-handbook-9781836200062

Bons estudos!

O post Review do livro “The LLM Engineer’s Handbook” apareceu primeiro em Diego Nogare.

Review do livro “Extending Power BI with Python and R – Second Edition”

Diego Nogare — Mon, 03 Jun 2024 23:18:38 +0000

Fala galera! Fiz mais um review de livro, mas desta vez foi o “Extending Power BI with Python and R – Second Edition”, do meu amigo Luca Zavarella, que publicou pela Packt Pub. Me senti muito feliz com o convite dele para fazer esse review e compartilhar no blog, afinal, espero que você também estenda o Power BI com Python e R após ler este livro.

Bom, o Power BI é uma ferramenta da Microsoft poderosa para visualização de dados, mas vai muito além disso. Dessa forma, vasculhando alguns posts antigos, achei esse de 2013, falando sobre as novidades de BI no SQL Server 2014 e ainda nem tinha o Power BI.

Primeiramente, nos 22 capítulos deste livro, é possível explorar desde a integração de scripts R e Python até técnicas avançadas de análise e otimização. Em segundo lugar você irá aprender a configurar o R e o Python, a trabalhar com grandes conjuntos de dados, a detectar outliers e valores ausentes, a usar expressões regulares (o que é bem trabalhoso, vamos combinar!) e até incorporar Machine Learning em seus projetos. Aliás, independente de você ser um iniciante ou um usuário experiente, este livro completo com praticamente 800 paginas irá aprimorar suas habilidades no Power BI e ampliar suas possibilidades de análise de dados. Contudo, vou compartilhar contigo minhas impressões, para que você estenda o poder do Power BI com Python e R.

Vamos aos capítulos

1 – Integração de R e Python com o Power BI: Este capítulo abrange a integração de scripts R e Python com o Power BI, destacando sua utilidade além da simples visualização de dados. Explora como adicionar scripts R ou Python no Power BI, as ferramentas específicas para essa integração e as limitações desses scripts em diferentes produtos do Power BI.

2 – Configuração do R no Power BI: Foca na configuração do R com o Power BI, incluindo instalação, configuração de kernel R e ambientes de desenvolvimento.

3 – Configuração do Python no Power BI: Explora a integração do Python com o Power BI, abordando instalação, configuração de kernel Python e uso de ambientes virtuais.

4 – Solução de problemas comuns com Python e R no Power BI: Oferece soluções para problemas frequentes ao usar Python e R no Power BI.

5 – Importação de objetos de dados não tratados: Aborda a importação de arquivos RDS e PKL no Power BI, útil para dados processados externamente.

6 – Uso de expressões regulares no Power BI: Explora o uso de regex para busca e substituição em strings no Power BI, melhorando a limpeza de dados.

7 – Anonimização e pseudo-anonimização de dados no Power BI: Técnicas para proteger a privacidade dos dados usando scripts Python e R.

8 – Registro de dados do Power BI em fontes externas: Como extrair e registrar dados do Power BI em arquivos externos ou sistemas.

9 – Carregamento de grandes conjuntos de dados no Power BI: Técnicas para trabalhar com arquivos grandes usando Python e R.

10 – Aceleração do carregamento de dados com formato Parquet: Conversão de dados do formato CSV para Parquet para otimizar o desempenho.

11 – Chamando APIs externas para enriquecer seus dados: Extensão de dados usando APIs externas.

12 – Cálculo de colunas com algoritmos complexos: Distâncias: Uso de algoritmos para cálculos de distâncias.

13 – Cálculo de colunas com algoritmos complexos: Fuzzy Match: Técnicas avançadas de fuzzy match.

14 – Cálculo de colunas com algoritmos complexos: Problemas de otimização: Abordagem de problemas de otimização usando Python e R.

15 – Inclusão de insights estatísticos: Associações: Exploração de associações entre variáveis usando estatísticas.

16 – Inclusão de insights estatísticos: Outliers e valores ausentes: Detecção de outliers e imputação de valores ausentes.

17 – Uso de aprendizado de máquina sem licença premium ou incorporada: Integração de ML no Power BI.

18 – Uso de linguagens externas do SQL Server para análise avançada e integração de ML no Power BI: Uso de motores analíticos do Python e R no SQL Server e Azure SQL Managed Instance para o Power BI.

19 – Análise Exploratória de Dados (EDA): Foca na importância de compreender profundamente as características inerentes dos dados antes de aplicar modelos de ML. Introduz técnicas de EDA que ajudam na seleção de modelos adequados e na engenharia de features. Aborda limpeza de dados, relacionamentos entre variáveis e insights significativos para construir modelos precisos.

20 – Uso da gramática de gráficos em Python com plotnine (não achei uma tradução melhor, então fiz quase que literal): Guia abrangente sobre o pacote plotnine em Python, com paralelos ao popular ggplot2 em R. Explora a análise do conjunto de dados Titanic usando técnicas do plotnine, como criação de gráficos de barras e histogramas. Também aborda a integração do plotnine com o Power BI, incluindo instruções detalhadas para uso dessas visualizações no ambiente do Power BI.

21 – Visualizações avançadas: Criação de gráficos personalizados avançados, com foco em gráficos de barras circulares. Esses gráficos são úteis para exibir dados periódicos ou cíclicos de forma clara e eficiente. O capítulo aborda seleção e implementação de gráficos de pizza no R e no Power BI, além da integração de scripts R para renderizar gráficos complexos do ggplot2.

Só lembrando que não se deve usar gráficos com nome de comida, sejam eles pizza ou rosca. rss

22 – Visualizações interativas e personalizadas em R: Aprimoramento das visualizações de dados com interatividade, explorando a transição de gráficos estáticos para melhor interpretabilidade.

Minha opinião

Pessoalmente eu considero o Power BI uma ótima ferramenta. Afinal, o capítulo 17 e 18 trazem mais proximidade ao que tenho trabalhado nos últimos anos, e gostei realmente do que li. Na minha opinião é um material sólido para quem pretende aplicar as possibilidades que o R e o Python oferecem para seus projetos de DataViz. Embora o livro ofereca uma visão ampla, prática e aplicada, de como você poderá construir e utilizar estas técnicas. Nesse sentido, as referências e leituras adicionais te ajudarão aprofundar no contexto explicado no cap´tulo. Com o propósito de ajudar a validar o que você aprendeu, todo final de capítulo tem algumas perguntinhas que ajudam a fixar o conteúdo.

Em linhas gerais recomendo sim a leitura, principalmente para quem se interessa pelo assunto de DataViz. Enquanto escrevo esse texto, a versão digital está a venda na Amazon por um pouco mais de 250 reais.

Estenda o poder do Power BI com Python e R

A atualização do Github contendo os códigos não é tão frequente, afinal, há materiais com mais de 2 anos lá no repo. O que não é um problema, já que outros códigos são mais recentes.

Bons estudos!

O post Review do livro “Extending Power BI with Python and R – Second Edition” apareceu primeiro em Diego Nogare.

Review do livro “Transformer for natural language processing and computer vision – 3rd Edition”

Diego Nogare — Mon, 29 Apr 2024 20:00:07 +0000

Fiz mais um review de livro, como já tinha feito recentemente de MLOps, Azure Data Factory e algoritmos, mas desta vez foi “Transformer for natural language processing and computer vision – 3rd Edition“. O livro foi escrito por Denis Rothman e publicado pela Packt Pub. Neste livro você irá aprender sobre transformers para texto e visão computacional.

O livro e seus capítulos

Quero compartilhar minhas impressões iniciais, mas já sei que vou ter que ler mais vezes para realmente entender. Para mim esse assunto é novo, e achei difícil, por mais direto e didático que o Denis foi no livro, ainda sinto que é complexo e terei que estudar muito até ter confiança de sair falando de IA Generativa. O livro é uma leitura ampla, explica a arquitetura de transformers para texto e visão computacional. Em suas quase 700 páginas o livro possui 20 capítulos e está separado em três grandes grupos, sendo: Os Fundamentos dos Transformers; A Ascensão da NLP Supra-humana; Visão computacional generativa: uma nova maneira de ver o mundo.

Ao final de cada capítulo, acima de tudo, é possível ver as referências utilizadas para gerar o texto, além de algumas recomendações de leituras futuras para completar o aprendizado. FAlando em aprendizado, contudo, no final de cada capítulo você irá encontrar questões de Verdadeiro ou Falso sobre o que estudou. No final do livro tem o gabarito com as respostas, e algumas delas até tem uma explicação rápida da resposta correta.

Desde a arquitetura básica até aplicações práticas, este livro abrange:

Representações de Linguagem: Entenda como os transformers aprendem representações ricas para palavras e frases.
Tradução Automática: Discute como os transformers são usados para tradução de idiomas.
Visão Computacional: Descubra como aplicar os mesmos princípios aos dados de imagem.

Bom, vamos aos capítulos…

Capítulo 1

O que são transformer? O autor explica, de forma abrangente, o conceito de transformer e os modelos fundamentais. O texto trás a complexidade de tempo O(1) desses modelos, que, segundo o texto, revolucionou diversas áreas. Além disso, destaca como os transformers se tornaram dominantes e trouxeram avanços significativos em várias áreas de pesquisa. Transformers são importantes para texto e também para visão computacional.

Capítulo 2

Iniciando com a arquitetura do modelo transformer explora o contexto do Processamento de Linguagem Natural (NLP) e compreende como as arquiteturas de Redes Neurais Recorrentes (RNNs), Long Short-Term Memory (LSTM) e Redes Neurais Convolucionais (CNNs) foram abandonadas e abriram caminho para a arquitetura transformer. Nesse capítulo, o autor explora a arquitetura original do transformer, publicada no artigo científico Attention Is All You Need, desenvolvida por pesquisadores do Google Research e Google Brain. Além disso, descreve a teoria dos transformers e explora, na prática, como funcionam as subcamadas de múltiplas atenções em Python.

Capítulo 3

Em Tarefas emergentes vs. tarefas downstream: As profundezas invisíveis dos transformers, o autor estabelece uma conexão entre a arquitetura funcional e matemática dos transformers por meio da introdução do conceito de emergência. Em seguida, o autor aborda como medir o desempenho dos transformers antes de explorar diversas tarefas downstream, como o Standard Sentiment TreeBank (SST-2), a aceitabilidade linguística e os esquemas de Winograd.

Não sei como traduzir Downstream, então mantive com o nome original. Se você tiver uma tradução apropriada, me conte e eu atualizo o post

Capítulo 4

Já em Avanços em traduções com Google Trax, Google Translate e Gemini, o texto explora a tradução automática em três etapas. Primeiro, define o que é a tradução automática. Em seguida, explica o pré-processamento de um conjunto de dados do Workshop on
Statistical Machine Translation (WMT) de 2014. Por fim, demonstra como implementar códigos para traduções automáticas em Python.

Capítulo 5

Aprofundando no ajuste fino com BERT discute a arquitetura do transformer original. O Bidirectional Encoder Representations from Transformers (BERT) leva os transformers a uma nova e vasta maneira de perceber o mundo do NLP. Em vez de analisar uma sequência passada para prever uma sequência futura, o BERT analisa a toda a sequência! O autor explora as principais inovações da arquitetura do BERT e, em seguida, ajusta um modelo BERT passo a passo em um notebook do Google Colab.

Capítulo 6

No Pré-treinando um modelo RoBERTa do zero, o texto implementa um modelo de transformer RoBERTa a partir do zero usando PyTorch na Hugging Face. Primeiro, é treinado um tokenizador em um conjunto de dados personalizado. Em seguida, é feito um pré-treino de modelo de suporte ao cliente com IA generativa.

Capítulo 7

No capítulo de A revolução da IA Generativa com o ChatGPT, o autor explora as melhorias significativas e a disseminação dos modelos ChatGPT no cotidiano de desenvolvedores e usuários finais. Inicialmente, é apresentada a arquitetura dos modelos GPT da OpenAI. Em seguida, trabalha com a API do GPT-4 e seus hiper-parâmetros para implementar diversos exemplos de NLP em Python. Por fim, aprendemos como obter melhores resultados com Retrieval Augmented Generation (RAG). No capítulo é implementado um exemplo de RAG com o GPT-4.

Capítulo 8

Ajuste fino de modelos OpenAI GPT, é explorada a técnica de ajuste fino para aprimorar os modelos GPT disponíveis por meio da API. Com o ajuste fino é possível obter resultados de maior qualidade do que apenas com prompts. Além disso, permite treinar o modelo com mais exemplos do que caberia em um prompt e economizar tokens devido a prompts mais curtos. Essa abordagem também reduz a latência das respostas nas solicitações. Os modelos da OpenAI já foram treinados em uma grande quantidade de texto, mas o fine tuning permite adaptá-los para tarefas em áreas de negócios específicas.

Capítulo 9

Desvendando a caixa preta com ferramentas interpretáveis, o autor trás detalhes dos modelos de transformer, interpretando e visualizando suas tarefas. Apresenta o BertViz para visualizar as camadas de atenção, o Language Interpretability Tool (LIT) para rodar uma análise de componentes principais (PCA) e o LIME para visualizar os transformers por meio do aprendizado de dicionário. Além disso, os LLMs da OpenAI vão mais a fundo, permitindo visualizar a atividade de um neurônio em um transformer de forma interativa.

Capítulo 10

Em Investigando o papel dos Tokenizadores na formação de Modelos de transformadores, apresenta inicialmente as práticas recomendadas independentes de tokenizadores para avaliar a qualidade de um tokenizador. Descreve as diretrizes básicas para conjuntos de dados e tokenizadores sob a perspectiva da tokenização. O autor explora a abordagem de tokenizadores de palavras e subpalavras, e demonstra como um tokenizador pode moldar o treinamento e o desempenho de um modelo de transformers.

Capítulo 11

O capítulo com titulo Alavancando os incorporamentos de LLM como alternativa ao ajuste fino, explora por que a busca com incorporamento pode ser, às vezes, uma alternativa eficaz ao ajuste fino. São discutidas as vantagens e limitações dessa abordagem. Além disso, são explicados os fundamentos dos incorporamentos de texto. Para solidificar o aprendizado, implementa um código Python que lê um arquivo, o tokeniza e o incorpora com as bibliotecas Gensim e Word2Vec. Para concluir, você terá trabalhado desde o design de prompts até a engenharia avançada de prompts, utilizando incorporamentos para a RAG.

Capítulo 12

Rumo à rotulagem de papéis semânticos sem sintaxe com o ChatGPT e o GPT-4 explora os conceitos de modelos estocásticos sem sintaxe e não repetitivos. Utilizam o ChatGPT Plus com o GPT-4 para executar amostras de Semantic Role Labeling (SRL), com exemplos simples e complexos. Apresenta como um modelo de propósito geral reage às solicitações de SRL.

Capítulo 13

Em Sumarização com T5 e ChatGPT, o autor explica os conceitos e a arquitetura do modelo de transformer T5. Utiliza o T5 para resumir documentos com modelos da Hugging Face. Os exemplos neste capítulo estão relacionados a áreas jurídicas e médicas, buscando explorar a sumarização em domínios específicos do conhecimento. Também trás uma comparação das abordagens de sumarização entre o T5 e o ChatGPT.

Capítulo 14

Explorando os LLMs de ponta com o Vertex AI e o PaLM 2. Apresenta o Google PaLM 2, um modelo com 540 bilhões de parâmetros. O PaLM 2 é um modelo autoregressivo, com ativação densa e decodificador. Explora como o PaLM 2 pode executar diversas tarefas como chat, classificação e geração de texto. O capítulo implementa a API do PaLM 2 dontro da Vertex AI, para várias tarefas de NLP, incluindo mas não se limitando, à perguntas e respostas e sumarização. FInaliza o capítulo, inclusive, com o processo de ajuste fino no Vertex AI.

Capítulo 15

Em Protegendo os gigantes: mitigando riscos em LLMs, exploram os riscos associados aos Large Language Models (LLMs) e estratégias para tentar mitigar os riscos. Estes são alguns riscos e abordagens de mitigação:

Alucinações: LLMs podem gerar respostas falsas ou incorretas, inegavelmente, levando à desinformação;
Memorização: LLMs podem memorizar exemplos específicos de seus dados de treinamento, reproduzindo-os literalmente;
Comportamento emergente arriscado: LLMs podem exibir comportamento inesperado ou prejudicial devido à sua complexidade;
Desinformação: LLMs podem ocasionalmente gerar conteúdo que dissemina desinformação;
Operações de influência: Atacantes maliciosos podem explorar LLMs para manipular a opinião pública ou enganar os usuários;
Conteúdo prejudicial: LLMs podem produzir saídas sobretudo prejudiciais ou ofensivas, e até criminosas;
Ataques adversários (“Jailbreaks”): LLMs podem ser vulneráveis a manipulações intencional, comprometendo a integridade do conteúdo gerado.

A fim de mitigar esses riscos, empregam técnicas avançadas de engenharia de prompts. Isso inclui a implementação de um modelo de moderação, a manutenção de uma base de conhecimento, a análise de palavras-chave, o uso de pilotos de prompts, a moderação pós-processamento e a alavancagem de incorporamentos, entre outras…

Capítulo 16

O texto Além do texto: transformers de visão no amanhecer da IA revolucionária, explora os modelos de transformers que respeitam a estrutura básica do transformer original, mas fazem algumas extensões significativas. Isso gerou poderosos transformers para visão, como o ViT, CLIP, DALL-E e GPT-4V. O autor implementa transformer de visão em Python, utilizando o GPT-4V, e expande as interações de texto-para-imagem do DALL-3. É importante destacar que os transformers vão além de texto e chegam até visão computacional.

Capítulo 17

Em Transcendendo a fronteira entre imagem e texto com a Stable Difusion, o autor explora os modelos de difusão, apresentando o Stable Vision, que, aliás, criou uma onda incrível de imagens realistas que está se espalhando pelo mercado. Explica os princípios, a matemática e implementa um código de Stable Difusion no Keras. O texto analisa cada um dos principais componentes de um modelo de Stable Difusion e examina os códigos do Keras. Para finalizar, também discute um modelo de de texto-para-vídeo com a Hugging Face e um modelo de vídeo-para-texto com o TimeSformer da Meta.

Capítulo 18

Hugging Face AutoTrain: Treinando modelos de visão sem codificação explora como treinar um transformer de visão usando o AutoTrain da Hugging Face. O autor explica o processo de treinamento automatizado e o autor comenta os problemas imprevisíveis que demonstram por que até o aprendizado de máquina automatizado requer expertise humana. Este capítulo também trás uma discussão e mostra como explorar os limites de um modelo de visão computacional, independentemente de quão sofisticado ele seja.

Este desafio de re-treino automatizado está presente, inclusive, no Machine Learning tradicional. Não é algo exclusivo da IA Generativa

Capítulo 19

No caminho para a IA geral funcional com o HuggingGPT e seus pares demonstra como podemos usar modelos encadeados entre plataformas para resolver problemas complexos de classificação de imagens. O autor compara o HuggingGPT e o Google Cloud Vision no trabalho de identificação de imagens fáceis, difíceis e muito difíceis. Além disso, o capítulo comenta as abordagens clássicas e explora como encadear modelos.

Capítulo 20

Além dos prompts projetados por humanos com ideação generativa explora a ideação generativa, uma abordagem que automatiza a produção de ideias para conteúdo de texto e imagem. A fase de desenvolvimento destas ideações requer especialistas qualificados em IA. Já para o usuário final, a abordagem é uma experiência simples de point and click. O autor discute e nos faz pensar em ideias generativas éticas para empresas sem recursos de marketing, mas não se limita apenas à essa área de atuação.

Minha opinião

Na minha opinião é um material rico para conhecer e aplicar a arquitetura de transformers para texto e visão computacional, codificando com Python. O livro oferece uma visão ampla, porém prática e aplicada, de como a arquitetura funciona e vários detalhes sobre os modelo de linguagem e te visão. É uma leitura densa, e pra mim, vou ter que estudar mais porque achei o assunto complexo. Não é do meu cotidiano trabalhar com GenAI, e por isso quero estudar mais antes de sair falando besteira por ai. As referências e leituras adicionais ajudarão quando eu tiver tempo para aprofundar.

Em linhas gerais recomendo a leitura, principalmente para quem se interessa pelo assunto de Inteligência Artificial. A versão digital está na Amazon por um pouco menos de 250 reais enquanto escrevo esse texto.

Transformers para texto e visão computacional

A atualização do Github contendo os códigos é frequente, inclusive no momento que posto esse texto, a ultima atualização de código foi ontem 29/04/2024.

Bons estudos!

O post Review do livro “Transformer for natural language processing and computer vision – 3rd Edition” apareceu primeiro em Diego Nogare.

Machine Learning – Meu repositório no github

Diego Nogare — Mon, 25 Mar 2024 21:59:08 +0000

Seja bem-vindo ao meu repositório de Machine Learning no GitHub! Aqui, você encontrará os códigos que desenvolvi durante a disciplina de Aprendizagem de Máquina do doutorado no Mackenzie. Você encontrará diversos Jupyter Notebook para aprender Machine Learning utilizando Python e abordando desde Análise Exploratória Descritiva até implementações práticas de Aprendizado Supervisionado e Aprendizado não Supervisionado, além de boas práticas como Validação Cruzada, Grid Search e Serialização do Modelo e códigos que realizam comparações dos algoritmos estudados.

Navegue pelo repositório de machine learning com Python e execute todos os códigos no Google Colab para aprimorar suas habilidades em Machine Learning. E claro, colabore para que todos possamos aprender cada vez mais!

Meu repositório no github

O repositório é dedicado a compartilhar os códigos com resoluções de problemas de Machine Learning. Ajudam no entendimento desta área de atuação que vem crescido bastante nos últimos anos. Aqui você irá encontrar exemplos de algoritmos no repositório de machine learning com Python explicados de maneira detalhada (ao menos estou tentando deixar o mais detalhado que consigo, no tempo que tenho).

Os códigos estão organizados em grupos, onde há o nome do arquivo e uma breve descrição do que ele tem de implementação.

Análise exploratória descritiva

Existem os códigos que fazem a exploração de dados de um dataset de Detecção de Fraude e outro da Iris. Além de uma exploração de dados com os dígitos do MNIST.

Aprendizado supervisionado

Só coloquei os códigos de algoritmos de classificação, porém, tem KNN, Árvore de Decisão e Multi-Layer Perceptron (Rede Neural). Tem espaço para incluir outros algoritmos de classificação, como também há espaço para adicionar algoritmos de regressão, por que eu não subi nenhum.

Aprendizado não supervisionado

Apesar de já ter o arquivo para o DBScan e o K-Means, só o K-Means que escrevi os códigos… para o DBScan eu comecei a fazer a parte teórica mas não implementei nada. Há espaço para colaborar aqui também…

Além, é claro, de outros algoritmos que quiserem

Boas práticas

Tem códigos utilizando Validação Cruzada, Grid Search e Serialização de Modelos… Mas aqui também há espaço para trazerem mais boas práticas

Comparação de algoritmos

Para o trabalho de comparar os algoritmos, fiz a junção de vários códigos do repositório e então comparei KNN, Árvore de Decisão e Multi-Layer Perceptron para a base de dados MNIST… Como eu queria garantir que os dígitos testados não tivessem sido utilizados de forma alguma, criei uma rede adversaria generativa para que fosse possível criar dígitos artificiais. Então, com esses dígitos, eu posso testar os algoritmos em si e comparar seus resultados.

Animação com a geração artificial dos dígitos entre a época 0 e 100

De bonus ainda tem um código que fiz para juntar as imagens dos dígitos em cada uma das épocas e construir um gif animado. Assim fica bem legal ver a evolução das gerações de dígitos artificiais ao longo das épocas da GAN.

Contribua com o repositório de machine learning

Você já fez alguma coisa de ML e gostaria de subir nesse repositório? Se for até o final do Readme.md vai ver algumas instruções rápidas para contribuir além de uma playlist explicando como fazer isso. Mas mesmo assim, aqui está uma lsita simplificada de passos para contribuir:

Crie uma conta no GitHub: Se você ainda não tem uma, você pode criar uma gratuitamente no site do GitHub.
Fork do repositório: Abra o link do projeto e faça um “fork” dele. Isso cria uma cópia do projeto na sua conta do GitHub.
Clone o repositório para o seu computador: Use o comando git clone seguido do URL do seu fork para baixar o repositório para o seu computador.
Faça suas alterações: Faça as alterações que você acha que melhoram o projeto.
Commit suas alterações: Use o comando git commit -m seguido de uma mensagem descritiva para salvar suas alterações.
Push suas alterações para o GitHub: Use o comando git push origin seguido do nome da sua branch (main) para enviar suas alterações para o seu fork no GitHub.
Abra um Pull Request: Volte para o seu fork no GitHub, selecione a sua branch e clique no botão “New pull request”. Escreva uma descrição detalhada das suas alterações e então clique em “Create pull request”.

A partir disso eu recebo o seu PR, analiso o que você codou e faço o merge para o repositório. Dando os devidos créditos à você, é claro!

Quer estudar mais

Quer estudar os algoritmos e implementá-los no repositório de machine learning com Python? Com o livro Mãos à obra: aprendizado de máquina com scikit-learn & tensorflow você vai aprender bastante, assim como com Data Science do zero: noções fundamentais com Python. Então não deixe de estudar e se aperfeiçoar nessa disciplina!

O post Machine Learning – Meu repositório no github apareceu primeiro em Diego Nogare.

Ferramentas e plataformas essenciais para projetos de IA e ML

Diego Nogare — Thu, 08 Feb 2024 02:48:39 +0000

A Inteligência Artificial (IA) e o Machine Learning (ML) estão revolucionando o mundo da tecnologia, isso eu acredito que não é duvida para ninguém! Com o avanço dessas tecnologias, surgem também novas ferramentas e plataformas que facilitam o desenvolvimento de projetos nessa área. Neste texto, quero explorar algumas ferramentas e plataformas disponíveis para desenvolver projetos de IA e ML. Bora?!

Ferramentas de IA e ML

Primeiramente, é importante destacar que a escolha da ferramenta certa pode fazer toda a diferença em um projeto de IA ou ML. Entre as mais populares para Python estão TensorFlow, PyTorch e Keras. Essas ferramentas oferecem uma variedade de recursos que facilitam a implementação de algoritmos de ML.

O TensorFlow é uma biblioteca de código aberto para IA e ML, foi desenvolvido pela Google, e pode ser usado em várias de linguagens de programação, incluindo Python e Java. Seguindo a mesma linha, o PyTorch é um framework de ML, também de código aberto, usado para construir e treinar modelos de Deep Learning. O PyTorch é escrito em Python, tornando-o relativamente fácil para a maioria dos desenvolvedores de ML aprender e usar. Já o Keras é uma API projetada para seres humanos, não para máquinas. O Keras segue as melhores práticas para reduzir a carga cognitiva: oferece APIs consistentes e simples, minimiza o número de ações do usuário necessárias para casos de uso comuns e fornece mensagens de erro claras.

Plataformas de desenvolvimento

Além das ferramentas, as plataformas de desenvolvimento também são essenciais. Plataformas como Google Cloud AI, AWS Sagemaker e Microsoft Azure Machine Learning proporcionam um ambiente robusto para o desenvolvimento e a implementação de modelos de ML.

O Google Cloud AI é uma plataforma de IA que oferece uma variedade de serviços, incluindo análise de vídeo e imagem, reconhecimento de fala e processamento multilíngue. Já o AWS Sagemaker, contudo, é um serviço totalmente gerenciado na nuvem que permite aos cientistas de dados construir, treinar e implantar modelos de ML de alta qualidade com rapidez e confiança. Ainda seguindo a mesma estratégia, o Microsoft Azure Machine Learning é um serviço de IA corporativo que suporta o ciclo de vida completo de Machine Learning, oferecendo operações de ML líderes do setor, interoperabilidade de código aberto e ferramentas integradas.

Escolhendo a ferramenta e plataforma certa

A escolha da ferramenta e plataforma certa depende de vários fatores, incluindo o tipo de projeto, o nível de habilidade do desenvolvedor e o orçamento disponível. Por isso é importante pesquisar e experimentar diferentes opções antes de tomar uma decisão. Inclusive, escrevi há um tempo sobre como escolher uma ótima solução, recomendo a leitura.

Entendo que é crucial observar as necessidades específicas do seu negócio, porque cada projeto de IA e ML tem requisitos únicos e, portanto, a ferramenta e a plataforma que melhor atendem a esses requisitos podem variar. Considere fatores como facilidade de uso, flexibilidade, escalabilidade e suporte da comunidade. Além disso, leve em conta o custo e a compatibilidade com as tecnologias existentes em sua organização. Sempre tem um legado que precisa ser integrado, lembre-se disso!

Não se esqueça de realizar testes com as ferramentas e plataformas candidatas. Isso permitirá que você avalie seu desempenho em um ambiente real e determine se elas atendem às suas reais necessidades. Não deixe de pensar no futuro dessa plataforma. As necessidades do seu business podem mudar com o tempo, então, escolha soluções que possam se adaptar e crescer com o seu negócio. Se possível, evite lock-in de ferramenta para não virar refém de fornecedores.

Conclusão

A escolha das ferramentas e plataformas corretas é um passo fundamental no desenvolvimento de projetos de IA e ML. Porém, com a ferramenta e plataforma correta, os desenvolvedores podem focar em resolver problemas complexos e inovar, em vez de se preocupar com questões técnicas.

Imagem de capa criada com IA pelo Bing: Utilizei o prompt: “Uma cidade cheia de prédios comerciais com fachada espelhada, com o céu em tons de azul celeste, com nuvens com números no estilo matrix, em estilo de desenho em aquarela”.

O post Ferramentas e plataformas essenciais para projetos de IA e ML apareceu primeiro em Diego Nogare.

Análise e visualização de dados para ML e Ciência de Dados

Diego Nogare — Mon, 22 Jan 2024 19:45:42 +0000

A Ciência de Dados é uma área em constante crescimento, e no momento em que há um aumento da quantidade de dados disponíveis, a necessidade de Análise e visualização de dados para ML e Ciência de Dados de maneira eficiente tornou-se cada vez mais importante. Neste post, quero explorar como o Machine Learning pode ser usado para essa finalidade, utilizando a linguagem de programação Python.

Machine Learning e Ciência de Dados

Machine Learning é um subcampo da Inteligência Artificial que se concentra em desenvolver algoritmos que permitem que os computadores aprendam a partir dos dados. Contudo, na Ciência de Dados, esses algoritmos são usados para descobrir padrões e insights nos dados. Anteriormente expliquei neste texto como a Inteligência Artificial está presente no nosso cotidiano. Aliás, esse texto também faz uma referência à uma outra publicação que conto um pouco da história da Inteligência Artificial.

Analise e Visualização de dados

Análise de Dados

A análise é o coração da ciência de dados, pois engloba o processo de inspecionar, limpar e transformar dados. Tem o objetivo de descobrir informações úteis, informar conclusões e apoiar os gestores nas tomada de decisões. A análise de dados pode ser dividida em muitas sub-áreas, e quero destacar quatro delas aqui:

Descoberta de Informações: A análise de dados ajuda a descobrir padrões e tendências nos dados que podem não ser imediatamente aparentes. Aliás, isso pode levar a insights valiosos que podem ser usados para informar estratégias de negócios ou direcionar decisões.
Tomada de Decisões Baseada em Dados: Com a análise de dados, as decisões podem ser baseadas em dados, em contraste com decisões com base em intuição, suposições ou com o famoso “eu que mando aqui”. Isso pode levar a melhores resultados e maior eficiência.
Previsão e Modelagem: A análise de dados permite a criação de modelos preditivos que podem ser usados para prever comportamentos ou tendências do futuro. Isso é particularmente útil em campos como vendas, marketing e finanças. Lembrando que, em virtude de ter resultados probabilísticos e não serem resultados determinísticos, a predição está associada à uma probabilidade do resultado acontecer.
Melhoria da Precisão: A análise de dados pode ajudar a melhorar a precisão das previsões e decisões ao fornecer uma base sólida de evidências em que se basear. Ou seja, melhora a tomada de decisão baseada em dados.

Visualização de Dados

Já a visualização de dados, que também é uma parte essencial da ciência de dados, permite que dados complexos sejam transformados em gráficos, facilitando a compreensão e interpretação dos dados. No Dataviz também podemos destacar muitos pontos importantes, mas quero manter o padrão e trazer quatro que entendo ser imporatnte:

Compreensão Rápida: Gráficos e imagens são processados pelo cérebro humano muito mais rápido do que texto, por consequência, a visualização de dados permite que as pessoas entendam os dados rapidamente.
Descoberta de Padrões: A visualização de dados pode revelar padrões, tendências e correlações nos dados que podem não ser evidentes em dados brutos, visto que nosso cérebro funciona melhor ao ver uma imagem do que ao ver um monte de numero amontoado.
Comunicação Eficaz: A visualização de dados é uma maneira eficaz de comunicar informações complexas de maneira clara e concisa. Ela pode ser usada com o intuito de contar histórias com dados, tornando as informações mais acessíveis e memoráveis. Leve em consideração o publico que vai consumir o seu gráfico, comunique com o seu publico de forma que eles entendam o que você está transmitindo.
Tomada de Decisão Informada: A visualização de dados pode ajudar na tomada de decisões ao fornecer uma representação visual clara dos dados. Isso pode levar a melhores decisões baseadas em dados. Um exemplo disso são os acompanhamentos com KPIs em reuniões executivas, os gestores normalmente olham para alguns faróis e ao bater o olho já sabem o que está indo bem e o que está indo mal.

Consegui te explicar a importância da Análise e Visualização de dados para Machine Learning e Ciência de Dados ?

Quer ver código?

Python é uma linguagem de programação popular na Ciência de Dados, isso se dá, acima de tudo, pela sua simplicidade e à variedade de bibliotecas disponíveis. As mais comuns são Pandas e NumPy para análise de dados, e Matplotlib e Seaborn para criar gráficos e visualizações interativas.

O Pandas é uma biblioteca Python que permite manipular estruturas de dados de forma rápida, flexível e expressiva. Foi desenvolvida pensando em pessoas que trabalham com dados relacionais ou rotulados, deixando a manipulação fácil e intuitivo. Da mesma forma, o NumPy, que é um pacote de processamento de arrays de forma geral, pois ele fornece um objeto de array multidimensional de alto desempenho e ferramentas para trabalhar com esses arrays.

O Matplotlib é uma biblioteca Python focada na criação de visualizações estáticas, animadas e interativas. Ela permite criar figuras de qualidade para consumir em vários formatos. Já o Seaborn é uma biblioteca baseada em Matplotlib e é particularmente útil para visualizar dados complexos. Não posso falar muito do Seaborn porque não trabalhei com ele ainda…

Estes pacotes Python que comentei são muito úteis para se trabalhar com Machine Learning e Ciência de Dados, aliás, acredito que usá-los vai te ajudar a resolver problemas de analise e visualização grandes conjuntos de dados e transformar os dados brutos em insights valiosos. Inclusive, durante uma disciplina do doutorado, eu criei um Repo no Github e coloquei alguns códigos lá dentro.

Eu ficaria muito feliz com sua contribuição nesse repo, no final da página do Github explico como você pode contribuir

Imagem de capa criada com IA pelo Bing. Utilizei o prompt: “Um macbook com gráficos coloridos em Azul, Vermelho, Verde e Amarelo e um copo de café na mesa, o macbook está em cima de uma mesa de escritório com o fundo de escritório desfocado. Os gráficos são como um dashboard para tomada de decisão” para a criação.

O post Análise e visualização de dados para ML e Ciência de Dados apareceu primeiro em Diego Nogare.

Primeiros passos em Machine Learning

Diego Nogare — Wed, 01 Apr 2020 12:00:56 +0000

Para aprender Machine Learning

é interessante saber uma linguagem de programação

Pensando em alternativas na construção de soluções envolvendo aprendizagem de máquina, é interessante dar os primeiros passos em Machine Learning. Pode-se fazer isso escolhendo uma linguagem de programação estatística, como o R ou Python, ou então seguindo com serviços cognitivos. Mas afinal, se for para o caminho da linguagem de programação, qual das duas devo investir meu tempo? Seguindo o ranking de linguagens de programação da IEEE, em 2019, o Python aparece em primeiro lugar e o R em quinto. Contudo, isso não significa que você deve escolher o Python apenas por isso. Ambas linguagens são ótimas para trabalhar com Machine Learning!

Você poderia desenvolver soluções de Machine Learning com qualquer linguagem como Java ou C#, porque no final das contas, os algoritmos são representações matemáticas. Porém, isso não é recomendado, porque estas linguagens são poderosas para alguns tipos de desenvolvimentos mas não possuem módulos específicos para cálculos matriciais complexos.

O R é uma das linguagens de programação estatística mais utilizadas para este fim, assim como o Python. Por outro lado, o Python é bastante versátil permitindo inclusive desenvolvimento de aplicações web.

IDE – Integrated Development Environment

As duas linguagens são gratuitas, isso significa que não precisa pagar para desenvolver soluções com elas. Por outro lado as IDEs, que são os software utilizados para escrever os códigos, podem ser cobradas. É muito comum usar o RStudio para desenvolver com linguagem R e o PyCharm para Python. Estas duas IDEs possuem a versão gratuita e a paga. Em ambas a versão gratuita é utilizada principalmente para estudos, e a paga é para quando você terá algum tipo de rentabilidade com a sua solução desenvolvida.

Existem alternativas. Uma é o VSCode que tem o Python nativo mas o R precisa ser adicionado como extensão. Ou o Jupyter Notebook, que é uma IDE web-based que permite nativamente escolher o Kernel de interpretação do código com Python ou R.

Comunidade

Para as duas linguagens existe uma comunidade muito ativa. Esta comunidade publica diariamente vários pacotes de funcionalidades, que resolvem problemas específicos. No R a comunidade se centraliza no CRAN – The Comprehensive R Archive Network enquanto a comunidade Python utiliza o PyPi – Python Package Index. Estes pacotes ajudam a acelerar o desenvolvimento, facilitando a execução de tarefas complexas de forma simples. Imagine que você esteja fazendo uma análise exploratória descritiva e necessita gerar diversos gráficos sobre os dados. No R existe o GGPLOT2 que é um dos pacotes mais usados para geração de gráficos, e no Python o MatPlotLib. Mas repare que você não precisará criar do zero, você poderá utilizar algo já pronto que resolve o seu problema de forma específica.

A mesma coisa acontece para os principais pacotes de Machine Learning. Existem pacotes preparados em cada uma das comunidades, que facilitam o desenvolvimento dos seus modelos de aprendizagem de máquina.

Para aprender

Sendo totalmente imparcial, para você dar seus primeiros passos em Machine Learning, escolha uma das duas linguagens de programação e se arrisque. Existem diversos cursos gratuitos de R e de Python na internet. O Kaggle possui diversas bases de dados com muitos desafios, assim como o repositório de dataset da UCI. Os fóruns de discussão são ótimos pontos de encontro para tirar duvidas sobre a linguagem. E o principal benefício de escolher entre uma ou outra linguagem, é que a migração entre elas é bastante rápida. Ao aprender uma linguagem, migrar para a outra é questão praticamente de sintaxe. A forma de pensar, e de resolver problemas, é muito similar. Se não se adaptou com R, mude para o Python com muita fluidez.

Ah, outro ponto importante. Não se preocupe em aprender a matemática complexa por trás de cada modelo agora. Sugiro que aprenda uma das linguagens, estude alguns algoritmos que resolvem os principais problemas (classificação binária, classificação multi-classes, regressão linear bivariada, regressão linear multivariada, regressão logística, clustering e regras de associação). Depois que já estiver fluido em resolver problemas com estes algoritmos, ai sim comece a estudar o que eles fazem e como funcionam. Assim poderá entender o que está fazendo, e até melhorar a performance quando for preciso.

O post Primeiros passos em Machine Learning apareceu primeiro em Diego Nogare.

Análise do Livro – Python Machine Learning

Diego Nogare — Mon, 24 Feb 2020 12:00:19 +0000

Python Machine Learning

Machine Learning e Deep Learning com Python, Scikit-Learn e TensorFlow 2

O livro Python Machine Learning, Third Edition foi escrito por Sebastian Raschka e Vahid Mirjalili, e publicado pela Packt Publishing. Este livro está na terceira edição e cobre assuntos voltados a Machine Learning e Deep Learning, com Python.

São 770 páginas que conduzem o leitor para sair de tópicos mais triviais como modelos de aprendizagem supervisionada chegando a assuntos muito mais complexos como Deep Learning e criação de redes GAN.

O livro me surpreendeu positivamente com o acompanhamento passo a passo para codificar em Python utilizando a parafernália tecnológica que permite sair do outro lado. A parte prática aplica os elementos apresentados na teoria. A parte teórica dos capítulos permite entender o que se está desenvolvendo. Ou seja, os autores apresentam um balanceamento fluído entre teoria e prática técnica, fixando o assunto que foi apresentado. Mas não inicie a leitura achando que será algo simples, porque não é! O processo de aprendizagem de máquina é complexo, contudo ao fazer o estudo com seriedade, ao término do livro você conseguirá construir soluções que podem ser úteis no nosso cotidiano.

E para completar, você pode baixar todos os códigos no Github do Sebastian.

Minha visão

Os primeiros dois terços do livro, até por volta da página 450 é, mais voltado para processos tradicionais de Machine Learning. Mas o ultimo 1/3 do livro é possível ver muita coisa de Deep Learning com Tensorflow.

O nível de formalização matemática foi além do que precisava ter. Ficou excessivo, já que é um livro prático de mercado e não um artigo acadêmico. Mas que não prejudica a aprendizagem, só cansa um pouco mais. Se não for o seu interesse aprender a formalização matemática, apesar de ser muito importante, não se assuste e siga adiante.

Minha impressão deste livro é que ele permite você compreender a teoria e prática do que é mais moderno em questões de Aprendizagem de Máquina. Contudo, se você busca uma carreira em Inteligência Artificial e Machine Learning, você não precisa ler este livro, você DEVE!

O post Análise do Livro – Python Machine Learning apareceu primeiro em Diego Nogare.