It’s Dr. actually

its dr actually

Depois de vários anos de estudo, stress e aprendizados, finalmente conquistei em 03/02/2026 o título de Doutor em Engenharia Elétrica e Computação pela Universidade Presbiteriana Mackenzie. E por coincidência, foi exatamente 6 anos após a defesa do meu mestrado. Consequentemente, ganhei o “passe livre” para brincar com o meme “It’s Dr. Actually” (e se preparem, vou usar pra caramba agora! rss)

Esse meme é comum em fóruns de tecnologia e até no LinkedIn. Geralmente, as pessoas o utilizam para celebrar a conclusão do doutorado de forma leve e bem-humorada (alguns são arrogantes e espero não ficar assim!). A brincadeira marca o momento em que o aluno recebe o reconhecimento formal por seu esforço acadêmico intenso. Além disso, a brincadeira serve como uma ferramenta de quebra de gelo em ambientes técnicos muito sérios. No caso da minha pesquisa, resultados operacionais reais no setor financeiro validam essa nova autoridade técnica. Afinal, propor uma nova arquitetura de referência para plataformas de MLOps é uma proeza digna de um legítimo “Doutor”. rss

Um pouco da minha pesquisa

A jornada para colocar um modelo de Machine Learning em produção enfrenta obstáculos no ambiente corporativo. Muitos projetos de ML não atingem a fase operacional ou falham em entregar o valor esperado para o negócio. Isso por si só, já é ruim! Além disso, os profissionais de ciência de dados, frequentemente, focam na matemática dos algoritmos e acabam desprezando aspectos da computação como a Engenharia de Software. Elementos como qualidade, performance e confiabilidade acabam negligenciados durante o ciclo de desenvolvimento. E isso não é exatamente um problema, visto que a área de Ciência de Dados é bem plural e tem profissionais de muitas formações distintas.

E para ajudar, equipes de ciência de dados sofrem com a falta de infraestrutura automatizada e processos manuais lentos. Por exemplo, no Itaú Unibanco S.A., cientistas chegavam a esperar seis meses por recursos computacionais. Essa demora gerava um backlog crítico de mais de 100 modelos aguardando publicação. Entretanto, a instabilidade dos dados e a complexidade das dependências de entrada tornam o fluxo de trabalho manual altamente propenso a erros.

A área de MLOps surge justamente para automatizar esse ciclo de vida de desenvolvimento de modelos de ML iterativo. No entanto, a literatura acadêmica ainda apresenta poucas pesquisas sobre as técnicas de implementação prática e publicação, dando muito mais foco na parte de desenvolvimento/experimentação.

Metodologia baseada em dados e o rigor científico

Para dar fundamentação metodológica para a pesquisa, segui para uma abordagem de Pesquisa Aplicada, que trás em seu processo um alto rigor científico. Primeiramente, segui para uma Revisão Sistemática de Literatura (RSL) analisando 131 artigos primários publicados entre 2018 e 2024. Estes foram os artigos que li de fato, mas a pesquisa começou com mais de 2.800 publicações científicas. Essa análise permitiu identificar 12 categorias temáticas essenciais que orbitam a a área de MLOps.

Além da base teórica, também conduzi uma pesquisa anônima com 25 profissionais e executivos brasileiros. Essa etapa revelou os desafios reais enfrentados pelas indústrias, como a dificuldade de integração com sistemas legados. Os entrevistados apontaram que ferramentas existentes são complexas e exigem alta especialização técnica, o que impacta os projetos como um todo. Essa coleta de respostas foi fundamental para embasar o desenvolvimento da nova arquitetura que desenvolvi.

O terceiro pilar da metodologia eu investiguei a estratégia de “construir versus comprar” soluções de tecnologia. Construí um guia de suporte à tomada de decisão rigoroso baseado na maturidade da empresa e na vantagem competitiva do projeto. Se o MLOps for atividade central para o negócio, o desenvolvimento interno torna-se o caminho recomendado. Caso contrário, a aquisição de ferramentas de mercado pode acelerar a integração da IA nos produtos… Mas vale dar uma olhada com calma nessa publicação porque ela pode ser extrapolada para outras ferramentas e áreas. Ficou bem robusta 🙂

A solução que apresentei é de uma Arquitetura de Referência modular

A solução central da tese é uma Arquitetura de Referência composta por quatro estágios interconectados e modulares. O Estágio 1 foca na Engenharia de Dados, defendendo a centralidade e governança das fontes de informação. Nesta camada, processos de aquisição, preparação e validação garantem que os dados tenham a qualidade necessária para o treinamento. Consequentemente, o versionamento de dados torna-se peça-chave para a reprodutibilidade dos experimentos.

O Estágio 2 abrange o Ambiente de Desenvolvimento, onde ocorre a construção cíclica do modelo de ML. Detalho as etapas de ajuste de hiperparâmetros, seleção de algoritmos e avaliação de performance. Além disso, a arquitetura prevê a manutenção constante do código para evitar o acúmulo de débitos técnicos. Já o Estágio 3 foca no Ambiente de Produção, gerenciando as esteiras de inferência e publicação.

Finalmente, o Estágio 4 aborda as Preocupações Transversais, que permeiam todo o ciclo de vida do modelo. Este estágio inclui segurança cibernética, monitoramento contínuo e a flexibilidade do poder computacional. Dou destaque que o monitoramento deve registrar logs operacionais e detectar desvios estatísticos, como o data-drift. Essa estrutura modular mitiga a complexidade e permite que múltiplos times descentralizados colaborem de forma eficiente.

Escalabilidade e gestão de modelos de Deep Learning

Um diferencial importante desta Tese é o suporte explícito para esteiras de Deep Learning. Uma das soluções é o uso de contêineres e tecnologias de nuvem para garantir a portabilidade dos modelos. Assim, o sistema consegue processar predições em tempo real com baixa latência para o usuário final. A arquitetura detalha processos de Continuous Training (CT), permitindo o retreinamento automático dos modelos quando necessário. Isso é importante porque o desempenho de um modelo de IA pode degradar rapidamente no mundo real. Através da observabilidade, os engenheiros conseguem investigar comportamentos históricos e diagnosticar problemas silenciosos. Além disso, a transparência e a explicabilidade da IA são pilares fundamentais para garantir um processamento ético.

O fluxo operacional apresentado na Tese guia o desenvolvedor desde a definição de requisitos até a predição final. O uso de padrões como o “Modelo Campeão/Desafiante” permite testar novos algoritmos em paralelo sem afetar a produção. Se parar para ver com calma, a solução oferece um roteiro técnico preciso para evitar falhas comuns no desenvolvimento de projetos de IA, ML e DL.

It’s Dr. Actually

Já que chegou até aqui e investiu tempo lendo um pouco do trabalho que demorei 4 anos para concluir, te convido a gastar mais tempo e acompanhar as publicações que fiz em periódicos e congressos científicos. Afinal (tentando fazer a brincadeira do começo do post) It’s Dr., actually!

Muito obrigado!

Um doutorado não se faz da noite para o dia, foi uma construção de anos de dedicação, estudos e stress para criar essa Arquitetura de Referência de MLOps para projetos de Machine Lerning e Deep Learning… E, assim como a ciência, um doutorado não se faz sozinho. Quero aproveitar esse finalzinho do texto para agradecer todas pessoas que participaram comigo das publicações, todos que assistiram as apresentações ou leram os papers, todos que de forma direta ou indireta contribuíram para este trabalho. Vocês são parte disso, queria que a alegria desta titulação também se estendesse até vocês! E, claro, quero deixar um agradecimento especial à meus orientadores (Leandro Augusto da Silva e Ismar Frango Silveira) e aos avaliadores da banca (Marcelo Nogueira, Alexandra Aparecida de Souza, Gustavo Scalabrini Sampaio e Fabio Silva Lopes), suas sugestões e ensinamentos contribuíram com o resultado final deste trabalho.

MUITO OBRIGADO!

 

A foto de capa foi gerada com o Google Nano Banana 3, usando o prompt: Foto ultra-realista, com iluminação de estúdio, de uma mesa de trabalho de um profissional da computação com um teclado e mouse sem fio e um monitor ultra-wide curvo. A organização da mesa é bagunçada, mas em destaque tem uma xícara de café com o texto “It’s Dr. Actually” em letras pixealizadas como um terminal de computador.