Explorando o Poder da NLP (NER)

Reconhecimento de Entidades Nomeadas (NER): Explorando o Poder da NLP Hoje quero compartilhar um tema fascinante que tenho estudado: o Reconhecimento de Entidades Nomeadas (NER). Esta técnica, amplamente utilizada no campo do Processamento de Linguagem Natural (NLP), é uma poderosa ferramenta que permite identificar e categorizar entidades específicas em textos, como nomes de pessoas, organizações, […]

Read More

Ludwig Criado Pela Uber Technologies

Explorando o Potencial do Ludwig: Uma Ferramenta de Aprendizado de Máquina de Código Aberto Recentemente, durante minha jornada de aprendizado em ciência de dados, me deparei com uma ferramenta chamada Ludwig. Desenvolvida pela Uber Technologies, essa solução de código aberto despertou meu interesse por sua abordagem inovadora e acessível ao aprendizado de máquina. Apesar de […]

Read More

Wokflow para Storytelling

Como criar um workflow eficaz para apresentações de storytelling Criar apresentações de storytelling que realmente engajam e comunicam insights é uma habilidade essencial para cientistas e analistas de dados. O storytelling é mais do que apenas apresentar dados; trata-se de conectar-se com o público, transmitir uma narrativa clara e garantir que as decisões possam ser […]

Read More

LLM com Predibase Vale a Pena Usar?

Potencial e Limitações para Profissionais de Dados Como cientista de dados em constante busca por ferramentas que otimizem e simplifiquem o desenvolvimento de soluções baseadas em aprendizado de máquina, recentemente comecei a estudar a plataforma Predibase. Embora ainda não tenha tido a oportunidade de utilizá-la diretamente, fiquei impressionado com o potencial que ela oferece, especialmente para […]

Read More

Algoritmos de Machine Learning – Decision Tree

Algoritmos de Machine Learning – Decision Tree Dando continuidade à série Algoritmos de ML, hoje abordarei o Decision Tree, um dos algoritmos mais simples e interpretáveis para aprendizado supervisionado. Ele é amplamente utilizado em problemas de classificação e regressão devido à sua capacidade de gerar regras claras e intuitivas. Neste artigo, explorarei como funciona, suas […]

Read More

PCA em Machine Learning: Reduza Dimensões e Ganhe Desempenho

Descubra como o PCA reduz a dimensionalidade de dados e melhora o desempenho de modelos de Machine Learning. Veja exemplos práticos de aplicação. O PCA (Principal Component Analysis) é uma das técnicas mais utilizadas em Machine Learning para reduzir a dimensionalidade dos dados sem perder informações relevantes. Essa abordagem melhora o desempenho dos modelos e […]

Read More

AutoML a Automação e o Ciêntista de Dados

AutoML: Otimizando o Tempo e Elevando Resultados na Ciência de Dados O dia a dia de um cientista de dados é repleto de desafios. Desde a compreensão do problema de negócio até a entrega de modelos preditivos de alta qualidade, enfrentamos um processo complexo e, muitas vezes, demorado. Em muitos projetos, tarefas como limpeza de […]

Read More

AWS Feature Store Eficiência em Retreinamento em ML

AWS Feature Store: Uma Solução Eficiente para Gerenciar e Reutilizar Features em Machine Learning Como cientista de dados, tenho explorado diversas ferramentas para otimizar o trabalho com dados e modelos de Machine Learning. Entre elas, a AWS Feature Store tem se destacado como uma solução poderosa e estratégica, especialmente em cenários com grandes volumes de dados e […]

Read More

Algoritmos de Machine Learning – Gradient Boosting (GBM)

Algoritmos de Machine Learning – Gradient Boosting (GBM) Dando continuidade à série Algoritmos de ML, hoje falarei sobre o Gradient Boosting Machine (GBM), um dos algoritmos mais potentes e amplamente utilizados em aprendizado supervisionado. Com sua capacidade de combinar vários modelos fracos (geralmente árvores de decisão) em um modelo forte, o GBM é frequentemente a […]

Read More

Apache Iceberg e AWS Glue: Qual Escolher?

Apache Iceberg e AWS Glue: Qual Escolher? Olá, pessoal! Aqui é o Josemar, e hoje quero bater um papo com vocês sobre duas ferramentas muito úteis no mundo dos dados: Apache Iceberg e AWS Glue. Se você trabalha ou pretende trabalhar com data lakes, ETL e processamento de grandes volumes de dados, com certeza já deve ter ouvido […]

Read More