Análise e Modelagem de Churn de Clientes

Descrição do problema

A empresa de serviços de internet enfrenta um problema crescente de rotatividade de clientes, o que tem impactado negativamente em seus lucros. Para evitar a perda de clientes e minimizar as consequências, a empresa está buscando compreender os fatores que influenciam os clientes a desistir ou deixar de utilizar seus serviços, além de antecipar e prever quando um cliente tem alta probabilidade de churn. A empresa acredita que, por meio do conhecimento aprofundado dos clientes e suas necessidades, é possível oferecer soluções personalizadas e aprimorar seus serviços, mantendo a satisfação e fidelização da base de clientes.

Análise e Modelagem dos dados

Para solucionar o problema de negócios, serão executadas as seguintes etapas: identificação dos dados contidos no conjunto fornecido pela empresa, filtragem das linhas e colunas que não contêm informações relacionadas ao problema de negócios, verificação de valores nulos e dados duplicados por meio da limpeza dos dados, análise exploratória de dados (EDA) para encontrar insights e entender como as variáveis afetam a taxa de rotatividade, engenharia de recursos para converter os dados em informações compreensíveis para os modelos de aprendizado de máquina, criação de modelos de aprendizado de máquina para prever a rotatividade, avaliação dos resultados do machine learning e conversão do desempenho dos modelos de aprendizado de máquina em resultados de negócios.

Insights Obtidos

A partir da análise do conjunto de dados fornecido, pode-se concluir que os clientes que deixam de usar os serviços da empresa possuem as seguintes características:
  • Contrato realizado mensalmente
  • Menos de 10 meses de contrato
  • Conta mensal superior a R$60,00

Aplicação de modelo de Machine Learning

A lista de algoritmos classificadores de Machine Learning foi testada e aquele que apresentou melhor desempenho foi selecionado para ser utilizado em previsões futuras.
  • O modelo escolhido foi o Gradient Boost com 50 estimadores de profundidade 3. O modelo foi escolhido por test_split e os hiperparâmetros tunados por GridSearchCV.

Performance do Modelo de Machine Learning

Modelo F1 Score RUC_AUC
Gradient Boost 0.655 0.779

Resultados de Negócio

De acordo com os dados coletados, 25% dos clientes da empresa de telefonia deixaram a mesma. Uma análise anterior teria permitido a retenção de 78% desses clientes, totalizando 1457 clientes. Se esses clientes estivessem pagando uma taxa mensal de R$60, a empresa teria obtido uma receita adicional de R$87.400,00 no período.

Notebook da solução do problema

Clique Aqui para mais detalhes sobre a solução desse problema.