Análise e Modelagem de Churn de Clientes
Descrição do problema
A empresa de serviços de internet enfrenta um problema crescente de rotatividade de clientes, o que tem impactado negativamente em seus lucros. Para evitar a perda de clientes e minimizar as consequências, a empresa está buscando compreender os fatores que influenciam os clientes a desistir ou deixar de utilizar seus serviços, além de antecipar e prever quando um cliente tem alta probabilidade de churn. A empresa acredita que, por meio do conhecimento aprofundado dos clientes e suas necessidades, é possível oferecer soluções personalizadas e aprimorar seus serviços, mantendo a satisfação e fidelização da base de clientes.
Análise e Modelagem dos dados
Para solucionar o problema de negócios, serão executadas as seguintes etapas: identificação dos dados contidos no conjunto fornecido pela empresa, filtragem das linhas e colunas que não contêm informações relacionadas ao problema de negócios, verificação de valores nulos e dados duplicados por meio da limpeza dos dados, análise exploratória de dados (EDA) para encontrar insights e entender como as variáveis afetam a taxa de rotatividade, engenharia de recursos para converter os dados em informações compreensíveis para os modelos de aprendizado de máquina, criação de modelos de aprendizado de máquina para prever a rotatividade, avaliação dos resultados do machine learning e conversão do desempenho dos modelos de aprendizado de máquina em resultados de negócios.
Insights Obtidos
A partir da análise do conjunto de dados fornecido, pode-se concluir que os clientes que deixam de usar os serviços da empresa possuem as seguintes características:- Contrato realizado mensalmente
- Menos de 10 meses de contrato
- Conta mensal superior a R$60,00
Aplicação de modelo de Machine Learning
A lista de algoritmos classificadores de Machine Learning foi testada e aquele que apresentou melhor desempenho foi selecionado para ser utilizado em previsões futuras.- O modelo escolhido foi o Gradient Boost com 50 estimadores de profundidade 3. O modelo foi escolhido por test_split e os hiperparâmetros tunados por GridSearchCV.
Performance do Modelo de Machine Learning
| Modelo | F1 Score | RUC_AUC |
|---|---|---|
| Gradient Boost | 0.655 | 0.779 |