Modelo de Recomendação de Planos da Megaline

Descrição

Este projeto faz parte do curso de Ciência de Dados da TripleTen e envolve a criação de um modelo de classificação para a operadora de celular Megaline. O objetivo é analisar o comportamento dos clientes e recomendar um dos planos mais recentes: Smart ou Ultra, utilizando dados comportamentais de clientes que já migraram para os novos planos. O modelo deve alcançar uma acurácia mínima de 0,75.

Instalação

Pré-requisitos

Python 3.x: (Qualquer versão do Python 3, como 3.6, 3.7, 3.8, etc.)
Bibliotecas Python:
- pandas
- numpy
- scikit-learn
- matplotlib
- seaborn

Instruções de Instalação

Clone o repositório: git clone https://github.com/Rosental14/Megaline_1.git
Navegue até o diretório do projeto:
Instale as dependências: pip install -r requirements.txt

Uso

Abra o Jupyter Notebook
Navegue até o arquivo projeto_megaline_1.ipynb e abra-o.
Execute as células sequencialmente para reproduzir a análise e a criação do modelo.

Funcionalidades

Etapas Iniciais

Importação de Bibliotecas: pandas, numpy, scikit-learn, matplotlib e seaborn.
Leitura dos Dados: Carregamento do arquivo users_behavior.csv
Informações Gerais: Impressão das informações gerais do DataFrame para conferir tipos de dados e valores ausentes.

Divisão dos Dados

Divisão em Conjuntos: Divisão dos dados em conjuntos de treinamento, validação e teste na proporção 80:10:10.
Características e Alvo: Definição das colunas de características e do alvo.

Estudo do Melhor Modelo

Modelos Testados: Avaliação de três modelos de classificação: Árvore de Decisão, Floresta Aleatória e Regressão Logística.
Métricas de Avaliação: Utilização da acurácia como métrica principal e consideração do tempo de execução dos modelos.

Árvore de Decisão

Hiperparâmetros: Teste de diferentes valores para criterion, min_samples_leaf e max_depth.
Melhor Modelo: Acurácia de 83.18% com max_depth=10, criterion='gini' e min_samples_leaf=7.
Tempo de Execução: Aproximadamente 2.31 segundos.

Floresta Aleatória

Hiperparâmetros: Teste de diferentes valores para bootstrap, max_depth e n_estimators.
Melhor Modelo: Acurácia de 83.18% com max_depth=1, bootstrap=False e n_estimators=9.
Tempo de Execução: Aproximadamente 7.67 segundos.

Regressão Logística

Modelo: Utilização de solver='liblinear' e random_state=14.
Acurácia: 71.34%.
Tempo de Execução: Aproximadamente 0.01 segundos.

Teste do Melhor Modelo

Treinamento Completo: Treinamento do melhor modelo (Árvore de Decisão) com todos os dados disponíveis.
Acurácia no Conjunto de Teste: 84.47%.

Prova Real do Modelo

Comparação com Dados Aleatórios: Acurácia de 84.5% com dados reais e aproximadamente 50% com dados aleatórios, comprovando a eficiência do modelo.

Créditos

Autor: Renan Rosental

Contato

Para dúvidas e feedback, entre em contato via e-mail: renan.engal@gmail.com

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
datasets		datasets
test		test
.gitignore		.gitignore
README.md		README.md
projeto_megaline_1.ipynb		projeto_megaline_1.ipynb
requirements		requirements

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Modelo de Recomendação de Planos da Megaline

Descrição

Instalação

Uso

Funcionalidades

Etapas Iniciais

Divisão dos Dados

Estudo do Melhor Modelo

Árvore de Decisão

Floresta Aleatória

Regressão Logística

Teste do Melhor Modelo

Prova Real do Modelo

Créditos

Contato

About

Uh oh!

Releases

Packages

Languages

Rosental14/Megaline_1

Folders and files

Latest commit

History

Repository files navigation

Modelo de Recomendação de Planos da Megaline

Descrição

Instalação

Uso

Funcionalidades

Etapas Iniciais

Divisão dos Dados

Estudo do Melhor Modelo

Árvore de Decisão

Floresta Aleatória

Regressão Logística

Teste do Melhor Modelo

Prova Real do Modelo

Créditos

Contato

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages