1° Challenge de Dados - Alura
A Alura Voz é uma empresa de telecomunicação que nos contratou para atuar como cientistas de dados na equipe de vendas. Logo na primeira semana, a liderança nos informa que é muito necessário realizar um estudo quanto ao Churn da empresa. É explicado que o churn indica se um cliente cancelou ou não o contrato com a empresa, e também que, nos casos de perda do cliente a empresa também perde faturamento, o que ocasiona prejuizos na receita final.
Desse modo, nossa liderança informa que temos 4 semanas para buscar uma alternativa que possa minimizar a saída de clientes e nos entrega um conjunto de dados da Alura Voz que contém diversas informações sobre os clientes e também informa se eles deixaram ou não a empresa.
Sabemos que, antes de pensar em qualquer alternaiva, é preciso entender as informações que recebemos e, após uma pequena reunião, concluímos que na primeira semana nós nos dedicaríamos a entender o banco de dados, descobrir os tipos de dados, verificar a existencia de valores incoerentos e corrigi-los caso seja necessário.
Semana 1 - Limpeza dos dados
Dados
Ao observar a Base de dados da Alura Voz, verificamos que essa é uma base disponibilizada via API em formato JSON com várias camandas de dados.
Junnto a esses dados também foi disponibilizado o dicionário dos dados que nele contém todas as informações sobre as colunas do banco de dados.
Nela, além da informação se o cliente deixou ou não a empresa, também contém:
Cliente:
gender
: gênero (masculino e feminino)SeniorCitizen
: informação sobre um cliente ter ou não idade igual ou maior que 65 anosPartner
: se o cliente possui ou não um parceiro ou parceiraDependents
: se o cliente possui ou não dependentes
Serviço de telefonia
tenure
: meses de contrato do clientePhoneService
: assinatura de serviço telefônicoMultipleLines
: assisnatura de mais de uma linha de telefone
Serviço de internet
InternetService
: assinatura de um provedor internetOnlineSecurity
: assinatura adicional de segurança onlineOnlineBackup
: assinatura adicional de backup onlineDeviceProtection
: assinatura adicional de proteção no dispositivoTechSupport
: assinatura adicional de suporte técnico, menos tempo de esperaStreamingTV
: assinatura de TV a caboStreamingMovies
: assinatura de streaming de filmes
Contrato
Contract
: tipo de contratoPaperlessBilling
: se o cliente prefere receber online a faturaPaymentMethod
: forma de pagamentoCharges.Monthly
: total de todos os serviços do cliente por mêsCharges.Total
: total gasto pelo cliente
Tendo essas informações entendemos nossos dados e, assim, podemos realizar uma análise mais técnica, buscando entender JSON, os dados e realizar o tratamento deles.
Todo o desenvolvimento feito na nossa 1° semana pode ser observado no notebook semana 1.
#alura #alurachallengedatascience1
Conheça a equipe
Sthefanie Monica
Bacharela em Engenharia Elétrica pela UTFPR e atualmente instrutora de Data Science na Alura. Durante o período de graduação realizei diversas pesquisas voltadas à redes neurais e visão computacional, inclusive um período de pesquisa no Hospital Israelita Albert Einstein. No meu tempo livre adoro jogar, seja boardgames ou jogos eletrônicos, e amo conhecer novos lugares e pessoas, então estou sempre planejando a próxima viagem.
Ana Clara
Sou bacharela em Informática Biomédica e atualmente mestranda em Bioengenharia, ambas pela USP. Atuo como pesquisadora FAPESP e instrutora na Escola de Dados da Alura. Já realizei estágio no Hospital das Clínicas-FMRP, sou cofundadora e atual conselheira do grupo Data Girls. Possuo grande interesse na área de Ciência de Dados e Inteligência Artificial com aplicações em diferentes áreas de negócio. Além disso sou apaixonada por livros, séries, games e um bom café.
Bruno Raphaell
Estudante de engenharia elétrica na Universidade Federal do Piauí (UFPI) e atualmente scuba de Data Science na Alura. Apaixonado por música, filmes biográficos e programação. No tempo livre tento sair do prata no LoL, tocar algum instrumento e assistir filmes e séries.
João Miranda
Bacharel em Matemática pela UFMG e cursando MBA em Data Science e Analytics na USP/Esalq. Atualmente sou monitor na Escola de Dados do grupo Alura. Gosta muito de livros, jogos eletrônicos, boardgames e tiro com arco.
Mirla Costa
Graduanda em Engenharia elétrica pela Universidade Federal do Piauí com pesquisa focada em Aprendizado de Máquina e Inteligência Computacional. Atuo como Scuba na escola de Data Science da Alura sempre amei muito programar, ensinar de trabalhar com tecnologia. Meu tempo livre dedico a brincar com meus animias, assistir animações e séries, além de jogar RPG de mesa.