O aprendizado de máquina visa automatizar a tarefa de construção de modelos analíticos para executar tarefas cognitivas. Isso é feito através da aplicação de algoritmos que aprendem iterativamente a partir de dados de treinamento específicos de problemas, o que permite que computadores encontrem insights ocultos e padrões complexos. O aprendizado de máquina mostra boa aplicabilidade, especialmente em tarefas relacionadas a dados de alta dimensão, como classificação, regressão e agrupamento.
O câncer de mama ocorre devido a uma disfunção celular que faz determinadas células do nosso corpo crescerem e se multiplicarem desordenadamente, formando um tumor. Esse é um dos tipos de câncer mais comuns entre as mulheres no Brasil e no mundo. As células mais afetadas, nesse tipo de câncer, são as que revestem os ductos mamários ou se encontram nos lóbulos das glândulas mamárias. O presente projeto visa criar um modelo que possa prever se um câncer é benigno ou maligno.
O conjunto de dados selecionado para o projeto foi extraído do site kaggle e produzido por UCL Machine Learning. Ele reúne diversas características que são calculadas a partir de uma imagem digitalizada de uma punção de agulha fina de uma massa mamária. Ele descreve as características dos núcleos celulares presentes na imagem.
As seguintes etapas foram seguidas no desenvolvimento do projeto:
- Coleta de dados
- Preparação dos Dados
- Separação dos dados em conjuntos de teste e treino
- Treinamento do modelo
- Avaliação do modelo