#PRACTICA 2.1 ##Trabajando con Rapidminer
El objetivo de esta práctica es la de adquirir conocimientos básicos en analítica de datos, busca y uso de datasets y aplicación de conceptos de minería de datos con la herramienta "Rapidminer".
###Requisitos previos
- Tener instalado la aplicación Rapidminer Studio (http://www.rapidminer.com)
###DETALLE DE PRACTICA
-
Crear un repositorio en su cuenta github con el nombre: uasb_analytics, incluir el archivo README.md por defecto y utilizar licencia GPL.
-
Buscar en internet un dataset que sea de tu agrado y subir a su cuenta github. A continuación se listan algunos URL's que podrán ser de ayuda.
- http://www.freebase.com
- http://www.reddit.com/r/opendata
- http://www.dbpedia.org
- http://www.aws.amazon.com/publicdatasets/
- http://www.opensourcesports.com
- http://archive.ics.uci.edu/ml
- http://www.kdnuggets.com
NOTA: En caso de que el dataset sea muy grande (>30MB) considerar la reducción de instancias o filas. (No limitante) Sobre el formato se recomienda para este trabajo emplear el formato CSV (No limitante).
-
En el archivo README.md describir que es lo que contiene el data set e incluir una descripción detallada de cada columna o atributo.
-
Presentar tres hallazgos que pudiste encontrar en el dataset. Esto significa que mediante análisis de datos (estadísticas, gráficas, análisis multidimensional, modelos predictivos) que información relavante pudiste encontrar y que podrías resumir en tres afirmaciones.
Cada hallazgo deberá acompañar de:
- Una descripíon de que es lo que quieres encontrar.
- Un gráfico (exportar imagen en formatos jpeg o png)
- Una afirmación o conclusión a la que se ha llegado.
Para cada hallazgo se deberá utilizar un nuevo proceso en rapidminer que deberá ser exportado (archivo.rmp) y subido a su cuenta github.
- Cada hallazgo deberá acompañar de:
- Una descripción de qué es lo que quieres encontrar
- Un gráfico o tabla resumen de lo analizado (exportar imagen en formatos jpeg o png)
- Una afirmación o conclusión a la que se ha llegado.
- Construir tres archivos llamados "Resultado1.md", "Resultado2.md", "Resultado3.md", que muestre todo lo descrito en el punto 5 y subirlos a su cuenta github.