#PRACTICA 2.2 ##Trabajando con Lenguaje R
El objetivo de esta práctica es la de adquirir conocimientos básicos en analítica de datos, busca y uso de datasets y aplicación de conceptos de minería de datos con lenguaje R.
###Requisitos previos Tener instalada la aplicación R y RStudio (https://cran.r-project.org/) (https://www.rstudio.com/)
###1. Obteniendo el repositorio Realizar un Fork del repositorio: https://github.com/urvog/uasb_R-analytics y seguir las instrucciones.
###2. Dataset Buscar en internet un dataset que sea de tu agrado y subirlo a tu cuenta github. A continuación se listan algunos URL's que podrán ayudarte.
- http://www.freebase.com
- http://www.reddit.com/r/opendata
- http://www.dbpedia.org
- http://www.aws.amazon.com/publicdatasets/
- http://www.opensourcesports.com
- http://archive.ics.uci.edu/ml
- http://www.kdnuggets.com
Crear un archivo llamado Dataset.md que describirá que es lo que contiene tu dataset incluyendo además una descripción de la información de cada columna o atributo.
NOTA: En caso de que el dataset sea muy grande (>30MB) considerar la reducción de instancias o filas. (No limitante).
Sobre el formato se recomienda para este trabajo emplear el formato CSV (No limitante).
##3. Análisis de datos Presentar tres hallazgos que pudiste encontrar en el dataset. Esto significa que mediante el análisis de datos (estadísticas, gráficas, análisis multidimensional, modelos predictivos) puedas encontrar información relevante para establecer tres afirmaciones.
El codigo R de cada hallazgo debera describir con comentarios "#" lo que se esta haciendo paso a paso:
- Una descripcíon de lo que quieres encontrar. (Ejemplo: la relación entre los atributos 1, 2 y 3)
- Un gráfico que muestre lo encontrado (exportar la imagen en formatos jpeg o png)
- Una afirmación o conclusión a la que se ha llegado.
Para cada hallazgo se deberá generar el código y guardarlo en un archivo con la extension del lenguaje R. (hallazgo1.R, hallazgo2.R, hallazgo3.R), cada código deberá exportar una imagen en formato "png" (hallazgo1.png, hallazgo2.png, hallazgo3.png) y con dimensiones de 480x480 .
Subir todos los archivos codigo R e imágenes generadas a tu cuenta github.