Skip to content

khorneflakes-dev/Proyecto-Final-YELP

Repository files navigation

PF-YELP

Metricas

Son indicadores que mide la empresa, usando todos los datos que tiene a disposicion, ej. numero de ordenes por dia en un restaurante

KPI’s (Key Performance Indicator)

Es una metrica clave, estas son solo unas cuantas respecto a las metricas pero tienen un alto impacto en el negocio, por lo que mejorarlas representara un inpacto positivo para la empresa,

entendemos asi que todos los KPI’s son metricas pero no todas las metricas son KPI’s

  1. Variación porcentual del promedio de estrellas(calificación): PCC= (promedio estrellas año 2) - (promedio estrellas año 1) / ((promedio estrellas año 1) *100

  2. Variación porcentual de reviews: PCR = (cantidad de reviews año 2) - (cantidad de reviews año 1) /((cantidad de reviews año 1))

  3. popularidad: PO = promedio(polaridad*(1-subjetividad))

  4. porcentaje de sucursales cerradas por rubro CSC = (cantidad de sucursales cerradas) / (cantidad de sucursales totales por rubro) *100

Objetivos:

  • Predecir cuales son los rubros de negocios que mas creceran o decaeran
  • Predecir la localizacin mas conveniente de nuevos locales de estos negocios evaluados
  • Implementar un sistema de recomendaciones para usuarios

Alcance del proyecto

stack tecnológico

  • Extraction and transformation:
  • load and storage:
  • analysis:
  • incremental load or streaming
  • Presentation: dash plotly

Diccionario de datos

users: 'n_user_id': integer user code, 'review_count': number of reviews written by the user, 'yelping_since': user registration date, 'useful': number of useful votes given by the users to other user's reviews, 'funny': number of funny votes given by the users to other user's reviews, 'cool': number of cool votes given by the users to other user's reviews, 'friends': comma separated str with friend's alphanumeric codes , 'fans': number of fans, 'average_stars': average reviews stars given by the user.

users_ids: 'n_user_id': integer user code, 'user_id': alphanumeric user code

Work Flow

Extraction and tranformation

Users dataset:

  • load: it was made in chunks of 400.000 rows to the dataframe called "users"
  • drop columns: all the columns with amounts of compliments.
  • change data type to use less memory: 'average_stars':np.float32 , 'fans':'uint16', 'review_count':'uint16', 'cool':'uint32', 'useful':'uint32', 'funny':'uint32', yelping_since:'%Y-%m-%d %H:%M:%S'
  • get integer index to replace alphanumeric index: to use less memory the alphanumerid user_id columns was replaced by the dataframe index(0 - 1987896)
  • No duplicated or null founded

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •