Son indicadores que mide la empresa, usando todos los datos que tiene a disposicion, ej. numero de ordenes por dia en un restaurante
Es una metrica clave, estas son solo unas cuantas respecto a las metricas pero tienen un alto impacto en el negocio, por lo que mejorarlas representara un inpacto positivo para la empresa,
entendemos asi que todos los KPI’s son metricas pero no todas las metricas son KPI’s
-
Variación porcentual del promedio de estrellas(calificación): PCC= (promedio estrellas año 2) - (promedio estrellas año 1) / ((promedio estrellas año 1) *100
-
Variación porcentual de reviews: PCR = (cantidad de reviews año 2) - (cantidad de reviews año 1) /((cantidad de reviews año 1))
-
popularidad: PO = promedio(polaridad*(1-subjetividad))
-
porcentaje de sucursales cerradas por rubro CSC = (cantidad de sucursales cerradas) / (cantidad de sucursales totales por rubro) *100
- Predecir cuales son los rubros de negocios que mas creceran o decaeran
- Predecir la localizacin mas conveniente de nuevos locales de estos negocios evaluados
- Implementar un sistema de recomendaciones para usuarios
- Extraction and transformation:
- load and storage:
- analysis:
- incremental load or streaming
- Presentation: dash plotly
users: 'n_user_id': integer user code, 'review_count': number of reviews written by the user, 'yelping_since': user registration date, 'useful': number of useful votes given by the users to other user's reviews, 'funny': number of funny votes given by the users to other user's reviews, 'cool': number of cool votes given by the users to other user's reviews, 'friends': comma separated str with friend's alphanumeric codes , 'fans': number of fans, 'average_stars': average reviews stars given by the user.
users_ids: 'n_user_id': integer user code, 'user_id': alphanumeric user code
- load: it was made in chunks of 400.000 rows to the dataframe called "users"
- drop columns: all the columns with amounts of compliments.
- change data type to use less memory: 'average_stars':np.float32 , 'fans':'uint16', 'review_count':'uint16', 'cool':'uint32', 'useful':'uint32', 'funny':'uint32', yelping_since:'%Y-%m-%d %H:%M:%S'
- get integer index to replace alphanumeric index: to use less memory the alphanumerid user_id columns was replaced by the dataframe index(0 - 1987896)
- No duplicated or null founded