¡Bienvenidos al Grupo Snowflake ❄️ de Data Engineering Latam 😊 la comunidad más grande y chévere de todas!.
Grupo de Telegram para compartir sus dudas, comentarios y todo lo relacionado a snowflake
- 🛠️ Workshop: Sobre Snowflake ❄️
- 📅 Fecha: Todos los miércoles
- 🕙 Hora: 20:00 Lima, Bogotá, Quito (GMT-5)
- 👉 Inscríbete en: https://bit.ly/Snowflake_DEL
En esta seccion podras
Preparación y visualización de datos encontrar todos los workshops que han sido impartidos y puede
- 🗒️ Sentencia SQL: [ No hay ]
- 📹 Sesión en vivo: Snowflake 01 - Introducción a Snowflake
La arquitectura de Snowflake es nativa de la nube, y es una combinación entre shared-disk y shared-nothing. Dicho diseño permite optimizar el rendimiento individual de sus tres capas de las que está compuesta Snowflake:
- Capa de almacenamiento de base de datos.
- Capa de procesamiento de consultas.
- Capa de servicios en la nube.
- 🗒️ Sentencia SQL: [ No hay ]
- 📹 Sesión en vivo: Snowflake 02 - Data Cloud Architecture
Snowflake brinda una interfaz web moderna (snowsight), la cual permite realizar operaciones de datos y tareas de administración de snowflake desde un ambiente amigable al usuario. La interfaz web moderna es la evolución de la interfaz web clásica, debido a que incorporaron un ambiente colaborativo entre los usuarios, autocompletar las sentencias SQL, creación de dashboards, explorar y mapear las relaciones y accesos de los usuarios, análisis de las consultas (query) con facilidad, entre otras funcionalidades.
- 🗒️ Sentencia SQL: Script
- 📹 Sesión en vivo: Snowflake 03 - Interfaz Web Moderna
Conforme las organizaciones comienzan a consumir servicios empresariales en la nube, el análisis de uso y la administración de las cuentas en servicios en la nube cobra un papel muy relevante. Es por ello que Snowflake ayuda a identificar quién, cómo y cuándo se tiene acceso a la información (base de datos, metadato, tablas, etc), así como su protección de acceso y datos.
- 🗒️ Sentencia SQL: Script
- 📹 Sesión en vivo: Snowflake 04 - Account Management
La seguridad dentro de un data warehouse es la parte más importante de su arquitectura Snowflake y una que a menudo se pone en un segundo plano. Muchas veces no lo vemos tan importante como los propios datos, sin embargo, configurar los roles y permisos correctos es lo que mantiene sólida la integridad de los datos y configurarlo desde el inicio asegura que se eviten problemas en un futuro.
Es una buena práctica de seguridad tener a cada persona y herramienta con su propio nombre de usuario y contraseña, de esta manera, las contraseñas no se desperdician y conoce a cada persona que tiene acceso a la base de datos. Además, tenga en cuenta que es posible que no desee que todos en sus usuarios tengan acceso a Snowflake.
- 🗒️ Sentencia SQL: Script
- 📹 Sesión en vivo: Snowflake 05 - Security
Snowflake proporciona una amplia gama de objetos que brindan toda la funcionalidad proporcionada por la mayoría de los proveedores de plataformas de bases de datos y en algunos casos, incluso un poco más. Mediante los objetos de base de datos de Snowflake es posible construir un almacén de datos multidimensional, tan complejo o simple según sea la necesidad de quien lo implementa y por eso es importante entender su estructura y mecanismo de trabajo.
A continuación, se mencionan algunos objetos de base de datos, solo como referencia: warehouse, roles, base de datos, esquemas, tables, constraints, vistas, otros (Tablas externas, funciones de usuario, store procedure, secuencias, etc)
- 🗒️ Sentencia SQL: Script
- 📹 Sesión en vivo: Snowflake 06 - Database Objects
La capa de cómputo de Snowflake, juega un papel importante dentro de la gestión de los recursos dentro de la plataforma, esto debido a que te permite incrementar o decrementar el cómputo requerido para procesar datos y por consecuencia determina el pago a realizar por dicho cómputo que ha sido utilizado. (Recordemos que la capa de cómputo está enfocada al procesamiento de datos y existe otra capa específicamente para el almacenamiento)
Para determinar cómo configurar el cómputo en Snowflake, dependerá de diversas variables (número de usuarios, tamaño de datos a procesar, periodicidad en la que se procesan los datos, criticidad del proceso a consumir, entre otros), las cuales permitirán tener los servicios configurados de acuerdo a cada necesidad.
- 🗒️ Sentencia SQL: Script
- 📹 Sesión en vivo: Snowflake 07 - How Snowflake Compute Works
Los datos semiestructurados (también conocidos como datos parcialmente estructurados) son un tipo de datos que no siguen la estructura tabular asociada con las bases de datos relacionales u otras formas de tablas de datos, pero contienen etiquetas y metadatos para separar elementos semánticos y establecer jerarquías de registros y campos.
Los datos semiestructurados vienen en una variedad de formatos, según la fuente de la que se originan. Aquí hay algunos de los más comunes:
- XML: El lenguaje de marcado extensible (XML) se ha convertido en uno de los formatos de datos semiestructurados más populares.
- JSON: Recopila datos semiestructurados de dispositivos IoT, navegadores web y teléfonos inteligentes, luego organiza esos datos en lotes antes de transmitirlos a una plataforma de datos a través de una canalización de datos.
- Avro: Originalmente desarrollado para su uso con Apache Hadoop, Avro es un marco de trabajo de llamada a procedimiento remoto (RPC) y serialización de datos.
- ORC: Optimized Row Columnar (ORC) es un formato de datos semiestructurados que se diseñó inicialmente para lograr una compresión más eficiente y mejorar el rendimiento para leer, escribir y procesar datos en comparación con los formatos anteriores de Hive.
- 🗒️ Sentencia SQL: Script
- 📹 Sesión en vivo: Snowflake 08 - Semi-structured Data
Snowflake te permite realizar la carga de datos mediante diferentes alternativas tales como: SnowSQL, Interface Web, línea de comando. La carga de datos es actividad de alta relevancia, debido a que hay que determinar el volumen de la información a procesar, frecuencia con la cual será cargada la información y definir si la carga de información será incremental o carga full, con el objetivo de tomar ventaja de Snowflake.
- 🗒️ Sentencia SQL: Script
- 📹 Sesión en vivo: Snowflake 09 - Loading Data
Snowflake brinda una interfaz web (clásica), donde todos los usuarios pueden conectarse a Snowflake para tener acceso a distintas opciones para la administración y desarrollo dentro de la plataforma. A continuación, se listan algunas funcionalidades que pueden ser realizadas dentro de dicha interfaz:
- Crear y administrar usuarios.
- Crear y usar almacenes virtuales.
- Crear y modificar base de datos (esquemas, tablas, vistas, etc).
- Carga de datos a tablas.
- Ejecutar y monitorear consultas de datos.
- 🗒️ Sentencia SQL: Script
- 📹 Sesión en vivo: Snowflake 10 - Classic Web Interface
Cada sesión es grabada 📹 Canal de Youtube suscribete, dale like, comenta y comparte:
- Snowflake 01 - Introducción a Snowflake
- Snowflake 02 - Data Cloud Architecture
- Snowflake 03 - Interfaz Web Moderna
- Snowflake 04 - Account Management
- Snowflake 05 - Security
- Snowflake 06 - Database Objects
- Snowflake 07 - How Snowflake Compute Works
- Snowflake 08 - Semi-structured Data
- Snowflake 09 - Loading Data
- Snowflake 10 - Classic Web Interface
Data Engineering Latam es la comunidad de datos más grande de América Latina cuya misión es promover el talento de la región a través de la difusión de charlas, talleres, grupos de estudio, ayuda colaborativa y la creación de contenido relevante.
Todas y cada una de nuestras iniciativas y contenidos se mantienen sin apoyo de terceros. Si quieres vernos crecer, nos puedes ayudar con tus reacciones, comentarios y compartidas de nuestros contenidos en redes sociales 🥹
🎤 Cuéntanos aquí
Este no es un curso, los ponentes no son profesores y tú no eres un alumno. Todos estamos aquí reunidos porque nos apasiona este campo. Si algún ponente propone ejercicios a resolver, no estás obligado a presentarlos (ni nosotros a corregirlos =)
¡Cualquier feedback que tengas, siempre con respeto, es bienvenido!
Se recomienda compartir tu resumen a manera de slides, notion, canva, artículo en Medium, post en redes sociales o todo lo antes mencionado utilizando el #dataengineeringlatam y etiquetándonos.