Skip to content

DataEngineering-LATAM/Snowflake-StudyClub

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

72 Commits
 
 
 
 
 
 

Repository files navigation

Snowflake-StudyClub Data Engineering Latam ❄️❄️❄️

GitHub contributors GitHub forks GitHub stars GitHub watchers

¡Bienvenidos al Grupo Snowflake ❄️ de Data Engineering Latam 😊 la comunidad más grande y chévere de todas!.

Grupo de Telegram para compartir sus dudas, comentarios y todo lo relacionado a snowflake

Temas de cada Workshop:

  • 🛠️ Workshop: Sobre Snowflake ❄️
  • 📅 Fecha: Todos los miércoles
  • 🕙 Hora: 20:00 Lima, Bogotá, Quito (GMT-5)
  • 👉 Inscríbete en: https://bit.ly/Snowflake_DEL

Workshops

En esta seccion podras

Workshop #1: 🛠️ Introducción a Snowflake

Preparación y visualización de datos encontrar todos los workshops que han sido impartidos y puede

Workshop #2: 🛠️ Data Cloud Architecture

La arquitectura de Snowflake es nativa de la nube, y es una combinación entre shared-disk y shared-nothing. Dicho diseño permite optimizar el rendimiento individual de sus tres capas de las que está compuesta Snowflake:

  • Capa de almacenamiento de base de datos.
  • Capa de procesamiento de consultas.
  • Capa de servicios en la nube.

Workshop #3: 🛠️ Interfaz Web Moderna

Snowflake brinda una interfaz web moderna (snowsight), la cual permite realizar operaciones de datos y tareas de administración de snowflake desde un ambiente amigable al usuario. La interfaz web moderna es la evolución de la interfaz web clásica, debido a que incorporaron un ambiente colaborativo entre los usuarios, autocompletar las sentencias SQL, creación de dashboards, explorar y mapear las relaciones y accesos de los usuarios, análisis de las consultas (query) con facilidad, entre otras funcionalidades.

Workshop #4: 🛠️ Account Management

Conforme las organizaciones comienzan a consumir servicios empresariales en la nube, el análisis de uso y la administración de las cuentas en servicios en la nube cobra un papel muy relevante. Es por ello que Snowflake ayuda a identificar quién, cómo y cuándo se tiene acceso a la información (base de datos, metadato, tablas, etc), así como su protección de acceso y datos.

Workshop #5: 🛠️ Security

La seguridad dentro de un data warehouse es la parte más importante de su arquitectura Snowflake y una que a menudo se pone en un segundo plano. Muchas veces no lo vemos tan importante como los propios datos, sin embargo, configurar los roles y permisos correctos es lo que mantiene sólida la integridad de los datos y configurarlo desde el inicio asegura que se eviten problemas en un futuro.

Es una buena práctica de seguridad tener a cada persona y herramienta con su propio nombre de usuario y contraseña, de esta manera, las contraseñas no se desperdician y conoce a cada persona que tiene acceso a la base de datos. Además, tenga en cuenta que es posible que no desee que todos en sus usuarios tengan acceso a Snowflake.

Workshop #6: 🛠️ Database Objects

Snowflake proporciona una amplia gama de objetos que brindan toda la funcionalidad proporcionada por la mayoría de los proveedores de plataformas de bases de datos y en algunos casos, incluso un poco más. Mediante los objetos de base de datos de Snowflake es posible construir un almacén de datos multidimensional, tan complejo o simple según sea la necesidad de quien lo implementa y por eso es importante entender su estructura y mecanismo de trabajo.

A continuación, se mencionan algunos objetos de base de datos, solo como referencia: warehouse, roles, base de datos, esquemas, tables, constraints, vistas, otros (Tablas externas, funciones de usuario, store procedure, secuencias, etc)

Workshop #7: 🛠️ How Snowflake Compute Works

La capa de cómputo de Snowflake, juega un papel importante dentro de la gestión de los recursos dentro de la plataforma, esto debido a que te permite incrementar o decrementar el cómputo requerido para procesar datos y por consecuencia determina el pago a realizar por dicho cómputo que ha sido utilizado. (Recordemos que la capa de cómputo está enfocada al procesamiento de datos y existe otra capa específicamente para el almacenamiento)

Para determinar cómo configurar el cómputo en Snowflake, dependerá de diversas variables (número de usuarios, tamaño de datos a procesar, periodicidad en la que se procesan los datos, criticidad del proceso a consumir, entre otros), las cuales permitirán tener los servicios configurados de acuerdo a cada necesidad.

Workshop #8: 🛠️ Semi-structured Data in Snowflake

Los datos semiestructurados (también conocidos como datos parcialmente estructurados) son un tipo de datos que no siguen la estructura tabular asociada con las bases de datos relacionales u otras formas de tablas de datos, pero contienen etiquetas y metadatos para separar elementos semánticos y establecer jerarquías de registros y campos.

Los datos semiestructurados vienen en una variedad de formatos, según la fuente de la que se originan. Aquí hay algunos de los más comunes:

  • XML: El lenguaje de marcado extensible (XML) se ha convertido en uno de los formatos de datos semiestructurados más populares.
  • JSON: Recopila datos semiestructurados de dispositivos IoT, navegadores web y teléfonos inteligentes, luego organiza esos datos en lotes antes de transmitirlos a una plataforma de datos a través de una canalización de datos.
  • Avro: Originalmente desarrollado para su uso con Apache Hadoop, Avro es un marco de trabajo de llamada a procedimiento remoto (RPC) y serialización de datos.
  • ORC: Optimized Row Columnar (ORC) es un formato de datos semiestructurados que se diseñó inicialmente para lograr una compresión más eficiente y mejorar el rendimiento para leer, escribir y procesar datos en comparación con los formatos anteriores de Hive.

Workshop #9: 🛠️ Loading Data

Snowflake te permite realizar la carga de datos mediante diferentes alternativas tales como: SnowSQL, Interface Web, línea de comando. La carga de datos es actividad de alta relevancia, debido a que hay que determinar el volumen de la información a procesar, frecuencia con la cual será cargada la información y definir si la carga de información será incremental o carga full, con el objetivo de tomar ventaja de Snowflake.

Workshop #10: 🛠️ Classic Web Interface

Snowflake brinda una interfaz web (clásica), donde todos los usuarios pueden conectarse a Snowflake para tener acceso a distintas opciones para la administración y desarrollo dentro de la plataforma. A continuación, se listan algunas funcionalidades que pueden ser realizadas dentro de dicha interfaz:

  • Crear y administrar usuarios.
  • Crear y usar almacenes virtuales.
  • Crear y modificar base de datos (esquemas, tablas, vistas, etc).
  • Carga de datos a tablas.
  • Ejecutar y monitorear consultas de datos.

Videos

Cada sesión es grabada 📹 Canal de Youtube suscribete, dale like, comenta y comparte:


Sobre la comunidad Data Engineering Latam

Data Engineering Latam es la comunidad de datos más grande de América Latina cuya misión es promover el talento de la región a través de la difusión de charlas, talleres, grupos de estudio, ayuda colaborativa y la creación de contenido relevante.

Síguenos en nuestras redes oficiales

Todas y cada una de nuestras iniciativas y contenidos se mantienen sin apoyo de terceros. Si quieres vernos crecer, nos puedes ayudar con tus reacciones, comentarios y compartidas de nuestros contenidos en redes sociales 🥹

¿Quieres dar charla en la comunidad?

🎤 Cuéntanos aquí

Disclaimer

Este no es un curso, los ponentes no son profesores y tú no eres un alumno. Todos estamos aquí reunidos porque nos apasiona este campo. Si algún ponente propone ejercicios a resolver, no estás obligado a presentarlos (ni nosotros a corregirlos =)

¡Cualquier feedback que tengas, siempre con respeto, es bienvenido!

¿Cómo aprovechar mejor esta iniciativa?

Se recomienda compartir tu resumen a manera de slides, notion, canva, artículo en Medium, post en redes sociales o todo lo antes mencionado utilizando el #dataengineeringlatam y etiquetándonos.

About

Grupo de estudios de Snowflake organizado por la comunidad Data Engineering Latam

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •