Bem-vindo ao meu perfil! Sou um profissional especializado em transformar dados em insights estratégicos, com experiência em Big Data, Data Engineering, Machine Learning e BI. Minha missão é impulsionar decisões orientadas por dados e otimizar processos empresariais por meio de soluções escaláveis e auditáveis.
- Experiência prática com pipelines distribuídos, modelagem dimensional e governança de dados.
- Forte atuação em Python, SQL, Power BI, GCP, Databricks, dbt, Trino, PySpark e Airflow.
- Projetos com grandes volumes de dados (~360M linhas) e dashboards estratégicos para acompanhamento de KPIs.
- Certificado em IBM Data Science & Data Analyst, com foco em ML, ETL, BI e Cloud Computing.
- Inglês fluente, Espanhol intermediário, Francês básico.
- Python (Pandas, NumPy, Scikit-learn, Matplotlib, Seaborn)
- SQL avançado (PostgreSQL, MySQL, SQL Server, Oracle)
- R (ggplot2, dplyr, caret)
- Google Cloud Platform (BigQuery, Dataflow, AI Platform, Pub/Sub)
- AWS (S3, Redshift, Athena, Glue, SageMaker, Lambda)
- Azure (Data Factory, Synapse Analytics, Databricks)
- Apache Spark / PySpark, dbt, Trino, MinIO, Apache Iceberg, Kafka
- Power BI (DAX, Power Query, Row Level Security)
- Tableau, Looker, Excel Avançado
- Dashboards estratégicos e relatórios dinâmicos
- Pipelines automatizados com Airflow, dbt, Python
- Modelagem Dimensional: Star Schema, Snowflake Schema
- Data Lake, Data Warehouse, Data Lineage, Data Governance
- Modelos preditivos, regressão, redes neurais
- NLP, Computer Vision, Deep Learning (TensorFlow, Keras, PyTorch)
- MLflow, experiment tracking e CI/CD para ML
- Descrição: ETL + modelagem dimensional + dashboards Power BI
- Tecnologias: Python, dbt, Trino, MinIO, Iceberg, Power BI
- Impacto: Processamento de ~360M linhas, dashboards estratégicos com RLS
- Descrição: Extração e tratamento de dados XML automatizada
- Tecnologias: Python, SQL, Power BI
- Impacto: Redução de retrabalho e tempo de execução em processos corporativos
- Descrição: Modelo preditivo para análise de séries temporais
- Tecnologias: Python, Pandas, Scikit-learn, TensorFlow
- Impacto: Identificação de padrões estratégicos para decisões de negócio
(Inclua links diretos para repositórios correspondentes)
- Desafios em empresas inovadoras que utilizem dados para crescimento estratégico
- Projetos com impacto real e aprendizado contínuo
- Ambientes que incentivem soluções orientadas por dados e transformação digital
- Email: pedrovelame123@gmail.com
- LinkedIn: linkedin.com/in/pedro-h-velame
- GitHub: github.com/pedrohvel