Kafka_Real_Time_Stock_Market_Data_Engineering_Project

This Repo contains details about Kafka Real Time Stock Market Data Engineering Project, Thanks

Introduction and Data Flow:

In this project, you will execute an End-To-End Data Engineering Project on Real-Time Stock Market Data using Kafka. We are going to use different technologies such as Python, Amazon Web Services (AWS), Apache Kafka, Glue, Athena, and SQL Extension to the technologies made includes:

Connecting PowerBI to AWS S3 JSON File and building a sample PowerBI Report
Connecting PowerBI to AWS Athena Database and building a sample PowerBI Report

Technology Used:

Programming Languages: Python and R Language
Cloud Provider: AWS - S3, Athena, Glue Catalog, Glue Crawler, Ec2
Reporting Tool: PowerBI
ODBC Driver: Simba ODBC Driver to connect PowerBI to AWS Athena
R Packages: AWS S3 R Package to connect to AWS S3 bucket

Dataset URL:

https://github.com/vinaykm5758/Kafka_Real_Time_Stock_Market_Data_Engineering_Project/blob/main/indexProcessed.csv

Kafka Producer Code: https://github.com/vinaykm5758/Kafka_Real_Time_Stock_Market_Data_Engineering_Project/blob/main/Kafka_Producer.ipynb

Kafka Consumer Code: https://github.com/vinaykm5758/Kafka_Real_Time_Stock_Market_Data_Engineering_Project/blob/main/KafkaConsumer.ipynb

Connecting to Kafka components in AWS EC2 Instance: https://github.com/vinaykm5758/Kafka_Real_Time_Stock_Market_Data_Engineering_Project/blob/main/Kafka_1.PNG

AWS S3 Data: https://github.com/vinaykm5758/Kafka_Real_Time_Stock_Market_Data_Engineering_Project/blob/main/AWS_S3_Data.PNG

PowerBI Reports:

Connecting PowerBI with AWS S3 bucket sample JSON file: Page-1: https://github.com/vinaykm5758/Kafka_Real_Time_Stock_Market_Data_Engineering_Project/blob/main/Realtime_AWS_Athena_PowerBI_Report.pbix
Connecting PowerBI with AWS Athena Table "stock_market_kafka.kafka_stock_market_demo_viinay": Page-2: https://github.com/vinaykm5758/Kafka_Real_Time_Stock_Market_Data_Engineering_Project/blob/main/Realtime_AWS_Athena_PowerBI_Report.pbix

Data Validations:

Validated the counts for the Index column from AWS Athena Vs PowerBI Report in Real time: Counts Matched

R Script used in PowerBI:

Sys.setenv(

"AWS_ACCESS_KEY_ID" = 'XXX', "AWS_SECRET_ACCESS_KEY" = 'XX', "AWS_DEFAULT_REGION" = "us-east-1" )

test_data <- aws.s3::s3read_using(FUN = read.csv, object = 'stock_market_95.json', bucket = 's3://kafka-stock-market-demo-viinay/')

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
AWS_S3_Connection_to_PowerBI_JSON_Sample_Data.PNG		AWS_S3_Connection_to_PowerBI_JSON_Sample_Data.PNG
AWS_S3_Data.PNG		AWS_S3_Data.PNG
Athena_Table_Results.PNG		Athena_Table_Results.PNG
Athena_Table_Results_Live_Count_Final.PNG		Athena_Table_Results_Live_Count_Final.PNG
Athena_Table_Results_Live_Count_Initial.PNG		Athena_Table_Results_Live_Count_Initial.PNG
Athena_Table_Results_Max_Date_Final_Values.PNG		Athena_Table_Results_Max_Date_Final_Values.PNG
Athena_Table_Results_Max_Date_Values.PNG		Athena_Table_Results_Max_Date_Values.PNG
KafkaConsumer.ipynb		KafkaConsumer.ipynb
Kafka_1.PNG		Kafka_1.PNG
Kafka_Producer.ipynb		Kafka_Producer.ipynb
PowerBI_Index_Counts_Validations.PNG		PowerBI_Index_Counts_Validations.PNG
README.md		README.md
Realtime_AWS_Athena_PowerBI_Report.pbix		Realtime_AWS_Athena_PowerBI_Report.pbix
indexProcessed.csv		indexProcessed.csv
stock_market_0.json		stock_market_0.json
stock_market_95.json		stock_market_95.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Kafka_Real_Time_Stock_Market_Data_Engineering_Project

About

Uh oh!

Releases

Packages

Languages

ViinayKumaarMamidi/Kafka_Real_Time_Stock_Market_Data_Engineering_Project

Folders and files

Latest commit

History

Repository files navigation

Kafka_Real_Time_Stock_Market_Data_Engineering_Project

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages