Monocular Deep Learning Multimodal with Object Relevance Estimation for Real-Time Navigation of Visually Impaired individuals (MMOR)

Real time Deep Learning assistant for visually impaired people. The model architecture fusion panoptic segmentation Panoptic FPN and monocular depth estimation Midas. The outcome is a video captured on a mobile device, generating spoken descriptions of user's environment to facilitate navigation, applying a heuristic algorithm for adapting prediction to user environment expectation. The model has been tested on members from Asociación Cultural y Recreativa para la Proyección del Invidente Puebla, A.C. (ACRIP) and result effective for user experience analysis. For more description check our Article or Presentation

Requirements

Python >= 3.7

Run with GPU accelerator

DroidCam >= 6.5.2

Installation

Download DroidCam Client on Widows, (Mac or Linux)https://www.dev47apps.com/droidcam/linux/].
Download DroinCam - WebCam app on your smartphone

Usage

Connect DroidCam Client from a computer to your smartphone, by connect both devices to same WiFi > copy from smartphone to laptop the Decive IP and DroidCam Port > Start
Run Colab Notebook to learn about basic usage.
For more information check documentation

Credits

Enrique García enriquegv001@gmail.com
Rafael Espinosa rafael.espinosa.castaneda@tec.mx

Name		Name	Last commit message	Last commit date
Latest commit History 120 Commits
__pycache__		__pycache__
detectron2		detectron2
img2		img2
Machine_Learning_for_assist_visually_impaired_individuals_for_their_real_time_navigation_ (1).pdf		Machine_Learning_for_assist_visually_impaired_individuals_for_their_real_time_navigation_ (1).pdf
Model_for_viusal_impairment.ipynb		Model_for_viusal_impairment.ipynb
README.md		README.md
Transformed Data Analysis.xlsx		Transformed Data Analysis.xlsx
VideoStreamColab.py		VideoStreamColab.py
Visually_Impair_Answers_Puebla.ipynb		Visually_Impair_Answers_Puebla.ipynb
change_name.ipynb		change_name.ipynb
documentation.md		documentation.md
dog.jpg		dog.jpg
main.py		main.py
models.py		models.py
modelsCopy.py		modelsCopy.py
onVideo_d.py		onVideo_d.py
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Monocular Deep Learning Multimodal with Object Relevance Estimation for Real-Time Navigation of Visually Impaired individuals (MMOR)

Table of Contents

Requirements

Installation

Usage

Credits

About

Uh oh!

Releases

Packages

Uh oh!

Languages

enriquegv001/depth_and_det_visual_impair

Folders and files

Latest commit

History

Repository files navigation

Monocular Deep Learning Multimodal with Object Relevance Estimation for Real-Time Navigation of Visually Impaired individuals (MMOR)

Table of Contents

Requirements

Installation

Usage

Credits

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages