🎤 Easy Whisper: Transcripción de voz a texto con interfaz gráfica

Easy Whisper es una aplicación de escritorio que convierte tu voz en texto utilizando inteligencia artificial. Desarrollada con Python y la biblioteca Whisper de OpenAI, ofrece una interfaz gráfica sencilla y eficiente.

🛠️ Instalación

1. Crear un entorno virtual con Miniconda

Para mantener las dependencias organizadas, es recomendable crear un entorno virtual con Miniconda:

conda create -n easy_whisper
conda activate easy_whisper

2. Instalar Pytorch con soporte de CUDA (opcional si se tiene una GPU NVIDIA)

Ver comandos de instalación según la versión de CUDA disponible en tu sistema (https://pytorch.org/get-started/locally/).

Ejemplo:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124

3. Instalar Whisper

Para utilizar Whisper,seguir la instrucciones desde el repositorio oficial de OpenAI (https://github.com/openai/whisper/tree/main).

Ejemplo:

Usando pip:

pip install -U openai-whisper

Desde el repositorio (recomendado para GPU):

pip install git+https://github.com/openai/whisper.git

4. Instalar las dependencias adicionales

Instala las siguientes bibliotecas necesarias para el funcionamiento de la aplicación:

pip install pyside6 sounddevice numpy pyautogui keyboard

🚀 Uso

1. Activa el entorno virtual:

conda activate easy_whisper

2. Ejecuta la aplicación:

python main.py

📚 Instrucciones de uso

1. 🔧 Selecciona tu micrófono en la lista desplegable.

2. 🎙️ Habla normalmente y presiona Ctrl + Alt para comenzar o detener la grabación.

3. 📋 El texto transcrito se copiará automáticamente y se pegará en la aplicación que tengas activa.

4. 🔵 La barra azul muestra la intensidad del sonido detectado (más alta = estás hablando).

5. 🎛️ También puedes usar el botón de la interfaz para controlar manualmente la grabación.

ℹ️ La transcripción puede tardar unos segundos al terminar de hablar.

📄 Licencia

Esta aplicación está disponible bajo la GNU Affero General Public License v3.0 (AGPL-3.0). Consulta el archivo LICENSE para obtener más detalles sobre los términos y condiciones de esta licencia.

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
images		images
LICENSE		LICENSE
README.md		README.md
backend.py		backend.py
gui.py		gui.py
logo.ico		logo.ico
main.py		main.py
qt.conf		qt.conf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

🎤 Easy Whisper: Transcripción de voz a texto con interfaz gráfica

🛠️ Instalación

1. Crear un entorno virtual con Miniconda

2. Instalar Pytorch con soporte de CUDA (opcional si se tiene una GPU NVIDIA)

3. Instalar Whisper

4. Instalar las dependencias adicionales

🚀 Uso

1. Activa el entorno virtual:

2. Ejecuta la aplicación:

📚 Instrucciones de uso

ℹ️ La transcripción puede tardar unos segundos al terminar de hablar.

📄 Licencia

About

Uh oh!

Releases

Packages

Languages

License

felipetobars/easy_whisper

Folders and files

Latest commit

History

Repository files navigation

🎤 Easy Whisper: Transcripción de voz a texto con interfaz gráfica

🛠️ Instalación

1. Crear un entorno virtual con Miniconda

2. Instalar Pytorch con soporte de CUDA (opcional si se tiene una GPU NVIDIA)

3. Instalar Whisper

4. Instalar las dependencias adicionales

🚀 Uso

1. Activa el entorno virtual:

2. Ejecuta la aplicación:

📚 Instrucciones de uso

ℹ️ La transcripción puede tardar unos segundos al terminar de hablar.

📄 Licencia

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages