Skip to content

Aplicación de transcripción de voz a texto utilizando Whisper AI, con integración de control por atajo global (Ctrl + Alt) y funcionalidades de grabación manual. Permite copiar y pegar automáticamente la transcripción en cualquier aplicación activa.

License

Notifications You must be signed in to change notification settings

felipetobars/easy_whisper

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🎤 Easy Whisper: Transcripción de voz a texto con interfaz gráfica

Easy Whisper es una aplicación de escritorio que convierte tu voz en texto utilizando inteligencia artificial. Desarrollada con Python y la biblioteca Whisper de OpenAI, ofrece una interfaz gráfica sencilla y eficiente.

Interfaz Principal


🛠️ Instalación

1. Crear un entorno virtual con Miniconda

Para mantener las dependencias organizadas, es recomendable crear un entorno virtual con Miniconda:

conda create -n easy_whisper
conda activate easy_whisper

2. Instalar Pytorch con soporte de CUDA (opcional si se tiene una GPU NVIDIA)

Ver comandos de instalación según la versión de CUDA disponible en tu sistema (https://pytorch.org/get-started/locally/).

Ejemplo:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124

3. Instalar Whisper

Para utilizar Whisper,seguir la instrucciones desde el repositorio oficial de OpenAI (https://github.com/openai/whisper/tree/main).

Ejemplo:

Usando pip:

pip install -U openai-whisper

Desde el repositorio (recomendado para GPU):

pip install git+https://github.com/openai/whisper.git 

4. Instalar las dependencias adicionales

Instala las siguientes bibliotecas necesarias para el funcionamiento de la aplicación:

pip install pyside6 sounddevice numpy pyautogui keyboard

🚀 Uso

1. Activa el entorno virtual:

conda activate easy_whisper

2. Ejecuta la aplicación:

python main.py

📚 Instrucciones de uso

1. 🔧 Selecciona tu micrófono en la lista desplegable.

2. 🎙️ Habla normalmente y presiona Ctrl + Alt para comenzar o detener la grabación.

3. 📋 El texto transcrito se copiará automáticamente y se pegará en la aplicación que tengas activa.

4. 🔵 La barra azul muestra la intensidad del sonido detectado (más alta = estás hablando).

5. 🎛️ También puedes usar el botón de la interfaz para controlar manualmente la grabación.

ℹ️ La transcripción puede tardar unos segundos al terminar de hablar.

Ejemplo de uso

📄 Licencia

Esta aplicación está disponible bajo la GNU Affero General Public License v3.0 (AGPL-3.0). Consulta el archivo LICENSE para obtener más detalles sobre los términos y condiciones de esta licencia.

About

Aplicación de transcripción de voz a texto utilizando Whisper AI, con integración de control por atajo global (Ctrl + Alt) y funcionalidades de grabación manual. Permite copiar y pegar automáticamente la transcripción en cualquier aplicación activa.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages