Easy Whisper es una aplicación de escritorio que convierte tu voz en texto utilizando inteligencia artificial. Desarrollada con Python y la biblioteca Whisper de OpenAI, ofrece una interfaz gráfica sencilla y eficiente.
Para mantener las dependencias organizadas, es recomendable crear un entorno virtual con Miniconda:
conda create -n easy_whisper
conda activate easy_whisper
Ver comandos de instalación según la versión de CUDA disponible en tu sistema (https://pytorch.org/get-started/locally/).
Ejemplo:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124
Para utilizar Whisper,seguir la instrucciones desde el repositorio oficial de OpenAI (https://github.com/openai/whisper/tree/main).
Ejemplo:
Usando pip:
pip install -U openai-whisper
Desde el repositorio (recomendado para GPU):
pip install git+https://github.com/openai/whisper.git
Instala las siguientes bibliotecas necesarias para el funcionamiento de la aplicación:
pip install pyside6 sounddevice numpy pyautogui keyboard
conda activate easy_whisper
python main.py
1. 🔧 Selecciona tu micrófono en la lista desplegable.
2. 🎙️ Habla normalmente y presiona Ctrl + Alt para comenzar o detener la grabación.
3. 📋 El texto transcrito se copiará automáticamente y se pegará en la aplicación que tengas activa.
4. 🔵 La barra azul muestra la intensidad del sonido detectado (más alta = estás hablando).
5. 🎛️ También puedes usar el botón de la interfaz para controlar manualmente la grabación.
Esta aplicación está disponible bajo la GNU Affero General Public License v3.0 (AGPL-3.0). Consulta el archivo LICENSE para obtener más detalles sobre los términos y condiciones de esta licencia.