Skip to content

superogira/Audio-recorder-and-transcriber

Repository files navigation

Audio-recorder-and-transcriber

source code ทำงานกับ Python 3.11.9 ถ้าเวอร์ชั่นสูงกว่านี้อาจจะไม่ทำงาน

ไปทดลองเล่นได้ที่

E25WOP.com Alt text Alt text Alt text Alt text Alt text

ทดลองรันบน Rasberry Pi Zero 2 W

บน Rasberry Pi OS 64-bit สามารถใช้งานได้ (ทดลองใช้ Ubuntu OS แล้ว ค้าง เมื่อใช้ไปได้ไม่กี่นาที) Alt text

การถอดข้อความจากเสียง ปัจจุบันทำไว้รองรับ 5 ระบบ คือ

  1. Microsoft Azure AI Speech to Text (ฟรี 5 ชม.ต่อเดือน รองรับภาษาไทย)
  2. Google Cloud Speech-to-Text (ฟรี 1 ชม. ต่อเดือน หลังจากนั้นราว ๆ 1$/ชม. รองรับภาษาไทย)
  3. AssemblyAI (ฟรี 50$ แต่ยังไม่รองรับภาษาไทย)
  4. IBM Cloud (ฟรี 500 นาที แต่ยังไม่รองรับภาษาไทย)
  5. Speechmatics (ฟรี 8 ชม. ราคาถูกกว่าเจ้าอื่น ๆ รองรับภาษาไทย)

เพราะฉนั้นก่อนการใช้งานควรไปสร้าง API ก่อน (วิธีการสมัคร , การสร้าง สามารถสอบถามจาก ChatGPT ได้เลย)

การตั้งค่าการทำงานของระบบ ให้ตั้งค่าที่ไฟล์ recorder_transcriber-config.json

Alt text

ถ้าจะ Host ระบบเว็บด้วยตัวเอง อย่าลืมไป...

  • กำหนด username ใน secure_config.php
  • ทำ echo password_hash แล้วเอาค่าที่ hash แล้วไปกำหนดให้ $hashed_password
  • สร้างฐานข้อมูลจากไฟล์ 1.database.sql
  • ตั้งค่า ฐานข้อมูลใน db_config.php
  • ตั้งค่าว่าจะเก็บไฟล์ขนาดรวมกันได้เท่าไหร่ ($maxSize) ก่อนจะลบไฟล์เก่าสุดออก ใน upload.php (ค่าพื้นฐาน คือ 5GB)
  • กรณีจะใช้ระบบย้ายไฟล์ไป Google Drive ต้องตั้งค่าต่าง ๆ ในไฟล์ process_drive_transfer.php และ upload.php รวมถึงติดตั้ง Google API PHP Client ด้วย composer (คำสั่ง composer require google/apiclient) หรือจะโหลดไฟล์ vendor.zip นี้ไปแตกไฟล์ลงไปแทนก็ได้

ปัญหาที่ทราบอยู่แล้ว

  • บน Windows ถ้าใช้ Remote Desktop Connection ของ Windows เพื่อ Remote เข้าไป run ระบบ ตอนตัดการเชื่อมต่อ Remote จะเกิด error แนวทางแก้ไขเบื้องต้นคือ ให้ใช้โปรแกรม Remote ตัวอื่น เช่น Anydesk

มีปัญหาข้อสอบถามติดต่อได้ที่ Facebook

FACEBOOK