김남형 | 유준혁 | 최우진 |
---|---|---|
- 김남형(AI) : AI 파인 튜닝 (Text to Sign)
- 유준혁(WEB) : 파인튜닝된 AI 모델을 백엔드에 통합하여 서버 로직과 연결하고, 웹 프론트엔드와 연동
- 최우진(AI) : 수어 영상 인식 AI Pose Transformer 파인 튜닝 (Sign to Text)
SignToText_.x2.mp4
- 구현 방식
- JavaScript의 MediaRecorder API로 수어를 WebM 형식으로 녹화합니다.
- 녹화된 WebM 파일을 ffmpeg으로 MP4 형식으로 변환합니다.
- 생성된 MP4 파일을 파인튜닝된 Pose Transformer AI 모델에 입력합니다.
- AI가 출력한 글로스(단어)를 웹 화면에 표시합니다.
TextToSign_.mp4
- 구현 방식
- 사용자가 텍스트를 입력합니다.
- 입력된 텍스트를 HuggingFace API에 전달해 글로스(단어) 단위로 분리한 뒤 리스트로 반환받습니다.
- 반환된 글로스 리스트를 기반으로 VectorDB에서 매칭되는 영상 및 수어 설명을 조회합니다.
- 조회 결과(수어 영상 및 설명)를 사용자에게 출력합니다.