基于 AI 的智能语音转文本输入法,支持多种语音识别模型,为您提供准确、便捷的语音输入体验。
- 🎤 智能语音识别:集成 SiliconFlow API,支持多种语音识别模型
- 🔄 实时转换:语音实时转换为文字,输入效率高
- ⚙️ 灵活配置:支持多种模型选择和个性化设置
- 📱 Material 3 设计:现代化的用户界面,符合 Android 设计规范
- 🔐 隐私保护:录音文件仅用于转换,不会保存或上传
- FunAudioLLM/SenseVoiceSmall (推荐)
- OpenAI Whisper
- Speech-01
- 访问 SiliconFlow 官网
- 注册账号并获取 API Token
- 记录您的 Token 备用
# 构建项目
./gradlew build
# 安装到设备
./gradlew installDebug
-
配置 API Token
- 打开 Vox 应用
- 点击"配置 API Token"
- 输入您的 SiliconFlow API Token
-
启用输入法
- 点击"启用输入法"
- 在系统设置中启用"Vox 语音输入法"
-
选择输入法
- 点击"选择输入法"
- 将 Vox 设为当前输入法
- 在任意需要输入文字的应用中点击输入框
- 选择 Vox 语音输入法
- 点击麦克风按钮开始录音
- 说话完毕后再次点击停止录音
- 等待语音转换为文字并自动输入
- API Token:SiliconFlow API 访问令牌
- 语音识别模型:选择合适的语音识别模型
- 自动发送:转换完成后自动将文字发送到输入框
- 录音震动:开始和结束录音时震动提示
- 录音音效:开始录音时播放音效提示
- VoiceInputMethodService:输入法服务,处理语音录制和文本输入
- VoiceRepository:语音处理仓库,集成录音和API调用
- AudioRecorder:音频录制管理器
- PreferencesManager:用户偏好设置管理
- Kotlin:主要开发语言
- Jetpack Compose:现代化UI框架
- Material 3:设计系统
- Retrofit:网络请求库
- DataStore:数据持久化
- Coroutines:异步处理
curl --request POST \
--url https://api.siliconflow.cn/v1/audio/transcriptions \
--header 'Authorization: Bearer <your-token>' \
--header 'Content-Type: multipart/form-data' \
--form model=FunAudioLLM/SenseVoiceSmall \
--form file=@audio.m4a
{
"text": "转换后的文字内容"
}
- 录音权限:用于录制语音进行转换
- 网络权限:用于调用语音转文本API
- 震动权限:用于录音时的震动反馈
- 网络要求:需要稳定的网络连接来调用API
- API 配额:注意SiliconFlow API的使用配额限制
- 录音质量:在安静环境下录音效果更佳
- 语言支持:支持中文和英文语音识别
-
无法录音
- 检查是否授予了录音权限
- 确认麦克风硬件正常工作
-
转换失败
- 检查网络连接是否正常
- 验证API Token是否正确
- 确认API配额是否用完
-
输入法无法选择
- 确认已在系统设置中启用输入法
- 重启应用后重试
- 版本:1.0.0
- 最低 Android 版本:API 35 (Android 15)
- 目标 Android 版本:API 35
本项目采用 MIT 许可证,详见 LICENSE 文件。
欢迎提交 Issue 和 Pull Request 来改进这个项目。
如有问题或建议,请通过 GitHub Issues 联系我们。