Skip to content

xiaoyangliu1123/VoiceEditRecorder

Repository files navigation

语音转文字智能助手

这是一个基于 React 和 Vite 开发的语音转文字智能助手应用。用户可以通过语音输入,获得 AI 转录的文本,并得到智能润色和主题延伸建议。

功能特点

1. 语音录制 ✅

  • 简洁的录音界面
  • 实时录音状态显示
  • 支持录音暂停和继续
  • 实时显示录音时长

2. 语音转文字 ✅

  • 使用 Silicon Flow API 进行语音识别
  • 支持中文语音识别
  • 实时显示转录进度
  • 支持 WAV 格式音频处理

3. 文本智能处理 ✅

  • AI 文本润色和优化
  • 智能纠正错别字
  • 提供相关主题延伸建议
  • 自动生成相关标签

4. 历史记录管理 ✅

  • 按时间倒序展示历史记录
  • 支持查看历史录音
  • 支持查看历史转录文本
  • 支持查看历史润色结果
  • 本地存储历史记录

技术栈

  • React 18
  • Vite 4
  • TypeScript
  • TailwindCSS (用于样式)
  • Silicon Flow API (语音识别和文本处理)

项目结构

src/
├── components/         # 可复用组件
├── pages/             # 页面组件
├── hooks/             # 自定义 Hooks
├── services/          # API 服务
├── types/             # TypeScript 类型定义
├── utils/             # 工具函数
└── assets/            # 静态资源

开发计划

第一阶段:基础架构搭建 ✅

  • 项目初始化
  • 配置 TypeScript
  • 配置 TailwindCSS
  • 设置路由系统

第二阶段:核心功能开发 ✅

  • 实现录音功能
  • 集成语音转文字 API
  • 集成文本润色 API
  • 实现历史记录存储

第三阶段:UI 开发 ✅

  • 设计并实现首页
  • 设计并实现历史页面
  • 实现录音状态显示
  • 优化用户交互体验

第四阶段:优化和测试 🚧

  • 性能优化
  • 错误处理
  • 单元测试
  • 用户测试

环境要求

  • Node.js >= 16.17.0
  • npm >= 8.0.0

安装和运行

# 安装依赖
npm install

# 启动开发服务器
npm run dev

# 构建生产版本
npm run build

# 预览生产版本
npm run preview

API 配置

本项目使用 Silicon Flow API 进行语音识别和文本处理。您需要在项目根目录创建 .env 文件并配置以下环境变量:

VITE_SILICONFLOW_API_KEY=你的API密钥
VITE_SILICONFLOW_BASE_URL=API基础URL

使用说明

  1. 首页功能:

    • 点击"开始录音"按钮开始录音
    • 录音过程中可以点击"暂停录音"按钮暂停
    • 点击"停止录音"按钮结束录音并开始处理
    • 等待处理完成后可以查看转录结果和优化建议
  2. 历史记录:

    • 在导航栏点击"历史记录"查看所有历史转录
    • 可以播放历史录音
    • 查看原始文本和优化后的文本
    • 查看相关标签

注意事项

  1. 请确保在使用录音功能时允许浏览器访问麦克风
  2. 建议使用 Chrome 或 Firefox 浏览器以获得最佳体验
  3. 录音文件仅保存在本地,不会上传到服务器
  4. 首次使用需要配置 API 密钥
  5. 录音时长建议控制在 5 分钟以内

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published