语音转文字智能助手

这是一个基于 React 和 Vite 开发的语音转文字智能助手应用。用户可以通过语音输入，获得 AI 转录的文本，并得到智能润色和主题延伸建议。

功能特点

1. 语音录制 ✅

简洁的录音界面
实时录音状态显示
支持录音暂停和继续
实时显示录音时长

2. 语音转文字 ✅

使用 Silicon Flow API 进行语音识别
支持中文语音识别
实时显示转录进度
支持 WAV 格式音频处理

3. 文本智能处理 ✅

AI 文本润色和优化
智能纠正错别字
提供相关主题延伸建议
自动生成相关标签

4. 历史记录管理 ✅

按时间倒序展示历史记录
支持查看历史录音
支持查看历史转录文本
支持查看历史润色结果
本地存储历史记录

技术栈

React 18
Vite 4
TypeScript
TailwindCSS (用于样式)
Silicon Flow API (语音识别和文本处理)

项目结构

src/
├── components/         # 可复用组件
├── pages/             # 页面组件
├── hooks/             # 自定义 Hooks
├── services/          # API 服务
├── types/             # TypeScript 类型定义
├── utils/             # 工具函数
└── assets/            # 静态资源

开发计划

第一阶段：基础架构搭建 ✅

项目初始化
配置 TypeScript
配置 TailwindCSS
设置路由系统

第二阶段：核心功能开发 ✅

实现录音功能
集成语音转文字 API
集成文本润色 API
实现历史记录存储

第三阶段：UI 开发 ✅

设计并实现首页
设计并实现历史页面
实现录音状态显示
优化用户交互体验

第四阶段：优化和测试 🚧

性能优化
错误处理
单元测试
用户测试

环境要求

Node.js >= 16.17.0
npm >= 8.0.0

安装和运行

# 安装依赖
npm install

# 启动开发服务器
npm run dev

# 构建生产版本
npm run build

# 预览生产版本
npm run preview

API 配置

本项目使用 Silicon Flow API 进行语音识别和文本处理。您需要在项目根目录创建 .env 文件并配置以下环境变量：

VITE_SILICONFLOW_API_KEY=你的API密钥
VITE_SILICONFLOW_BASE_URL=API基础URL

使用说明

首页功能：
- 点击"开始录音"按钮开始录音
- 录音过程中可以点击"暂停录音"按钮暂停
- 点击"停止录音"按钮结束录音并开始处理
- 等待处理完成后可以查看转录结果和优化建议
历史记录：
- 在导航栏点击"历史记录"查看所有历史转录
- 可以播放历史录音
- 查看原始文本和优化后的文本
- 查看相关标签

注意事项

请确保在使用录音功能时允许浏览器访问麦克风
建议使用 Chrome 或 Firefox 浏览器以获得最佳体验
录音文件仅保存在本地，不会上传到服务器
首次使用需要配置 API 密钥
录音时长建议控制在 5 分钟以内

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
public		public
src		src
.env.example		.env.example
.gitignore		.gitignore
README.md		README.md
eslint.config.js		eslint.config.js
index.html		index.html
package-lock.json		package-lock.json
package.json		package.json
postcss.config.js		postcss.config.js
tailwind.config.js		tailwind.config.js
tsconfig.json		tsconfig.json
tsconfig.node.json		tsconfig.node.json
vite.config.js		vite.config.js
vite.config.ts		vite.config.ts

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

语音转文字智能助手

功能特点

1. 语音录制 ✅

2. 语音转文字 ✅

3. 文本智能处理 ✅

4. 历史记录管理 ✅

技术栈

项目结构

开发计划

第一阶段：基础架构搭建 ✅

第二阶段：核心功能开发 ✅

第三阶段：UI 开发 ✅

第四阶段：优化和测试 🚧

环境要求

安装和运行

API 配置

使用说明

注意事项

About

Uh oh!

Releases

Packages

Uh oh!

Languages

xiaoyangliu1123/VoiceEditRecorder

Folders and files

Latest commit

History

Repository files navigation

语音转文字智能助手

功能特点

1. 语音录制 ✅

2. 语音转文字 ✅

3. 文本智能处理 ✅

4. 历史记录管理 ✅

技术栈

项目结构

开发计划

第一阶段：基础架构搭建 ✅

第二阶段：核心功能开发 ✅

第三阶段：UI 开发 ✅

第四阶段：优化和测试 🚧

环境要求

安装和运行

API 配置

使用说明

注意事项

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages