proposal

12.30更新，所有模型的实验数据放在此,每个模型的数据概括在description.md中，可用于完成报告

数据集处理

构建词表(先自己实现了，后期可以用现成的试试看)

已经完成于，见此处，Vocab类将语料中出现的单词映射为一个唯一的编码。

数据可视化于此

构建dataset

对于Dataset对象，用索引方式得到一个tuple(input,label)

已经实现于此使用方法见DatasetDemo

padding

每个句子的长度不一样，编码后要填充为一样的长度，统计发现大部分句子长度在200到600之间，所以在600处截断。

masking（可选，先实现训练，后期可以再加）

防止填充的部分影响模型训练，故采用掩蔽(masking)

rnn等循环神经网络的掩蔽策略
transformer的掩蔽

寻找更多语料？

模型选择

softmax+ff

完全没有效果，但可以阅读这一篇了解训练的流程

rnn

gru

lstm

纯粹的lstm也几乎没有效果增加了以下策略：

双向
dropout
最大池化
隐藏状态用0初始化

准确率达到82%

还不知道是哪一个策略起了效果，需要对比文件中的两个自定义lstm控制变量研究一下

12.15已经新增任务于lstm文件,见文档的最后一个cell

transformer

2024.12.22 新增准备文件

2024.12.26 仅仅使用transformer编码器的堆叠，实现类似BERT的结构，参数和BERT类似：

编码器层数：10

隐藏神经元：768

注意力头数：12

训练轮数：50

参数大小：约800M

训练环境：nvidia L20 48G

学习率：2e-5

训练结果：

最低损失epoch50,batch200,loss = 0.11672550439834595好于前面所有的模型

准确率约85%

改进建议：引入early stop，在模型性能变差时中止训练

其他预训练模型？

GPT2(small)尝试，取最后一个logits再连接一个一个二分头需要hugging face 库 pip3 install transformer

GPT2(large)

BERT(base)

模型训练

可阅读这一篇

对每个句子，其每个单词被编码为数字，每个数字被拓展为一个向量(通过nn.embedding实现)，每个输入的形状是(batch_size,num_steps,embedding_size),输出则是(batch_size,2),以交叉熵作为损失函数进行训练。

Name		Name	Last commit message	Last commit date
Latest commit History 39 Commits
models		models
paper		paper
.gitignore		.gitignore
BERT.py		BERT.py
DataDemo.ipynb		DataDemo.ipynb
DatasetDemo.ipynb		DatasetDemo.ipynb
EncoderDecoder.py		EncoderDecoder.py
Fliter.py		Fliter.py
GPT2.py		GPT2.py
MemoryChecker.py		MemoryChecker.py
MemoryLog.py		MemoryLog.py
MyTransformer.py		MyTransformer.py
NN.py		NN.py
TrainWithFF.ipynb		TrainWithFF.ipynb
TransformerEncoder.ipynb		TransformerEncoder.ipynb
data_process.py		data_process.py
lstm.ipynb		lstm.ipynb
motionClassify.csv		motionClassify.csv
readme.md		readme.md
requirements.txt		requirements.txt
seq2seq.py		seq2seq.py
tools.py		tools.py
train.py		train.py
vocab.py		vocab.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

proposal

12.30更新，所有模型的实验数据放在此,每个模型的数据概括在description.md中，可用于完成报告

数据集处理

构建词表(先自己实现了，后期可以用现成的试试看)

构建dataset

padding

masking（可选，先实现训练，后期可以再加）

寻找更多语料？

模型选择

softmax+ff

rnn

gru

lstm

transformer

其他预训练模型？

模型训练

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

YukiNasumi/EmotionClassify

Folders and files

Latest commit

History

Repository files navigation

proposal

12.30更新，所有模型的实验数据放在此,每个模型的数据概括在description.md中，可用于完成报告

数据集处理

构建词表(先自己实现了，后期可以用现成的试试看)

构建dataset

padding

masking（可选，先实现训练，后期可以再加）

寻找更多语料？

模型选择

softmax+ff

rnn

gru

lstm

transformer

其他预训练模型？

模型训练

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages