Skip to content

2022秋季CS247《数据挖掘》项目:使用逻辑回归、支持向量机、BERT、GPT2等模型完成twitter160万条数据的情感分析

Notifications You must be signed in to change notification settings

LuyuZhang00/Data-Mining

Repository files navigation

数据挖掘大作业-情感分析

大作业要求答辩PPT

1.背景介绍:

1.1 任务介绍:

在自然语言处理中,情感分析和观点挖掘是文本数据挖掘领域的一个重要方向。情感分析一般指判断一段文本所表达的情绪状态,属于文本分类问题。主要任务是对文本中的主观信息(如观点、情感、评价、态度、情绪等)进行提取、分析、处理、归纳和推理。本次任务中,我们需要通过模型对一段文本进行情绪的正负判断,可以作为一个简单的二分类任务。

1.2 数据集介绍:

本次使用的数据集从网络上爬取的推文,其中训练集160万条。数据集拥有六个特征,分别是标签、ID、日期、话题、用户以及推文内容。

2实验思路:

Alt text

3.具体实现:

Alt text Alt text Alt text

Alt text Alt text

Alt text Alt text

4.思考与展望:

Alt text

About

2022秋季CS247《数据挖掘》项目:使用逻辑回归、支持向量机、BERT、GPT2等模型完成twitter160万条数据的情感分析

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published