MSCAPP Seminar Lessons

On 13 Feb 2024, I gave a lunchtime talk on creating an analysis using basic text analytics and stylometrics. The ISOT Fake News Data Set was used as the basis for demonstrating the following activities:

Setting up a text processing pipeline in spaCy.
Calculating counts and proportions of text features.
Calculating readability metrics, vocabulary richness, and lexical diversity via common python packages:
- Automated Readability Index (ARI) via textstat.
- Type-Token Ratio and Measure of Textual Lexical Diversity via lexicalrichness.
Determining emotion and valence of texts using LeXmo.
Reviewed 3 potential projects using text analytics and stylometrics:
- Clustering
- Topic Modeling with BERTopic
- Predictive Modeling

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
data		data
MSCAPP_Metrics.ipynb		MSCAPP_Metrics.ipynb
MSCAPP_Seminar_13Feb2024.pptx		MSCAPP_Seminar_13Feb2024.pptx
MSCAPP_Stylometry_and_Text_Analytics.ipynb		MSCAPP_Stylometry_and_Text_Analytics.ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

MSCAPP Seminar Lessons

About

Uh oh!

Releases

Packages

Languages

lammypi/MSCAPP_Seminar_Lessons

Folders and files

Latest commit

History

Repository files navigation

MSCAPP Seminar Lessons

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages