参考文章:基于TextRank算法的文本摘要(附Python代码)
原文以同领域多篇文章输入,生成的一个单要点摘要。本项目以独立整篇文章作为输入,分别输出每篇文章的摘要。
目录结构:
.
├── SentenceSplit.py
├── __pycache__
│ └── SentenceSplit.cpython-37.pyc
├── sample_article.txt
├── sgns.wiki.word
├── sgns.wiki.word.bz2
├── stop_words.txt
└── summary_chinese.ipynb
SentenceSplit.py
参考于用户@GLZ1925给出的中文分句方法sample_article.txt
随机取自雷锋网最新文章sgns.wiki.word.bz2
为Chinese Word Vectors 中文词向量中的Wikipedia_zh 中文维基百科预训练模型。解压后得到sgns.wiki.word
,使用时请删除文档中第一行数据形状信息。stop_words.txt
中文停用词summary_chinese.ipynb
TextRank算法实现代码