Skip to content

CAU-LiuZiyu/Data-Analysis-for-Infomatics

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Data_Analysis_for_Infomatics

CAU Graduate Student Course Materials

Outline

Lesson_One

Advanced Features of Python, Numpy and Pandas

Homework: data analysis tryout.

Lesson_Two

Data for Infomatics Research, Data Cleaning and Regular Expression

In class presentation:

2-1 介绍如何下载scopus、wos、cnki数据以及数据的基本形式和内容(1分);

2-2 介绍网络应用程序API是什么,调用API的基本规范和基本方式是什么(2分);

2-3 介绍科技情报数据清洗和整理的基本步骤,每一步的难点都是什么,可结合已有研究论文进行综述(2分);

2-4 介绍科技情报数据中有关作者名、作者机构、关键词的具体清洗方法,可参考苏新宁著《面向知识服务的知识组织理论与方法》相关内容或其他论文(2分)。

Lesson_Three

ScientoPy and MetaKnowledge

In class presentation:

3-1 介绍不同文摘数据库的学科分类,以及如何建立本地的期刊-学科、文献-学科映射;(2分)

3-2 介绍题录数据中引文部分的引文缩略格式,以及如何将缩略引文和完整引文进行大规模快速映射;(3分)

3-3 介绍metaknowledge库(https://github.com/UWNETLAB/metaknowledge),分析metaknowledge库的架构,以及核心代码;(3分)

3-4 介绍ScientoPy库(https://github.com/jpruiz84/ScientoPy),分析ScientoPy库的架构,以及核心代码;(3分)

3-5 介绍Awesome Scholarly Data Analysis列表(https://github.com/napsternxg/awesome-scholarly-data-analysis),则要介绍列表中的资源。(1分)

Lesson_Four

Network Analysis

In class presentation:

4-1 介绍networkx库,以及基本的图论知识(包括顶点、边等术语,以及广度优先、深度优先等遍历算法,还有中心性、密度等概念),以及使用networkx实现引文图谱;(3分)

4-2 介绍基于关键词共现的文献主题聚类方法,及其局限;(2分)

4-3 介绍vosviewer所使用的聚类算法(smart local moving algorithm),参见相关论文Waltman, L., & Van Eck, N.J. (2013). A smart local moving algorithm for large-scale modularity-based community detection. European Physical Journal B, 86(11), 471;(3分)

4-4 完成CWTS科学计量课程(https://github.com/CWTSLeiden/CSSS),并分享课程内容和成果。(4分)

About

CAU Graduate Student Course Materials

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published