GitHub - dm-fedorov/pbp_cookiecutter: Шаблон cookiecutter на русском языке для анализа данных

Структура директорий

Типичный процесс проведения анализа данных включает несколько этапов:

предварительная обработка данных или ETL, Extract-Transform-Load (1-Data_Prep);
анализ данных или Exploratory Data Analysis (2-EDA).

Jupyter (Lab) Notebook перекладывает ответственность за структуру проекта на исследователя, поэтому важно о структуре подумать заранее.

Следующий шаблон ускорит разработку проектов в области науки о данных, т.к. обладает ясной и предсказуемой структурой файлов и директорий (повторяет схему выше):

.
├── 1-Data_Prep.ipynb  # Блокнот для подготовки данных
├── 2-EDA.ipynb        # Блокнот для анализа данных (может быть несколько)
├── data               # Директория с данными
│   ├── interim        # Рабочая директория для временных файлов
│   ├── processed      # Очищенные данные, готовые к анализу
│   └── raw            # Оригинальные (сырые) данные (никогда не должны изменяться)
└── reports            # Финальные отчеты (например, Excel)

Установка

В дистрибутиве Anaconda/Miniconda установка следующая:

$ conda config --add channels conda-forge
$ conda install cookiecutter

Если начнет ругаться на отсутствие git:

$ conda install -c anaconda git

В пути желательно не указывать кириллические символы, Anaconda/Miniconda их не любят.

Использование

В директории, в которой вы хотите хранить запускаемый проект, выполните шаблон следующим образом, ответив на вопросы, относящиеся к вашему проекту:

$ cookiecutter https://github.com/dm-fedorov/pbp_cookiecutter        
project_name [project_name]: data_journalism_project
directory_name [data_journalism_project]: 
description [More background on the project]: Исследование трендов.

В результате появится директория data_journalism_project, в которой хранятся необходимые файлы.

Дополнительная литература

Идея шаблона из статьи.
Документация по Cookiecutter: Better Project Templates

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
{{cookiecutter.directory_name}}		{{cookiecutter.directory_name}}
LICENSE		LICENSE
README.md		README.md
cookiecutter.json		cookiecutter.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Структура директорий

Установка

Использование

Дополнительная литература

About

Uh oh!

Releases

Packages

Languages

License

dm-fedorov/pbp_cookiecutter

Folders and files

Latest commit

History

Repository files navigation

Структура директорий

Установка

Использование

Дополнительная литература

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages