Skip to content

hibikihsh/j-mfd-sample

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 

Repository files navigation

J-MFD Sample

概要

J-MFD(Japanese Morphological and Functional Dictionary)を使用した日本語テキストの形態素解析と単語抽出を行うツール。

主な特徴

  • CSVファイルからテキストデータを読み込み
  • MeCabを使った形態素解析
  • J-MFD辞書に基づく単語のカウント
  • カテゴリ別の単語出現頻度分析

環境構築

必要な依存関係

MeCab

# macOS (Homebrew)
brew install mecab mecab-ipadic

# Ubuntu/Debian
sudo apt-get install mecab mecab-ipadic-utf8 libmecab-dev

# CentOS/RHEL
sudo yum install mecab mecab-ipadic mecab-devel

Python パッケージ

pip install mecab-python3 ipadic

セットアップ

  1. リポジトリをクローン
git clone <repository-url>
cd j-mfd-sample
  1. Python仮想環境の作成(推奨)
python -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate
  1. 依存関係のインストール
pip install -r requirements.txt
  1. J-MFD辞書ファイルの配置
    • ./data/J-MFD.csv に辞書ファイルを配置してください

command

形態素解析と単語の抽出

python main.py -f {file_path}

references

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages