J-MFD(Japanese Morphological and Functional Dictionary)を使用した日本語テキストの形態素解析と単語抽出を行うツール。
- CSVファイルからテキストデータを読み込み
- MeCabを使った形態素解析
- J-MFD辞書に基づく単語のカウント
- カテゴリ別の単語出現頻度分析
# macOS (Homebrew)
brew install mecab mecab-ipadic
# Ubuntu/Debian
sudo apt-get install mecab mecab-ipadic-utf8 libmecab-dev
# CentOS/RHEL
sudo yum install mecab mecab-ipadic mecab-devel
pip install mecab-python3 ipadic
- リポジトリをクローン
git clone <repository-url>
cd j-mfd-sample
- Python仮想環境の作成(推奨)
python -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
- 依存関係のインストール
pip install -r requirements.txt
- J-MFD辞書ファイルの配置
./data/J-MFD.csv
に辞書ファイルを配置してください
python main.py -f {file_path}