Token_Drop

This repository contains the original implementation of the token drop methods presented in
Token Drop mechanism for Neural Machine Translation (COLING 2020)
code based on fairseq-v0.9.0

Environment

python=3.8
pytorch=1.4

Installation

git clone https://github.com/zhajiahe/Token_Drop.git

cd Token_Drop && pip intall --editable .

Prepare data (EN-RO)

Download data

Download WMT16'EN-RO preprocessed by Lee et al. 2018 : Data

Binarize data

bash preprocess.sh

Training model

We conduct our experiment on 2 Tesla V100 by defalut.

Baseline system

CUDA_VISIBLE_DEVICES=0,1 python train.py data-bin/wmt16.en_ro --optimizer adam --criterion label_smoothed_cross_entropy --lr-scheduler inverse_sqrt \
                        --arch transformer --min-lr  1e-09 --lr  0.0003 --label-smoothing 0.1 --dropout 0.3 --adam-betas '(0.9, 0.98)' \
                        --warmup-init-lr 1e-07 --warmup-updates 4000 --keep-last-epochs 10 \
                        --share-all-embeddings --fp16 --max-tokens 7500 \
                        --eval-bleu --eval-bleu-remove-bpe \
                        --best-checkpoint-metric bleu --maximize-best-checkpoint-metric \
                        -s en -t ro --save-dir baseline_model --max-epoch 100 \
                        --src-drop 0.0 --tgt-drop 0.0 --drop-method 'none' \

Token drop system

CUDA_VISIBLE_DEVICES=0,1 python train.py data-bin/wmt16.en_ro --optimizer adam --criterion label_smoothed_cross_entropy --lr-scheduler inverse_sqrt \
                        --arch transformer --min-lr  1e-09 --lr  0.0003 --label-smoothing 0.1 --dropout 0.3 --adam-betas '(0.9, 0.98)' \
                        --warmup-init-lr 1e-07 --warmup-updates 4000 --keep-last-epochs 10 \
                        --share-all-embeddings --fp16 --max-tokens 7500 \
                        --eval-bleu --eval-bleu-remove-bpe \
                        --best-checkpoint-metric bleu --maximize-best-checkpoint-metric \
                        -s en -t ro --save-dir tokendrop_model --max-epoch 200 \
                        --src-drop 0.15 --tgt-drop 0.3 --drop-method 'unk_tag' --DTP --RTD \

Evaluation

Checkpoint average

python scripts/average_checkpoints.py --inputs checkpoints/ --output baseline_model/checkpoint_avg10.pt --num-epoch-checkpoint 10

Generate

python generate.py data-bin/wmt16.en_ro  --path baseline_model/checkpoint_avg10.pt --gen-subset test --beam 4 --remove-bpe

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
build		build
docs		docs
examples		examples
fairseq.egg-info		fairseq.egg-info
fairseq		fairseq
fairseq_cli		fairseq_cli
scripts		scripts
tests		tests
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
eval_lm.py		eval_lm.py
fairseq.gif		fairseq.gif
fairseq_logo.png		fairseq_logo.png
generate.py		generate.py
hubconf.py		hubconf.py
interactive.py		interactive.py
preprocess.py		preprocess.py
preprocess.sh		preprocess.sh
pyproject.toml		pyproject.toml
score.py		score.py
setup.py		setup.py
train.py		train.py
train.sh		train.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Token_Drop

Environment

Installation

Prepare data (EN-RO)

Download data

Binarize data

Training model

Baseline system

Token drop system

Evaluation

Checkpoint average

Generate

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

zhajiahe/Token_Drop

Folders and files

Latest commit

History

Repository files navigation

Token_Drop

Environment

Installation

Prepare data (EN-RO)

Download data

Binarize data

Training model

Baseline system

Token drop system

Evaluation

Checkpoint average

Generate

About

Resources

License

Code of conduct

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages