Skip to content

KATOKanji-0131/gloss-format-docxtable

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

gloss-format-docxtable

テキストを整形して、.docxの表の形でインターリニアーグロスにします。

Features

  • プレーンテキスト形式で入力された例文から.docxの表によるインターリニアーグロスを生成します。
  • 幅がいっぱいになったら自動で折り返します。
  • グロス行の略号は自動でスモールキャピタルになります。

Requirement

  • Python 3
  • pandas
  • python-docx

Installation

pip3 install pandas
pip3 install python-docx

Usage

実行方法

main.py, variables.py, example.txt, gloss_abbreviationが同じフォルダにあるようにしてください。

そうしたら、これらが例えば/Users/hamident0/Desktop/exformatにある場合、

$ cd /Users/hamident0/Desktop/exformat
$ python3 main.py 

でその場所に移動し、実行してください。同じ場所にexample.docxが生成されます。

例文テキストの準備

\gla 私 は 先生 だ
\glb I TOP teacher COP
\glft I am a teacher.

\gla 明日 は 晴れ だ
\glb tomorrow TOP sunny COP
\glft It will be sunny tomorrow.

example.txtに例文を書き込んでください。

  • 形態素の行を\gla から、グロスの行を\glb から、訳の行を\glft から開始してください。
  • 形態素とグロスは、半角スペースまたはタブで区切ってください。

行指定子の変更

どの行を形態素、グロス、訳として読み込むかの指定は\gla \gla \gla で行っています。これを例えばそれぞれ\morpheme\gloss\translationへ変更したい場合、variables.py

morph_spcf = r"\gla" # 形態素行の指定子
gl_spcf = r"\glb" # グロス行の指定子
trsl_spcf = r"\glft" # 訳行の指定子

という部分を

morph_spcf = r"\morpheme" # 形態素行の指定子
gl_spcf = r"\gloss" # グロス行の指定子
trsl_spcf = r"\translation" # 訳行の指定子

としてください。

グロス略号の追加・変更

略号を追加・変更したい場合、gloss_abbreviations.tsvに略号とその意味を追加してください。タブ区切りなので、略号と意味はタブで区切ってください。例えば、metasyntactic variableという意味のHOGEという略号を追加したい場合

HOGE	metasyntactic variable

のように追記してください。

Note

  • 同一の列にあるセルが全て同じ幅で出力されてしまいます。今後のアップデートで、セルの幅がもっと縮まるように修正します。
  • 訳が一つのセルに押し込められてしまっています。セルを結合して横に長く表示したいのですが、結合すると表示に影響が出てしまうのでこのままにしています。今後のアップデートで、訳を横に長く表示できるように修正します。
  • セルの余白が広すぎますが、今後のアップデートでもっと詰めて表示できるように修正します。
  • 現在は例文番号がアラビア数字の連番だけですが、数字の後ろにアルファベットをつけて4a, 4b...のように出力できるようにアップデートします。

Author

  • 加藤幹治 KATO, Kanji
  • 東京外国語大学大学院/日本学術振興会特別研究員 TUFS/JSPS
  • jiateng.ganzhi[at]gmail.com

Acknowledgement

グロス略号リストの作成にあたっては、「下地理則の研究室 グロスのリスト」 (https://www.mshimoji.com/blank-12) を参照しました。

License

"gloss-format-docxtable" is under MIT license.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •  

Languages