-
Notifications
You must be signed in to change notification settings - Fork 7
Description
upTeXにcatcodeが15以下でかつCJKのトークンを追加で導入しよう、という提案です。
[upTeX] JIS-encoded TFM #149
とは別に扱った方がよさそうなので issue を立てます。
背景はこちら。
#149 (comment)
現状の LaTeX3 では regression test(大量に用意されたテストファイル入力 .lvt に対するログ .tlg を比較)の仕組みが (u)pTeX に対しては機能していません。
pTeX では高位ビットが現れるテストファイルの入力中断処理が仕込まれている
upTeX では regression-test.cfg で最初から \disablecjktoken している
その理由は恐らく(u)pTeX が「和文(CJK)文字トークン」という独特の物が存在し,また文字コードが中途半端に 0--255 ではないこと(e.g.「
あ」できるのに「\catcode
あ」できない)
が理解されないためだと思われます。和文(CJK)文字トークンの catcode が 16〜18(19) であることも考慮されておらず「カテゴリーコードは 16 進 1 桁」を前提にしたインタフェースが構築されています(https://github.com/h20y6m/plexpl3/issues/3)。
で、私の提案はこちら
#149 (comment)
思いつきですが、その対策として例えばupTeXの仕様の追加で
「catcodeが11で文字コードがある値(例えば0x2E00以上)より大きい場合は漢字トークンとみなす」
「catcodeが12で文字コードがある値より大きい場合はCJK記号トークンとみなす」
のようなものを用意し、それらに対しては
「あ」できて「\catcode
あ」できてしかもCJKトークンである
という風にするのはいかがでしょうか?
で @aminophen さんのリプライ
#149 (comment)
この特定の値については #135 からだと思いますが,あちらは「OFM に定義された最大の文字コード」だから良かったものの,今回のようなものには使えないように思います。(例えば 0xB7 (U+00B7) は uptex-fonts でも和文扱いを想定した中黒です)