Open
Description
#2 #3 で"、"をデフォルトでは許容するように変更した。
この変更により、本来はエラーとしていたものも許容されるケースがある。
strict: true
の場合は本来のエラーを再現した挙動を維持した状態となっている。
"、"がコンテキストにより意味合いが変わるため、それを補足する方法について考えるIssue
ものすごく安直な実装だと、を間隔値(+1)することで
「右がiPhone、左がAndroidです。」
"が" と "が" で間隔値は2になるのでパスできます。(デフォルトでは間隔値2以上はセーフとゆるめ)
36a0498 という感じで 彼女は困り切った表情で、小声で尋ねた。
この変更の仕方だと上記のような"、"の使い方も単純に間隔値が増えるのでスルーされてしまいます。("で"の間隔値が2となる)
なので、仰るとおり助詞以外の単語も含めたポイント性にしてデフォルト値をもう少しあげるなりする必要が出てきそうな気はします。(今は助詞同士のみを見てる)
最初にあげた2つの例は、
意味的に対になるものが並立している場合 文が複文になっていて、同じデ格の格助詞がそれぞれ別の動詞にかかっている場合
という、それぞれ違う許容の仕方になっているんですよね…。逆に言うと、
同じ格助詞が一つの動詞に複数かかっていないか、またはかかっていても意味的に並立している場合
をチェックできるとよいのですが、そうすると単語(文節)の依存関係(係り受け)解析+格の意味解析が必要になるので、kuromojiではできなさそうです。
Metadata
Metadata
Assignees
Labels
No labels