kakasi -HK -KH オプションの不具合 ― 2006年05月04日 12時13分36秒
kakasi の -HK オプションはひらがなをカタカナに、-KH オプションはカタカナをひらがなに変換するオプションですが、踊り字の一の字点(ゝゞヽヾ)の変換処理が不十分なようです。
$ echo ツヽジ,サヾエ,さゝやか,たゞし | kakasi -HK ツジ,サエ,サヤカ,タシ
一の字点は削除されてしまいます。
$ echo ツヽジ,サヾエ,さゝやか,たゞし | kakasi -KH つヽじ,さヾえ,さゝやか,たゞし
一の字点は無変換でそのまま出力されます。
一の字点はひらがなでもカタカナでもないからということでしょうが、 -HK では次のように変換されるのが望ましいと思います。
さゝやか -> サヽヤカ たゞし -> タヾシ
同様に -KH では次のように変換されるのが望ましいと思います。
ツヽジ -> つゝじ サヾエ -> さゞえ
最近のコメント