kakasi -HK -KH オプションの不具合 ― 2006年05月04日 12時13分36秒
kakasi の -HK オプションはひらがなをカタカナに、-KH オプションはカタカナをひらがなに変換するオプションですが、踊り字の一の字点(ゝゞヽヾ)の変換処理が不十分なようです。
$ echo ツヽジ,サヾエ,さゝやか,たゞし | kakasi -HK ツジ,サエ,サヤカ,タシ
一の字点は削除されてしまいます。
$ echo ツヽジ,サヾエ,さゝやか,たゞし | kakasi -KH つヽじ,さヾえ,さゝやか,たゞし
一の字点は無変換でそのまま出力されます。
一の字点はひらがなでもカタカナでもないからということでしょうが、 -HK では次のように変換されるのが望ましいと思います。
さゝやか -> サヽヤカ たゞし -> タヾシ
同様に -KH では次のように変換されるのが望ましいと思います。
ツヽジ -> つゝじ サヾエ -> さゞえ
コメント
_ opengl2772 ― 2006年05月09日 22時38分53秒
まだ確認できていませんが、CVS上のソースは修正されたようです。
_ opengl2772 ― 2006年05月15日 18時55分41秒
最初の修正版では逆に変換されていましたが、最新版では直っていることを確認しました。
コメントをどうぞ
※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。
※なお、送られたコメントはブログの管理者が確認するまで公開されません。
トラックバック
このエントリのトラックバックURL: http://namazu.asablo.jp/blog/2006/05/04/352402/tb
※なお、送られたトラックバックはブログの管理者が確認するまで公開されません。