濁点/半濁点問題 ― 2006年04月18日 00時14分04秒
kakasi では濁点「゛」半濁点「゜」は記号扱いのため、分かち書きで問題が生じます。
0x212b ゛ # KATAKANA-HIRAGANA VOICED SOUND MARK 0x212c ゜ # KATAKANA-HIRAGANA SEMI-VOICED SOUND MARK
$ echo しう゛ぁ | kakasi -w しう ゛ ぁ $ echo シウ゛ァ | kakasi -w シウ ゛ ァ $ echo コンヒ゜ュータ | kakasi -w コンヒ ゜ ュータ $ echo こんひ゜ゅーた | kakasi -w こんひ ゜ ゅ ー た
長音同様、ひらがな、カタカナの両方として扱うように修正したいと思います。
make clean で失敗する環境のための修正 ― 2006年04月18日 18時51分28秒
make clean で失敗する環境のために pltests/Makefile.am の '@' の後の空白を削除しました。
繰返し記号問題 ― 2006年04月18日 21時33分17秒
kakasi では「ヽ,ヾ,ゝ,ゞ」といったひらがな繰返し記号、カタカナ繰返し記号をひらがなとして扱います。 しかし、分かち書きの場合にはこれらの処理が抜けており、繰り返し記号が欠落します。
0x2133 ヽ # KATAKANA ITERATION MARK 0x2134 ヾ # KATAKANA VOICED ITERATION MARK 0x2135 ゝ # HIRAGANA ITERATION MARK 0x2136 ゞ # HIRAGANA VOICED ITERATION MARK
例えば、
$ echo ツヽジ,サヾエ,さゝやか,たゞし | kakasi -w ツ ジ , サ エ , さやか , たし
というようにです。 この問題も修正したいと思います。
最近のコメント