濁点/半濁点問題2006年04月18日 00時14分04秒

kakasi では濁点「゛」半濁点「゜」は記号扱いのため、分かち書きで問題が生じます。

 0x212b ゛   # KATAKANA-HIRAGANA VOICED SOUND MARK
 0x212c ゜   # KATAKANA-HIRAGANA SEMI-VOICED SOUND MARK
 $ echo しう゛ぁ | kakasi -w
 しう ゛ ぁ
 $ echo シウ゛ァ | kakasi -w
 シウ ゛ ァ
 $ echo コンヒ゜ュータ | kakasi -w
 コンヒ ゜ ュータ
 $ echo こんひ゜ゅーた | kakasi -w
 こんひ ゜ ゅ ー た

長音同様、ひらがな、カタカナの両方として扱うように修正したいと思います。

make clean で失敗する環境のための修正2006年04月18日 18時51分28秒

make clean で失敗する環境のために pltests/Makefile.am の '@' の後の空白を削除しました。

繰返し記号問題2006年04月18日 21時33分17秒

kakasi では「ヽ,ヾ,ゝ,ゞ」といったひらがな繰返し記号、カタカナ繰返し記号をひらがなとして扱います。 しかし、分かち書きの場合にはこれらの処理が抜けており、繰り返し記号が欠落します。

 0x2133 ヽ   # KATAKANA ITERATION MARK
 0x2134 ヾ   # KATAKANA VOICED ITERATION MARK
 0x2135 ゝ   # HIRAGANA ITERATION MARK
 0x2136 ゞ   # HIRAGANA VOICED ITERATION MARK

例えば、

 $ echo ツヽジ,サヾエ,さゝやか,たゞし | kakasi -w
 ツ ジ , サ エ , さやか , たし

というようにです。 この問題も修正したいと思います。