異体字 ― 2006年04月09日 22時34分27秒
JIS X 0208 の JIS83制定時の変更点
http://www.asahi-net.or.jp/~ax2s-kmtn/ref/jis78-83.html
を見ていて、kakasi の異体字辞書(itaijidict)に含まれていない文字があることに気づきました。
JIS83で第1水準と第2水準が入れ替わったもの(22組) のうち5組
礦砿 邇迩 鶯鴬 諫諌 頸頚
JIS83で字形を変更し、従来の字形を第2水準に追加したもの(4字) のうち1組
堯尭
これらは JIS X 0208 の JIS83制定時の変更で挿し換わったものであるから異体字になります。 近いうちに itaijidic に追加して公開したいと思います。
そう思って異体字辞書を調べてみると
http://www.eonet.ne.jp/~kotobukispace/ddt/ddtj.html
にフリーの異体字辞書がありました。 厳密異体辞書、慣用異体辞書という区別があったり、JIS第3・4水準対応という区別もあったりもします。
kakasi での使用を考えた場合には、慣用異体字までは必要ないような印象を受けましたが、用途によっては有用でしょう。
また kakasi の場合は、EUC-JP ですので JIS X 0213 をサポートしたEUC-JISX0213を考えるというよりは、UNICODE化の際にJIS第3・4水準対応を考えた方が良いでしょう。
コメント
_ opengl2772 ― 2006年04月10日 22時18分41秒
コメントをどうぞ
※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。
※なお、送られたコメントはブログの管理者が確認するまで公開されません。
トラックバック
このエントリのトラックバックURL: http://namazu.asablo.jp/blog/2006/04/09/321605/tb
※なお、送られたトラックバックはブログの管理者が確認するまで公開されません。