atoc_conv の入力データ ― 2007年10月09日 16時28分33秒
atoc_conv は、KAKASI 付属の辞書ツールです。 ATOK の辞書から KAKASI の辞書(ソース形式)を作成するツールです。
atoc_conv の入力データのフォーマットは次の通りです。
ヨミ,漢字
Shift_JIS コードを想定しています。半角カナは全角ひらがなに変換されます。 '#' で始まる行はコメントです。 区切り記号の "," は空白文字(タブ、スペース)でも構いませんので
よみ 漢字
でも構いません。
また、mkkanwa は、よみのカタカナをひらがなに変換して kanwadict を作成しますので、カタカナでもひらがなでも構いません。 フォーマットが合うなら、ATOKの辞書に限らず、Shift_JIS コードの辞書データの変換に利用できます。
$ nkf -Se < 入力ファイル | tr , ' '
相当の処理を atoc_conv は行います。
なお、名前が atok_conv ではない理由については、私は知りません。
コメント
トラックバック
このエントリのトラックバックURL: http://namazu.asablo.jp/blog/2007/10/09/1845016/tb
※なお、送られたトラックバックはブログの管理者が確認するまで公開されません。
コメントをどうぞ
※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。
※なお、送られたコメントはブログの管理者が確認するまで公開されません。