filter/{msword, excel, powerpoint}.pl を pl/extutf8.pl を使用するように変更 ― 2008年07月26日 22時12分14秒
filter/{msword, excel, powerpoint}.pl を pl/extutf8.pl を使用するように変更しました。
Perl 5.8 以降か、NKF 2.04 以降の Perl モジュール、lv, unicode.pl のいずれかが利用できれば UTF-8 に対応するので、従来のこれらのフィルタよりは柔軟な対応となっています。
この変更に伴い各フィルタにあった utf8_to_eucjp は削除しました。
また、非日本語の場合、UTF-8 がそのままフィルタを素通りすることがわかりましたので、US-ASCII 文字以外は '#' に変換する処理を追加しました。
filter/ooo.pl 他も UTF-8 から EUC-JP へ変換する処理が含まれますので、そのうちに pl/extutf8.pl を使うように書き換える予定です。
コメント
トラックバック
このエントリのトラックバックURL: http://namazu.asablo.jp/blog/2008/07/26/3653051/tb
※なお、送られたトラックバックはブログの管理者が確認するまで公開されません。
コメントをどうぞ
※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。
※なお、送られたコメントはブログの管理者が確認するまで公開されません。