decode_numbered_entity 関係修正 ― 2005年12月07日 07時59分14秒
日本語環境では元々128以上は削除されるので、あまり関係ありません。
filter/gnumeric.pl も似たような問題があったので修正しました。
gnumeric では日本語はEUC-JPのままエンコードされるらしいです。
(というより何も考えずにエンコードしているのでしょう。)
このため、日本語環境以外でデコードすると文字化けの原因となるため、日本語環境以外では128以上は削除するようにしました。
また、EUC-JPの範囲外のコードをデコードするのは好ましくないため、簡単なコードの範囲チェックを加えました。
namazu-2.0.15pre3.tar.gz 公開 ― 2005年12月07日 08時00分28秒
Namazu 2.0.15 pre3 を公開します。
http://www.namazu.org/test/namazu-2.0.15pre3.tar.gz http://www.namazu.org/test/namazu-2.0.15pre3.tar.gz.md5 http://www.namazu.org/test/namazu-2.0.15pre3.tar.gz.sha1 http://www.namazu.org/test/namazu-2.0.15pre3.tar.gz.sig
$ md5sum namazu-2.0.15pre3.tar.gz
bea9d1e42c7ceeb307883b726cffd03a namazu-2.0.15pre3.tar.gz
$ sha1sum namazu-2.0.15pre3.tar.gz
245e66d8378615fd48c25f09ebf4bd0fd887a3ac namazu-2.0.15pre3.tar.gz
・主な pre2 からの修正内容(漏れがあるかもしれません)
* mknmz に --norc オプションを追加 * MaxHit, MaxMatch の比較を削除された文書を含めて行っていたのを修正 * フィールド検索の MaxHit の修正 * fseek の戻り値を -1 と比較していた部分を 0 でないかどうかで比較 するように修正 * 「中間一致検索」および「後方一致検索」で正規表現を含めることができ たバグを修正 * cmd.exe に /d /x /c オプションを付ける * QUERY_STRING の区切り '&' に加えて、';' を追加 * テンプレートの value="", selected, checked を削除する部分を修正 * xdoc2txt.exe 用フィルタ追加 * nmz_getlong_option() の戻り値チェックで EOF を -1 に変更 * namazu -4 オプションに引数が必要なので、short_options の 4 の後に ':' を追加 * namazu に --norc オプション * フレーズ検索で 文書ID=0 がヒットしないバグを修正 * 日付順ソートのため $fields{'utc'} を追加 * MeCab 対応 * conf/namazurc-sample に Suicide_Time と Regex_Search を追加 * MinGw版 nmz.dll を作成できるように Makefile を修正 * DDN(DOS Device Name)を排除するように修正 * tutorial.html のソフトウェアを最新バージョンに更新 * pltests の cmd.exe に /d /x オプションを追加 * filter/gnumeric.pl(decode_numbered_entity) コード範囲をチェック * filter/html.pl decode_numbered_entity 256以上を削除
・今後の予定
* pre3のWindowsで動作確認するためのテスト用バイナリの作成 * Namazu 2.0.15RC1 の公開
とくに大きな問題がない限り、基本的には、このpre3をほぼそのままRC1 として早々に公開したいと考えています。
免責) テストする場合は、文書が削除される危険性もあるので、念のため バックアップをとった文書を使ってテストしてください。
「Namazuの開発日記」メールマガジン第一号発行 ― 2005年12月07日 21時56分21秒
登録はもちろん無料です。
下記から登録/解除が可能です。
最近のコメント