Numadu とアジの干物の関係!? ― 2008年07月09日 17時51分39秒
pl/extutf8.pl を追加 ― 2008年07月14日 19時29分58秒
pl/extutf8.pl を追加しました。(stable-2-0, development-2-1)
UTF-8 拡張機能:
- UTF-8 から EUC-JP への変換
NKF perl モジュール、Encode、lv、unicode.pl のいずれかが必要
- UTF-8 から US-ASCII への変換
US-ASCII 以外の文字は '#' に置き換え
- UTF-8 から EUC-JP または US-ASCII への変換後、テキストの正規化
を行います。
まだ、フィルタから呼び出していませんが、フィルタ内にある UTF-8 からEUC-JP への変換処理を共通化して外部に押し出すことが目的です。
nmz2.0.18.001-win32.zip の nmz.dll を差し替え ― 2008年07月14日 19時31分42秒
ブルー会員エリアで nmz2.0.18.001-win32.zip の nmz.dll を差し替えるファイルを先行公開しました。 Visual C++ 2005 でコンパイルした nmz.dll (x86版)です。 従来の MinGw + gcc でコンパイルした nmz.dll の差し替え版となります。
Visual C++ 2005 でコンパイル可能な nmz.dll を用いた簡単な検索プログラムのサンプル付きです。 nmz.dll を用いた検索プログラムを C 言語で作成したい方には参考になるでしょう。
https://www.akaneiro.jp/members/blue/libnmz2.0.18.001-win32.zip
- 古いバージョンの Namazu for Windows をご利用の方は最新版の Namazu for Windows にバージョンアップしてください。
- nmz.dll は本アーカイブの nmz.dll に差し替えてください。
- 次の Namazu for Windows のアーカイブからは、この Visual C++ 2005 でコンパイルした nmz.dll に変更する予定です。
追記)
- 初期のアーカイブには含まれませんでしたが、最新のアーカイブには「libnmz API Windows(x86) 初級編」を追加しました。
libnmz API Windows版(x86) 初級編 ― 2008年07月14日 23時01分33秒
libnmz API Windows版(x86) 初級編 をまとめました。
Search::Namazu で利用している関数、構造体の説明等を行っています。 Search::Namazu 程度の簡単な検索プログラムなら libnmz を使うことで、C言語で作ることができます。
これは libnmz API UNIX版 初級編 の Windows(x86)版になります。
期間限定で以下のグレー会員エリアで公開します。
https://www.akaneiro.jp/members/gray/libnmz-win.pdf
追記)
- ダウンロード販売を開始しました。
- メンバエリアでの公開は終了しました。
コンパイル時のワーニング対策 ― 2008年07月16日 00時08分43秒
sizeof(size_t) != sizeof(int) の環境でコンパイル時にワーニングが出ないように型を変更しました。
- src/cgi.c
- src/namazu-cgi.c
- src/form.c
- src/output.c
- src/rcfile.c
- src/result.c
Namazu for Windows 2.0.18 の Win64 版アーカイブ公開 ― 2008年07月19日 21時33分47秒
Namazu for Windows 2.0.18 の Win64 版(x64版およびIA64版) の namazu.exe, namazu.cgi.exe, nmz.dll をまとめたアーカイブファイルを ブルー会員エリアで公開しました。
https://www.akaneiro.jp/members/blue/nmz2.0.18.001-win64.zip
nmz2.0.18.xxx-win32.zip に含まれる namazu.exe, namazu.cgi.exe, nmz.dll, nmz.lib と差し替えてご使用ください。
動作確認環境がないため、Win64版のプログラムは動作確認を行っておりませんので、ご了承ください。
なまず モチーフ リング ― 2008年07月24日 13時09分15秒
渋粋な墨なまずと瓢箪の半巾アレンジ3点せれくと ― 2008年07月26日 13時02分56秒
filter/{msword, excel, powerpoint}.pl を pl/extutf8.pl を使用するように変更 ― 2008年07月26日 22時12分14秒
filter/{msword, excel, powerpoint}.pl を pl/extutf8.pl を使用するように変更しました。
Perl 5.8 以降か、NKF 2.04 以降の Perl モジュール、lv, unicode.pl のいずれかが利用できれば UTF-8 に対応するので、従来のこれらのフィルタよりは柔軟な対応となっています。
この変更に伴い各フィルタにあった utf8_to_eucjp は削除しました。
また、非日本語の場合、UTF-8 がそのままフィルタを素通りすることがわかりましたので、US-ASCII 文字以外は '#' に変換する処理を追加しました。
filter/ooo.pl 他も UTF-8 から EUC-JP へ変換する処理が含まれますので、そのうちに pl/extutf8.pl を使うように書き換える予定です。
「libnmz API -初級編-」 ― 2008年07月30日 17時07分53秒
期間限定でメンバエリアにて公開しておりました「libnmz API」をダウンロード販売することになりました。 本書は日本語全文検索システム Namazu で利用されている検索エンジンのコアライブラリについてまとめたドキュメントです。 libnmz(nmz.dll) を使って簡単な検索プログラムを作成したい方の参考になるものと思います。 初級編では Search-Namazu で利用している API に絞って説明を行っています。
※ ダウンロード販売にあたり一部内容を修正しております。
http://www.akaneiro.jp/download/
- 「libnmz API UNIX版 - 初級編 -」 第2版 約30ページ
- 「libnmz API Windows版 - 初級編 -」 第3版 約30ページ
なお、グレー会員エリアでの公開は終了させていただきました。
最近のコメント