NMZ.slog 検索式(検索されたキーワード)のログ2007年07月12日 14時34分42秒

検索式(検索されたキーワード)のログは、インデックスディレクトリの NMZ.slog に記録されます。 昔のNamazuのマニュアルには NMZ.slog のフォーマットが載っていましたが、現在は載っていないようなので、紹介しておきます。

NMZ.slog は

検索式 TAB ヒット数 TAB ホスト名(or IP アドレス) TAB 日時

検索式: EUC-JP に変換した検索に用いた文字列

ヒット数: 検索式にヒットした件数 maxhit を越えた場合は 0 となることに注意

ホスト名: 完全修飾ドメイン名(FQDN)または IPアドレスまたは自分を指すLOCALHOST という文字列

日時: ctime形式 (システムのタイムゾーンでの日時)

のような書式で保存されます。EUC-JP で保存され、 TAB で区切っているので、後々テキスト処理を施すのも容易です。例えば

% awk '-F\t' '{ print $1 }' NMZ.slog | sort | uniq -c | sort -nr 

のようにコマンドラインから実行すれば検索式をそれぞれカウントして数字の大きい順に出力することができます。 同時に検索されたキーワードを比較・分析して同義語辞書を作成するのも面白いかもしれません。

NMZ.slogへログの記録を行うかどうかは、namazurc(または .namazurc)のLoggingで指定します。

Logging ON

でログを記録します。(デフォルト)

Logging OFF

でログの記録を行いません。

NMZ.slog は追加され続けますので、必要に応じてバックアップ、削除を定期的に行ってください。