NMZ.slog 検索式(検索されたキーワード)のログ ― 2007年07月12日 14時34分42秒
検索式(検索されたキーワード)のログは、インデックスディレクトリの NMZ.slog に記録されます。 昔のNamazuのマニュアルには NMZ.slog のフォーマットが載っていましたが、現在は載っていないようなので、紹介しておきます。
NMZ.slog は
検索式 TAB ヒット数 TAB ホスト名(or IP アドレス) TAB 日時
検索式: EUC-JP に変換した検索に用いた文字列
ヒット数: 検索式にヒットした件数 maxhit を越えた場合は 0 となることに注意
ホスト名: 完全修飾ドメイン名(FQDN)または IPアドレスまたは自分を指すLOCALHOST という文字列
日時: ctime形式 (システムのタイムゾーンでの日時)
のような書式で保存されます。EUC-JP で保存され、 TAB で区切っているので、後々テキスト処理を施すのも容易です。例えば
% awk '-F\t' '{ print $1 }' NMZ.slog | sort | uniq -c | sort -nr
のようにコマンドラインから実行すれば検索式をそれぞれカウントして数字の大きい順に出力することができます。 同時に検索されたキーワードを比較・分析して同義語辞書を作成するのも面白いかもしれません。
NMZ.slogへログの記録を行うかどうかは、namazurc(または .namazurc)のLoggingで指定します。
Logging ON
でログを記録します。(デフォルト)
Logging OFF
でログの記録を行いません。
NMZ.slog は追加され続けますので、必要に応じてバックアップ、削除を定期的に行ってください。
コメント
トラックバック
このエントリのトラックバックURL: http://namazu.asablo.jp/blog/2007/07/12/1647952/tb
※なお、送られたトラックバックはブログの管理者が確認するまで公開されません。
コメントをどうぞ
※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。
※なお、送られたコメントはブログの管理者が確認するまで公開されません。