Namazu 2.0.X のインデックスの種類2007年04月28日 21時31分07秒

Namazu 2.0.X のインデックスは大きく分けると次の3種類に分類できます。

  • A. 日本語インデックス (EUC-JP で構成)
  • B. 英語インデックス (US_ASCII のみで構成されたもの)
    • 日本語インデックスの下位互換。
  • C. イリーガルインデックス
    • ISO-8859-1 文字を含むインデックス。
    • 日本語インデックスと互換性がない。未サポート。
    • 現在の 2.3.X の UTF-8 インデックスとは皮肉なことに後方互換となっているが、2.3.X のインデックス形式は将来変更される可能があります。

A は日本語の文書を日本語で言語処理を行ってインデックスを作成したもの。

B は英語(US_ASCII)の文書からインデックスを作成したもの。

C は英語(ISO-8859-1)の文書を日本語以外(英語を含むISO-8859-1の言語)で言語処理を行ってインデックスを作成したもの。

  • 日本語インデックスを用いて検索結果を表示するには、メッセージの表示言語は日本語でなければなりません。(漢字コードについては制限があります。)
  • 英語インデックスを用いて検索結果を表示する場合は、メッセージの表示言語に制限はありません。(デフォルトでサポートしていない言語については、テンプレートおよびメッセージカタログを用意する必要はあります。)
  • イリーガルインデックスを用いて検索結果を表示するには、メッセージの表示言語はISO-8859-1の言語でなければなりません。日本語はISO-8859-1ではありませんので、日本語を選択することはできません。

コメント

コメントをどうぞ

※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。

※なお、送られたコメントはブログの管理者が確認するまで公開されません。

名前:
メールアドレス:
URL:
コメント:

トラックバック

このエントリのトラックバックURL: http://namazu.asablo.jp/blog/2007/04/28/1471066/tb

※なお、送られたトラックバックはブログの管理者が確認するまで公開されません。