『なまず料理』 ― 2007年09月20日 11時43分43秒
ブルー会員ID更新のお知せ ― 2007年09月20日 13時11分07秒
メンバエリアにアクセスするためのユーザID/パスワード(ブルー会員)を更新しました。新しいIDは、9月~11月末まで使用できます。(もちろん、前回のIDも9月末までは使用できます。)
不定期にユーザID/パスワード(グレー会員)をメルマガで公開していますが、新規にメルマガに登録された方は次回ユーザID/パスワードがメルマガで公開されるまでメンバエリアにアクセスできません。
このため、救済策としてユーザID/パスワード(ブルー会員)を販売しています。(Windows限定) ブルー会員は期間限定でメンバエリアにアクセス可能となります。
http://www.akaneiro.jp/download/
現在、グレー会員(メルマガ購読者)とブルー会員(有料ID)の違いは有効期限の違いのみとなっています。(今後、差別化する可能性もありますが、その内容は未定です。)
アクセスランキング16位!! ― 2007年09月21日 12時47分31秒
いつの間にかアサブロにアクセスランキングなる機能が付いてました。
http://dir.asablo.jp/blog/ranking/
アサブロというのは、アサヒネットのブログのことです。
この「ナマズのブログ」もアサブロで書いています。
昨日のアクセスランキングを見てみると、何と「ナマズのブログ」のアクセスランキングが16位になっていました。(前日は21位)
この「ナマズのブログ」は、アンフィニッシュトの無料アクセスカウンターを使ってアクセス数の表示を行っているのですが、それによると、平日のアクセス数はだいたい100件程度。それがアサブロ16位って...。
そもそもマニアックな内容のこのブログ。そんなに上位になるわけない内容なんですけどね。
アサブロの利用率が低いってことなんでしょうかねぇ~。あははは。
libintl-perl を使ってみる ― 2007年09月23日 01時27分08秒
Namazu では GNU gettext を利用して、メッセージの言語切り替えを行っています。 namazu や namazu.cgi は GNU gettext の libintl を使って、mknmz では独自のルーチンを使って(gettextを使わずに)メッセージカタログにアクセスしています。
このため、処理の違いにより不具合が生じることがあります。 例えば、mknmz では日本語でメッセージが出るのに、namazu.cgi では英語になるといったことです。 これは微妙な処理の違いや、GNU gettext の仕様変更によるものであったりします。
これらの微妙な差をなくすためには、mknmz の独自ルーチンをやめて、mknmz でも gettext を使うというのが正しい選択でしょう。
namazu, namazu.cgi で GNU gettext を使うのですから、mknmz で GNU gettext を使うようにしても、インストールの手間はそれほどかからないはずです。
mknmz は Perl によるプログラムですから、gettext の Perl モジュールが必要となります。そこで、いろいろ調べてみると libintl-perl というものを見つけました。 試しに libintl-perl-1.16 を使ってみました。
#!/usr/bin/perl use Locale::TextDomain qw (namazu); print __("Invalid query"); print "\n"; print N__("Invalid query"); print "\n";
このプログラムを Namazu がインストールされている環境で実行すると、
$ perl test-libintl-perl.pl 不正な検索式です Invalid query
と、表示されました。 これだけ動けば mknmz で使うのに十分でしょう。
ただ、ローケルファイルのあるディレクトリを指定した場合に正しく動いてくれませんでした。何か設定のミスだとは思いますが、はてさて。
ハローキティ なまずバージョン ― 2007年09月23日 16時50分36秒
kanwadict-20070924.tar.gz 公開 ― 2007年09月24日 23時02分37秒
市町村合併に伴い変更となった地名を含む、未登録の"郡"、"市"を追加した私家版 kanwadict を公開しました。
http://www.asahi-net.or.jp/~yw3t-trns/namazu/kakasi/
mkkanwa の辞書登録における問題点(2) ― 2007年09月26日 00時49分29秒
KAKASI 2.3.4 に付属の辞書 kakasidict には重複する単語が多く含まれています。 mkkanwa でバイナリ辞書 kanwadict に変換する際に、これらの重複単語は省かれるものだと思っていましたが、どうやらそうではないようです。
そこで登録される単語数と、ユニークな単語数について調べてみると、
121,787 登録される単語数 119,865 ユニークな単語数
となり、1,922 重複する単語が登録されていることがわかりました。 例えば、以下のものが重複する単語です。
おだじま 小田嶋 うさぎ 兎 はちゅうるい 爬虫類 えいせい 衛星
このうち、「爬虫類」は異体語の「爬蟲類」との重複です。 (異体語については、itaijidict に依存するので、kakasidict に重複して登録されているのは仕方ないかもしれません。)
約1%程度ですので、それほど性能に影響はでないとは思いますが、重複するエントリは無駄以外の何者でもありません。
単語の重複がない kakasidict を用意して kanwadict を作るのもよいですが、やはり、mkkanwa で辞書作成時に重複を省くのが良いでしょう。 (src/dict.c の add_item のところに重複チェックを加えれば良いようです。)
最近のコメント