Text-ChaSen と MeCab の PPM2007年01月29日 04時54分09秒

そう言えば、Text-ChaSen の PPM を公開していないことに気づきました。

Kakasi, MeCab のように辞書のインストールが必要なので PPM で一発インストールとはいきませんが、PPM があると楽ですよね。

また、MeCab の PPM も 0.92 のままでした。
0.93 はライセンス変更だけなのですが、バージョンアップしておくべきですよね。
時間がとれればバージョンアップします。

MeCab 0.93 リリース2006年08月02日 16時03分56秒

MeCab 0.93 がリリースされました。

ライセンスがLGPLから、LGPL,GPL,BSDライセンスのトリプルライセンスに変更となったぐらいだそうです。

MeCab 0.92 PPM2006年07月12日 00時45分59秒

MeCab 0.92 がリリースされましたので、MeCab の PPM および辞書を更新しました。

 http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd

ppm コマンドでインストール/バージョンアップができます。

 C:\> ppm uninstall MeCab
 C:\> ppm install http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd

MeCab Perl モジュールは ppm コマンドでインストールできますが、Text-Kakasi 同様に PPM のインストールだけでは動作せず、辞書と mecabrc のインストールおよび設定が必要になります。

 http://www.akaneiro.jp/public/mecab-ipadic-0.92.zip

から辞書ファイルをダウンロードして、手順に従ってインストールを行ってください。

  • Namazu for Windows 2.0.16 では EUC-JP の辞書を前提にしています。
  • Namazu 以外の用途用にEUC-JP版辞書以外にShift_JIS版辞書、UTF-8版辞書を用意しました。
http://www.akaneiro.jp/public/mecab-ipadic-0.92-sjis.zip
http://www.akaneiro.jp/public/mecab-ipadic-0.92-utf8.zip
  • MeCab PPM をバージョンアップした場合は、辞書もバージョンアップしてください。

なお、従来の MeCab 0.90/0.91用の辞書は名前を変更しました。

http://www.akaneiro.jp/public/mecab-ipadic-0.91.zip
http://www.akaneiro.jp/public/mecab-ipadic-0.91-sjis.zip
http://www.akaneiro.jp/public/mecab-ipadic-0.91-utf8.zip

MeCab 0.92 テストスクリプトの問題2006年07月11日 06時31分10秒

mecab-perl-0.92.tar.gz には test.pl test2.pl の二つのテストスクリプト(と思われる)が含まれます。

これらは Test モジュールを用いた一般的なテストスクリプトではありません。

そのことは特に問題ないのですが、test.pl はテストスクリプトであると、ExtUtils::MakeMaker に認識されますが、test2.pl は認識されません。
このため、test2.pl はモジュールの一部と認識されるようで、コンパイルすると blib/lib/ に含まれます。

テストスクリプトの test2.pl を MeCab の一部としてインストールする必要はないので、あまり好ましいものではありません。

複数のテストスクリプトを入れるのであるなら、Test モジュールを用いたテストスクリプトにして、 t/ 以下に置くのが良いように思います。

MeCab 0.92 + MinGw 環境での make check2006年07月10日 18時09分54秒

MeCab 0.92 + MinGw 環境で make check を実行するとエラーになることに気づきました。(これは MeCab 0.91 でもエラーになります。)

エラーの内容を確認すると、予め用意されている test.gld とテスト時に作成される test.out の改行コードの違いによる差で発生するものでした。
これは UNIX 環境でのテストを想定しているためでしょう。

tests/run.sh, tests/run2.sh の diff に -b オプションを付けてみるとエラーはなくなりました。
このことから、テストに失敗するのはテストプログラム側の問題であって、MeCab 0.92 の動作自体には問題はないということのようです。

MeCab 0.92 がリリース2006年07月10日 13時20分37秒

MeCab 0.92 がリリースされました。

http://sourceforge.jp/projects/mecab/

MeCab 0.91用Shift_JIS版、UTF-8版辞書も公開2006年05月21日 00時40分03秒

Namazu 用途以外でもActivePerlでMeCabを使いたい人がそこそこいらっしゃるようですので、EUC-JP版辞書に加え、Shift_JIS版、UTF-8版辞書を用意しました。

- http://www.akaneiro.jp/public/mecab-ipadic.zip
- http://www.akaneiro.jp/public/mecab-ipadic-sjis.zip
- http://www.akaneiro.jp/public/mecab-ipadic-utf8.zip

辞書ファイルをダウンロードして、手順に従ってインストールを行ってください。

  • Namazu for Windows 2.0.16 では EUC-JP の辞書を前提にしています。 Shift_JIS版、UTF-8版辞書は使えません。ご注意ください。

いろんなところが 2005 のまま2006年05月02日 03時25分20秒

どうでもいいことですが、いろんなところが 2005 のままです。
$ mecab -h
MeCab: Yet Another Part-of-Speech and Morphological Analyzer

Copyright (C) 2001-2005 Taku Kudo
Copyright (C) 2004-2005 Nippon Telegraph and Telephone Corporation

Usage: mecab [options] files
 -r, --rcfile=FILE              use FILE as resource file
 -d, --dicdir=DIR               set DIR  as a system dicdir
 -u, --userdic=FILE             use FILE as a user dictionary
 -l, --lattice-level=INT        lattice information level (default 0)
 -a, --all-morphs               output all morphs (default false)
 -O, --output-format-type=TYPE  set output format type (wakati,none,...)
 -p, --partial                  partial parsing mode
 -F, --node-format=STR          use STR as the user-defined node format
 -U, --unk-format=STR           use STR as the user-defined unk format
 -B, --bos-format=STR           use STR as the user-defined bos format
 -E, --eos-format=STR           use STR as the user-defined eos format
 -b, --input-buffer-size=INT    set input buffer size (default 8192)
 -C, --allocate-sentence        allocate new memory for input sentence
 -N, --nbest=INT                output N best results  (default 1)
 -t, --theta=FLOAT              set temparature parameter theta (default 0.75)
 -o, --output=FILE              set the output file name
 -v, --version                  show the version and exit.
 -h, --help                     show this help and exit.

MinGw における MeCab のシェアードライブラリの問題2006年05月02日 03時20分16秒

MeCab 0.90,0.91 のどちらもですが、手元の MinGw 環境では作成されたスタティックライブラリをリンクするとシンボルが見つからないというエラーが発生しました。
以下の修正を行って生成したシェアードライブラリならリンクも問題なくできます。
# cygwin は修正の必要はありませんでした。
$ diff -u mecab.h.org mecab.h
--- mecab.h.org 2006-04-30 23:30:26.000000000 +0900
+++ mecab.h     2006-05-02 03:19:37.000000000 +0900
@@ -122,7 +122,7 @@
 extern "C" {
 #endif

-#ifdef _WIN32
+#if defined(_WIN32) && !defined(__MINGW32__)
 #include 
 #  ifdef DLL_EXPORT
 #    define MECAB_DLL_EXTERN  __declspec(dllexport)

MeCab 0.91 PPM2006年05月01日 16時30分59秒

MeCab 0.91 がリリースされましたので、MeCab の PPM を更新しました。

 http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd

ppm コマンドでインストールができます。

 C:\> ppm uninstall MeCab
 C:\> ppm install http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd

MeCab Perl モジュールは ppm コマンドでインストールできますが、Text-Kakasi 同様に PPM のインストールだけでは動作せず、辞書と mecabrc のインストールおよび設定が必要になります。

 http://www.akaneiro.jp/public/mecab-ipadic.zip

から辞書ファイルをダウンロードして、手順に従ってインストールを行ってください。

  • Namazu for Windows 2.0.16 では EUC-JP の辞書を前提にしています。
  • Namazu 以外の用途用にEUC-JP版辞書以外にShift_JIS版辞書、UTF-8版辞書を用意しました。(2006.05.21修正)

[追記]