MeCab 0.90rc7 で修正される内容2006年01月14日 06時09分51秒

CVS の最新ソースでは、Perl から MeCab のバージョンを取得できるようになったそうです。

MeCab-perl-0.81 までは、
parse ($1);
というように特殊変数を渡すことができましたが、0.90rc6ではエラーになりました。これはバグであり、最新ソースでは修正されたそうです。

また、

$ echo -n "本日は晴天なり" | mecab -Owakai

とした場合、改行で終わらない行は処理されませんでしたが、これも修正されたそうです。

手元の環境で起こっていた(FreeBSD 6.0 では正常)Perl で無限ループになっていた ipadic の辞書作成部分は C++ のモジュールが使われるように変更されるそうです。

MeCab-perl-0.90rc6 対応2006年01月13日 02時47分34秒

どうにか MeCab-0.90rc6 を動かすことができたので、MeCab-perl-0.90rc6 対応を行いました。

MeCab 0.90rc6 その後2006年01月12日 05時11分06秒

MinGw ではipadicの辞書生成時に

'-' は、内部コマンドまたは外部コマンド、
操作可能なプログラムまたはバッチ ファイルとして認識されていません。

とエラーになりました。
open (S1, "|-") がダメなのでしょう。

cygwin では、無事辞書の生成ができましたが、mecab を実行すると

Tagger.cpp(222): tokenizer.cpp(177): cannot find entry for: DEFAULT

とエラーになりました。
どうも RC ファイルの設定の問題のようだが、詳細は不明。

Linux で Juman 辞書の生成を行ってみたが、やはり途中で無限ループに入りました。

...どれもまともに動かすことができていません。やれやれ。

mecab-ipadic-2.7.0-20051110 の make 完了せず2006年01月11日 03時28分22秒

MeCab 0.90rc6 の動作確認を行うために
mecab-ipadic-2.7.0-20051110.tar.gz
の make をしたのですが、make が完了せず、無限ループ(あるいは非常に時間がかかっている)状態におちいりました。

:
reading ./Others.csv .. 2
reading ./Postp-col.csv .. 90
reading ./Postp.csv .. 146
reading ./Prefix.csv .. 206
reading ./Suffix.csv .. 1294
reading ./Symbol.csv .. 198
reading ./Verb.csv .. 128946
--> ここで HDD をずっとアクセスしている状態となります。

プロセスを見ると以下の処理で無限ループになるようです。

17752 pts/1 S 0:00 make
17753 pts/1 D 0:45 perl /usr/local/libexec/mecab/mecab-dict-index -c euc
17755 pts/1 S 0:00 /usr/local/libexec/mecab/mecab-tool --darts --input=-

環境は以下の通りです。
* Linux 2.4.20-31.9
* perl, v5.8.0 built for i386-linux-thread-multi
(perl, v5.8.3 built for i686-linux でもダメ)
* gcc (GCC) 3.2.2 20030222 (Red Hat Linux 3.2.2-5)


ちなみに ChaSen 用の ipadic-2.7.0 では辞書の作成ができています。

MeCab PPM 作成挫折2005年12月03日 07時54分26秒

MeCab の PPM を作ろうとしていたのですが、挫折しました。

SWIG を使って作られているためか、g++ の使用を前提としているためか、いろいろやってはみたのですが、うまくコンパイルできませんでした。
# SWIG 自体はWindows版もあるので、Windows でコンパイルできないわけはないだろうと思うのですが...。

Text-Chasen はできているので、Text-Chasen を参考に Namazu で利用する部分だけを Perl から使えるように Perl モジュールを別に作った方が早いかもしれません。
まぁ、仮にText-Mecab とでもしましょうかねぇ。

# taku さんは、「もっと SWIG を!」という考えなんですけど...。
# これじゃ、逆行しちゃいますねぇ。

Re: MeCab 対応2005年11月21日 17時46分52秒

stable-2-0 のマニュアルも HEAD と同等の内容に修正しました。

MeCab 対応2005年11月17日 02時14分26秒

HEAD で対応していた MeCab を stable-2-0 に下ろしてきました。
ただし、ドキュメントはまだ修正できていません。

MeCab で分かち書きするには改行が必要!?2005年10月04日 07時59分23秒

改行しないで分かち書きのテストをした結果です。

$ echo -n "本日は晴天なり" | kakasi -w
本日 は 晴天 なり$


$echo -n "本日は晴天なり" | chasen -j -F '%m '
本日 は 晴天 なり
$


$ echo -n "本日は晴天なり" | mecab -Owakati -b 8192
$


というように MeCab では無視されます。 改行を入れると

$ echo "本日は晴天なり" | mecab -Owakati -b 8192
本日 は 晴天 なり
$


のように分かち書きされます。
MeCab では改行が必須のようです。

MeCab のインストール方法2005年09月18日 16時04分33秒

日本語全文検索システム Namazu の分かち書き処理に将来利用できる和布蕪(MeCab)のインストール方法を以下にまとめました。

MeCab のインストール方法