MeCab 0.90rc7 で修正される内容 ― 2006年01月14日 06時09分51秒
CVS の最新ソースでは、Perl から MeCab のバージョンを取得できるようになったそうです。
MeCab-perl-0.81 までは、
parse ($1);
というように特殊変数を渡すことができましたが、0.90rc6ではエラーになりました。これはバグであり、最新ソースでは修正されたそうです。
また、
$ echo -n "本日は晴天なり" | mecab -Owakai
とした場合、改行で終わらない行は処理されませんでしたが、これも修正されたそうです。
手元の環境で起こっていた(FreeBSD 6.0 では正常)Perl で無限ループになっていた ipadic の辞書作成部分は C++ のモジュールが使われるように変更されるそうです。
MeCab-perl-0.81 までは、
parse ($1);
というように特殊変数を渡すことができましたが、0.90rc6ではエラーになりました。これはバグであり、最新ソースでは修正されたそうです。
また、
$ echo -n "本日は晴天なり" | mecab -Owakai
とした場合、改行で終わらない行は処理されませんでしたが、これも修正されたそうです。
手元の環境で起こっていた(FreeBSD 6.0 では正常)Perl で無限ループになっていた ipadic の辞書作成部分は C++ のモジュールが使われるように変更されるそうです。
MeCab-perl-0.90rc6 対応 ― 2006年01月13日 02時47分34秒
どうにか MeCab-0.90rc6 を動かすことができたので、MeCab-perl-0.90rc6 対応を行いました。
MeCab 0.90rc6 その後 ― 2006年01月12日 05時11分06秒
MinGw ではipadicの辞書生成時に
'-' は、内部コマンドまたは外部コマンド、
操作可能なプログラムまたはバッチ ファイルとして認識されていません。
とエラーになりました。
open (S1, "|-") がダメなのでしょう。
cygwin では、無事辞書の生成ができましたが、mecab を実行すると
Tagger.cpp(222): tokenizer.cpp(177): cannot find entry for: DEFAULT
とエラーになりました。
どうも RC ファイルの設定の問題のようだが、詳細は不明。
Linux で Juman 辞書の生成を行ってみたが、やはり途中で無限ループに入りました。
...どれもまともに動かすことができていません。やれやれ。
'-' は、内部コマンドまたは外部コマンド、
操作可能なプログラムまたはバッチ ファイルとして認識されていません。
とエラーになりました。
open (S1, "|-") がダメなのでしょう。
cygwin では、無事辞書の生成ができましたが、mecab を実行すると
Tagger.cpp(222): tokenizer.cpp(177): cannot find entry for: DEFAULT
とエラーになりました。
どうも RC ファイルの設定の問題のようだが、詳細は不明。
Linux で Juman 辞書の生成を行ってみたが、やはり途中で無限ループに入りました。
...どれもまともに動かすことができていません。やれやれ。
mecab-ipadic-2.7.0-20051110 の make 完了せず ― 2006年01月11日 03時28分22秒
MeCab 0.90rc6 の動作確認を行うために
mecab-ipadic-2.7.0-20051110.tar.gz
の make をしたのですが、make が完了せず、無限ループ(あるいは非常に時間がかかっている)状態におちいりました。
:
reading ./Others.csv .. 2
reading ./Postp-col.csv .. 90
reading ./Postp.csv .. 146
reading ./Prefix.csv .. 206
reading ./Suffix.csv .. 1294
reading ./Symbol.csv .. 198
reading ./Verb.csv .. 128946
--> ここで HDD をずっとアクセスしている状態となります。
プロセスを見ると以下の処理で無限ループになるようです。
17752 pts/1 S 0:00 make
17753 pts/1 D 0:45 perl /usr/local/libexec/mecab/mecab-dict-index -c euc
17755 pts/1 S 0:00 /usr/local/libexec/mecab/mecab-tool --darts --input=-
環境は以下の通りです。
* Linux 2.4.20-31.9
* perl, v5.8.0 built for i386-linux-thread-multi
(perl, v5.8.3 built for i686-linux でもダメ)
* gcc (GCC) 3.2.2 20030222 (Red Hat Linux 3.2.2-5)
ちなみに ChaSen 用の ipadic-2.7.0 では辞書の作成ができています。
mecab-ipadic-2.7.0-20051110.tar.gz
の make をしたのですが、make が完了せず、無限ループ(あるいは非常に時間がかかっている)状態におちいりました。
:
reading ./Others.csv .. 2
reading ./Postp-col.csv .. 90
reading ./Postp.csv .. 146
reading ./Prefix.csv .. 206
reading ./Suffix.csv .. 1294
reading ./Symbol.csv .. 198
reading ./Verb.csv .. 128946
--> ここで HDD をずっとアクセスしている状態となります。
プロセスを見ると以下の処理で無限ループになるようです。
17752 pts/1 S 0:00 make
17753 pts/1 D 0:45 perl /usr/local/libexec/mecab/mecab-dict-index -c euc
17755 pts/1 S 0:00 /usr/local/libexec/mecab/mecab-tool --darts --input=-
環境は以下の通りです。
* Linux 2.4.20-31.9
* perl, v5.8.0 built for i386-linux-thread-multi
(perl, v5.8.3 built for i686-linux でもダメ)
* gcc (GCC) 3.2.2 20030222 (Red Hat Linux 3.2.2-5)
ちなみに ChaSen 用の ipadic-2.7.0 では辞書の作成ができています。
MeCab PPM 作成挫折 ― 2005年12月03日 07時54分26秒
MeCab の PPM を作ろうとしていたのですが、挫折しました。
SWIG を使って作られているためか、g++ の使用を前提としているためか、いろいろやってはみたのですが、うまくコンパイルできませんでした。
# SWIG 自体はWindows版もあるので、Windows でコンパイルできないわけはないだろうと思うのですが...。
Text-Chasen はできているので、Text-Chasen を参考に Namazu で利用する部分だけを Perl から使えるように Perl モジュールを別に作った方が早いかもしれません。
まぁ、仮にText-Mecab とでもしましょうかねぇ。
# taku さんは、「もっと SWIG を!」という考えなんですけど...。
# これじゃ、逆行しちゃいますねぇ。
SWIG を使って作られているためか、g++ の使用を前提としているためか、いろいろやってはみたのですが、うまくコンパイルできませんでした。
# SWIG 自体はWindows版もあるので、Windows でコンパイルできないわけはないだろうと思うのですが...。
Text-Chasen はできているので、Text-Chasen を参考に Namazu で利用する部分だけを Perl から使えるように Perl モジュールを別に作った方が早いかもしれません。
まぁ、仮にText-Mecab とでもしましょうかねぇ。
# taku さんは、「もっと SWIG を!」という考えなんですけど...。
# これじゃ、逆行しちゃいますねぇ。
Re: MeCab 対応 ― 2005年11月21日 17時46分52秒
stable-2-0 のマニュアルも HEAD と同等の内容に修正しました。
MeCab 対応 ― 2005年11月17日 02時14分26秒
HEAD で対応していた MeCab を stable-2-0 に下ろしてきました。
ただし、ドキュメントはまだ修正できていません。
ただし、ドキュメントはまだ修正できていません。
MeCab で分かち書きするには改行が必要!? ― 2005年10月04日 07時59分23秒
改行しないで分かち書きのテストをした結果です。
というように MeCab では無視されます。 改行を入れると
のように分かち書きされます。
MeCab では改行が必須のようです。
$ echo -n "本日は晴天なり" | kakasi -w
本日 は 晴天 なり$
$echo -n "本日は晴天なり" | chasen -j -F '%m '
本日 は 晴天 なり
$
$ echo -n "本日は晴天なり" | mecab -Owakati -b 8192
$
というように MeCab では無視されます。 改行を入れると
$ echo "本日は晴天なり" | mecab -Owakati -b 8192
本日 は 晴天 なり
$
のように分かち書きされます。
MeCab では改行が必須のようです。
最近のコメント