MeCab で分かち書きするには改行が必要!?2005年10月04日 07時59分23秒

改行しないで分かち書きのテストをした結果です。

$ echo -n "本日は晴天なり" | kakasi -w
本日 は 晴天 なり$


$echo -n "本日は晴天なり" | chasen -j -F '%m '
本日 は 晴天 なり
$


$ echo -n "本日は晴天なり" | mecab -Owakati -b 8192
$


というように MeCab では無視されます。 改行を入れると

$ echo "本日は晴天なり" | mecab -Owakati -b 8192
本日 は 晴天 なり
$


のように分かち書きされます。
MeCab では改行が必須のようです。

コメント

コメントをどうぞ

※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。

※なお、送られたコメントはブログの管理者が確認するまで公開されません。

名前:
メールアドレス:
URL:
コメント:

トラックバック

このエントリのトラックバックURL: http://namazu.asablo.jp/blog/2005/10/04/97436/tb

※なお、送られたトラックバックはブログの管理者が確認するまで公開されません。

_ ナマズのブログ - 2006年01月14日 06時23分03秒

CVS の最新ソースでは、Perl から MeCab のバージョンを取得できるようになったそうです。

MeCab-perl-0.81 までは、
parse ($1);
というように特殊変数を渡すことができましたが、0.90rc6では