鐚一文2007年10月02日 03時38分32秒

鐚一文は、「びたいちもん」と読みます。

$ echo 鐚一文 | kakasi -JH -p 
びた{いちぶん|かずふみ}
$ echo 鐚一文 | mecab -N4
鐚      名詞,一般,*,*,*,*,*
一      名詞,数,*,*,*,*,一,イチ,イチ
文      名詞,接尾,助数詞,*,*,*,文,ブン,ブン
EOS
鐚      名詞,一般,*,*,*,*,*
一      名詞,数,*,*,*,*,一,イチ,イチ
文      名詞,接尾,助数詞,*,*,*,文,モン,モン
EOS
鐚      名詞,一般,*,*,*,*,*
一文    名詞,一般,*,*,*,*,一文,イチブン,イチブン
EOS
鐚      名詞,固有名詞,組織,*,*,*,*
一文    名詞,一般,*,*,*,*,一文,イチブン,イチブン
EOS
$ echo 鐚一文 | chasen
鐚                      未知語
一文    イチブン        一文    名詞-一般
EOS

と、みなさん読めません。

mecab-ipadic-2.7.0-20070801 公開2007年08月01日 13時10分46秒

MeCab の辞書 mecab-ipadic-2.7.0-20070801 が公開されました。

今回の修正は、「単語の読みが正しく学習できていなかった問題を修正」とのことですので、古い辞書を使っている方はバージョンアップをお勧めします。

これに伴い「MeCab 0.96 のインストール方法」を修正しました。

http://www.asahi-net.or.jp/~yw3t-trns/namazu/mecab/index.htm

また、 ActivePerl(Windows 用 Perl) 用の MeCab PPM で必要となる辞書(EUC-JP版, Shift_JIS版, UTF-8版)を mecab-ipadic-2.7.0-20070801 に変更しました。 それぞれ以下からダウンロードできます。

http://www.akaneiro.jp/public/mecab-ipadic-0.96.zip
https://www.akaneiro.jp/members/mecab-ipadic-0.96-sjis.zip
https://www.akaneiro.jp/members/mecab-ipadic-0.96-utf8.zip

MeCab 0.96 PPM2007年06月28日 05時06分30秒

MeCab 0.96 がリリースされましたので、MeCab の PPM パッケージおよび辞書を更新しました。

http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd

ppm コマンドでインストール/バージョンアップができます。

C:\> ppm uninstall MeCab
C:\> ppm install http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd

MeCab Perl モジュールは ppm コマンドでインストールできますが、Text-Kakasi 同様に PPM のインストールだけでは動作せず、辞書と mecabrc のインストールおよび設定が必要になります。

http://www.akaneiro.jp/public/mecab-ipadic-0.96.zip

から辞書ファイルをダウンロードして、手順に従ってインストールを行ってください。

  • Namazu for Windows 2.0.17 では EUC-JP の辞書を前提にしています。
  • Namazu 以外の用途用にEUC-JP版辞書以外にShift_JIS版辞書、UTF-8版辞書を用意しました。 Shift_JIS版辞書とUTF-8版辞書は下記のメンバエリアで公開しています。 メンバエリアにアクセスするためにはユーザIDとパスワードが必要になります。
 https://www.akaneiro.jp/members/mecab-ipadic-0.96-sjis.zip
 https://www.akaneiro.jp/members/mecab-ipadic-0.96-utf8.zip
  • MeCab PPM をバージョンアップした場合は、辞書もバージョンアップしてください。

[追記]

MeCab 0.96 リリース2007年06月13日 03時02分30秒

MeCab 0.96 がリリースされました。

http://mecab.sourceforge.net/

また、MeCab 用 IPA 辞書も更新されました。(mecab-ipadic-2.7.0-20070610)

MeCab 0.96 の辞書のフォーマットは MeCab 0.94, 0.95 と同じ DIC_VERSION 102 です。

DIC_VERSION と MeCab のバージョンとの関係は次の通りです。

  • DIC_VERSION 102, MeCab 0.94, 0.95, 0.96
  • DIC_VERSION 101, MeCab 0.92, 0.93
  • DIC_VERSION 100, MeCab 0.90, 0.91

「MeCab のインストール方法」のページを更新しました。 インストール方法は下記を参考にしてください。(UNIX向け)

http://www.asahi-net.or.jp/~yw3t-trns/namazu/mecab/index.htm

MeCab 0.95 にバッファオーバーフロー2007年03月20日 17時38分57秒

MeCab 0.95 以前のバージョンでバッファオーバーフローが見つかりました。 パッチが公開されていますので、今朝公開した MeCab 0.95 PPM はパッチをあてたものに更新しました。再度、インストールし直してください。

古いバージョンの MeCab を使っている人もバージョンアップしてください。

MeCab 0.95 PPM2007年03月20日 05時04分03秒

MeCab 0.95 がリリースされましたので、MeCab の PPM および辞書を更新しました。

 http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd

ppm コマンドでインストール/バージョンアップができます。

 C:\> ppm uninstall MeCab
 C:\> ppm install http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd

MeCab Perl モジュールは ppm コマンドでインストールできますが、Text-Kakasi 同様に PPM のインストールだけでは動作せず、辞書と mecabrc のインストールおよび設定が必要になります。

 http://www.akaneiro.jp/public/mecab-ipadic-0.95.zip

から辞書ファイルをダウンロードして、手順に従ってインストールを行ってください。

  • Namazu for Windows 2.0.17 では EUC-JP の辞書を前提にしています。
  • Namazu 以外の用途用にEUC-JP版辞書以外にShift_JIS版辞書、UTF-8版辞書を用意しました。
http://www.akaneiro.jp/public/mecab-ipadic-0.95-sjis.zip
http://www.akaneiro.jp/public/mecab-ipadic-0.95-utf8.zip
  • MeCab PPM をバージョンアップした場合は、辞書もバージョンアップしてください。

古い mecab-ipadic 公開終了2007年03月17日 05時02分02秒

サーバのHDD容量の関係で、古いMeCab 0.90/0.91 用および 0.92/0.93 用IPA辞書(Windows用バイナリ)の公開を近日中に終了します。

これらの辞書はそれぞれEUC-JP,Shift_JIS,UTF-8の3種類用意しているため、合計150MB程になるためです。

今後は最新バージョンの用の辞書のみ公開することにします。 (現在、最新版はMeCab 0.94/0.95用です。)

MeCab 0.95 リリース2007年03月12日 12時19分36秒

MeCab 0.95 がリリースされました。

http://mecab.sourceforge.net/

  • 辞書は MeCab 0.94 と同じ DIC_VERSION 102 です。
DIC_VERSION と MeCab のバージョンとの関係は次の通りです。
- DIC_VERSION 102, MeCab 0.94, 0.95
- DIC_VERSION 101, MeCab 0.92, 0.93
- DIC_VERSION 100, MeCab 0.90, 0.91

MeCab 0.94 PPM2007年03月01日 06時46分02秒

MeCab 0.94 がリリースされましたので、MeCab の PPM および辞書を更新しました。

 http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd

ppm コマンドでインストール/バージョンアップができます。

 C:\> ppm uninstall MeCab
 C:\> ppm install http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd

MeCab Perl モジュールは ppm コマンドでインストールできますが、Text-Kakasi 同様に PPM のインストールだけでは動作せず、辞書と mecabrc のインストールおよび設定が必要になります。

 http://www.akaneiro.jp/public/mecab-ipadic-0.94.zip

から辞書ファイルをダウンロードして、手順に従ってインストールを行ってください。

  • Namazu for Windows 2.0.16 では EUC-JP の辞書を前提にしています。
  • Namazu 以外の用途用にEUC-JP版辞書以外にShift_JIS版辞書、UTF-8版辞書を用意しました。
http://www.akaneiro.jp/public/mecab-ipadic-0.94-sjis.zip
http://www.akaneiro.jp/public/mecab-ipadic-0.94-utf8.zip
  • MeCab PPM をバージョンアップした場合は、辞書もバージョンアップしてください。

MeCab 0.94 リリース2007年02月25日 14時34分58秒

MeCab 0.94 がリリースされました。

http://mecab.sourceforge.net/

しかし、手元の環境では残念ながらコンパイルできていません。

tokenizer.cpp: In member function `bool MeCab::TokenizerImpl<N, P>::open(const MeCab::Param&)':
tokenizer.cpp:104: parse error before `>' token
tokenizer.cpp:123: parse error before `>' token
tokenizer.cpp:167: parse error before `>' token
tokenizer.cpp:167: parse error before `)' token
tokenizer.cpp:169: parse error before `>' token
tokenizer.cpp:176: parse error before `>' token
make[2]: *** [tokenizer.lo] エラー 1
make[2]: 出ます ディレクトリ `/backup/src/mecab-0.94/src'
make[1]: *** [all-recursive] エラー 1
make[1]: 出ます ディレクトリ `/backup/src/mecab-0.94'
make: *** [all-recursive-am] エラー 2