鐚一文 ― 2007年10月02日 03時38分32秒
鐚一文は、「びたいちもん」と読みます。
$ echo 鐚一文 | kakasi -JH -p びた{いちぶん|かずふみ}
$ echo 鐚一文 | mecab -N4 鐚 名詞,一般,*,*,*,*,* 一 名詞,数,*,*,*,*,一,イチ,イチ 文 名詞,接尾,助数詞,*,*,*,文,ブン,ブン EOS 鐚 名詞,一般,*,*,*,*,* 一 名詞,数,*,*,*,*,一,イチ,イチ 文 名詞,接尾,助数詞,*,*,*,文,モン,モン EOS 鐚 名詞,一般,*,*,*,*,* 一文 名詞,一般,*,*,*,*,一文,イチブン,イチブン EOS 鐚 名詞,固有名詞,組織,*,*,*,* 一文 名詞,一般,*,*,*,*,一文,イチブン,イチブン EOS
$ echo 鐚一文 | chasen 鐚 未知語 一文 イチブン 一文 名詞-一般 EOS
と、みなさん読めません。
mecab-ipadic-2.7.0-20070801 公開 ― 2007年08月01日 13時10分46秒
MeCab の辞書 mecab-ipadic-2.7.0-20070801 が公開されました。
今回の修正は、「単語の読みが正しく学習できていなかった問題を修正」とのことですので、古い辞書を使っている方はバージョンアップをお勧めします。
これに伴い「MeCab 0.96 のインストール方法」を修正しました。
http://www.asahi-net.or.jp/~yw3t-trns/namazu/mecab/index.htm
また、 ActivePerl(Windows 用 Perl) 用の MeCab PPM で必要となる辞書(EUC-JP版, Shift_JIS版, UTF-8版)を mecab-ipadic-2.7.0-20070801 に変更しました。 それぞれ以下からダウンロードできます。
http://www.akaneiro.jp/public/mecab-ipadic-0.96.zip https://www.akaneiro.jp/members/mecab-ipadic-0.96-sjis.zip https://www.akaneiro.jp/members/mecab-ipadic-0.96-utf8.zip
MeCab 0.96 PPM ― 2007年06月28日 05時06分30秒
MeCab 0.96 がリリースされましたので、MeCab の PPM パッケージおよび辞書を更新しました。
http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd
ppm コマンドでインストール/バージョンアップができます。
C:\> ppm uninstall MeCab C:\> ppm install http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd
MeCab Perl モジュールは ppm コマンドでインストールできますが、Text-Kakasi 同様に PPM のインストールだけでは動作せず、辞書と mecabrc のインストールおよび設定が必要になります。
http://www.akaneiro.jp/public/mecab-ipadic-0.96.zip
から辞書ファイルをダウンロードして、手順に従ってインストールを行ってください。
- Namazu for Windows 2.0.17 では EUC-JP の辞書を前提にしています。
- Namazu 以外の用途用にEUC-JP版辞書以外にShift_JIS版辞書、UTF-8版辞書を用意しました。 Shift_JIS版辞書とUTF-8版辞書は下記のメンバエリアで公開しています。 メンバエリアにアクセスするためにはユーザIDとパスワードが必要になります。
https://www.akaneiro.jp/members/mecab-ipadic-0.96-sjis.zip https://www.akaneiro.jp/members/mecab-ipadic-0.96-utf8.zip
- MeCab PPM をバージョンアップした場合は、辞書もバージョンアップしてください。
[追記]
- この内容は古くなっております。 http://namazu.asablo.jp/blog/2008/09/29/3788573 をご覧ください。
MeCab 0.96 リリース ― 2007年06月13日 03時02分30秒
MeCab 0.96 がリリースされました。
また、MeCab 用 IPA 辞書も更新されました。(mecab-ipadic-2.7.0-20070610)
MeCab 0.96 の辞書のフォーマットは MeCab 0.94, 0.95 と同じ DIC_VERSION 102 です。
DIC_VERSION と MeCab のバージョンとの関係は次の通りです。
- DIC_VERSION 102, MeCab 0.94, 0.95, 0.96
- DIC_VERSION 101, MeCab 0.92, 0.93
- DIC_VERSION 100, MeCab 0.90, 0.91
「MeCab のインストール方法」のページを更新しました。 インストール方法は下記を参考にしてください。(UNIX向け)
http://www.asahi-net.or.jp/~yw3t-trns/namazu/mecab/index.htm
MeCab 0.95 にバッファオーバーフロー ― 2007年03月20日 17時38分57秒
MeCab 0.95 以前のバージョンでバッファオーバーフローが見つかりました。 パッチが公開されていますので、今朝公開した MeCab 0.95 PPM はパッチをあてたものに更新しました。再度、インストールし直してください。
古いバージョンの MeCab を使っている人もバージョンアップしてください。
MeCab 0.95 PPM ― 2007年03月20日 05時04分03秒
MeCab 0.95 がリリースされましたので、MeCab の PPM および辞書を更新しました。
http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd
ppm コマンドでインストール/バージョンアップができます。
C:\> ppm uninstall MeCab C:\> ppm install http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd
MeCab Perl モジュールは ppm コマンドでインストールできますが、Text-Kakasi 同様に PPM のインストールだけでは動作せず、辞書と mecabrc のインストールおよび設定が必要になります。
http://www.akaneiro.jp/public/mecab-ipadic-0.95.zip
から辞書ファイルをダウンロードして、手順に従ってインストールを行ってください。
- Namazu for Windows 2.0.17 では EUC-JP の辞書を前提にしています。
- Namazu 以外の用途用にEUC-JP版辞書以外にShift_JIS版辞書、UTF-8版辞書を用意しました。
http://www.akaneiro.jp/public/mecab-ipadic-0.95-sjis.zip http://www.akaneiro.jp/public/mecab-ipadic-0.95-utf8.zip
- MeCab PPM をバージョンアップした場合は、辞書もバージョンアップしてください。
古い mecab-ipadic 公開終了 ― 2007年03月17日 05時02分02秒
サーバのHDD容量の関係で、古いMeCab 0.90/0.91 用および 0.92/0.93 用IPA辞書(Windows用バイナリ)の公開を近日中に終了します。
これらの辞書はそれぞれEUC-JP,Shift_JIS,UTF-8の3種類用意しているため、合計150MB程になるためです。
今後は最新バージョンの用の辞書のみ公開することにします。 (現在、最新版はMeCab 0.94/0.95用です。)
MeCab 0.95 リリース ― 2007年03月12日 12時19分36秒
MeCab 0.95 がリリースされました。
- 辞書は MeCab 0.94 と同じ DIC_VERSION 102 です。
DIC_VERSION と MeCab のバージョンとの関係は次の通りです。
- DIC_VERSION 102, MeCab 0.94, 0.95 - DIC_VERSION 101, MeCab 0.92, 0.93 - DIC_VERSION 100, MeCab 0.90, 0.91
MeCab 0.94 PPM ― 2007年03月01日 06時46分02秒
MeCab 0.94 がリリースされましたので、MeCab の PPM および辞書を更新しました。
http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd
ppm コマンドでインストール/バージョンアップができます。
C:\> ppm uninstall MeCab C:\> ppm install http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd
MeCab Perl モジュールは ppm コマンドでインストールできますが、Text-Kakasi 同様に PPM のインストールだけでは動作せず、辞書と mecabrc のインストールおよび設定が必要になります。
http://www.akaneiro.jp/public/mecab-ipadic-0.94.zip
から辞書ファイルをダウンロードして、手順に従ってインストールを行ってください。
- Namazu for Windows 2.0.16 では EUC-JP の辞書を前提にしています。
- Namazu 以外の用途用にEUC-JP版辞書以外にShift_JIS版辞書、UTF-8版辞書を用意しました。
http://www.akaneiro.jp/public/mecab-ipadic-0.94-sjis.zip http://www.akaneiro.jp/public/mecab-ipadic-0.94-utf8.zip
- MeCab PPM をバージョンアップした場合は、辞書もバージョンアップしてください。
MeCab 0.94 リリース ― 2007年02月25日 14時34分58秒
http://mecab.sourceforge.net/
しかし、手元の環境では残念ながらコンパイルできていません。
tokenizer.cpp: In member function `bool MeCab::TokenizerImpl<N, P>::open(const MeCab::Param&)':
tokenizer.cpp:104: parse error before `>' token
tokenizer.cpp:123: parse error before `>' token
tokenizer.cpp:167: parse error before `>' token
tokenizer.cpp:167: parse error before `)' token
tokenizer.cpp:169: parse error before `>' token
tokenizer.cpp:176: parse error before `>' token
make[2]: *** [tokenizer.lo] エラー 1
make[2]: 出ます ディレクトリ `/backup/src/mecab-0.94/src'
make[1]: *** [all-recursive] エラー 1
make[1]: 出ます ディレクトリ `/backup/src/mecab-0.94'
make: *** [all-recursive-am] エラー 2
最近のコメント