GNU libiconv に EUC-JIS-2004, Shift_JIS-2004, ISO-2022-JP-2004 追加 ― 2008年09月20日 02時08分00秒
GNU libiconv で configure 時に --enable-extra-encodings を付けると、EUC-JISX0213, Shift_JISX0213, ISO-2022-JP-3 が利用できるようになります。
現在では、(IANA には未登録ですが)それぞれ EUC-JIS-2004, Shift_JIS-2004, ISO-2022-JP-2004 という名前になっています。
厳密には2004(EUC-JIS-2004, ...) とドラフト(EUC-JISX0213, ...) とでは、10文字追加されているという違いもあるのですが、 あまりこの差を区別して取り扱うことはありません。
GNU libiconv も 2004-07-31 の修正で 10文字追加していますが、名前はドラフト(EUC-JISX0213, ...)のままでした。
今回、それぞれのエリアスとして EUC-JIS-2004, Shift_JIS-2004, ISO-2022-JP-2004 を日本語エンコーディングパッチに追加してもらいました。
libiconv-1.12-ja-4.patch.gz
http://www2d.biglobe.ne.jp/~msyk/software/libiconv-1.12-ja-patch.html
ActivePerl 用 Text-Iconv PPM 更新のお知らせ ― 2008年09月20日 03時14分28秒
Windows ActivePerl 用 Text-Iconv 1.7 の PPM を更新しました。
前回は GNU libiconv 1.10 + 日本語エンコーディングパッチベースのものでしたが、 今回は GNU libiconv 1.12 + 日本語エンコーディングパッチ (libiconv-1.12-ja-4.patch.gz) ベースのものに更新しました。
また、configure オプションに --enable-extra-encodings を付けているので、 JISX0213, Shift_JISX0213, ISO-2022-JP-3 およびそのエリアス EUC-JIS-2004, Shift_JIS-2004, ISO-2022-JP-2004 も使用できます。
C:\> ppm uninstall Text-Iconv C:\> ppm install http://www.akaneiro.jp/PPMPackages/800/Text-Iconv.ppd
としてインストールしてください。
- Windows 専用です。
- ActivePerl ビルド800番台(Perl 5.8)専用です。
- ActivePerl ビルド600番台(Perl 5.6)、1000番台(Perl 5.10)にはインストールできません。
- ActivePerl x86 用です。ActivePerl x64 にはインストールできません。
ソースコードを含む zip ファイルは以下のメンバエリアで公開しています。
https://www.akaneiro.jp/members/PPMPackages/zips/8xx-builds-only/Windows/Text-Iconv.zip
- メンバエリアにアクセスするにはIDとパスワードが必要です。
- グレー会員のIDとパスワードはメルマガで不定期に公開されます。(無償)
- ブルー会員のIDとパスワードは期間限定でダウンロード販売で販売しています。
また、Text-Iconv PPM 作成に用いた GNU libiconv 1.12 + 日本語エンコーディングパッチ (libiconv-1.12-ja-4.patch.gz) を反映したソースプログラムは下記で公開しています。(無償)
ActivePerl + MeCab PPM のテストプログラム ― 2008年09月22日 00時38分26秒
ActivePerl + MeCab PPM の動作テストを行う簡単なプログラムを紹介します。
#!/usr/bin/perl -w use strict; use Encode; use MeCab 0.97; my $str = "本日は晴天なり。"; my $t = new MeCab::Tagger("-Owakati"); Encode::from_to($str, "Shift_JIS", "EUC-JP"); $str = $t->parse($str); Encode::from_to($str, "EUC-JP", "Shift_JIS"); print $str;
- この Perl スクリプトは Shift_JIS で作成してください。
- MeCab の辞書は EUC-JP 版の辞書を使用してください。
MeCab 用 IPA バイナリ辞書インストーラ公開のお知せ ― 2008年09月22日 20時49分10秒
以前より .zip 形式で公開しておりました MeCab PPM 用 IPA バイナリ辞書を .msi (Microsoft Installer 形式)で公開することになりました。
MeCab では、入力データの漢字コードと同じ漢字コードの辞書を使う必要があります。 3種類の辞書を用意していますので、目的に合せてご利用ください。
●MeCab 用 IPA バイナリ辞書インストーラ(EUC-JP版)
http://www.akaneiro.jp/public/mecab/ipadic/
Namazu for Windows で使用する場合は EUC-JP 版の辞書をご利用ください。
●MeCab 用 IPA バイナリ辞書インストーラ(Shift_JIS版)
https://www.akaneiro.jp/members/mecab/ipadic-sjis/
メンバエリアにて公開。グレー会員以上の方がダウンロード可能です。 ブルー会員、グリーン会員の方もダウンロード可能です。
●MeCab 用 IPA バイナリ辞書インストーラ(UTF-8版)
https://www.akaneiro.jp/members/mecab/ipadic-utf8/
メンバエリアにて公開。グレー会員以上の方がダウンロード可能です。 ブルー会員、グリーン会員の方もダウンロード可能です。
[インストール方法]
IE で上記 URL にアクセスするとインストーラが起動します。 あとはインストーラの指示に従ってインストールしてください。
[動作環境]
- ActivePerl Windows(x86) 版のみに対応しています。
ActivePerl Windows(x64) 版には対応していません。
- ActivePerl 800番台(5.8.X) のみに対応しています。
ActivePerl 600番台(5.6.X)、1000番台(5.10.X) にはインストールできません。
詳しくは
http://www.akaneiro.jp/mecab/ppm/
をご覧ください。
なお、従来の .zip ファイルの公開は終了しました。
libnmz2.0.18.003-win32.zip 公開 ― 2008年09月28日 22時48分10秒
libnmz2.0.18.003-win32.zip をブルー会員エリアで公開しました。
Visual C++ 2005 でコンパイルした nmz.dll (x86版)です。 従来の MinGw + gcc でコンパイルした nmz.dll の差し替え版となります。 libnmz2.0.18.003-win32.zip では GNU libiconv のバージョン 1.12-ja-4 (日本語エンコーディングパッチをあてたもの)をリンクしました。
Visual C++ 2005 でコンパイル可能な nmz.dll を用いた簡単な検索プログラムのサンプル付きです。 nmz.dll を用いた検索プログラムを C 言語で作成したい方には参考になるでしょう。
https://www.akaneiro.jp/members/blue/libnmz2.0.18.003-win32.zip
- 古いバージョンの Namazu for Windows をご利用の方は最新版の Namazu for Windows にバージョンアップしてください。 nmz.dll は本アーカイブの nmz.dll に差し替えてください。
- 次の Namazu for Windows のアーカイブからは、この Visual C++ 2005 でコンパイルした nmz.dll に変更する予定です。
- 「libnmz API Windows 版 初級編」の PDF ファイルは別配布となりました。
- libnmz2.0.18.001-win32-zip, libnmz2.0.18.002-win32-zip の公開は終了しました。
MeCab 0.97 PPM ― 2008年09月29日 17時29分49秒
MeCab 0.97 は随分前にリリースされていましたが、MeCab の PPM を 0.97 にバージョンアップするのを忘れていました。 個人的には 0.97 を使っていましたが、古い 0.96 を公開していました。
そのまま 0.97 を公開しても良かったのですが、最近 SWIG を少し学習したので、MeCab PPM を VC++ 2005 でコンパイルしてみました。 多少苦労しましたが、VC++ 2005 でコンパイルできましたので、 今後は MinGw + gcc でコンパイルしたものではなくて VC++ 2005 でコンパイルしたものを公開することにします。 (VC++ 2005 でコンパイルできるということは x64 版のコンパイルも可能ということになりますから。)
MeCab の PPM のインストールはまず IPA 辞書のインストールを行ってください。 (必ず専用の辞書のインストールを行ってください。 MeCab Windows 版の辞書を本辞書の代わりに使用することはできません。)
http://www.akaneiro.jp/public/mecab/ipadic/
Microsoft Installer 形式(.msi)のインストーラが起動し、MeCab 用 IPA 辞書(EUC-JP)のインストールが行われます。
辞書のインストールが終了しましたら、メニューから「MeCab PPM install」を選択して MeCab PPM のインストールを行ってください。
- Windows 用 ActivePerl 専用です。
- AcitvePerl x86 版用です。
- ActivePerl ビルド800番台(Perl 5.8)専用です。
- AcitvePerl ビルド600番台(Perl 5.6)、ビルド1000番台(Perl 5.10) にはインストールできません。
詳しくは http://www.akaneiro.jp/mecab/ をご覧ください。
- Namazu for Windows 2.0.18 では EUC-JP の辞書を前提にしています。
- Namazu 以外の用途用にEUC-JP版辞書以外にShift_JIS版辞書、UTF-8版辞書を用意しました。 Shift_JIS版辞書とUTF-8版辞書は下記のメンバエリアで公開しています。 メンバエリアにアクセスするためにはユーザIDとパスワードが必要になります。
最近のコメント