GNU libiconv に EUC-JIS-2004, Shift_JIS-2004, ISO-2022-JP-2004 追加2008年09月20日 02時08分00秒

GNU libiconv で configure 時に --enable-extra-encodings を付けると、EUC-JISX0213, Shift_JISX0213, ISO-2022-JP-3 が利用できるようになります。

現在では、(IANA には未登録ですが)それぞれ EUC-JIS-2004, Shift_JIS-2004, ISO-2022-JP-2004 という名前になっています。

厳密には2004(EUC-JIS-2004, ...) とドラフト(EUC-JISX0213, ...) とでは、10文字追加されているという違いもあるのですが、 あまりこの差を区別して取り扱うことはありません。

GNU libiconv も 2004-07-31 の修正で 10文字追加していますが、名前はドラフト(EUC-JISX0213, ...)のままでした。

今回、それぞれのエリアスとして EUC-JIS-2004, Shift_JIS-2004, ISO-2022-JP-2004 を日本語エンコーディングパッチに追加してもらいました。

libiconv-1.12-ja-4.patch.gz

http://www2d.biglobe.ne.jp/~msyk/software/libiconv-1.12-ja-patch.html

ActivePerl 用 Text-Iconv PPM 更新のお知らせ2008年09月20日 03時14分28秒

Windows ActivePerl 用 Text-Iconv 1.7 の PPM を更新しました。

前回は GNU libiconv 1.10 + 日本語エンコーディングパッチベースのものでしたが、 今回は GNU libiconv 1.12 + 日本語エンコーディングパッチ (libiconv-1.12-ja-4.patch.gz) ベースのものに更新しました。

また、configure オプションに --enable-extra-encodings を付けているので、 JISX0213, Shift_JISX0213, ISO-2022-JP-3 およびそのエリアス EUC-JIS-2004, Shift_JIS-2004, ISO-2022-JP-2004 も使用できます。

C:\> ppm uninstall Text-Iconv
C:\> ppm install 
       http://www.akaneiro.jp/PPMPackages/800/Text-Iconv.ppd

としてインストールしてください。

  • Windows 専用です。
  • ActivePerl ビルド800番台(Perl 5.8)専用です。
  • ActivePerl ビルド600番台(Perl 5.6)、1000番台(Perl 5.10)にはインストールできません。
  • ActivePerl x86 用です。ActivePerl x64 にはインストールできません。

ソースコードを含む zip ファイルは以下のメンバエリアで公開しています。

https://www.akaneiro.jp/members/PPMPackages/zips/8xx-builds-only/Windows/Text-Iconv.zip

  • メンバエリアにアクセスするにはIDとパスワードが必要です。
  • グレー会員のIDとパスワードはメルマガで不定期に公開されます。(無償)
  • ブルー会員のIDとパスワードは期間限定でダウンロード販売で販売しています。

また、Text-Iconv PPM 作成に用いた GNU libiconv 1.12 + 日本語エンコーディングパッチ (libiconv-1.12-ja-4.patch.gz) を反映したソースプログラムは下記で公開しています。(無償)

http://www.akaneiro.jp/public/src/

ActivePerl + MeCab PPM のテストプログラム2008年09月22日 00時38分26秒

ActivePerl + MeCab PPM の動作テストを行う簡単なプログラムを紹介します。

#!/usr/bin/perl -w

use strict;
use Encode;
use MeCab 0.97;


my $str = "本日は晴天なり。";

my $t = new MeCab::Tagger("-Owakati");

Encode::from_to($str, "Shift_JIS", "EUC-JP");
$str = $t->parse($str);

Encode::from_to($str, "EUC-JP", "Shift_JIS");
print $str;
  • この Perl スクリプトは Shift_JIS で作成してください。
  • MeCab の辞書は EUC-JP 版の辞書を使用してください。

MeCab 用 IPA バイナリ辞書インストーラ公開のお知せ2008年09月22日 20時49分10秒

以前より .zip 形式で公開しておりました MeCab PPM 用 IPA バイナリ辞書を .msi (Microsoft Installer 形式)で公開することになりました。

MeCab では、入力データの漢字コードと同じ漢字コードの辞書を使う必要があります。 3種類の辞書を用意していますので、目的に合せてご利用ください。

●MeCab 用 IPA バイナリ辞書インストーラ(EUC-JP版)

http://www.akaneiro.jp/public/mecab/ipadic/

Namazu for Windows で使用する場合は EUC-JP 版の辞書をご利用ください。

●MeCab 用 IPA バイナリ辞書インストーラ(Shift_JIS版)

https://www.akaneiro.jp/members/mecab/ipadic-sjis/

メンバエリアにて公開。グレー会員以上の方がダウンロード可能です。 ブルー会員、グリーン会員の方もダウンロード可能です。

●MeCab 用 IPA バイナリ辞書インストーラ(UTF-8版)

https://www.akaneiro.jp/members/mecab/ipadic-utf8/

メンバエリアにて公開。グレー会員以上の方がダウンロード可能です。 ブルー会員、グリーン会員の方もダウンロード可能です。

[インストール方法]

IE で上記 URL にアクセスするとインストーラが起動します。 あとはインストーラの指示に従ってインストールしてください。

[動作環境]

  • ActivePerl Windows(x86) 版のみに対応しています。
 ActivePerl Windows(x64) 版には対応していません。
  • ActivePerl 800番台(5.8.X) のみに対応しています。
 ActivePerl 600番台(5.6.X)、1000番台(5.10.X) にはインストールできません。

詳しくは

http://www.akaneiro.jp/mecab/ppm/

をご覧ください。

なお、従来の .zip ファイルの公開は終了しました。

libnmz2.0.18.003-win32.zip 公開2008年09月28日 22時48分10秒

libnmz2.0.18.003-win32.zip をブルー会員エリアで公開しました。

Visual C++ 2005 でコンパイルした nmz.dll (x86版)です。 従来の MinGw + gcc でコンパイルした nmz.dll の差し替え版となります。 libnmz2.0.18.003-win32.zip では GNU libiconv のバージョン 1.12-ja-4 (日本語エンコーディングパッチをあてたもの)をリンクしました。

Visual C++ 2005 でコンパイル可能な nmz.dll を用いた簡単な検索プログラムのサンプル付きです。 nmz.dll を用いた検索プログラムを C 言語で作成したい方には参考になるでしょう。

https://www.akaneiro.jp/members/blue/libnmz2.0.18.003-win32.zip

  • 古いバージョンの Namazu for Windows をご利用の方は最新版の Namazu for Windows にバージョンアップしてください。 nmz.dll は本アーカイブの nmz.dll に差し替えてください。
  • 次の Namazu for Windows のアーカイブからは、この Visual C++ 2005 でコンパイルした nmz.dll に変更する予定です。
  • 「libnmz API Windows 版 初級編」の PDF ファイルは別配布となりました。
  • libnmz2.0.18.001-win32-zip, libnmz2.0.18.002-win32-zip の公開は終了しました。

MeCab 0.97 PPM2008年09月29日 17時29分49秒

MeCab 0.97 は随分前にリリースされていましたが、MeCab の PPM を 0.97 にバージョンアップするのを忘れていました。 個人的には 0.97 を使っていましたが、古い 0.96 を公開していました。

そのまま 0.97 を公開しても良かったのですが、最近 SWIG を少し学習したので、MeCab PPM を VC++ 2005 でコンパイルしてみました。 多少苦労しましたが、VC++ 2005 でコンパイルできましたので、 今後は MinGw + gcc でコンパイルしたものではなくて VC++ 2005 でコンパイルしたものを公開することにします。 (VC++ 2005 でコンパイルできるということは x64 版のコンパイルも可能ということになりますから。)

MeCab の PPM のインストールはまず IPA 辞書のインストールを行ってください。 (必ず専用の辞書のインストールを行ってください。 MeCab Windows 版の辞書を本辞書の代わりに使用することはできません。)

http://www.akaneiro.jp/public/mecab/ipadic/

Microsoft Installer 形式(.msi)のインストーラが起動し、MeCab 用 IPA 辞書(EUC-JP)のインストールが行われます。

辞書のインストールが終了しましたら、メニューから「MeCab PPM install」を選択して MeCab PPM のインストールを行ってください。

  • Windows 用 ActivePerl 専用です。
  • AcitvePerl x86 版用です。
  • ActivePerl ビルド800番台(Perl 5.8)専用です。
  • AcitvePerl ビルド600番台(Perl 5.6)、ビルド1000番台(Perl 5.10) にはインストールできません。

詳しくは http://www.akaneiro.jp/mecab/ をご覧ください。

  • Namazu for Windows 2.0.18 では EUC-JP の辞書を前提にしています。
  • Namazu 以外の用途用にEUC-JP版辞書以外にShift_JIS版辞書、UTF-8版辞書を用意しました。 Shift_JIS版辞書とUTF-8版辞書は下記のメンバエリアで公開しています。 メンバエリアにアクセスするためにはユーザIDとパスワードが必要になります。

https://www.akaneiro.jp/members/mecab/ipadic-sjis/

https://www.akaneiro.jp/members/mecab/ipadic-utf8/