ChaSen のインストール方法修正2005年10月01日 05時06分24秒

IPADIC 2.7.0 は品詞体系変更のためのベータ版であったので、IPADIC 2.6.3 を使用するように修正しました。

wakatidict を tarball に含めるための修正2005年10月01日 22時55分39秒

make dist で作成した tarball を解凍して configure するとエラーになるので、tknamazu 同様 DIST_WAKATIDICT を用意して EXTRA_DIRS 他に追加しました。

これにより make dist で作成した tarball に wakatidict が含まれるようになりました。

(HEADのみ)

ChaSen の COPYRIGHT2005年10月04日 02時56分30秒

ChaSen 2.3.3 の COPYRIGHT
Copyright (c) 2003 Nara Institute of Science and Technology
All rights reserved.

Redistribution and use in source and binary forms, with or without
modification, are permitted provided that the following conditions
are met:

1. Redistributions of source code must retain the above copyright
   notice, this list of conditions and the following disclaimer.
2. Redistributions in binary form must reproduce the above copyright
   notice, this list of conditions and the following disclaimer in the
   documentation and/or other materials provided with the distribution.
3. The name Nara Institute of Science and Technology may not be used to 
endorse or promote products derived from this software without specific
prior written permission.

THIS SOFTWARE IS PROVIDED BY Nara Institute of Science and Technology
``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A
PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE Nara Institute
of Science and Technology BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED
TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.


日本語訳(機械翻訳)

Copyright(c)2003奈良先端科学技術大学院大学のAll rights reserved。

以下の条件が満たされれば、ソースでの再分配と使用と変更のあるなしにかかわらずバイナリ形式は受入れられます:

1. ソースコードの再分配は上の版権情報、状態のこのリスト、および以下の注意書きを保有しなければなりません。
2. バイナリ形式における再分配は上の版権情報を再生させなければなりません、と状態のこのリストとドキュメンテーション、そして/または、その他の材料における以下の注意書きは分配に前提としました。
3. 名前奈良先端科学技術大学院大学は、このソフトウェアから特定の先の許可書なしで得られた製品を宣伝するか、または促進するのに使用されないかもしれません。

このソフトウェアは「そのままな」奈良先端科学技術大学院大学とどんな急行か黙示的な保証、包含、他によっても、特定の目的のための市場性とフィットネスの黙示的な保証が放棄されるかどうかということです。 奈良先端科学技術大学院大学はしかしながら、もたらされたどんな直接の、または、間接的であるか、付帯的であるか、特別であるか、模範的であるか、必然的な損害賠償(; サービス、代替財、使用の損失、データ、または利益の調達; 包含、他、ビジネス中断)と責任のどんな理論の上でも決して、傾向がないでしょう; そのような損害の可能性についてアドバイスされてもこのソフトウェアの使用から何らかの方法で起こる契約、厳しい責任負担、または不法行為(そうでなければ、怠慢を含んでいる)にかかわらず;

ipadic の COPYRIGHT2005年10月04日 03時12分21秒

ipadic 2.6.3 の COPYRIGHT
Copyright 2000, 2001, 2002, 2003 Nara Institute of Science
and Technology.  All Rights Reserved.

Use, reproduction, and distribution of this software is permitted.
Any copy of this software, whether in its original form or modified,
must include both the above copyright notice and the following
paragraphs.

Nara Institute of Science and Technology (NAIST),
the copyright holders, disclaims all warranties with regard to this
software, including all implied warranties of merchantability and
fitness, in no event shall NAIST be liable for
any special, indirect or consequential damages or any damages
whatsoever resulting from loss of use, data or profits, whether in an
action of contract, negligence or other tortuous action, arising out
of or in connection with the use or performance of this software.

A large portion of the dictionary entries
originate from ICOT Free Software.  The following conditions for ICOT
Free Software applies to the current dictionary as well.

Each User may also freely distribute the Program, whether in its
original form or modified, to any third party or parties, PROVIDED
that the provisions of Section 3 ("NO WARRANTY") will ALWAYS appear
on, or be attached to, the Program, which is distributed substantially
in the same form as set out herein and that such intended
distribution, if actually made, will neither violate or otherwise
contravene any of the laws and regulations of the countries having
jurisdiction over the User or the intended distribution itself.

NO WARRANTY

The program was produced on an experimental basis in the course of the
research and development conducted during the project and is provided
to users as so produced on an experimental basis.  Accordingly, the
program is provided without any warranty whatsoever, whether express,
implied, statutory or otherwise.  The term "warranty" used herein
includes, but is not limited to, any warranty of the quality,
performance, merchantability and fitness for a particular purpose of
the program and the nonexistence of any infringement or violation of
any right of any third party.

Each user of the program will agree and understand, and be deemed to
have agreed and understood, that there is no warranty whatsoever for
the program and, accordingly, the entire risk arising from or
otherwise connected with the program is assumed by the user.

Therefore, neither ICOT, the copyright holder, or any other
organization that participated in or was otherwise related to the
development of the program and their respective officials, directors,
officers and other employees shall be held liable for any and all
damages, including, without limitation, general, special, incidental
and consequential damages, arising out of or otherwise in connection
with the use or inability to use the program or any product, material
or result produced or otherwise obtained by using the program,
regardless of whether they have been advised of, or otherwise had
knowledge of, the possibility of such damages at any time during the
project or thereafter.  Each user will be deemed to have agreed to the
foregoing by his or her commencement of use of the program.  The term
"use" as used herein includes, but is not limited to, the use,
modification, copying and distribution of the program and the
production of secondary products from the program.

In the case where the program, whether in its original form or
modified, was distributed or delivered to or received by a user from
any person, organization or entity other than ICOT, unless it makes or
grants independently of ICOT any specific warranty to the user in
writing, such person, organization or entity, will also be exempted
from and not be held liable to the user for any such damages as noted
above as far as the program is concerned.


日本語訳(機械翻訳)
Copyright2000、2001、2002、2003奈良先端科学技術大学院大学。
All rights reserved。

このソフトウェアの使用、再現、および分配は受入れられます。 このソフトウェアのどんなコピーも原型か変更にされるにかかわらず上の版権情報と以下のパラグラフの両方を含まなければなりません。

奈良先端科学技術大学院大学(NAIST)(著作権保有者)はこのソフトウェアに関してすべての保証を放棄します、市場性とフィットネスのすべての黙示的な保証を含んでいてこのソフトウェアの契約か怠慢か他のねじれている動作、起こる動作か使用か性能にかかわらずNAISTは使用、データまたは利益の損失から生じるのにおいてどんな特別であるか、間接的であるか必然的な損害賠償か全くどんな損害賠償にも決して、責任がないでしょう。

エントリーがICOT Free Softwareから溯源する辞書の大きい部分。 ICOT Free Softwareのための以下の条件はまた、現在の辞書に適用されます。

また、各Userは自由にProgramを分配するかもしれません、セクション3(「保証がありません」)に関する条項がいつも現れるか、または添付されるPROVIDED、プログラム、どれがこの場所に出されるのと同じ書式で実質的に分配されるか、そして、およびそのそのようなものがフォームの、または、どんな第三者かパーティーにも変更されたオリジナルで分配を意図したか否かに関係なく; 実際に作られると、どちらも、Userか意図された分配自体に管轄する法のどれかと国の規則に、違反しますか、そうでなければ、違反しないでしょうか?

保証がありません。

プログラムを実験的にプロジェクトの間に行われた研究開発の間に作り出して、そのように実験的に生産されているとしてユーザに提供します。 それに従って、急行、暗示する、法定またはそうでないことにかかわらず全く少しも保証なしでプログラムを提供します。 「保証」という用語は、この場所にインクルードを使用しますが、有限でなくて、プログラムの特定の目的のための品質、性能、市場性、およびフィットネスのどんな保証とどんな侵害の非実在であるかいずれの違反はどんな第三者の右です。

プログラムの各ユーザは、同意して、分かって、同意したと考えられて、理解されて、プログラムにおける、いかなるどんな保証もなくて、全体の危険がそれに従って、プログラムに起こったか、またはそうでなければ、接続したのがユーザによって想定されます。

したがって、ICOT、著作権保有者もプログラムの開発に参加しているか、またはそうでなければ関連するいかなる他の組織と彼らのそれぞれのない職員も、ディレクター、役員、および他の従業員はありとあらゆる損害賠償に支払いの義務があるように保たれるものとします、制限なしで一般的で、特別で、付帯的で必然的な損害賠償を含んでいて; そうでなければ、無能の外へ、または、使用かいつでもプロジェクトの間、においてその後プログラムかどんな製品か材料か生産されたか、または別の方法でそれらについて通知するか、またはそうでなければ、知識を持っていたことにかかわらずプログラムを使用することによって得られた結果、そのような損害賠償の可能性も使用することができないことに関して起こります; 各ユーザがその人のプログラムで役に立つ始めによる上記に同意したと考えられるでしょう。 プログラムからのこの場所に含んでいますが、中古の同じくらい「使用」が制限されない用語、使用、変更、プログラムのコピーと分配、および二次製品の生産。

プログラムがユーザでどんな人からも原型か変更にされるにかかわらず分配されたか、配送した、または受信された場合では、そのような人、組織またはどんな実体もICOTの如何にかかわらずどんな特定の保証も文章におけるユーザに作るか、または与えない場合また、免除されて、プログラムと同じくらい遠くにユーザにとって注意されるようなどんな損害賠償にも支払いの義務があるように保たれない組織かICOT以外の実体が関係があります。

Text::ChaSen の COPYRIGHT2005年10月04日 04時36分38秒

Text::ChaSen の COPYRIGHT

IPADIC のライセンスにあわせているようです。

Copyright(c) 1998, 1999 NOKUBI Takatsugu 
Copyright(c) 1997 Nara Institute of Science and Technorogy.
All Rights Reserved.

Use, reproduction, and distribution of this software is permitted.
Any copy of this software, whether in its original form or modified,
must include both the above copyright notice and the following
paragraphs.

Nara Institute of Science and Technology (NAIST),
the copyright holders, disclaims all warranties with regard to this
software, including all implied warranties of merchantability and
fitness, in no event shall NAIST be liable for
any special, indirect or consequential damages or any damages
whatsoever resulting from loss of use, data or profits, whether in an
action of contract, negligence or other tortuous action, arising out
of or in connection with the use or performance of this software.

The Japanese morphological dictionary included in this system
originates from ICOT Free Software.  The following conditions for ICOT
Free Software applies to the morphological dictionary of the system.

Each User may also freely distribute the Program, whether in its
original form or modified, to any third party or parties, PROVIDED
that the provisions of Section 3 ("NO WARRANTY") will ALWAYS appear
on, or be attached to, the Program, which is distributed substantially
in the same form as set out herein and that such intended
distribution, if actually made, will neither violate or otherwise
contravene any of the laws and regulations of the countries having
jurisdiction over the User or the intended distribution itself.

NO WARRANTY

The program was produced on an experimental basis in the course of the
research and development conducted during the project and is provided
to users as so produced on an experimental basis.  Accordingly, the
program is provided without any warranty whatsoever, whether express,
implied, statutory or otherwise.  The term "warranty" used herein
includes, but is not limited to, any warranty of the quality,
performance, merchantability and fitness for a particular purpose of
the program and the nonexistence of any infringement or violation of
any right of any third party.

Each user of the program will agree and understand, and be deemed to
have agreed and understood, that there is no warranty whatsoever for
the program and, accordingly, the entire risk arising from or
otherwise connected with the program is assumed by the user.

Therefore, neither ICOT, the copyright holder, or any other
organization that participated in or was otherwise related to the
development of the program and their respective officials, directors,
officers and other employees shall be held liable for any and all
damages, including, without limitation, general, special, incidental
and consequential damages, arising out of or otherwise in connection
with the use or inability to use the program or any product, material
or result produced or otherwise obtained by using the program,
regardless of whether they have been advised of, or otherwise had
knowledge of, the possibility of such damages at any time during the
project or thereafter.  Each user will be deemed to have agreed to the
foregoing by his or her commencement of use of the program.  The term
"use" as used herein includes, but is not limited to, the use,
modification, copying and distribution of the program and the
production of secondary products from the program.

In the case where the program, whether in its original form or
modified, was distributed or delivered to or received by a user from
any person, organization or entity other than ICOT, unless it makes or
grants independently of ICOT any specific warranty to the user in
writing, such person, organization or entity, will also be exempted
from and not be held liable to the user for any such damages as noted
above as far as the program is concerned.

Text::ChaSen インストール方法修正2005年10月04日 04時40分43秒

Text::ChaSen 1.0.3 は chasen-2.3.3.tar.gz に含まれているので、chasen-2.3.3.tar.gz 付属の Text::ChaSen をインストールする方法に変更しました。

ChaSen のインストール方法

MeCab で分かち書きするには改行が必要!?2005年10月04日 07時59分23秒

改行しないで分かち書きのテストをした結果です。

$ echo -n "本日は晴天なり" | kakasi -w
本日 は 晴天 なり$


$echo -n "本日は晴天なり" | chasen -j -F '%m '
本日 は 晴天 なり
$


$ echo -n "本日は晴天なり" | mecab -Owakati -b 8192
$


というように MeCab では無視されます。 改行を入れると

$ echo "本日は晴天なり" | mecab -Owakati -b 8192
本日 は 晴天 なり
$


のように分かち書きされます。
MeCab では改行が必須のようです。

Microsoft Visual C++ Toolkit 2003 と nmake2005年10月04日 23時06分03秒

Windows 版のソフトウェアの開発に必要な開発環境(無料)の紹介

マイクロソフトが無料で提供しているコンパイラ「Microsoft Visual C++ Toolkit 2003」

Microsoft Visual C++ Toolkit 2003

Platform SDK
Windows Server 2003 SP1 Platform SDK Web Install

"Core SDK" には nmake.exe, lib.exe も含まれます。

.NET Framework SDK
.NET Framework SDK Version 1.1

msvcrt.libが含まれます。

nmake.exe 1.5
http://download.microsoft.com/download/vc15/Patch/1.52/W95/EN-US/nmake15.exe

mknmz:Win32: ファイル名に '\' が含まれる場合、処理を SKIP2005年10月05日 19時08分03秒

Windows 環境のある条件下において、ファイル名に '\' 0x5c が含まれる場合があることがわかりました。
パス区切りと誤認するため、ファイル名に '\' を含むファイルについては処理をスキップするように修正しました。(HEAD, stable-2-0)
(ただし、Shift_JIS の2バイト目にも 0x5c を含む文字がありますが、これは対象外です。)

mknmz: $CodingSystem をシステムの設定から参照2005年10月05日 19時33分58秒

Win32 環境では $CodingSystem を "sjis" に決めうちしていましたが、Win32::API を使ってシステムの設定(ANSIコードページ)を参照するようにしました。
また、従来 "euc", "sjis" となっていたものをそれぞれ "eucJP", "cp932"に変更しました。(HEAD のみ)

ちなみにOS/2 は cp932、OS/2 Warp 4 は cp943(x-IBM943C) とからしいのですが、どのみちきちんと対応する予定はないので、OS/2 は "cp932" で代表します。

なお、今のところこの変更により何か得られるものがあるかといえば、特にありません。従来通りです。
ファイル名に中国語が使えるわけでも、cp932 の機種依存文字が使えようになったわけでもありません。

残念ながら、Win32 環境では Win32::API Perl モジュールが必要となります。