OLE オブジェクトの誤認を回避するための修正 ― 2007年11月18日 19時43分02秒
OLE オブジェクトは、File-MMagic では 'application/msword' と判定され、全て Word とみなされます。 Excel, PowerPoint, Visio 等、種類を判定するのは、今のところ拡張子で判定しています。(本来は中身で判定すべき)
この拡張子で判定する部分は各フィルタの add_magic で追加しています。 しかし、対応するメディアタイプのフィルタが有効な場合は良いのですが、無効な場合はその拡張子のファイルは全て Word とみなされています。
例えば、Visio のファイルを mknmz で処理した場合に、olevisio.pl が有効になっていないと、pltests が通りません。
これを回避するために、Word を処理する olemsword.pl と xdoc2txt.pl の add_media に他の種類のメディアタイプを判定するための処理を追加しました。
最近のコメント