perlでwordファイルの中身を検索してみるアプリ

を作成途中。
とりあえず、OLEまわりの参考にしたページは以下のとおり、サンプルは結構excelだったりするのはどうしてでしょう?
http://hep-www.px.tsukuba.ac.jp/~masato/link/www5a.biglobe.ne.jp/~n_rieko/perl/ole.htm
http://www.att.or.jp/perl/faq/perlwin32faq/perlwin32faq12j.html
blog::楓: perlからExcelを使う
http://www.site-cooler.com/kwl/perl/ole.htm
開明堂 : 読んだ : tatsuya『Perl から Win32 を使う』
http://homepage3.nifty.com/hippo2000/perltips/Win32/OLE.htm

で、word内部の文字コードperlでパターン検索で使用する文字コードが多分違うので、それを合わせるためにjcode.plではなく、jcode.pmを使用したほうが良いそうなので

set HTTP_PROXY = "http://IP:PORT"
ppm>s jcode

で今日現在では0.88のJcodeが見つかるのでインストール。ソースも

use Jcode;

Jcode::convert(\$str,'sjis');

の様に修正。
ちなみに検索文字列のマッチングを行う前に

$paras = $doc->Paragraphs;
foreach(in $paras){
    $str = $_->Range->{'Text'};   #この部分
    Jcode::convert(\$str,'sjis');
    ほげほげ
}

の様に文字列を取得しておきましょう。これをやらずに、どうしてマッチングに引っかからないのか悩んでしまいました。

む。Jcode.pmEncodeモジュールの方が良いらしい。でも今回は見送りで。




あとは、Thread化してみたり、GUIにしてみたりと言ったところでしょうか。
とりあえず文字列が存在するファイルをリストアップ出来ること。っていうのをゴールにしています。



スレッド化は失敗。プログラムの終了時にエラーっぽいメッセージが出るので、中止。
とりあえず、各種変数を可変にして、後はGUIからやるようにして見ます。
それにしても処理が遅いなぁ・・・ 
ちょっと興味が湧いたのでOLE/COM Object Viewerを立ち上げたけど、メソッドとかプロパティってどこに書いてあるのさ?
Excelでマクロを起動させる場合は、Runメソッドを使います。とか涼しい顔して書いてあるけど、Viewerにはそんなメソッド見つからなかったぞ。
Object Classes-All Objectとは別の場よ?探す場所が悪いのか?

いずれはPDFの中身も検索できないかな?と画策してみたものの、wordの時の様に単純に行くのかどうか?むむむぅ。
ちょっと深いところ(?)に行くとさっぱり解らなくなる。ruby256 邪道本を読み直すか・・・