perlで日本語を含むHTMLのscrapingをしてみる

| | コメント(0) | トラックバック(0)
先のエントリにも書いたように、CPANのmoduleそのままではHTMLのscrappingをやると日本語環境で問題が起きます。また、日本語環境では動かないという報告はちらほら見かけるものの、動かしたとか使ったという報告は見かけませんでした。
なので、cpanのmoduleをちょっとだけ変更してちゃんと動くようにしてみました。これでいくらか便利になるかな?

perlのモジュール化をまともに触ったことがないので、パッチをあげるのはその辺をしっかり理解してからにします。
数日以内にしたいなーと思っています。

修正箇所などの詳細は続きからどうぞ。
[続きは失われました。後ほど編集いたします。]

トラックバック(0)

このブログ記事を参照しているブログ一覧: perlで日本語を含むHTMLのscrapingをしてみる

このブログ記事に対するトラックバックURL: http://pascal.iobb.net/diary/mt-tb.cgi/13

コメントする

このブログ記事について

このページは、pascalが2007年11月 9日 12:00に書いたブログ記事です。

ひとつ前のブログ記事は「perlでHTMLのscrapingをするときの問題点」です。

次のブログ記事は「数学の問題」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

Powered by Movable Type 4.01