perlで日本語を含むHTMLのscrapingをしてみる
先のエントリにも書いたように、CPANのmoduleそのままではHTMLのscrappingをやると日本語環境で問題が起きます。また、日本語環境では動かないという報告はちらほら見かけるものの、動かしたとか使ったという報告は見かけませんでした。
なので、cpanのmoduleをちょっとだけ変更してちゃんと動くようにしてみました。これでいくらか便利になるかな?
perlのモジュール化をまともに触ったことがないので、パッチをあげるのはその辺をしっかり理解してからにします。
数日以内にしたいなーと思っています。
修正箇所などの詳細は続きからどうぞ。
なので、cpanのmoduleをちょっとだけ変更してちゃんと動くようにしてみました。これでいくらか便利になるかな?
perlのモジュール化をまともに触ったことがないので、パッチをあげるのはその辺をしっかり理解してからにします。
数日以内にしたいなーと思っています。
修正箇所などの詳細は続きからどうぞ。
[続きは失われました。後ほど編集いたします。]
トラックバック(0)
このブログ記事を参照しているブログ一覧: perlで日本語を含むHTMLのscrapingをしてみる
このブログ記事に対するトラックバックURL: http://pascal.iobb.net/diary/mt-tb.cgi/13

コメントする