• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:HTML::TreeBuilderについてです)

HTML::TreeBuilderとは?インストール方法と使い方

このQ&Aのポイント
  • Perlで特定のHTMLタグの情報を抜き出すために使われるモジュールであるHTML::TreeBuilderについて説明します。
  • HTML::TreeBuilderは、HTMLをパースしてツリー構造に変換することができるモジュールです。
  • このモジュールを使うことで、HTMLの要素や属性に簡単にアクセスすることができます。また、ツリー構造を操作することで、必要な情報を抽出することも可能です。

質問者が選んだベストアンサー

  • ベストアンサー
  • kumoz
  • ベストアンサー率64% (120/185)
回答No.1

> my $tree = HTML::TreeBuilder->new; > $tree->parse($content); > $tree = decode("UTF-8",$tree); > $tree = encode("Shift_JIS",$tree); > ... > my @items = $tree->look_down('id', 'sideRanking')->find('li'); $tree に decode と encode の戻り値を代入している部分は誤りです。decode と encode は文字列を返すので、$tree はオブジェクトではなく通常の文字列を格納する変数になってしまいます。 なお、HTML::TreeBuilde を始めとした質問に書かれているモジュールをあまり使ったことがないので明快な解答を示すことができませんが、文字コードの変換を最後に移したらどうでしょうか。 print encode("Shift_JIS", decode("UTF-8", $_->as_text)), "\n" for @items;