※ ChatGPTを利用し、要約された質問です(原文:perl 漢字コードの書き方,エンコーダー?)
Perl漢字コードとエンコーダーについて
このQ&Aのポイント
Perlの漢字コード(UTF-8)の扱いについて詳しい方に教えていただきたい。
数年前に自作したファイル加工用のシェルスクリプトで文字コードの指定方法を忘れてしまった。
以前はネット上にあるエンコーダーを使用していたが、見つけられずに困っている。
こんにちは! Perlの漢字コード(UTF8)の扱いについて詳しい方,おしえていただけないでしょうか?
数年前に自作した,ファイル加工用のシェルスクリプトを久しぶりに取り出してみたら,訳が分からなくなってしまいました。
シェルスクリプトは,大きなファイル(文字コードはUTF-8)の中から特定の表現を削って小さくする物で,例えば次のような行が並んでいます。
perl -pe 's/\343\200\220\.*?\343\200\201//g' | \
困っているのは,文字コードをどうやって決めたか思い出せない点にあります。
新しい記述を足したいのですが,文字コードの指定の方法をすっかり忘れているのに気付いて,呆然としているところです。
以前はネット上にある,どこかのエンコーダーを使ったように記憶していますが。
うまく見つけらずにいます。
ご存じの方,ご教示いただけると大変ありがたいです。。
(試行錯誤して,UTF-8の16進6桁の漢字コードから,2桁ずつとって10進に直す,のは違うらしいことが分かりました。(;^_^A)
お礼
> \343 など、3桁の数字 は8進数です kmeeさま,大変ありがとうございます! これで,先に進めます (^-^)