※ ChatGPTを利用し、要約された質問です(原文:charsetの判定)
charsetの判定方法とは?
このQ&Aのポイント
html文を解析するプログラムを書く際、charsetの指定場所を正確に判定する方法は何か?
アメリカン航空のホームページでは、charsetの指定が<head>タグの前にあることが確認された。
IEやchromeはこの位置でもcharsetを正しく判定することができる。
htmlの知識がほとんどないまま、無謀にもhtml文を解析するプログラムを書いています。これまでは
charset
の指定は<head> </head>の間で行われていると信じてコードを書いてきました。しかしアメリカン航空のホームページ
http://www.americanairlines.jp/content/jp/specialOffers/aboutfuel.jhtml
では
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<!-- Inserting OPARAM tags -->
<HTML>
<HEAD>
このように<HEAD>タグの前にあります。これでIEやchromeはcharsetを正しく判定しています。
するとcharset指定場所の判定はどのようにしたらよいのでしょうか?
お礼
ご回答有り難うございます
補足
>テストしたわけで ナルホド、テストすればよいわけですね。 以下のhtml文でIEもchromeも共にutf-8として反応しました。どこに書いてもよいような. . . . <html> <head> <meta http-equiv="Content-Language" content="ja"> <meta name="GENERATOR" content="Microsoft FrontPage 5.0"> <meta name="ProgId" content="FrontPage.Editor.Document"> <title>試験</title> </head> <body> <p>試験</p> </body> </html> <meta http-equiv="Content-Type" content="text/html; charset=utf-8">