- 締切済み
XercesCにて、EUCのXML文書をパースしたい
Linux上でXercesCを使って、EUCのXML文書をパースしたいのですが、 サンプルで付いているDOMPrintに、EUCのXML文書を食わせると、 Message: An exception occurred! Type:TranscodingException, Message:Could not create a converter for encoding: EUC-JP などと表示され、正常にパースできません。 標準で付いている「iso-8859-1」というコードのxml文書は正常にパースできている のですが。。。 EUCはそのまま扱えないのでしょうか? 他のコードに一度変換するしかないのでしょうか・・・? なお、Windows環境ではSHIFT-JISの文書は正常にパース出来ているのですが。。 使用しているバージョンは、 XercesC : 2.60 OS : redhat9 です。
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- επιστημη(@episteme)
- ベストアンサー率46% (546/1184)
回答No.1
文字コードライブラリICUを抱き込めばパースできることがXercesのドキュメントに明記されています。
補足
ありがとうございます。 教えていただいたURLを参考に、XercesCソース一式(xerces-c-current.tar.gz)を取得し、ビルド環境を構築しました。ビルドも出来ています。 また、icu一式(icu-3.2-LinuxRedHat9-gcc3.2.2.tgz)も取得しました。 が、ここからどうしていいのかが分かりません。。。 runConfigure -plinux -cgcc -xg++ -minmem -nsocket -ticu -rpthread という記述が教えていただいたページにはありますが、これはどこでどのように指定するものなのでしょうか・・・? 初心者のため初歩的な質問で申し訳ないですが、ご教授お願いします。