• 締切済み

XercesCにて、EUCのXML文書をパースしたい

Linux上でXercesCを使って、EUCのXML文書をパースしたいのですが、 サンプルで付いているDOMPrintに、EUCのXML文書を食わせると、 Message: An exception occurred! Type:TranscodingException, Message:Could not create a converter for encoding: EUC-JP などと表示され、正常にパースできません。 標準で付いている「iso-8859-1」というコードのxml文書は正常にパースできている のですが。。。 EUCはそのまま扱えないのでしょうか? 他のコードに一度変換するしかないのでしょうか・・・? なお、Windows環境ではSHIFT-JISの文書は正常にパース出来ているのですが。。 使用しているバージョンは、  XercesC : 2.60  OS : redhat9 です。

みんなの回答

回答No.1

文字コードライブラリICUを抱き込めばパースできることがXercesのドキュメントに明記されています。

参考URL:
http://xml.apache.org/xerces-c/build-misc.html
noname#14336
質問者

補足

ありがとうございます。 教えていただいたURLを参考に、XercesCソース一式(xerces-c-current.tar.gz)を取得し、ビルド環境を構築しました。ビルドも出来ています。 また、icu一式(icu-3.2-LinuxRedHat9-gcc3.2.2.tgz)も取得しました。 が、ここからどうしていいのかが分かりません。。。 runConfigure -plinux -cgcc -xg++ -minmem -nsocket -ticu -rpthread という記述が教えていただいたページにはありますが、これはどこでどのように指定するものなのでしょうか・・・? 初心者のため初歩的な質問で申し訳ないですが、ご教授お願いします。