- ベストアンサー
wordファイルをhtml形式で保存した場合、特に調べても出てこないタグやスタイルについて教えてください。
- wordファイルをhtml形式で保存する際に、タグやスタイルが付与されます。その中には特に調べても出てこないものもあります。
- 具体的には、style="mso-spacerun:yes"というスタイルは、wordと同じようなスペースの間隔で表示するために使用されます。
- また、<o:p>~</o:p>というタグは、リストやEnterキー入力時の挿入などを示していますが、IE6/7では正しく表示されないことがあります。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
正しい回答は、MS-OfficeやVB開発ツールのSDKなどのリファレンスを見ると仕様がかかれています。 概要だけ。 コードを見るとわかりますが、先頭の宣言部分が普通のHTMLと違いますよね。 xmlns なんて文字がありますね。これはXML文(インスタンス)の宣言と同じです。もともと、MS-OfficeはXMLへの移行して、半分成功したが、完全移行とはならずに失敗しました。 このNSとはネームスペースを表しています。なのでXMLのネームスペースを ”o” "w" "m" 宣言しました。という事をあらわしています。つまり、HTMLではなく、XML文として作成されています。 全体としてはHTMLなんですが、IEで解釈する部分(IEのみで有効)はXMLとして、XSLTなどのやり方に対応しているということです。この辺はXMLを勉強しないとわからないことです。 なので、<o:p>~</o:p>とは、そのXMLです。IEによってトランスファー(XSLT)、つまり再フォーマットされて表示される部分です(oでネームスペースを宣言されているので、oの次に:というセパレーターでpの動作をXSLTで行います)。 style="mso-spacerun:yesはCSSのしきたりに沿って、対応していないブラウザでは無視され、効果はでません。 CSSに関しては他の事も同じです。class=MsoNormalは単なる、そのようなクラスが、IE側で持っているという事です。当然対応していないブラウザでは無視されるだけです。 タグ名に:と言うセパレーターを使用している場合、XML文として記述されている事に注意してください。先頭がネームスペースであってHTMLのタグではありません。HTMLとしては”o:p”と言うタグとして認識され、無効のタグ名です。よって、対応していないブラウザではタグとしては認識されず、そのままコンテントとして表示されます。 この辺を理解しあ上で、再度ネットなど検索して資料を探してみてください。かならず見つかります。もちろんマイクロソフトのSDKを見れば記載されています。 例: http://www6.airnet.ne.jp/manyo/xml/office/step4.html http://msdn.microsoft.com/ja-jp/library/aa163621(v=office.10).aspx (このサイトは開発ツールについてくるSDKをWeb上で公開しています。リンクをたどれば、いろんな開発ヒントがみれます) http://technet.microsoft.com/ja-jp/library/cc750134.aspx http://www.codeproject.com/KB/office/Wordyna.aspx?msg=2860697 http://www.google.co.jp/search?hl=ja&lr=lang_ja&tbs=lr%3Alang_1ja&q=urn%3Aschemas-microsoft-com%3Aoffice%3Aword&btnG=%E6%A4%9C%E7%B4%A2&aq=f&aqi=&aql=&oq= http://www.google.co.jp/search?hl=ja&q=urn%3Aschemas-microsoft-com%3Aoffice%3Aoffice&lr=lang_ja 上記サイトにMS-OfficeのXMLのスキマーDLサイトが見つかります。そのスキマーを見れば、ある程度は理解できるかと。