- ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:メールから本文だけを取り出す方法)
メールの本文を取り出す方法
このQ&Aのポイント
- 迷惑メールフィルタリングでメールの本文を取り出す方法について教えてください。
- メールの本文を取り出す際に出てくる規則性のない文字列処理に苦戦しています。どのように取り出せば良いでしょうか。
- 添付ファイルの有無によってメールの本文取得方法が異なるようです。詳しい方に教えていただけますか。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
ヘッダと本文の境目は空行です。 なお、RFC2822的には、添付ファイルも「本文」の一部にすぎません。 人間にとっての本文(添付ファイル以外の文章)は、本文の MIMEマルチパート構造を解釈して分解するひつようがあるのでは ないでしょうか。
お礼
MIMEについての説明をよんでみました。 本文(添付ファイル含む)は確かに改行がありました。 添付ファイルが含まれているときに(人間にとっての)本文の前に付いてくる--Apple-Mail-5-23440192や--Multipartも後に必ず「Content-Type:」が出現するので、その後の改行を読み取った後を(人間にとっての)本文だとすれば解決できそうです。 (人間にとっての)本文の終わりと添付ファイルに関する情報が書かれている部分との境目は必ずしも空行があるとは限らないようですが、本文の前後に--Apple-Mail-5-23440192などまったく同一のものが出現するようなので、この特徴を使って本文だけを取り出そうと思います。 すばやい解答ありがとうございました。