Преобразование сообщений электронной почты в PDF-файл на C#

#c# #pdf #msg #gembox-document #gembox-email

#c# #PDF #сообщение #gembox-документ #gembox-электронная почта

Вопрос:

Я использую GemBox.Email и GemBox.Документ для преобразования электронных писем в PDF.

Это мой код:

 static void Main()
{
    MailMessage message = MailMessage.Load("input.eml");
    DocumentModel document = new DocumentModel();

    if (!string.IsNullOrEmpty(message.BodyHtml))
        document.Content.LoadText(message.BodyHtml, LoadOptions.HtmlDefault);
    else
        document.Content.LoadText(message.BodyText, LoadOptions.TxtDefault);

    document.Save("output.pdf");
}
  

Код работает для файлов EML, но не для сообщений MSG (оба MailMessage.BodyHtml и MailMessage.BodyText ) пусты.

Как я могу заставить это работать и для MSG?

Комментарии:

1. MSG — это формат файла, отличный от EML и специфичный для MS Outlook. Проверьте, действительно ли GemBox может их обрабатывать. Возможно, вам нужно сообщить ему, чего ожидать.

2. Хммм, … это говорит о том, что они могут. И это определяется расширением файла. Так что ваш код должен просто работать. Можете ли вы подтвердить, что ваш .msg действительно является допустимым файлом сообщений Outlook и содержит содержимое? Можете ли вы попробовать другой файл с расширением msg? Можете ли вы открыть его в Outlook или в одном из приложений «Outlook-msg Reader»?

3. @Fildor он должен поддерживать MSG, EML и MHTML в соответствии с их примером преобразования .

4. Да, я только что прочитал это тоже. Итак, либо есть ошибка (в чем я сомневаюсь), либо ваш файл MSG каким-то образом не является допустимым файлом сообщений ms Outlook. Я бы попробовал другой файл и дважды и трижды проверил этот файл, прежде чем обращаться в службу поддержки, если вам все еще не повезло, и файл действителен.

5. @NixonUposseen Я полагаю, что проблема может быть связана с вашим файлом MSG, поэтому попробуйте предложения от Fildor. Если проблема не устранена, можете ли вы загрузить куда-нибудь свой файл MSG, чтобы я мог взглянуть на него?

Ответ №1:

Проблема возникает с определенными файлами MSG, которые не содержат HTML-содержимого в теле RTF, вместо этого у них есть необработанное тело RTF.

В MailMessage настоящее время класс не предоставляет API для тела RTF (только обычный текст и текст HTML). Тем не менее, вы можете получить его как Attachment файл с именем «Body.rtf«.

Кроме того, к вашему сведению, еще одна проблема, с которой вы столкнулись, заключается в том, что изображения из HTML-текста письма не встроены, и, следовательно, вы потеряете их при экспорте в PDF.

В любом случае, попробуйте использовать следующее:

 static void Main()
{
    // Load an email (or retrieve it with POP or IMAP).
    MailMessage message = MailMessage.Load("input.msg");

    // Create a new document.
    DocumentModel document = new DocumentModel();

    // Import the email's body to the document.
    LoadBody(message, document);

    // Save the document as PDF.
    document.Save("output.pdf");
}

static void LoadBody(MailMessage message, DocumentModel document)
{
    if (!string.IsNullOrEmpty(message.BodyHtml))
    {
        var htmlOptions = LoadOptions.HtmlDefau<
        // Replace attached CID images to inlined DATA urls.
        var htmlBody = ReplaceEmbeddedImages(message.BodyHtml, message.Attachments);
        // Load HTML body to the document.
        document.Content.End.LoadText(htmlBody, htmlOptions);
    }
    else if (message.Attachments.Any(a => a.FileName == "Body.rtf"))
    {
        var rtfAttachment = message.Attachments.First(a => a.FileName == "Body.rtf");
        var rtfOptions = LoadOptions.RtfDefau<
        // Get RTF body from the attachment.
        var rtfBody = rtfOptions.Encoding.GetString(rtfAttachment.Data.ToArray());
        // Load RTF body to the document.
        document.Content.End.LoadText(rtfBody, rtfOptions);
    }
    else
    {
        // Load TXT body to the document.
        document.Content.End.LoadText(message.BodyText, LoadOptions.TxtDefault);
    }
}

static string ReplaceEmbeddedImages(string htmlBody, AttachmentCollection attachments)
{
    var srcPattern =
        "(?<=<img. ?src=["'])"  
        "(. ?)"  
        "(?=["'].*?>)";

    // Iterate through the "src" attributes from HTML images in reverse order.
    foreach (var match in Regex.Matches(htmlBody, srcPattern, RegexOptions.IgnoreCase).Cast<Match>().Reverse())
    {
        var imageId = match.Value.Replace("cid:", "");
        Attachment attachment = attachments.FirstOrDefault(a => a.ContentId == imageId);

        if (attachment != null)
        {
            // Create inlined image data. E.g. "..."
            ContentEntity entity = attachment.MimeEntity;
            var embeddedImage = entity.Charset.GetString(entity.Content);
            var embeddedSrc = $"data:{entity.ContentType};{entity.TransferEncoding},{embeddedImage}";

            // Replace the "src" attribute with the inlined image.
            htmlBody = $"{htmlBody.Substring(0, match.Index)}{embeddedSrc}{htmlBody.Substring(match.Index   match.Length)}";
        }
    }

    return htmlBody;
}
  

Для получения дополнительной информации (например, о том, как добавлять заголовки электронной почты и вложения в выходной PDF), ознакомьтесь с примерами преобразования электронной почты в PDF.