Как анализировать сообщение, чтобы каждый раз извлекать только тело?

#php #email #email-parsin&

#php #Адрес электронной почты #электронная почта-синтаксический анализ

Вопрос:

Я кодирую конвейер электронной почты и получаю сообщение и все такое, но мне трудно, когда дело доходит до извлечения нового ответа пользователя и добавления его в журнал заявок.

Некоторые почтовые клиенты добавляют что-то вроде «2011-03-14, в 6: 00 утра, Stack Overflow написал:» перед старыми сообщениями другие этого не делают… Я совершенно потерян.

Пожалуйста, помогите.

Комментарии:

1. Тьфу, я думаю, это довольно сложно. Вы анализируете только текст или также сообщения в формате HTML?

2. Да, стандартного способа сделать это нет. Gmail делает это, сравнивая ответ с оригиналом и выясняя, что изменилось. Как указал Пекка, у вас также есть проблемы с HTML по сравнению с обычным текстом. Большинство почтовых клиентов отправляют текстовую версию вместе с HTML-версией, но не все. Если существует версия plant-text, вы можете предпочесть обработать ее, если только форматирование не важно для вас.

Ответ №1:

Текст «на xxx foo написал» является частью текста электронного письма, потому что автор включил его автоматически и автор не удалял его. Итак, вы, по-видимому, все сделали правильно 🙂