Как преобразовать HTML в обычный текст в Acumatica для использования в отчетах и запросах?

#acumatica

#acumatica

Вопрос:

Есть ли какой-либо простой способ преобразовать основной текст из действия, задачи или другого HTML-поля в Acumatica в читаемый формат, который хорошо отображается в отчете или общем запросе? Я мог бы создать функцию SQL для удаления HTML, представления SQL, содержащего разделенный код, а затем добавить этот объект в Acumatica, но я ищу более простой и понятный способ.

Ответ №1:

Вы можете создать пользовательский атрибут, который подписывается на событие выбора поля, чтобы динамически преобразовывать поле в обычный текст. Есть много способов выполнить фактическое преобразование, но я бы рекомендовал использовать HtmlAgilityPack, библиотеку с открытым исходным кодом, которая уже поставляется с Acumatica для выполнения этой работы.

Вот как я бы определил атрибут:

 using System;
using System.IO;
using HtmlAgilityPack;

namespace PX.Data
{  
  [PXString(IsUnicode = true)]
  public class HtmlToTextAttribute : PXAggregateAttribute, IPXFieldSelectingSubscriber
  {
    protected Type _htmlField;
  
    public HtmlToTextAttribute(Type htmlField)
    {
      if (htmlField == null) {
        throw new PXArgumentException(nameof(htmlField), ErrorMessages.ArgumentNullException);
      }
      
      _htmlField = htmlField;
    }
  
    public virtual void FieldSelecting(PXCache sender, PXFieldSelectingEventArgs e)
    {
      var html = sender.GetValue(e.Row, _htmlField.Name) as string;
      if(!String.IsNullOrWhiteSpace(html))
      {
        e.ReturnValue = ConvertToPlainText(html);
      }
    }
    
    //Source: https://github.com/ceee/ReadSharp/blob/master/ReadSharp/HtmlUtilities.cs
    public static string ConvertToPlainText(string html)
    {
      HtmlDocument doc = new HtmlDocument();
      doc.LoadHtml(html);

      StringWriter sw = new StringWriter();
      ConvertTo(doc.DocumentNode, sw);
      sw.Flush();
      return sw.ToString();
    }

    private static void ConvertContentTo(HtmlNode node, TextWriter outText)
    {
      foreach (HtmlNode subnode in node.ChildNodes)
      {
        ConvertTo(subnode, outText);
      }
    }
        
    private static void ConvertTo(HtmlNode node, TextWriter outText)
    {
      string html;
      switch (node.NodeType)
      {
        case HtmlNodeType.Comment:
          // don't output comments
          break;

        case HtmlNodeType.Document:
          ConvertContentTo(node, outText);
          break;

        case HtmlNodeType.Text:
          // script and style must not be output
          string parentName = node.ParentNode.Name;
          if ((parentName == "script") || (parentName == "style"))
            break;

          // get text
          html = ((HtmlTextNode)node).Text;

          // is it in fact a special closing node output as text?
          if (HtmlNode.IsOverlappedClosingElement(html))
            break;

          // check the text is meaningful and not a bunch of whitespaces
          if (html.Trim().Length > 0)
          {
            outText.Write(HtmlEntity.DeEntitize(html));
          }
          break;

        case HtmlNodeType.Element:
          switch (node.Name)
          {
            case "p":
              // treat paragraphs as crlf
              outText.Write("rn");
              break;
            case "br":
              outText.Write("rn");
              break;
          }

          if (node.HasChildNodes)
          {
            ConvertContentTo(node, outText);
          }
          break;
      }
    }
  }
}
  

Чтобы использовать этот атрибут, просто определите новое (не сохраняемое) поле и украсьте его атрибутом HtmlToText, например, как расширение в таблице CRActivity:

     #region UsrBodyText
    [HtmlToText(typeof(CRActivity.body))]
    [PXUIField(DisplayName="Body (text)")]
    public virtual string UsrBodyText { get; set; }
    public abstract class usrBodyText : PX.Data.BQL.BqlString.Field<usrBodyText> { }
    #endregion