simplexml_load_file(): http://website.com/feed:563 : ошибка синтаксического анализатора: Объект ‘nbsp’ не определен

#php #xml #xml-parsing #simplexml #feed

#php #xml #xml-синтаксический анализ #simplexml #поток

Вопрос:

Я пытаюсь загрузить XML-данные с веб-сайта, но получаю следующие ошибки:

 simplexml_load_file(): http://website.com/feed:563: parser error : Entity 'nbsp' not defined
simplexml_load_file(): 00f0iu00f0, viu00f0 hu00f6fum mu00f3ttekiu00f0 u00feau00f0.rnrnamp;amp;nbsp;
 

Вот код:

 $rss = simplexml_load_file('http://website.com/feed');
foreach ($rss->channel->item as $item) {
    $title = (string)trim(strip_tags($item->title));
    $title = html_entity_decode($post['title']);
    $description = (string)trim(strip_tags($item->description));
}
 

У меня нет доступа для редактирования XML-кода, так как решить эту проблему?

ОБНОВЛЕНИЕ: это 1-я часть RSS-канала

 <?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
    xmlns:content="http://purl.org/rss/1.0/modules/content/"
    xmlns:wfw="http://wellformedweb.org/CommentAPI/"
    xmlns:dc="http://purl.org/dc/elements/1.1/"
    xmlns:atom="http://www.w3.org/2005/Atom"
    xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
    xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
    >

<channel>
    <title></title>
    <atom:link href="" rel="self" type="application/rss xml" />
    <link></link>
    <description></description>
    <lastBuildDate>Wed, 24 Feb 2021 12:12:53  0000</lastBuildDate>
    <language>en-US</language>
    <sy:updatePeriod>
    hourly  </sy:updatePeriod>
    <sy:updateFrequency>
    1   </sy:updateFrequency>
    <generator></generator>

<image>
    <url></url>
    <title></title>
    <link></link>
    <width>32</width>
    <height>32</height>
</image> 
    <item>
        <title></title>
        <link></link>
        
        <dc:creator><![CDATA[]]></dc:creator>
        <pubDate>Wed, 24 Feb 2021 11:00:20  0000</pubDate>
                <category><![CDATA[]]></category>
        <guid isPermaLink="false"></guid>

                    <description><![CDATA[ [...]]]></description>
                                        <content:encoded><![CDATA[<p></p>
<p></p>
<p><strong></strong></p>
<p> <a href=""></a></p>
]]></content:encoded>
</item>
 

Как получить содержимое из этого кода с помощью PHP?

Комментарии:

1. Вы уверены, что ответ содержит RSS-канал XML?

2. Да, я просмотрел ссылку в браузере, с которой она начинается <?xml version="1.0" encoding="UTF-8"?><rss version="2.0"

3. Я не знаю XML, но я уверен, что это XML и rss-канал

4. amp;nbsp; не допускается в XML — только в (X) HTML.

5. Какие функции могут работать в этой ситуации?