#php #xml #xml-parsing #simplexml #feed
#php #xml #xml-синтаксический анализ #simplexml #поток
Вопрос:
Я пытаюсь загрузить XML-данные с веб-сайта, но получаю следующие ошибки:
simplexml_load_file(): http://website.com/feed:563: parser error : Entity 'nbsp' not defined
simplexml_load_file(): 00f0iu00f0, viu00f0 hu00f6fum mu00f3ttekiu00f0 u00feau00f0.rnrnamp;amp;nbsp;
Вот код:
$rss = simplexml_load_file('http://website.com/feed');
foreach ($rss->channel->item as $item) {
$title = (string)trim(strip_tags($item->title));
$title = html_entity_decode($post['title']);
$description = (string)trim(strip_tags($item->description));
}
У меня нет доступа для редактирования XML-кода, так как решить эту проблему?
ОБНОВЛЕНИЕ: это 1-я часть RSS-канала
<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
xmlns:content="http://purl.org/rss/1.0/modules/content/"
xmlns:wfw="http://wellformedweb.org/CommentAPI/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:atom="http://www.w3.org/2005/Atom"
xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
>
<channel>
<title></title>
<atom:link href="" rel="self" type="application/rss xml" />
<link></link>
<description></description>
<lastBuildDate>Wed, 24 Feb 2021 12:12:53 0000</lastBuildDate>
<language>en-US</language>
<sy:updatePeriod>
hourly </sy:updatePeriod>
<sy:updateFrequency>
1 </sy:updateFrequency>
<generator></generator>
<image>
<url></url>
<title></title>
<link></link>
<width>32</width>
<height>32</height>
</image>
<item>
<title></title>
<link></link>
<dc:creator><![CDATA[]]></dc:creator>
<pubDate>Wed, 24 Feb 2021 11:00:20 0000</pubDate>
<category><![CDATA[]]></category>
<guid isPermaLink="false"></guid>
<description><![CDATA[ [...]]]></description>
<content:encoded><![CDATA[<p></p>
<p></p>
<p><strong></strong></p>
<p> <a href=""></a></p>
]]></content:encoded>
</item>
Как получить содержимое из этого кода с помощью PHP?
Комментарии:
1. Вы уверены, что ответ содержит RSS-канал XML?
2. Да, я просмотрел ссылку в браузере, с которой она начинается
<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
3. Я не знаю XML, но я уверен, что это XML и rss-канал
4.
amp;nbsp;
не допускается в XML — только в (X) HTML.5. Какие функции могут работать в этой ситуации?