#rss
#RSS-канал
Вопрос:
Я использую Google Reader для просмотра различных rss-каналов. Одна из вещей, которые он делает, — это указывает, сколько там непрочитанных элементов. Как это отслеживается? Я имею в виду, что когда я просматриваю источник любого заданного rss-канала, он показывает конечный список, скажем, из 20 элементов. Если я некоторое время не просматриваю ленту, у меня может оказаться больше непрочитанных элементов, чем доставлено в этих 20 элементах.
Как это делается? Использует ли Google просто свои ресурсы, часто ли проверяет каналы и сохраняет ли элементы? Есть ли способ просматривать страницы через RSS-каналы?
Ответ №1:
RSS — это просто формат файла XML. Чтобы запомнить, что вы прочитали ранее, вам нужно сохранить эту информацию локально.
У некоторых поставщиков RSS есть API, чтобы вы могли запрашивать rss-документы с определенным набором параметров, но если вы просто проверяете RSS на наличие обновлений, вам придется запомнить, что вы видели раньше (вероятно, сохранив последнее полученное и сравнив их).
Короче говоря, да, Google, вероятно, хранит истории rss, чтобы предоставить вам историю, выходящую за рамки того, что показывает текущий канал. И, вероятно, он опрашивает их довольно часто. Владельцы сайтов могут вводить теги с метаинформацией, чтобы сообщить боту Google, как часто возвращаться для проверки обновлений.
Если обновления происходят очень быстро и удаляются из отображаемого RSS-канала до того, как туда доберется ваш поисковик, то вам не повезло, если только провайдер не предлагает какой-либо другой способ извлечения информации.
Комментарии:
1. Однако просто знать, что вы видели, недостаточно. Если у вас некоторое время не было доступа к RSS, и есть элементы, которые вы не видели и которые достаточно старые, чтобы их больше не было в текущей ленте, в элементах, которые видит Google, будет пробел. Как ит может узнать о них?