Извлекать информацию из URL, чтобы поделиться ею на моем веб-сайте

#web-services #information-retrieval

#веб-сервисы #извлечение информации

Вопрос:

Я собираюсь разработать новую функцию на своем веб-сайте, которая позволит пользователю указывать мне URL-адрес, затем я бы использовал этот URL для получения названия сайта, описания и изображений, чтобы хранить эту информацию на своем веб-сайте. Мне нужно знать, есть ли какой-либо скрипт, который может это сделать, или есть веб-сервис, который примет URL и предоставит мне необходимую информацию, или я должен начать разрабатывать это с нуля.

Кроме того, я хотел бы знать, существуют ли какие-либо стандарты, используемые в механизме обмена информацией, поскольку я хочу разрешить пользователю делиться видео или фотографией из Интернета.

Ответ №1:

Не существует единого скрипта, который может извлекать информацию со всех сайтов, потому что исходный HTML для большинства веб-сайтов отличается. Вам нужно будет написать код специально для сайтов, которые вы очищаете.

Что касается синдикации контента, вы можете использовать RSS (Really Simple Syndication), который представляет собой формат XML, обычно используемый для обмена контентом.