API или библиотека для получения фрагмента или резюме с веб-страницы

#python #summary #data-extraction

#python #Краткие сведения #извлечение данных

Вопрос:

Я хочу указать URL-адрес и получить резюме. Существует ли библиотека или API для этого?

Я работаю с Python, но могу переносить с других языков.

Комментарии:

1. Что такое резюме? Весь текст на странице? Заголовок страницы? Что-то еще?

2. Резюме применяет какую-то эвристику для получения репрезентативного текста со страницы. (Аналогично тому, что происходит, когда вы вводите ссылку в поле общего доступа FB.)

Ответ №1:

Возможно, вы ищете что-то вроде urllib или urllib2?

Обе эти библиотеки позволяют извлекать информацию из указанного URL. Вот (слегка устаревшее) введение, которое я нашел с помощью быстрого поиска.

http://www.codercaste.com/2009/11/28/how-to-use-the-urllib-python-library-to-fetch-url-data-and-more/