#node.js #web-scraping #sharepoint-online
#node.js #очистка веб-страниц #sharepoint-online
Вопрос:
Мы разрабатываем бота в nodejs, и в качестве требования нам необходимо динамически извлекать веб-страницу из веб-страниц сайта Sharepoint online. Я пробовал использовать множество API, таких как https://[tenantName].com/sites/[xyzpage]/_api/web/ $metadata., я пробовал много других API, но большинство из них предназначены для извлечения списков и т. Д.
Следующее возвращает много информации, которая не имеет отношения к содержимому веб-страницы. Существует ли какой-либо API, который возвращает исходный код / html веб-страницы в [xyzpage]
Я пробовал инструменты для создания веб-страниц, но сайты sharepoint online защищены, поэтому могут работать с ним?есть ли какой-либо способ очистить защищенные страницы с идентификатором клиента / секретом?
Любая помощь будет высоко оценена.
Комментарии:
1. Вы имеете в виду простой http-запрос get?
2. да, получить запрос через nodejs. когда веб-сайт защищен паролем.
3. Как защищен паролем веб-сайт?
4. это страница sharepoint наших клиентов. где нам нужно динамически извлекать информацию с веб-страницы. Веб-сайт sharepoint является частным, а не общедоступной страницей, как Википедия. Пользователям необходимо войти в систему с учетными данными для доступа к странице.
5. Хорошо, и как работает вход в систему ?! пользователь / адрес электронной почты и пароль через простой формулярный, LDAP, HTTP basic auth ?! Опубликовать более подробную информацию
Ответ №1:
Наконец-то выяснили, как очистить сайт sharepoint. См. раздел microsoft docs очистка списка sharepoint. Оказывается, вся информация о сайтах / веб-сайтах также обрабатывается как список в sharepoint. API Sharepoint list извлекает все сведения из любого места в sharepoint sites / web