Как получить URL-адреса и матрицу смежности для проблемы PageRank

#dataset #pagerank

#набор данных #pagerank

Вопрос:

Мне интересно самому разыграть проблему PageRank. Я хочу получить данные с определенного веб-сайта, такие как URL-адреса и матрица смежности, чтобы они соответствовали задаче PageRank. Интересно, знает ли кто-нибудь, как получить такие данные.

Комментарии:

1. Написать свой собственный краулер и начать ползти?