Как получить доступ к Википедии с помощью Node.js

#node.js #wikipedia

#node.js #википедия

Вопрос:

Я ищу самый простой способ интегрировать Википедию в node.js приложение. Требования заключаются в том, чтобы иметь возможность осуществлять поиск записей и находить сущности в каждой записи.

Какие-нибудь известные существующие библиотеки / методы для этого?

Спасибо

Комментарии:

1. Вероятно, вам следует сказать, что вы хотите с этим сделать. Простое извлечение и отображение HTML из Wikipedia.org должно быть простым делом.

Ответ №1:

Недавно появился анализатор текста вики с открытым исходным кодом (http://sweble.org /) это может быть полезно для вас, если вы создадите свое собственное решение. Конечно, для этого потребуется загрузить дамп данных Википедии, проанализировать и сохранить объекты в базе данных.

Вы также могли бы посмотреть dbpedia (http://dbpedia.org/About ), хотя для этого потребуется интегрировать стек rdf в ваше приложение (либо запустить локальный репозиторий rdf, либо взаимодействовать с часто ошибочной онлайн-версией через sparql).

Один из простых подходов заключается в использовании API поисковой системы и ограничении site:wikipedia.org — например:

http://www.google.com/search ?q=node.js site:wikipedia.org

Я обнаружил, что это может работать действительно хорошо.

Ответ №2:

Паук для очистки с использованием jquery — это фантастика:

https://github.com/mikeal/spider

Майк-мужчина

Предположительно, вы бы использовали это для побочного (личного) проекта. Не уверен, насколько кошерно рыться в Википедии с помощью скребка.