#node.js #wikipedia
#node.js #википедия
Вопрос:
Я ищу самый простой способ интегрировать Википедию в node.js приложение. Требования заключаются в том, чтобы иметь возможность осуществлять поиск записей и находить сущности в каждой записи.
Какие-нибудь известные существующие библиотеки / методы для этого?
Спасибо
Комментарии:
1. Вероятно, вам следует сказать, что вы хотите с этим сделать. Простое извлечение и отображение HTML из Wikipedia.org должно быть простым делом.
Ответ №1:
Недавно появился анализатор текста вики с открытым исходным кодом (http://sweble.org /) это может быть полезно для вас, если вы создадите свое собственное решение. Конечно, для этого потребуется загрузить дамп данных Википедии, проанализировать и сохранить объекты в базе данных.
Вы также могли бы посмотреть dbpedia (http://dbpedia.org/About ), хотя для этого потребуется интегрировать стек rdf в ваше приложение (либо запустить локальный репозиторий rdf, либо взаимодействовать с часто ошибочной онлайн-версией через sparql).
Один из простых подходов заключается в использовании API поисковой системы и ограничении site:wikipedia.org — например:
http://www.google.com/search ?q=node.js site:wikipedia.org
Я обнаружил, что это может работать действительно хорошо.
Ответ №2:
Паук для очистки с использованием jquery — это фантастика:
https://github.com/mikeal/spider
Майк-мужчина
Предположительно, вы бы использовали это для побочного (личного) проекта. Не уверен, насколько кошерно рыться в Википедии с помощью скребка.