#python #wikipedia-api
#python #википедия-api
Вопрос:
Я использую wiki api на python для получения категорий и подкатегорий различных страниц Википедии. Проблема, с которой я сталкиваюсь, заключается в том, что я получаю больше информации при извлечении подкатегорий страницы категории (в частности, идентификатора страницы для каждой подкатегории), но когда я извлекаю категории для той же страницы категории, я получаю только заголовок страницы, а не идентификатор страницы.
Это то, что я получаю, когда запускаю запрос на страницу «Категория: языки программирования на основе классов», и вот URL, который я использую: https://en.wikipedia.org/w/api.php?action=queryamp;prop=categoriesamp;format=jsonfmamp;titles=Category:Class-based_programming_languages
"pages": {
"909420": {
"pageid": 909420,
"ns": 14,
"title": "Category:Class-based programming languages",
"categories": [
{
"ns": 14,
"title": "Category:Object-oriented programming languages"
}
Это то, что я получаю, когда запускаю запрос на ту же страницу, но нахожу подкатегории. Это URL-адрес, который я использую: https://en.wikipedia.org/w/api.php?action=queryamp;format=jsonfmamp;list=categorymembersamp;cmnamespace=14amp;cmlimit=100amp;cmtitle=Category:Class-based_programming_languages
"query": {
"categorymembers": [
{
"pageid": 3623580,
"ns": 14,
"title": "Category:C "
},
{
"pageid": 44668068,
"ns": 14,
"title": "Category:Java (programming language)"
},
{
"pageid": 44667679,
"ns": 14,
"title": "Category:Ruby (programming language)"
}
Я также хотел бы получить идентификатор страницы при поиске категорий. Я пропускаю параметр в URL?
Комментарии:
1. Я сомневаюсь, что это возможно. Вероятно, для этого запроса используется таблица categorylinks, в которой не хранятся идентификаторы страниц.