Могу ли я получить список файлов Викимедиа, отфильтрованных по регулярному выражению?

#wikipedia-api #wikimedia

Вопрос:

Я ищу, чтобы найти все изображения Кавахары Кейги из Викимедиа.

Имена файлов обычно содержат строки «RMNH.ART» и «Kawahara Keiga» — см.:

 https://en.wikipedia.org/wiki/File:Naturalis_Biodiversity_Center_-_RMNH.ART.5_-_Carcinoplax_longimana_(De_Haan,_1833)_-_Kawahara_Keiga.jpg
https://en.wikipedia.org/wiki/File:Naturalis_Biodiversity_Center_-_RMNH.ART.537_-_Halieutaea_stellata_-_Kawahara_Keiga_-_Siebold_Collection.jpg
https://en.wikipedia.org/wiki/File:Naturalis_Biodiversity_Center_-_RMNH.ART.256_-_Hemitrygon_akajei_(Müller_&_Henle,_1841)_-_Kawahara_Keiga_-_Siebold_Collection.jpg
 

Можно ли запросить API Викимедиа и получить список файлов, отфильтрованных по «содержит», регулярному выражению или аналогичному?

Ответ №1:

Отвечая на ваш конкретный вопрос, вы можете использовать: https://commons.wikimedia.org/w/api.php?action=queryamp;list=searchamp;srsearch=RMNH.ARTamp;srnamespace=6amp;srlimit=500amp;формат=json

В качестве альтернативы, хотя, поскольку изображения уже классифицированы, вы могли бы использовать это вместо: https://commons.wikimedia.org/w/api.php?action=queryamp;list=categorymembersamp;cmtitle=Category:Kawahara_Collection_at_Naturalis_Biodiversity_Centeramp;cmlimit=500amp;format=json

Они оба вернут первые 500 файлов, и чтобы получить их все, вам нужно будет добавить amp;sroffset=500 или amp;cmcontinue. По общему признанию, я не совсем уверен, как работает второй вариант.

Документы для обоих из них находятся по адресу https://www.mediawiki.org/wiki/API:Search и https://www.mediawiki.org/wiki/API:Categorymembers