Искровой разъем Mongo DB

#mongodb #pyspark

Вопрос:

Я пытаюсь прочитать из базы данных mongo в pyspark. Я хочу читать только документы с определенным строковым полем, которое начинается с «некоторой строки».

Этот работает просто отлично:

 ppl = "[{'$match': {'field.sub': 'abcde'}}, {'$limit': 100}]"
df = spark.read.format('mongo').option('pipeline', ppl).load()

Но когда я переключусь на:

 ppl = "[{'$match': {'field.sub': '/ab'}}, {'$limit': 100}]"
df = spark.read.format('mongo').option('pipeline', ppl).load()

Я получаю нулевые записи. Любая мысль о том, как я могу фильтровать по первым буквам строк из field.sub

Вопрос:

Комментарии:

Вам также может понравиться

Как очистить интервал вне его функции закрытия или обещания?

Как «объединить» левые части с помощью Dartz

Как в AWS Amplify можно восстановить записи, которые не удалось синхронизировать?