PyFlink — Как ReadFile() с указанным форматом ввода файла (вместо текстового формата)?

#python #apache-flink

#python #apache-flink

Вопрос:

В Java / Scala API существует метод ReadFile(FileInputFormat, path, watchType, interval, pathFilter, TypeInfo), который считывает файлы по пути на основе заданного FileInputFormat . С помощью этого метода я могу читать другие типы файлов, например, файл gzip.

Есть ли соответствующий метод в Python API? (Или как я могу прочитать файл gzip с помощью Python API?)

Спасибо, Acan

Ответ №1:

вам необходимо использовать встроенный модуль python gzip.

пример:

 import gzip
with gzip.open("test.txt.gz", "rb") as f:
    data = f.read()
print(data)
>>> b'example text'
 

вот руководство https://www.tutorialspoint.com/python-support-for-gzip-files-gzip

Ответ №2:

Вы можете вызвать read_text_file метод stream_execution_environment в PyFlink