#python #apache-flink
#python #apache-flink
Вопрос:
В Java / Scala API существует метод ReadFile(FileInputFormat, path, watchType, interval, pathFilter, TypeInfo), который считывает файлы по пути на основе заданного FileInputFormat . С помощью этого метода я могу читать другие типы файлов, например, файл gzip.
Есть ли соответствующий метод в Python API? (Или как я могу прочитать файл gzip с помощью Python API?)
Спасибо, Acan
Ответ №1:
вам необходимо использовать встроенный модуль python gzip.
пример:
import gzip
with gzip.open("test.txt.gz", "rb") as f:
data = f.read()
print(data)
>>> b'example text'
вот руководство https://www.tutorialspoint.com/python-support-for-gzip-files-gzip
Ответ №2:
Вы можете вызвать read_text_file
метод stream_execution_environment
в PyFlink