#python #amazon-web-services #aws-glue #aws-glue-spark
#python #amazon-веб-сервисы #aws-glue #aws-glue-spark
Вопрос:
Как выбрать python версии 3 при развертывании AWS glue Job с glue версии 1.0 с использованием YAML (бессерверный)? Я развертываю AWS glue с использованием бессерверного кода YAML. AWS предоставил параметр GlueVersion для выбора версии glue для использования, которую я устанавливаю на «1.0». Я хочу использовать Python 3, но он развертывается на python 2 в задании glue. Есть ли у кого-нибудь идея, как настроить его на использование python3 с использованием кода развертывания YAML без внесения изменений вручную в задание склеивания?
Комментарии:
1. существует свойство pythonversion, как показано в boto3.amazonaws.com/v1/documentation/api/latest/reference /. … вы также должны найти эквивалент
2. свойство версии python, упомянутое в документах, предназначено для задания glue python shell, а не для задания glue spark
Ответ №1:
Подтверждено AWS, их документ сбивает с толку, где они упоминают параметр PythonVersion для оболочки python. Они работают над исправлением формулировки документа. Приведенный ниже шаблон формирования может работать для меня.
Type: AWS::Glue::Job
Properties:
Name: <job name>
Description: ETL Job
GlueVersion: '1.0'
Command:
Name: glueetl
PythonVersion: 3
ScriptLocation: <script location>
ExecutionProperty:
MaxConcurrentRuns: 1
AllocatedCapacity: <number for workers>
DefaultArguments:
<any default arguments for glue job>
Role:
Ref: <glue roles>
Connections:
Connections:
- Ref: <any JDBC connections>