Beam на EMR выдает java.util.Ошибка ServiceConfigurationError

#apache-flink #apache-beam #amazon-emr

#apache-flink #apache-beam #amazon-emr

Вопрос:

У меня есть приложение Apache Beam (с использованием beam версии 2.23.0), которое я пытаюсь развернуть на AWS EMR (emr-5.30.1) с предустановленным Flink (1.10.0).

Приложение работает без проблем, когда я развертываю его в своем локальном кластере docker flink. Но когда я делаю

 flink run -m yarn-cluster -c my_class my_jar.jar
  

на главном узле кластера EMR

Я получаю

 java.util.ServiceConfigurationError: com.fasterxml.jackson.databind.Module: Provider com.fasterxml.jackson.module.jaxb.JaxbAnnotationModule not a subtype
at java.util.ServiceLoader.fail(ServiceLoader.java:239)
at java.util.ServiceLoader.access$300(ServiceLoader.java:185)
at java.util.ServiceLoader$LazyIterator.nextService(ServiceLoader.java:376)
at java.util.ServiceLoader$LazyIterator.next(ServiceLoader.java:404)
at java.util.ServiceLoader$1.next(ServiceLoader.java:480)
at com.fasterxml.jackson.databind.ObjectMapper.findModules(ObjectMapper.java:1054)
at org.apache.beam.sdk.options.PipelineOptionsFactory.<clinit>(PipelineOptionsFactory.java:471)
at org.myapp.main(MainApp.java:78)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:498)
at org.apache.flink.client.program.PackagedProgram.callMainMethod(PackagedProgram.java:321)
at org.apache.flink.client.program.PackagedProgram.invokeInteractiveModeForExecution(PackagedProgram.java:205)
at org.apache.flink.client.ClientUtils.executeProgram(ClientUtils.java:138)
at org.apache.flink.client.cli.CliFrontend.executeProgram(CliFrontend.java:664)
at org.apache.flink.client.cli.CliFrontend.run(CliFrontend.java:213)
at org.apache.flink.client.cli.CliFrontend.parseParameters(CliFrontend.java:895)
at org.apache.flink.client.cli.CliFrontend.lambda$main$10(CliFrontend.java:968)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:422)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1844)
at org.apache.flink.runtime.security.HadoopSecurityContext.runSecured(HadoopSecurityContext.java:41)
at org.apache.flink.client.cli.CliFrontend.main(CliFrontend.java:968)
  

Похоже, проблема в
org.apache.beam.sdk.options.PipelineOptionsFactory.<clinit>(PipelineOptionsFactory.java:471) том, но я не совсем понимаю, что вызывает такое поведение.

Может кто-нибудь, пожалуйста, посоветовать, что может вызвать это?

Заранее благодарю вас!

Комментарии:

1. Для меня это похоже на проблему с загрузкой классов. Можете ли вы найти все банки в пути к классу, в котором находится класс JaxbAnnotationModule ? У вас это тоже есть в вашем jar?

2. привет @ArvidHeise JaxbAnnotationModule в моем пути к классу нет, вы правы. Что меня смущает, так это то, почему мое приложение нормально работает при локальной настройке docker? Это тот же JAR, который я развертываю в обоих местах, и по какой-то причине EMR терпит неудачу, а локальный — нет. Есть идеи?

Ответ №1:

Вероятно, это проблема с загрузкой классов.

В экземпляре EMR Flink EC2 уже есть несколько jar, и эти библиотеки загружаются перед вашими собственными зависимостями. Таким образом, версия, которая используется во время выполнения, — это версия, предоставляемая EMR, а не та, которая у вас есть в качестве зависимости в вашей собственной pom.xml .

Существует несколько решений:

  • в вашем pom.xml случае используйте ту же версию, что и предоставленная EMR
  • в экземпляре EC2 замените версию EMR на вашу
  • измените порядок загрузки библиотеки
  • каким бы ни было решение, вам нужно отправить в Flink все необходимые зависимости, а не только jar, содержащий ваш собственный код

Комментарии:

1. Спасибо. Да, проблема действительно заключалась в несоответствии версий.