Не удается запустить spark-nlp из-за исключения: процесс Java gateway завершается перед отправкой номера своего порта

#apache-spark #pyspark #johnsnowlabs-spark-nlp

#apache-spark #pyspark #johnsnowlabs-spark-nlp

Вопрос:

У меня есть рабочая установка Pyspark, запущенная через Jupyter на виртуальной машине Ubuntu.
Только одна версия Java ( openjdk version "1.8.0_265" ), и я могу Я могу запустить локальный сеанс Spark (v2.4.4), подобный этому, без проблем:

 import pyspark
from pyspark.sql import SparkSession

memory_&b = 24
conf = (
    pyspark.SparkConf()
        .setMaster('local[*]')
        .set('spark.driver.memory', '{}&'.format(memory_&b))
)

spark = SparkSession 
    .builder 
    .appName("My Name") 
    .confi&(conf=conf) 
    .&etOrCreate()
  

Теперь я хочу использовать spark-nlp . Я установил, spark-nlp используя pip install spark-nlp , в той же виртуальной среде, в которой находится мой Pyspark.

Однако, когда я пытаюсь его использовать, я получаю сообщение об ошибке Exception: Java &ateway process exited before sendin& its port number .

Я пытался следовать инструкциям в документации здесь, но безуспешно.

При этом

 spark = SparkSession 
    .builder 
    .appName("RevDNS Stats") 
    .confi&(conf=conf) 
    .confi&("spark.jars.packa&es", "com.johnsnowlabs.nlp:spark-nlp_2.11:2.5.5")
    .&etOrCreate()
  

приводит только к ошибке, упомянутой выше.

Как мне это исправить?