Авторизация через Apache Ranger в Spark

#apache-spark #authorization #apache-ranger

#apache-spark #авторизация #apache-ranger

Вопрос:

У нас есть политики ranger, определенные в таблице hive, и авторизация работает должным образом, когда мы используем hive cli и beeline. Но когда мы получаем доступ к этим таблицам hive с помощью spark-shell или spark-submit, это не работает.

Есть ли какой-нибудь способ ее настроить?

Заявление о проблеме: Ranger защищает только сервер Hive (JDBC). Но Spark не взаимодействует с HS2, а напрямую взаимодействует с Metastore. Следовательно, единственный способ использовать политики Ranger, если вы используете Hive через JDBC. Другой вариант — это списки ACL HDFS или хранилища, которые представляют собой грубый контроль над путем к файлу и т. Д. Вы также можете использовать Ranger для управления списками ACL HDFS. В таком сценарии spark будет связан этими политиками. Но, если я использую Ranger для управления списками ACL HDFS, как вы упомянули, это приведет к грубому контролю над файлом. У меня может быть несколько детализированных вариантов использования на уровне строк / столбцов

Комментарии:

1. #rikamamanus Пожалуйста, ответьте на обновленный вопрос

Ответ №1:

Проверьте наличие проверок ranger в пользовательском интерфейсе ranger и проверьте наличие отклоненных результатов для этих таблиц, подтвердите пользователя.

Комментарии:

1. rikamamanus — проблема в том, что Ranger защищает только сервер Hive (JDBC). Но Spark не взаимодействует с HS2, а напрямую взаимодействует с Metastore. Следовательно, единственный способ использовать политики Ranger, если вы используете Hive через JDBC. Другой вариант — это списки ACL HDFS или хранилища, которые представляют собой грубый контроль над путем к файлу и т. Д. Вы также можете использовать Ranger для управления списками ACL HDFS. В таком сценарии spark будет связан этими политиками. Но, если я использую Ranger для управления списками ACL HDFS, как вы упомянули, это приведет к грубому контролю над файлом. У меня может быть несколько детализированных вариантов использования на уровне строк / столбцов

2.Кто-нибудь может мне помочь, если есть какие-либо ограничения подхода здесь или какой-либо способ реализовать аналогично тому, что было сделано здесь? issues.apache.org/jira/browse/RANGER-2128 issues.apache.org/jira/browse/SUBMARINE-409