Несколько контейнеров в adls

#azure #azure-data-lake #concept

#azure #azure-озеро данных #концепция

Вопрос:

Я собираюсь наметить приблизительную концепцию того, как должно быть структурировано озеро данных. Одна вещь поразила меня в отношении концепции контейнера. Мой вопрос в том, есть ли какие-либо преимущества в наличии нескольких контейнеров? Например. наличие нескольких контейнеров для каждого варианта использования? Но я также могу представить его в одном контейнере с разными папками. С точки зрения управления доступом, rbac на уровне контейнера, acl на уровне папок, файлов. Единственное отличие заключается в концепции безопасности, если у меня есть один контейнер с несколькими папками для вариантов использования или несколько контейнеров для каждого варианта использования. Существуют ли подобные аргументы убийцы, почему мы должны следовать одному подходу вместо другого?

Комментарии:

1. Привет @ gyang, пожалуйста, поправьте меня, если я неправильно понял вас в ответе.

2. Привет, если мой ответ полезен для вас, пожалуйста, примите (отметьте) его как ответ. Это может быть полезно для других участников сообщества.

Ответ №1:

Во-первых, преимущества контейнера:

  1. мы можем включить автоматическое удаление контейнера и восстановить контейнер, удаленный с помощью программы, но в папке нет этой функции.

  2. Мы можем установить уровень доступа к контейнеру при его создании:

    • Частные: данные контейнера являются частными для владельца учетной записи
    • Большой двоичный объект: разрешить общедоступный доступ на чтение для больших двоичных объектов
    • Контейнер: разрешить общедоступный доступ для чтения и списка ко всему контейнеру

Поэтому я думаю, что контейнер обладает большей безопасностью и изоляцией. С точки зрения управления доступом контейнеры имеют более грубый контроль доступа. Выбор зависит от индивидуальных потребностей.