#azure #azure-data-lake #concept
#azure #azure-озеро данных #концепция
Вопрос:
Я собираюсь наметить приблизительную концепцию того, как должно быть структурировано озеро данных. Одна вещь поразила меня в отношении концепции контейнера. Мой вопрос в том, есть ли какие-либо преимущества в наличии нескольких контейнеров? Например. наличие нескольких контейнеров для каждого варианта использования? Но я также могу представить его в одном контейнере с разными папками. С точки зрения управления доступом, rbac на уровне контейнера, acl на уровне папок, файлов. Единственное отличие заключается в концепции безопасности, если у меня есть один контейнер с несколькими папками для вариантов использования или несколько контейнеров для каждого варианта использования. Существуют ли подобные аргументы убийцы, почему мы должны следовать одному подходу вместо другого?
Комментарии:
1. Привет @ gyang, пожалуйста, поправьте меня, если я неправильно понял вас в ответе.
2. Привет, если мой ответ полезен для вас, пожалуйста, примите (отметьте) его как ответ. Это может быть полезно для других участников сообщества.
Ответ №1:
Во-первых, преимущества контейнера:
-
мы можем включить автоматическое удаление контейнера и восстановить контейнер, удаленный с помощью программы, но в папке нет этой функции.
-
Мы можем установить уровень доступа к контейнеру при его создании:
- Частные: данные контейнера являются частными для владельца учетной записи
- Большой двоичный объект: разрешить общедоступный доступ на чтение для больших двоичных объектов
- Контейнер: разрешить общедоступный доступ для чтения и списка ко всему контейнеру
Поэтому я думаю, что контейнер обладает большей безопасностью и изоляцией. С точки зрения управления доступом контейнеры имеют более грубый контроль доступа. Выбор зависит от индивидуальных потребностей.