#data-modeling #data-warehouse
#моделирование данных #хранилище данных
Вопрос:
Я спрашиваю, поскольку эти слова используются практически взаимозаменяемо в некоторой документации, которую мне пришлось просмотреть.
В чем различия в реальном мире?
Комментарии:
1. Хранилище данных — это гораздо более масштабная концепция. Помимо модели данных, DW содержит систему потока управления, управление безопасностью, администрирование платформы, процесс ETL, метаданные и т.д. и т.п.
Ответ №1:
«Хранилище данных» — это в основном концепция информационной системы, которая описывает централизованный и надежный источник данных (например, компании / бизнеса).
Из Википедии: «DWS — это центральные хранилища интегрированных данных из одного или нескольких разрозненных источников. Они хранят текущие и исторические данные в одном месте, которые используются для создания аналитических отчетов для сотрудников по всему предприятию.»
При этом, я думаю, немного излишне говорить «унифицированное хранилище данных»; хранилище данных — это «унифицированный» источник данных по определению.
Это определение подразумевает, что модель данных в хранилище данных должна быть унифицированной, канонической моделью всех соответствующих данных. Вы также можете рассматривать хранилище данных как набор витрин данных, которые, в свою очередь, представляют собой унифицированные / канонические модели меньшего размера, ориентированные на конкретные бизнес / функциональные области; таким образом, «унифицированную модель данных» можно рассматривать как сумму различных более мелких / специфических моделей (витрин данных).
Хранилище данных, как информационная система, обычно окружено множеством технологических инструментов (базы данных, программное обеспечение ETL, инструменты аналитики и отчетности и т.д.); Но независимо от того, как вы обрабатываете, моделируете и исследуете данные, основная цель DW — служить куратором, единственным источником достоверности для (деловых) вопросов, которые (должны) основываться на данных.