в чем разница между унифицированным хранилищем данных и унифицированной моделью данных?

#data-modeling #data-warehouse

#моделирование данных #хранилище данных

Вопрос:

Я спрашиваю, поскольку эти слова используются практически взаимозаменяемо в некоторой документации, которую мне пришлось просмотреть.

В чем различия в реальном мире?

Комментарии:

1. Хранилище данных — это гораздо более масштабная концепция. Помимо модели данных, DW содержит систему потока управления, управление безопасностью, администрирование платформы, процесс ETL, метаданные и т.д. и т.п.

Ответ №1:

«Хранилище данных» — это в основном концепция информационной системы, которая описывает централизованный и надежный источник данных (например, компании / бизнеса).

Из Википедии: «DWS — это центральные хранилища интегрированных данных из одного или нескольких разрозненных источников. Они хранят текущие и исторические данные в одном месте, которые используются для создания аналитических отчетов для сотрудников по всему предприятию.»

При этом, я думаю, немного излишне говорить «унифицированное хранилище данных»; хранилище данных — это «унифицированный» источник данных по определению.

Это определение подразумевает, что модель данных в хранилище данных должна быть унифицированной, канонической моделью всех соответствующих данных. Вы также можете рассматривать хранилище данных как набор витрин данных, которые, в свою очередь, представляют собой унифицированные / канонические модели меньшего размера, ориентированные на конкретные бизнес / функциональные области; таким образом, «унифицированную модель данных» можно рассматривать как сумму различных более мелких / специфических моделей (витрин данных).

Хранилище данных, как информационная система, обычно окружено множеством технологических инструментов (базы данных, программное обеспечение ETL, инструменты аналитики и отчетности и т.д.); Но независимо от того, как вы обрабатываете, моделируете и исследуете данные, основная цель DW — служить куратором, единственным источником достоверности для (деловых) вопросов, которые (должны) основываться на данных.