Разреженная индексация и плотная кластеризация индексирования?

#database

Вопрос:

Я читал об индексации. Там я обнаружил, что разреженная индексация означает, что для каждого уникального значения в индексном файле будет только одна запись, а для плотной индексации в индексном файле будет запись для каждого ключа поиска в файле данных. Но я очень запутался в некоторых понятиях.

  1. Является ли кластерный индекс разреженным или плотным.
  2. Есть ли какая-либо разница между разреженным индексом и индексом плотной кластеризации

Потому что на данном изображении я думаю, что пример представляет собой разреженный индекс, но написано, что это пример индекса плотной кластеризации. Изображение взято из книги Зильбершатца.

введите описание изображения здесь

Комментарии:

1. Является ли кластерный индекс разреженным или плотным , зависит от данных в индексе. Часто он плотный, потому что люди часто создают кластеризованный индекс на уникальном значении. Есть ли какая-либо разница между разреженным индексом и индексом плотной кластеризации Разреженный и плотный индексы, очевидно, противоположны. Насколько плотным является кластеризованный индекс, зависит от данных. Нет правила, согласно которому кластеризованный индекс является плотным или разреженным. Эти вопросы кажутся немного абстрактными и не слишком актуальными для проблем реального мира.

2. @Ник. McDermaid Если мы создаем кластерный индекс по уникальному значению, то для каждого уникального значения будет запись в индексном файле. И эта запись будет указывать на первое появление ключа поиска в файле базы данных. Тогда, насколько он плотный, я думаю, что он должен быть разреженным. Предположим, что у нас есть (1,2,2,2,3,3,4,4,4,4). Мы создаем индекс для (1,2,3,4), тогда он будет разреженным, а не плотным.

3. 1,2,2,2,3,3,4,4,4,4 не является уникальным, хотя

4. @Ник. McDermaid Мы делаем кластеризацию для неключевых, а неключевые могут повторяться. Но файл нашей базы данных должен быть отсортирован не по ключу. Таким образом, для (1,2,2,2,3,3,4,4,4,4) мы можем сделать индекс кластеризации. В этом случае ключ поиска для индексного файла будет(1,2,3,4), и это, я думаю, будет разреженным, а не плотным. Поправьте меня, если я ошибаюсь ?