Реализация DBSCAN с использованием R деревьев

#real-time #data-mining #cluster-analysis #r-tree #dbscan

#в режиме реального времени #интеллектуальный анализ данных #кластерный анализ #r-tree #dbscan

Вопрос:

Я пытаюсь реализовать DBSCAN с использованием R дерева.Мы можем хранить данные в виде R деревьев.Итак, мой вопрос в том, как я могу хранить данные в реальном времени в R деревьях и как я должен реализовать запрос региона, чтобы найти окрестности точки с его помощью?

Ответ №1:

Сначала внедрите R-деревья, затем DBSCAN.

Что касается реального времени, вы, вероятно, захотите изучить специализированные алгоритмы кластеризации для потоков данных.

Ответ №2:

Я не уверен, что вы подразумеваете под данными в реальном времени. В случае, если вы ссылаетесь на изменяющиеся данные или потоковые данные, вы также можете удалить устаревший материал из R-дерева. Если вы имеете в виду, что ваши данные также имеют временное измерение, то вы можете просто увеличить количество коэффициентов, которыми управляет R-дерево (x, y, t) — я предполагаю, что вы используете простую двунаправленную версию.

Если вы хотите реализовать DBSCAN, вам нужно будет выполнить запросы диапазона, чтобы вычислить плотности сферических областей вокруг точек. Следовательно, ваши региональные запросы должны быть способны обрабатывать сферические области запросов (в этом отношении я бы также посоветовал вам ознакомиться с SR-Tree Шиничи Сато, это может быть полезно). Опять же, если под данными реального времени вы подразумеваете, что ваши данные имеют временную характеристику, вы можете рассмотреть возможность использования областей запроса эллипсоидной формы (допускающих раздельное масштабирование пространственных и временных характеристик).

Надеюсь, это поможет :]