Я получаю плохие результаты кластера при использовании динамического временного искажения в качестве меры сходства в k-средних для данных временных рядов. Как я могу улучшить?

#python #r #machine-learning #time-series #cluster-analysis

#python #r #машинное обучение #временные ряды #кластерный анализ

Вопрос:

Я хочу сгруппировать Xi. Каждая строка состоит из значения Xi в определенной временной метке. Вот набор данных.:

 X1  X2  X3  X4

100 100 100 100

91.56786232 96.62190102 98.08459941 96.54390935

92.90859973 97.64075269 103.1123983 98.13031161

.... .... .... ..... ..
  

Кроме того, я знаю, что Xi коррелируют. Таким образом, я также попытался выполнить иерархическую кластеризацию на основе матрицы взаимосвязей. Любые другие подходы, которые я мог бы попробовать?

Комментарии:

1. Какими будут кластеры в этом примере?

2. примечание: k-средние значения четко определены только для евклидова расстояния, использовать его с произвольным подобием — ужасная идея.