Проблема, похожая на проблему коммивояжера

#algorithm #optimization #traveling-salesman #np

#алгоритм #оптимизация #коммивояжер #np

Вопрос:

У меня есть разные функции в моем наборе данных, эти функции называются следующим образом A B C D E F G H

Существует корреляция между этими функциями

 Features   Correlation
----------------------
A B        70
A C        78
B C        96
A G        93
.
.
.
 

Поэтому я хотел бы сгруппировать похожие функции вместе, чтобы их можно было представить одной функцией

Что-то вроде этого

 Seed   Group        Correlations Avg
-----------------------------------
A      D amp; G         98   93 / 2 = 95.5
B      F amp; C amp; E     85   96   79 / 3 = 86.6
..
..
..
H      -             -
 

Итак, я получаю все тесные корреляции в одной группе

Другой взгляд на проблему

несколько городов в стране (город A B C D .. H)

Каждый город имеет связь с другим городом

 Cities   Connection %
----------------------
A B        70
A C        78
B C        96
A G        93
.
.
.
 

Мы хотели бы нанять региональных менеджеров, где города с близкими связями могут обслуживаться одним и тем же региональным менеджером

Мы хотим иметь оптимальное количество региональных менеджеров и где они должны находиться

 Office Area   Other Served Areas        Connection Avg
------------------------------------------------------
A             D amp; G         98   93 / 2 = 95.5
B             F amp; C amp; E     85   96   79 / 3 = 86.6
..
..
..
H             -             -
 

Мне просто нужен метод, позволяющий определить, как разделить эти объекты / города оптимальным образом, чтобы охватить большинство объектов / городов с минимальным количеством ссылок / менеджеров областей

Комментарии:

1. Больше похоже на кластеризацию k-средних

2. @user3386109 как это сделать с помощью K-mean, какова будет функция набора данных в этом случае?