вычисление значения принадлежности к кластеру в нечетком k-режиме

#artificial-intelligence #cluster-analysis #data-mining #fuzzy #k-means

#искусственный интеллект #кластерный анализ #интеллектуальный анализ данных #нечеткий #k-средние

Вопрос:

Я искал алгоритм кластеризации для нечетких кластерных категориальных атрибутов и нашел алгоритм k-modes, у меня есть способ, которым он работает, но я не понимаю, вычисляется ли матрица принадлежности или принадлежности так же, как эта матрица в алгоритме нечетких c-средних? в случае «нет» не могли бы вы уточнить способ его вычисления?

заранее благодарим вас за помощь

Ответ №1:

Используя обозначения цитируемой статьи, вопрос заключается в
вычисляется ли матрица W для k-режима таким же образом, как и для k-среднего ?

Ответ — ДА, различий вообще не должно быть, и, конечно, все ограничения на W остаются неизменными; в частности, его транспонирование должно быть случайным (*).

Основное различие между k-Mean и k-Mode касается вычисления Z и, конечно, функции расстояния. Мне пришлось бы перечитать статью на свежий взгляд, поскольку ATM детали о Z немного нечеткие (каламбур) для меня, для обоих алгоритмов k-режима, жесткого и нечеткого.

(*) Сказано менее педантично: для каждого объекта сумма его коэффициентов w для всех k кластеров должна быть равна 1, и все все эти коэффициенты w должны быть положительными (и, следовательно, в диапазоне [0,1]).