K-означает кластеризацию набора данных MNIST

#python #mnist

#python #mnist

Вопрос:

В настоящее время я работаю над набором данных MNIST, и мой обучающий набор составляет 60 000. Это закодировано на Python, и задача просит меня выполнить кластеризацию 6000 обучающих векторов для каждого класса в 64 кластера.

Мне было интересно, как я могу это сделать? Не уверен, как я это делаю с помощью функции KmeanCluster из sklearn.

Как мне разделить каждый класс из чисел 0-9 на 6000 обучающих векторов?

Комментарии:

1. Вам не нужны метки для kmeans. Когда у вас есть 64 кластера, может быть или не быть простого способа перевести в числа.

2. не могли бы вы, пожалуйста, подробнее рассказать? Спасибо

3. kmeans пытается найти 64 кластера в ваших данных. Таким образом, он сгруппирует каждую точку в 1 из 64 классов, и это будет основано только на значениях пикселей, а не на метке. Нет простого способа сказать, что будут означать 64 кластера. Таким образом, выполните k means и посмотрите, какие кластеры вы получите