#python #mnist
#python #mnist
Вопрос:
В настоящее время я работаю над набором данных MNIST, и мой обучающий набор составляет 60 000. Это закодировано на Python, и задача просит меня выполнить кластеризацию 6000 обучающих векторов для каждого класса в 64 кластера.
Мне было интересно, как я могу это сделать? Не уверен, как я это делаю с помощью функции KmeanCluster из sklearn.
Как мне разделить каждый класс из чисел 0-9 на 6000 обучающих векторов?
Комментарии:
1. Вам не нужны метки для kmeans. Когда у вас есть 64 кластера, может быть или не быть простого способа перевести в числа.
2. не могли бы вы, пожалуйста, подробнее рассказать? Спасибо
3. kmeans пытается найти 64 кластера в ваших данных. Таким образом, он сгруппирует каждую точку в 1 из 64 классов, и это будет основано только на значениях пикселей, а не на метке. Нет простого способа сказать, что будут означать 64 кластера. Таким образом, выполните k means и посмотрите, какие кластеры вы получите