Проблема классификации — каждая запись является уникальным классом

#python-3.x #machine-learning #multiclass-classification

#python-3.x #машинное обучение #мультиклассовая классификация

Вопрос:

У меня есть тысячи записей, каждая из которых является уникальным классом. Я думаю, это означает, что, какой бы алгоритм ML я ни выбрал, я не смогу выполнить разделение поездов / тестов, потому что разделение тестов не может быть смоделировано. Это связано с тем, что для каждого класса существует только одна запись, поэтому модель не могла обучиться чему-либо, что находится в тестовом разделении.

Я не могу оправдать введение невидимых записей для прогнозирования, если моя модель не может быть проверена.

Каждая запись похожа на общую учетную запись с примерно 20 функциями. Я думал об использовании KNN, но KNN также не сможет выполнить разделение на поезд / тест. Как мне решить эту проблему? Является ли KNN неправильной моделью для использования здесь?

Комментарии:

1. Вам нужно больше объяснить, что именно вы пытаетесь сделать и с какими данными вы работаете. Кроме того, как эта задача является задачей классификации, если вы не можете группировать записи в классы? Потому что то, что вы пытаетесь сделать, кажется более актуальным для проблемы регрессии, если вы не можете классифицировать записи по группам

2. Если каждая запись связана с одним уникальным классом, и у вас есть тысячи записей. Тогда я сомневаюсь, что это проблема классификации больше. Вам нужно рассмотреть это либо как проблему кластеризации, либо как проблему регрессии. Покажите нам реальный образец вашего набора данных!