Что я должен проверить, если модель имеет очень хороший результат как для поезда, так и для теста?

#machine-learning #random-forest

#машинное обучение #случайный лес

Вопрос:

Я использую случайный лес для выполнения двоичной классификации, размер теста 0,3, 5-кратное резюме, как для поезда, так и для теста, точность и отзыв превышают 99%, я переборщил?

Комментарии:

1. Я голосую за то, чтобы закрыть этот вопрос как не относящийся к теме, потому что он не касается программирования.

Ответ №1:

Если вы выполнили разделение теста на 70-30 поездов и 5-кратное резюме только на наборе поездов. после этого получили точность 99% и отзыв на ТЕСТОВОМ наборе, вы выполнили все шаги.

что вы можете проверить, так это пропорцию распределения данных в вашем тестировании и разделении обучения. сделайте среднее значение для ваших y_train и y_test. убедитесь, что вы получаете сопоставимые цифры.

Ответ №2:

Проверьте, что выборки из наборов данных обучения и тестирования отличаются, и, возможно, попробуйте запустить на некоторых новых реальных образцах.