#machine-learning #random-forest
#машинное обучение #случайный лес
Вопрос:
Я использую случайный лес для выполнения двоичной классификации, размер теста 0,3, 5-кратное резюме, как для поезда, так и для теста, точность и отзыв превышают 99%, я переборщил?
Комментарии:
1. Я голосую за то, чтобы закрыть этот вопрос как не относящийся к теме, потому что он не касается программирования.
Ответ №1:
Если вы выполнили разделение теста на 70-30 поездов и 5-кратное резюме только на наборе поездов. после этого получили точность 99% и отзыв на ТЕСТОВОМ наборе, вы выполнили все шаги.
что вы можете проверить, так это пропорцию распределения данных в вашем тестировании и разделении обучения. сделайте среднее значение для ваших y_train и y_test. убедитесь, что вы получаете сопоставимые цифры.
Ответ №2:
Проверьте, что выборки из наборов данных обучения и тестирования отличаются, и, возможно, попробуйте запустить на некоторых новых реальных образцах.