#python #logistic-regression #large-data #feature-selection #variable-selection
#python #логистическая регрессия #большие данные #функция-выбор #переменная-выбор
Вопрос:
У меня есть проект, связанный с набором данных Kaggle competition, который отображается здесь в application_train csv https://drive.google.com/drive/folders/1zYotRg3l_m66JQRrGYi1VkuW0A0tfC4K?usp=sharing
цель состоит в том, чтобы выполнить логистическую регрессию. Однако у меня возникли проблемы с выбором данных.
Поскольку у меня 122 переменных, как мне выбрать наиболее подходящие?
data = pd.read_csv(«C:/Users/migue/Downloads/application_train.csv «) Data_head данных
Спасибо