Как выбрать соответствующие переменные для применения логистической регрессии для очень большого набора данных

#python #logistic-regression #large-data #feature-selection #variable-selection

#python #логистическая регрессия #большие данные #функция-выбор #переменная-выбор

Вопрос:

У меня есть проект, связанный с набором данных Kaggle competition, который отображается здесь в application_train csv https://drive.google.com/drive/folders/1zYotRg3l_m66JQRrGYi1VkuW0A0tfC4K?usp=sharing

цель состоит в том, чтобы выполнить логистическую регрессию. Однако у меня возникли проблемы с выбором данных.

Поскольку у меня 122 переменных, как мне выбрать наиболее подходящие?

data = pd.read_csv(«C:/Users/migue/Downloads/application_train.csv «) Data_head данных

Спасибо