#python #dataframe #regression
Вопрос:
У меня есть фрейм данных, содержащий множество столбцов , один из которых Score
имеет значения от 0 до 1 (если это поможет: он представляет сложность теста. Чем ближе к 1, тем проще тест). Я создал дополнительный столбец, который применяет logit
функцию к каждому из этих значений.
from scipy.special import logit
df['InverseLogistic'] = df.apply(lambda row : logit(row['Score']), axis = 1)
Причина, по которой я сделал это преобразование, заключается в том, чтобы выполнить логистическую регрессию. Однако будет много значений inf
, потому что во входных данных есть такие значения, как 0 и 1. Что мне с ними делать? Должен ли я применить логистическую функцию к 0 и 1? Должен ли я просто устранить их? Являются ли они вообще проблемой для модели?