Скорость выбора в selection_rate_group_summary в fairlearn

#fairlearn

#fairlearn

Вопрос:

Как selection_rate_group_summary определяет значение отсечения, когда мы передаем ему выходные данные смягченной модели в модуле fairlearn.

Скорость выбора в одном из наших данных действительно высока все время при использовании функции, которая является неестественной.

Ответ №1:

Значение отсечки отсутствует. selection_rate_group_summary просто собирает коэффициенты отбора для всех групп и в целом.

Пример:

 >>> from fairlearn.metrics import selection_rate_group_summary
>>> y = [0, 1, 1, 1, 1, 1, 1, 1]
>>> sensitive_features = ["a", "b", "a", "b", "a", "b", "a", "b"]
>>> selection_rate_group_summary(y, y, sensitive_features=sensitive_features)
{'overall': 0.875, 'by_group': {'a': 0.75, 'b': 1.0}}
  

Аналогично, если у нас много и много выборок, а числа становятся очень большими, это все равно работает (без отсечения):

 >>> y = [1] * 1000000
>>> y[0] = 0
>>> sensitive_features = ["a", "b"] * 500000
>>> selection_rate_group_summary(y, y, sensitive_features=sensitive_features)
{'overall': 0.999999, 'by_group': {'a': 0.999998, 'b': 1.0}}
  

Если вы имели в виду что-то другое, пожалуйста, обновите вопрос или напишите сообщение сообществу на Gitter

Комментарии:

1. Ну, Gitter заблокирован моей компанией из-за подозрений на вредоносное ПО, это единственное решение. Я имел в виду, как смягченная модель выбрала 1/0, теперь я знаю ответ, глядя на код

2. Если вы имели в виду настольное приложение Gitter, есть также веб-сайт, который вы можете открыть в браузере. Дайте мне знать, если что-то еще неясно. Я не уверен, что это помогло…