Есть ли какой-либо метод для обнаружения выбросов в ненормально распределенных данных?

#python #outliers

#python #выбросы

Вопрос:

Я работаю над автоматизацией анализа временных рядов. В этом я должен автоматизировать процесс обнаружения выбросов в одномерных временных рядах. Таким образом, мои данные могут быть нормально распределены или ненормально распределены.

Я знаю тест grubb и блок-график, которые можно использовать для обнаружения выбросов, но предполагается, что это для обычных распределенных данных

Ответ №1:

Если у вас есть эмпирическое распределение, вы можете вычислить квантили (например, при 0,025 и 0,975) для этого распределения. Тогда значения, которые находятся за пределами квантилей, могут быть обозначены как выбросы. Будьте осторожны, это будет полезно только для распределений, которые имеют форму колокола (не как экспоненциальный).

В других случаях вы должны знать о начале каждого распределения, например, в экспоненциальном или пуассоновском, вы должны смотреть только на правую часть.

Для получения дополнительных ответов https://stats.stackexchange.com/questions/129274/outlier-detection-on-skewed-distributions