#python #outliers
#python #выбросы
Вопрос:
Я работаю над автоматизацией анализа временных рядов. В этом я должен автоматизировать процесс обнаружения выбросов в одномерных временных рядах. Таким образом, мои данные могут быть нормально распределены или ненормально распределены.
Я знаю тест grubb и блок-график, которые можно использовать для обнаружения выбросов, но предполагается, что это для обычных распределенных данных
Ответ №1:
Если у вас есть эмпирическое распределение, вы можете вычислить квантили (например, при 0,025 и 0,975) для этого распределения. Тогда значения, которые находятся за пределами квантилей, могут быть обозначены как выбросы. Будьте осторожны, это будет полезно только для распределений, которые имеют форму колокола (не как экспоненциальный).
В других случаях вы должны знать о начале каждого распределения, например, в экспоненциальном или пуассоновском, вы должны смотреть только на правую часть.
Для получения дополнительных ответов https://stats.stackexchange.com/questions/129274/outlier-detection-on-skewed-distributions