Проверьте, согласуются ли несколько точек данных друг с другом в пределах 1 сигмы

#scipy #statistics #cluster-analysis #gaussian #uncertainty

Вопрос:

У меня сложная проблема. Предположим, у меня есть N гауссовых точек данных с неопределенностью 1 сигма.

Для простоты давайте сначала рассмотрим 11 точек данных: X=5.0,4.9,15.2,3.2,11.4,5.1,6.0,2.3,4.8,13.4,6.01 , и их 1 сигма неопределенности sigma_X=0.3,0.5,2.4,0.3,3.8,0.3,1.2,0.5,0.3,1.1,0.02. Я хотел бы знать, какие точки данных согласуются друг с другом. В приведенном выше примере: все 5 точек данных: X=5.0, 4.9, 5.1,6.0,4.8 с помощью sigma_X=0.3,0.5,0.3,1.2,0.3 имеют перекрытие друг с другом в пределах X -sigma_X (также есть другой кластер, X=15,2,11,4,13,4, sigma_x=2,4,3,8,1,1, но мне это не нужно). Я хотел бы найти кластер, который включает в себя наибольшее количество точек данных (по сравнению с другими кластерами). Далее я хотел бы обобщить проблему на N точек данных. Обратите внимание, что все точки данных в кластере должны перекрываться друг с другом.

Я думаю, что это чем-то похоже на друзей друзей или алгоритм кластеризации (на основе двоичного дерева). Может кто-нибудь, пожалуйста, помочь мне, как я могу закодировать его на python?