Как вы настраиваете веса образцов в два этапа без замены

#math #sampling

Вопрос:

Допустим, у вас есть вектор вероятностей p , и вы хотите выбрать индекс p . Однако мы не хотим делать выборку p напрямую, а сначала выберем подмножество индексов, а затем выберем из этого подмножества. Моя проблема в следующем: как мне выполнить выборку с правильным весом?

Для простоты давайте предположим p = [1/6, 1/3, 1/2] . Сначала мы выберем 2 индекса из p , чтобы получить подмножество I . I может быть [0, 1] (вероятность 1/15 1/12 = 3/20 ), [0, 2] (вероятность 1/10 1/6 = 4/15 ) или [1, 2] (вероятность 1/4 1/3 = 7/12 ). Проблема в том, что я понятия не имею, как связать вероятности на втором этапе выборки.

Предположим I = [0, 1] , что было бы интуитивно понятно проводить выборку с весами [1/3, 2/3] , однако эта стратегия вызывает недостаточную выборку с низкими вероятностями (для первого индекса мы получаем 3/20 * 1/3 4/15 * 1/4 = 7/60 < 1/6 ).

Спасибо за любые подсказки!

Комментарии:

1. 1/15 1/12 = 3/20 что это за дроби?

2. 1/15 = вероятность для индекса выборки 0, затем индекс выборки 1. 1/12 = вероятность для индекса выборки 1, затем индекс 0. Следовательно, 3/20 = вероятность получения множества [0, 1] .

3. Интересный вопрос, однако, он больше подходит для math.stackexchange.com или stats.se. Тем не менее, похоже, что вы хотите выбрать подмножество с вероятностью P = (сумма отдельных p), а затем для выборки из подмножества выберите один элемент с вероятностью p/P (т. Е. Нормализуйте p в подмножестве, чтобы они равнялись 1). Хотя я не уверен, что понимаю, что ты хочешь сделать.