#math #sampling
Вопрос:
Допустим, у вас есть вектор вероятностей p
, и вы хотите выбрать индекс p
. Однако мы не хотим делать выборку p
напрямую, а сначала выберем подмножество индексов, а затем выберем из этого подмножества. Моя проблема в следующем: как мне выполнить выборку с правильным весом?
Для простоты давайте предположим p = [1/6, 1/3, 1/2]
. Сначала мы выберем 2 индекса из p
, чтобы получить подмножество I
. I
может быть [0, 1]
(вероятность 1/15 1/12 = 3/20
), [0, 2]
(вероятность 1/10 1/6 = 4/15
) или [1, 2]
(вероятность 1/4 1/3 = 7/12
). Проблема в том, что я понятия не имею, как связать вероятности на втором этапе выборки.
Предположим I = [0, 1]
, что было бы интуитивно понятно проводить выборку с весами [1/3, 2/3]
, однако эта стратегия вызывает недостаточную выборку с низкими вероятностями (для первого индекса мы получаем 3/20 * 1/3 4/15 * 1/4 = 7/60 < 1/6
).
Спасибо за любые подсказки!
Комментарии:
1.
1/15 1/12 = 3/20
что это за дроби?2.
1/15 =
вероятность для индекса выборки 0, затем индекс выборки 1.1/12 =
вероятность для индекса выборки 1, затем индекс 0. Следовательно,3/20 =
вероятность получения множества[0, 1]
.3. Интересный вопрос, однако, он больше подходит для math.stackexchange.com или stats.se. Тем не менее, похоже, что вы хотите выбрать подмножество с вероятностью P = (сумма отдельных p), а затем для выборки из подмножества выберите один элемент с вероятностью p/P (т. Е. Нормализуйте p в подмножестве, чтобы они равнялись 1). Хотя я не уверен, что понимаю, что ты хочешь сделать.