Загрузка с заменой

#statistics #sampling #resampling #population

#Статистика #выборка #повторная выборка #население

Вопрос:

Я читаю статью и смущен их описанным методом начальной загрузки. в тексте говорится:

неопределенности, связанные с каждой сложенной плотностью потока, получены с помощью метода начальной загрузки, в ходе которого выбираются и повторно складываются случайные подвыборки (с заменой) источников. Количество источников в каждой подвыборке равно исходному количеству источников в стеке. Этот процесс повторяется 10000 раз, чтобы определить репрезентативный разброс в свойствах складываемой совокупности.

Итак, скажем, у меня есть 50 значений. Я нахожу среднее значение этих значений. В соответствии с этим методом я бы получил подвыборку из этой исходной совокупности 50 и нашел это среднее значение, и повторил это 10 000 раз. Теперь, как я мог бы получить подвыборку, «равную исходному количеству источников в стеке», без того, чтобы моя подвыборка БЫЛА ТОЧНО ТАКОЙ ЖЕ, КАК ИСХОДНАЯ, И, СЛЕДОВАТЕЛЬНО, ИМЕЛА ТОЧНО ТАКОЕ ЖЕ СРЕДНЕЕ ЗНАЧЕНИЕ, ЧТО НИЧЕГО БЫ НАМ НЕ СКАЗАЛО !?

Комментарии:

1. Потому что ваша подвыборка не будет точно такой же, как вы рисуете с заменой. Итак, если вы повторите это 10000 раз, в итоге среднее значение некоторых подвыборок будет значительно ниже, а других выше, потому что вы получите непропорционально большое количество низких и высоких значений соответственно.

2. но у меня нет значений для замены — у меня есть только эти 50 значений

3. можете ли вы объяснить на примере, может быть?

4. «но у меня нет значений для замены — у меня есть только эти 50 значений» — выборка с заменой означает, что вы берете данные случайным образом, затем образно «возвращаете их обратно», затем берете другие данные. Поскольку вы «вернули его обратно», его можно было бы выбрать снова. При конечном количестве данных некоторые данные будут выбираться более одного раза, и, наоборот, некоторые не будут выбираться вообще; это делает среднее значение выборки отличным от одной начальной выборки для другой.

5. Выше приведено хорошее объяснение. Если вы хотите узнать немного больше о технических аспектах, эта статья может быть полезной.

Ответ №1:

вы можете повторно использовать значения. Итак, если у меня есть ABCDE в качестве моих значений, я могу загрузиться с помощью AABCD и т. Д. Я могу использовать значения дважды, это ключ