#mcmc #stan
#mcmc #stan
Вопрос:
Я использовал байесовскую модель в STAN для оценки модели регрессии ошибок измерения. Диагностика показывает, что цепочка сошлась. Однако, когда я смотрю на параметр по сравнению с логарифмическими задними графиками. Я обнаружил, что цепочка не исследовала пространство, где логарифмическая последовательность максимальна. На рисунке показан график зависимости параметра от логарифмически-апостериорного графика. Мы видим, что логарифмическая последовательность все еще увеличивается вправо.
Я пытаюсь понять, что могло вызвать такое поведение, поскольку цепочки сходятся к этой неожиданной точке, которая не является апостериорным режимом для этого предельного распределения. Почему HMC / NUTS не исследовали пространство справа, где логарифмическое значение для этого параметра выше?
Модель, которую я подбираю, является:
data {
int<lower=0> N; // Sample size
vector[N] X; // Predictor
vector[N] Y; // Response
real<lower=0> sigmax; // Measurement error in X
}
parameters {
real beta0; // intercept
real beta1; // X coefficient
real<lower=0> sigma; // error in Y
vector[N] Xu; // latent unmeasured X
}
model {
X ~ normal(Xu,sigmax);
Y ~ normal(beta0 beta1*Xu,sigma); // likelihood
}
Комментарии:
1. Для такой модели, как эта, вполне возможно, что окрестности режима не имеют вероятности. Существует несколько объяснений этого явления концентрации меры в моделях Stan, таких как это тематическое исследование .
2. Большое вам спасибо за очень хорошее тематическое исследование. В нем говорится, что «Довольно неожиданный результат заключается в том, что для нормального распределения в больших размерах типичный набор не включает объем вокруг режима». Однако, если я правильно понимаю, HMC должен выполнять выборку с обеих сторон режима, что не похоже на то, что происходит в этом примере. ситуация. Как правило, даже если режим не имеет достаточной вероятности, он будет выполнять выборку вокруг режима, и оценки не будут смещены при получении среднего значения. Я действительно ценю любые мысли или советы, чтобы заставить HMC исследовать это пространство.
3. Это может происходить на обеих (всех) сторонах режима, если там есть как плотность, так и объем. Мы называем это пончиком. Но иногда режим находится на краю, и весь объем находится на одной стороне от него. Я не уверен, что это так в вашем примере, но это объяснение того, что вы видите на графике.