Поиск референтной аллели для рандомизации по Менделю

#r #gwas

Вопрос:

Я пытаюсь выполнить MR, используя сводную статистику из этого GWAS. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7026164/#MOESM1

К сожалению, сводная статистика в дополнении содержит только аллель A1 и не содержит эталонного аллеля A2 или EAF, и поэтому я не могу согласовать данные с моими данными о результатах.

Я использую пакет MR в R с кодом

 x <- harmonise_data(
  exposure_dat =exposure_dat, 
  outcome_dat = outcome_dat_all, action = 1) 
 

и я получаю ошибку «ошибка в A2[to_swap] :
NAS не допускаются в назначениях по подписке»

Я полагаю, что это связано с тем, что для этого требуется аллель A2 в наборе данных экспозиции. Есть ли в любом случае, что я могу выполнить MR без него? Или, в качестве альтернативы, может ли кто-нибудь подсказать, как я могу быстро найти все эталонные аллели. Существует около 400 SNP, поэтому поиск их по отдельности не был бы идеальным.

Спасибо, я был бы признателен за любую помощь.

Комментарии:

1. Добро пожаловать. Просто напомню, что SO не относится конкретно к биоинформатике, поэтому многие люди не будут знать, что вы имеете в виду, когда говорите «GWAS» или «MR», поэтому лучше либо изложить это по буквам, либо перенести в раздел биоинформатики.

Ответ №1:

Я думаю, что вы можете извлечь A2 из колонки uniqID дополнительную информацию. Если они этого не предоставили EAF , вы потенциально можете использовать данные 1000 геномов для их расчета.