Как создать файл MAP / PED из файла дозировки в PLINK 2.0

#linux #unix

#linux #unix

Вопрос:

Я новичок в исследованиях PLINK и GWAS. Я не уверен, как написать скрипт для преобразования моего информационного файла или данных о дозировке в файл КАРТЫ для исследования ассоциации между генотипом и 1 фенотипом. Итак, первое: у меня есть информационный файл с информацией о дозировке и информацией о SNP, идентификаторе, положении, аллелях 1 и 2 и информации о вменении (см. Ниже)

rs148087467:60523: T: G 60523 T G 0.001 0.161 0.998 0 -1 -1 -1 — 10:60684: A: C 60684 A C 0,029 0,713 0,978 0 -1 -1 -1

Я хочу создать скрипт, но понятия не имею, как преобразовать его в файл карты. Я понимаю, что файл MAP содержит информацию о коде хромосомы, идентификаторе варианта (rs), местоположении / генетическом расстоянии (морганы) и координатах базовой пары (единицы bp).

Я предполагаю, что из этого также будет создан файл ped?

Может кто-нибудь, пожалуйста, помогите мне, как создать скрипт! Я новичок во всем этом, поэтому приношу свои извинения.

Спасибо!

Комментарии:

1. Как непосвященный в PLINK и GWAS изучает сам, что такое файл INFO и MAP? Это просто текстовые файлы / raw, и вам нужен какой-то скрипт для преобразования информации в файл карты? Не могли бы вы сформулировать свой вопрос с фактическим входным файлом и соответствующим фактическим выходным файлом, который вам нужен? (последний, вероятно, является файлом MAP)

2. Входные файлы представляют собой список текстовых файлов от chrom 1 до chrom 23 с именем oncoarray_chr1.txt_info. Внутренняя часть выглядит так: 1:10642: G: A 10642 G A 0.001 0.115 0.999 0 -1 -1 -1 — 1:11008: C: G 11008 C G 0,096 0,299 0,851 0 -1 -1 -1 Вывод — это файлы bim / bed / fam, которые я хочу сгенерировать с помощью PLINK2.0. Файл map / bim имеет формат: код хромосомы, идентификатор варианта, положение в сантиметровых органах, координата базовой пары, код аллеля ALT, код аллеля REF.

3. Идея в том, что я хочу провести исследование ассоциации с данными фенотипа и генотипа.

4. TBH до сих пор не ясно, в чем заключается ваш вопрос и присущая ему проблема. Почему вы отметили это с unix помощью and linux ? Если кто-то не использует то же программное обеспечение и не известен в этой области, мало кто может помочь с этим.

5. В моих исследованиях используется система linux / unix, моя область исследований — генетика.