Как получить 100 выборок длиной 1000 для каждой выборки из 5 мер, которые являются AATAA

#r #bioinformatics

#r #биоинформатика

Вопрос:

Я очень новичок в R. Не могли бы вы помочь?

Мне нужно вычислить среднее значение пропорций выборки из 5 мер, которые являются AATAA. Но застрял в получении 100 образцов каждой длины 1000 из выборки, состоящей из 5 мер, которые являются AATAA, из первых 100 000 нуклеотидов NC_006620.3

 install.packages("ape")
library(ape)
library(Biostrings)
dog_ch38 <- read.GenBank("NC_006620.3", as.character = TRUE)
dog_ch38 <- dog_ch38$NC_006620.3[1:100000]
txt <- paste(dog_ch38, collapse = "")
dog_ch38 <- str_to_upper(txt)
dog_ch38
get_DNA_sample <- function(DNA, n){
       N <- str_length(DNA)
       start <- sample(1:(N - n   1), size = 1)
       return(str_sub(DNA, start, start   n - 1))
   }
get_DNA_sample(dog_ch38, 1000)
  

Комментарии:

1. можете ли вы привести пример того, что вы ожидаете. Ваш вопрос не очень понятен

2. значение AATAA выборки длиной 100000 составляет 176 с <- DNAString(dog_ch38) km <- oligonucleotideFrequency(s[1:10^5], 5) km [«AATAA»]> AATAA> 176 Мне нужно 100 образцов длиной 1000 образцов, состоящих из 5 мер, которые являются AATAAдля вычисления среднего и sd

3. пожалуйста, добавьте это в свой вопрос. В вашем текущем коде нет поиска AATAA