#r #bioinformatics
#r #биоинформатика
Вопрос:
Я очень новичок в R. Не могли бы вы помочь?
Мне нужно вычислить среднее значение пропорций выборки из 5 мер, которые являются AATAA. Но застрял в получении 100 образцов каждой длины 1000 из выборки, состоящей из 5 мер, которые являются AATAA, из первых 100 000 нуклеотидов NC_006620.3
install.packages("ape")
library(ape)
library(Biostrings)
dog_ch38 <- read.GenBank("NC_006620.3", as.character = TRUE)
dog_ch38 <- dog_ch38$NC_006620.3[1:100000]
txt <- paste(dog_ch38, collapse = "")
dog_ch38 <- str_to_upper(txt)
dog_ch38
get_DNA_sample <- function(DNA, n){
N <- str_length(DNA)
start <- sample(1:(N - n 1), size = 1)
return(str_sub(DNA, start, start n - 1))
}
get_DNA_sample(dog_ch38, 1000)
Комментарии:
1. можете ли вы привести пример того, что вы ожидаете. Ваш вопрос не очень понятен
2. значение AATAA выборки длиной 100000 составляет 176 с <- DNAString(dog_ch38) km <- oligonucleotideFrequency(s[1:10^5], 5) km [«AATAA»]> AATAA> 176 Мне нужно 100 образцов длиной 1000 образцов, состоящих из 5 мер, которые являются AATAAдля вычисления среднего и sd
3. пожалуйста, добавьте это в свой вопрос. В вашем текущем коде нет поиска AATAA