Разбиение списка на основе ячеек, в которых определен binsize

#python #bioinformatics

#python #биоинформатика

Вопрос:

У меня есть словарь, в котором каждый ключ имеет список значений, где ключами являются номера хромосом, такие как chr1, chr2, а значениями являются позиции мутаций. Значения являются целыми числами, и я должен записать значения в ячейку размером 325. По сути, я выяснил, сколько мутаций находится в области 325 оснований для каждой хромосомы.

ИТАК, код, который я придумал, делает это: для каждого ключа создаются ячейки размером 325, начиная с минимального значения в списке значений до максимального значения. выполните цикл и посмотрите, какая позиция помещается в какую ячейку, и распечатайте их.

Итак, я получаю результаты в виде

 chr8     (55655029, 55655353)    [55655353]
chr8     (55655354, 55655678)    [55655365]
chr8     (5113304, 5113628)      [5113558]
chr8     (5115579, 5115903)      [5115598]
  

Это привело к тому, что первые два значения оказались в разных ячейках, тогда как первые два значения довольно близки и должны быть сгруппированы вместе?

Продолжаю ли я сдвигать ячейки или есть какая-либо разделяющая вещь, которую я могу использовать для позиций, разделив их как список для каждой хромосомы?

Ответ №1:

Вам не нужно «сдвигать ячейки, пока они не подойдут».

Учитывая информацию, которую вы упомянули, вы, предположительно, можете напрямую связаться с!outr с помощью стандартной математической функции по модулю?