Создание диаграммы рассеяния из двух файлов dna fasta в Python

#python #numpy #matplotlib #plot #biopython

#python #numpy #matplotlib #график #biopython

Вопрос:

в настоящее время я пытаюсь создать диаграмму из двух файлов ДНК fasta. к сожалению, я еще не настолько хорошо знаком с python, поэтому, вероятно, здесь я потерплю неудачу и надеюсь на вашу помощь. Я использую Pyhton 3.8 с Biopython, Matplotlib и numpy.

Я пытаюсь преобразовать данные ДНК в числа, чтобы я мог их построить. В то же время я могу прочитать файл fasta в своем коде, но не построить его

Я не могу продвинуться дальше при преобразовании днк в число, понятное для графика, или есть другой способ?

Пока это мой код

 from Bio import pairwise2  
from Bio.pairwise2 import format_alignment
from test3 import seq1 as fasta1 #seq1 unzipped fasta file
from test3 import seq2 as fasta2 #seq2 
from matplotlib import pyplot as plt
import numpy


alignment = pairwise2.align.globalxx(fasta1, fasta2)
print(alignment)
print(format_alignment(*alignment[0]))


plt.scatter(alignment,'skitscat', 'k')
plt.xlabel('fasta1')
plt.ylabel('fasta2')
plt.title('Eins Diagram')
plt.legend()
plt.plot(alignment[0])
plt.show()
  

в предварительном просмотре вы можете увидеть, как это должно выглядеть законченным.

Предварительный просмотр

спасибо за вашу помощь

Комментарии:

1. Здравствуйте и добро пожаловать в StackOverflow. Чтобы помочь другим ответить на ваш вопрос, попробуйте описать, какие попытки вы предприняли до сих пор, что работает в коде, а что нет, и задайте конкретные вопросы о найденных проблемах.

2. я пытаюсь преобразовать данные ДНК в числа, чтобы я мог их построить. в то же время я могу прочитать файл fasta в своем коде, но не построить его

3. можем ли мы получить входные файлы для тестирования вашего кода?