Проблема построения графика python для большого количества данных

#python #python-3.x #matplotlib #plot

#python #python-3.x #matplotlib #график

Вопрос:

Я новичок в python и пытаюсь построить диаграмму величины цвета (CMD) для выбранного кластера с помощью matplotlib, мне нужно отобразить 3400000 звезд, данные для каждой звезды будут иметь цвет по оси x и величину по оси y, однако мой код должен читать два столбца вфайл csv и график. Проблема в том, что когда я использую часть данных (3000 звезд), я могу успешно построить CMD, но когда я использую все данные, график получается очень беспорядочным (см. Рисунок Ниже), и кажется, что точки отображаются по их позициям в столбце, а не по его значению. Например, точка с данными (0.92,20.64) должна быть близка к оси y, но на самом деле расположена в крайнем правом углу графика только потому, что она размещена в последних нескольких столбцах набора данных. Итак, я хочу знать, как я могу построить весь набор данных и показать график, подобный первому рисунку.Спасибо за ваше время. Это мои коды:

 import matplotlib.pyplot as plt
import pandas as pd
import csv

data = pd.read_csv(r'C:UsersPeterDesktopF275W test.csv', low_memory=False)

# Generate some test data
x = data['F275W-F336W']
y = data['F275W']

#remove the axis
plt.axis('off')
plt.plot(x,y, ',')
plt.show()
  

Это график, который я получил за 3000 звезд, это CMD
Это график, который я получил для всего набора данных, что очень беспорядочно

Комментарии:

1. Не выводите все свои данные. Но проведите некоторый анализ и получите некоторые репрезентативные данные (меньшего размера) для визуализации.

2. Например, выберите и постройте только звезды с величиной> 7.

3. Образец из ваших данных представляет собой, и только образец графика.

4. Спасибо за ваш совет, но я думаю, что мне нужно отобразить не все из них, а большинство из них, я постараюсь установить определенный диапазон для звезд, которые я хочу отобразить, но знаете ли вы, что вызвало эту странную ошибку?