Вывод определенного диапазона значений с помощью pandas и matplotlib

#python #json #pandas #matplotlib

#python #json #pandas #matplotlib

Вопрос:

Я проанализировал данные form .json, чем построил их, но мне нужен только определенный диапазон,
например, year-mounth = 2014-12to 2020-03 КОД

 import pandas as pd
import matplotlib.pyplot as plt

data = pd.read_json("observed-solar-cycle-indices.json", orient='records')
data = pd.DataFrame(data)

print(data)

x = data['time-tag']
y = data['ssn']

plt.plot(x, y, 'o')
plt.xlabel('Year-day'), plt.ylabel('SSN')
plt.show()

 

Вот результат, как вы можете видеть, его слишком много
1

вот файл json: https://services.swpc.noaa.gov/json/solar-cycle/observed-solar-cycle-indices.json Как либо разобрать определенное значение из файла JSON, либо построить определенный диапазон?

Комментарии:

1. Что вы подразумеваете под «например, year-date = с 2014-314 по 2020-083», не должен ли год быть максимальным до 2014-012, если формат Год-месяцы?

2. Извините, формат Год-день

3. Вы уверены? Я загрузил ваш файл json, на который вы ссылались. Проверяя data['time-tag'] , я вижу годы, идущие от гггг-01 до гггг-12. Вы можете проверить это, используя data[data['time-tag'].str.contains('1900')] заполнение для 1900 любого года, который вам нравится.

4. Привет, Джирапат, ответ работает для вас?

5. извините, вы были правы в течение года — месяцев

Ответ №1:

Должно работать следующее:

Выберите данные, используя начальную и конечную дату

 ndata = data[ (data['time-tag'] > '2014-01') amp; (data['time-tag'] < '2020-12')] 
 

Построение данных. Маркировка по оси x адаптирована для отображения только каждой 12-й метки

 x = ndata['time-tag']
y = ndata['ssn']

fig, ax = plt.subplots()

plt.plot(x, y, 'o')

every_nth = 12
for n, label in enumerate(ax.xaxis.get_ticklabels()):
    if n % every_nth != 0:
        label.set_visible(False)

plt.xlabel('Year-Month') 
plt.xticks(rotation='vertical')
plt.ylabel('SSN')
plt.show()
 

введите описание изображения здесь

Ответ №2:

Вы могли бы выполнить поиск значения индекса ваших начальных и конечных дат как для значений x, так и для значений y. Используйте это для создания меньшего набора списков, которые вы можете отображать.

Например, это может быть что-то вроде

 x = data['time-tag']
y = data['ssn']

start_index = x.index('2014-314')
end_index = x.index('2020-083')

x_subsection = x[start_index : end_index]
y_subsection = y[start_index : end_index]

plt.plot(x_subsection, y_subsection, 'o')
plt.xlabel('Year-day'), plt.ylabel('SSN')
plt.show()
 

Возможно, вам потребуется преобразовать фрейм данных в массив с помощью np.array() .

Комментарии:

1. Я запустил скрипт и получил эту ошибку: x = data [‘time-tag’] Ошибка IndexError: допустимыми индексами являются только целые числа, slices ( : ), ellipsis ( ... ), numpy.newaxis ( None ) и целочисленные или логические массивы.