#python #json #pandas #matplotlib
#python #json #pandas #matplotlib
Вопрос:
Я проанализировал данные form .json, чем построил их, но мне нужен только определенный диапазон,
например, year-mounth = 2014-12to 2020-03 КОД
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_json("observed-solar-cycle-indices.json", orient='records')
data = pd.DataFrame(data)
print(data)
x = data['time-tag']
y = data['ssn']
plt.plot(x, y, 'o')
plt.xlabel('Year-day'), plt.ylabel('SSN')
plt.show()
Вот результат, как вы можете видеть, его слишком много
вот файл json: https://services.swpc.noaa.gov/json/solar-cycle/observed-solar-cycle-indices.json Как либо разобрать определенное значение из файла JSON, либо построить определенный диапазон?
Комментарии:
1. Что вы подразумеваете под «например, year-date = с 2014-314 по 2020-083», не должен ли год быть максимальным до 2014-012, если формат Год-месяцы?
2. Извините, формат Год-день
3. Вы уверены? Я загрузил ваш файл json, на который вы ссылались. Проверяя
data['time-tag']
, я вижу годы, идущие от гггг-01 до гггг-12. Вы можете проверить это, используяdata[data['time-tag'].str.contains('1900')]
заполнение для 1900 любого года, который вам нравится.4. Привет, Джирапат, ответ работает для вас?
5. извините, вы были правы в течение года — месяцев
Ответ №1:
Должно работать следующее:
Выберите данные, используя начальную и конечную дату
ndata = data[ (data['time-tag'] > '2014-01') amp; (data['time-tag'] < '2020-12')]
Построение данных. Маркировка по оси x адаптирована для отображения только каждой 12-й метки
x = ndata['time-tag']
y = ndata['ssn']
fig, ax = plt.subplots()
plt.plot(x, y, 'o')
every_nth = 12
for n, label in enumerate(ax.xaxis.get_ticklabels()):
if n % every_nth != 0:
label.set_visible(False)
plt.xlabel('Year-Month')
plt.xticks(rotation='vertical')
plt.ylabel('SSN')
plt.show()
Ответ №2:
Вы могли бы выполнить поиск значения индекса ваших начальных и конечных дат как для значений x, так и для значений y. Используйте это для создания меньшего набора списков, которые вы можете отображать.
Например, это может быть что-то вроде
x = data['time-tag']
y = data['ssn']
start_index = x.index('2014-314')
end_index = x.index('2020-083')
x_subsection = x[start_index : end_index]
y_subsection = y[start_index : end_index]
plt.plot(x_subsection, y_subsection, 'o')
plt.xlabel('Year-day'), plt.ylabel('SSN')
plt.show()
Возможно, вам потребуется преобразовать фрейм данных в массив с помощью np.array() .
Комментарии:
1. Я запустил скрипт и получил эту ошибку: x = data [‘time-tag’] Ошибка IndexError: допустимыми индексами являются только целые числа, slices (
:
), ellipsis (...
), numpy.newaxis (None
) и целочисленные или логические массивы.