Проблемы при рисовании точечной диаграммы

#python #matplotlib

#python #matplotlib

Вопрос:

Я использую matplotlib.pyplot.scatter для рисования некоторой простой точечной диаграммы. Однако появляется что-то неправильное, и я не могу найти решение. Вот код для рисования этой точечной диаграммы:

  # xActA, yActA, xActQ, yActQ are all lists with same dimensions.
ax1 = scatter(xActA, yActA, color = 'blue',s = 20, label = 'Answers', linestyle = 'o')
ax2 = scatter(xActQ, yActQ, color = 'black', s = 20, label = 'Questions', linestyle = 'o')
ax1.set_label('Answers')
ax2.set_label('Questions')
xscale('log')
yscale('log')
title('User activity')
xlabel('Number of posts')
ylabel('Number of users')
legend()
f1.show()
f1.savefig('figure7_test.png')
  

И ошибки нет, но график не содержит точек.

введите описание изображения здесь

Вот данные:

 xActA = [0, 1, 2, 3, 4, 5, 6, 129, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17,
             18, 147, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,
             35, 36, 39, 40, 7, 45, 46, 49, 50, 52, 53, 183, 59, 63, 65, 69,
             70, 72, 73, 55, 77, 78, 84, 85, 43, 215, 88, 100, 94, 131, 167,
             19, 375, 122, 125, 149]

  len(xActA) = 70

  yActA = [1212, 822, 194, 94, 61, 44, 24, 1, 26, 20, 11, 16, 10, 8, 5, 8,
             5, 5, 3, 1, 4, 4, 5, 3, 2, 3, 4, 3, 1, 2, 2, 3, 2, 1, 2, 2, 2, 2,
             31, 2, 1, 1, 2, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
             1, 1, 1, 2, 1, 1, 2, 1, 1, 1, 1]

  len(yActA) = 70

  xActQ [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23,    24, 25, 29, 36, 40, 45, 48, 50, 55, 67, 124]
  len(xActQ) = 34

  yActQ [204, 242, 150, 50, 49, 27, 5, 9, 4, 2, 6, 3, 2, 8, 4, 5, 1, 3, 3, 1, 3, 2, 2, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
  len(yActQ) = 24
  

И вторая ошибка возникает при использовании другого набора данных. Я проверяю данные … Извините за предыдущее неясное описание.

Комментарии:

1. Для второй проблемы (той, которая приводит к setting an array element with a sequence ) поможет, если вы отредактируете вопрос, чтобы показать, что представляет собой содержимое — или некоторое подмножество содержимого — xRa и yRa .

2. Почему вы используете scatter для этого? Scatter предназначен для отображения 3 или 4-мерных данных в 2 измерениях (путем изменения цвета и / или размера). Вам просто нужно plot . Кроме этого, похоже, что вы пропускаете значительную часть кода для создания рисунка, который вы показываете на своем изображении. Имеющийся у вас фрагмент кода работает (кроме linestyle='o' части, как уже указал @David). Вы опускаете ту часть вашего кода, которая вызывает вашу проблему.

3. Спасибо вам за вашу точку зрения. На самом деле я осознаю сюжет, который я видел, и я просто предполагаю, что он использует scatter. И да, вы правы, график может отображаться точно так же после того, как я попробовал, поскольку в легенде отображаются две точки вместо трех при использовании scatter. Тем не менее, мне все еще любопытно, почему на моем точечном графике ничего нет…

4. Мнение: Я предлагаю для будущих вопросов сохранить исходный вопрос «нетронутым» и задавать новые вопросы, которые у вас есть в новых вопросах SO. Этот вопрос прошел по крайней мере три основных этапа в течение своей жизни, и текущий вопрос слишком мало похож на оригинал. Результатом этого является то, что мой ответ и несколько комментариев кажутся второстепенными (или даже отвлекающими) в контексте текущего вопроса, что дезориентирует новых пользователей, прибывающих для просмотра этого вопроса.

Ответ №1:

Проблема в linestyle='o' . 'o' Директива — это marker , а не a linestyle , поэтому замените linestyle на marker в первых двух строках кода.

Вы можете увидеть полный список маркеров для scatter здесь.

Комментарии:

1. Спасибо за ваш ответ. Я попробовал, и он просто снова возвращается ко второй ошибке. Я опубликовал содержимое xRa и yRa. Не могли бы вы помочь мне найти ошибку? 🙂

2. @AnneS Используя данные, которые вы добавили в вопрос, я не могу воспроизвести исключение, которое вы получаете для второй части вопроса. Вызов scatter в вашем вопросе проходит мимо xRa и yRa , но вы отредактировали его, включив xActA и yActA . Являются ли эти два набора переменных одинаковыми?

3. Прошу прощения, я использую разные имена. Да, эти два набора переменных одинаковы.

4. Я обновляю вопрос… Прошу прощения за неясное утверждение. Не могли бы вы выяснить, почему на моем рисунке нет реального графика?

5. @AnneS Похоже, что regeirk решил эту проблему.

Ответ №2:

Если вы присмотритесь к своим данным повнимательнее, то заметите, что большинство ваших точек данных выходят за пределы области построения (x = [1e2:1e3]; y = [1e2:1e4]). Если вы используете линейный масштаб вместо логарифмического, вы увидите некоторые точки рассеяния, однако, не очень читаемым образом. Но если вы измените масштаб на ‘symlog’, а затем установите пределы x и y, используя ‘xlim’ и ‘ylim’, все готово. Конечно, вы должны убедиться, что маркер установлен в ‘o’ при запуске ‘scatter’. Проверьте полный код.

 from pylab import *

# The data
xActA = array([0, 1, 2, 3, 4, 5, 6, 129, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 
    18, 147, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 
    39, 40, 7, 45, 46, 49, 50, 52, 53, 183, 59, 63, 65, 69, 70, 72, 73, 55, 77,
    78, 84, 85, 43, 215, 88, 100, 94, 131, 167, 19, 375, 122, 125, 149])
yActA = array([1212, 822, 194, 94, 61, 44, 24, 1, 26, 20, 11, 16, 10, 8, 5, 8, 
    5, 5, 3, 1, 4, 4, 5, 3, 2, 3, 4, 3, 1, 2, 2, 3, 2, 1, 2, 2, 2, 2, 31, 2, 1,
    1, 2, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 2,
    1, 1, 1, 1])

xActQ = array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 16, 17, 18, 
    19, 20, 21, 22, 23, 24, 25, 29, 36, 40, 45, 48, 50, 55, 67, 124])
yActQ = array([204, 242, 150, 50, 49, 27, 5, 9, 4, 2, 6, 3, 2, 8, 4, 5, 1, 3, 
    3, 1, 3, 2, 2, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1])

# The plots
close('all')
f1 = figure()
ax1 = scatter(xActA, yActA, color='blue', s=20, label='Answers', marker='o')
ax2 = scatter(xActQ, yActQ, color='black', s=20, label='Questions', marker='o')
xscale('symlog')
yscale('symlog')
xlim([0, 1e3])
ylim([0, 1.5e3])
title('User activity')
xlabel('Number of posts')
ylabel('Number of users')
legend()
f1.show()
f1.savefig('figure7_test.png')
  

И эти несколько строк кода дают вам этот аккуратный рисунок: Результаты
(источник: nublia.com)