#python #pandas #visualization #correlation
#python #pandas #визуализация #корреляция
Вопрос:
У меня более 300 столбцов данных. Я не могу визуализировать корреляционную матрицу. Есть ли какой-либо способ решения таких проблем?
Примечание: все столбцы содержат непрерывные данные.
Ниже приведен код, который я использую в настоящее время.
corr = fan2.corr()
plt.figure(figsize=(10,8))
sns.heatmap(corr[(corr >= 0.5) | (corr <= -0.4)],
cmap='viridis', vmax=1.0, vmin=-1.0, linewidths=0.1,
annot=True, annot_kws={"size": 8}, square=True);
Комментарии:
1. Если ваши данные содержат смесь непрерывных и категориальных функций, попробуйте визуализировать их отдельно.
Ответ №1:
Как насчет того, чтобы написать это так:
corr = fan2.corr()
fig, ax = plt.subplots(figsize=(20,20))
sns.heatmap(corr[(corr >= 0.5) | (corr <= -0.4)],
cmap='viridis', vmax=1.0, vmin=-1.0, linewidths=0.1,
annot=True, annot_kws={"size": 8}, square=True,ax=ax);