Предложения по визуализации матрицы корреляции более 300 переменных в python?

#python #pandas #visualization #correlation

#python #pandas #визуализация #корреляция

Вопрос:

У меня более 300 столбцов данных. Я не могу визуализировать корреляционную матрицу. Есть ли какой-либо способ решения таких проблем?

Примечание: все столбцы содержат непрерывные данные.

Ниже приведен код, который я использую в настоящее время.

 corr = fan2.corr() 
plt.figure(figsize=(10,8))

sns.heatmap(corr[(corr >= 0.5) | (corr <= -0.4)], 
            cmap='viridis', vmax=1.0, vmin=-1.0, linewidths=0.1,
            annot=True, annot_kws={"size": 8}, square=True);
  

Комментарии:

1. Если ваши данные содержат смесь непрерывных и категориальных функций, попробуйте визуализировать их отдельно.

Ответ №1:

Как насчет того, чтобы написать это так:

 corr = fan2.corr() 
fig, ax = plt.subplots(figsize=(20,20))         
sns.heatmap(corr[(corr >= 0.5) | (corr <= -0.4)], 
        cmap='viridis', vmax=1.0, vmin=-1.0, linewidths=0.1,
        annot=True, annot_kws={"size": 8}, square=True,ax=ax);