#python #numpy #covariance #numpy-einsum
#python #numpy #ковариация #numpy-einsum
Вопрос:
Моя цель состоит в том, чтобы вычислить ковариационную матрицу набора данных , используя numpy.einsum
. Возьмем, к примеру,
example_data = np.array([0.2, 0.3], [0.1, 0.2]])
Ниже приведен код, который я попробовал:
import numpy as np
d = example_data[0].shape[1]
mu = np.mean(example_data, axis=0)
data = np.reshape(example_data,(len(example_data),d,1))
mu = np.tile(mu,len(example_data))
mu = np.reshape(mu,(len(example_data),d,1))
d_to_mean = data-mu
covariance_matrix = np.einsum('ijk,kji->ij', d_to_mean, np.transpose(d_to_mean))
#I don't know how to set the subscripts correctly
Любые предложения, как сделать этот подход выполнимым, приветствуются!
Ответ №1:
На основе определения ковариационной матрицы задача может быть решена довольно легко с помощью
tmp = np.random.rand(5,3) # 5 corresponds to 5 observations, 3 corresponds to 3 variables
tmp_mean = np.mean(tmp,axis=0)[:,None]
tmp_centered = tmp.T - tmp_mean
cov = (tmp_centered @ tmp_centered.T) / (5-1)
Если вам einsum
все равно нужно
cov_ein = np.einsum('ij,jk->ik',tmp_centered,tmp_centered.T) / (5-1)
Комментарии:
1. Что это
(5-1)
/ откуда это происходит?2. @Pazu Вам нужно разделить
(n-1)
наn
количество наблюдений, чтобы вычислить математическое ожидание матрицы.