Pandas を使用して相関行列を作成するには:
df.corr()
相関行列を作成する手順
ステップ1: データを収集する
まず、相関行列のデータを収集します。
たとえば、次の 3 つの変数を含むデータセットがあります。
A | B | C |
45 | 38 | 10 |
37 | 31 | 15 |
42 | 26 | 17 |
35 | 28 | 21 |
39 | 33 | 12 |
ステップ2: Pandasを使ってデータフレームを作成する
次に、上記のデータセットを Python でキャプチャするための DataFrame を作成します。
import pandas as pd
data = {'A': [45, 37, 42, 35, 39],
'B': [38, 31, 26, 28, 33],
'C': [10, 15, 17, 21, 12]
}
df = pd.DataFrame(data)
print(df)
コードを実行すると、次の DataFrame が取得されます。

ステップ3: Pandasを使用して相関行列を作成する
次に、このテンプレートを使用して相関行列を作成します。
df.corr()
完全なコード:
import pandas as pd
data = {'A': [45, 37, 42, 35, 39],
'B': [38, 31, 26, 28, 33],
'C': [10, 15, 17, 21, 12]
}
df = pd.DataFrame(data)
corr_matrix = df.corr()
print(corr_matrix)
Python でコードを実行すると、次の行列が得られます。

ステップ4(オプション):SeabornとMatplotlibを使用して相関行列の視覚的表現を取得する
相関行列を視覚的に表現するには、seaborn および matplotlib パッケージを使用できます。
まず、seaborn および matplotlib パッケージをインポートします。
import seaborn as sn
import matplotlib.pyplot as plt
次に、コードの末尾に次の構文を追加します。
sn.heatmap(corr_matrix, annot=True)
plt.show()
したがって、完全な Python コードは次のようになります。
import pandas as pd
import seaborn as sn
import matplotlib.pyplot as plt
data = {'A': [45, 37, 42, 35, 39],
'B': [38, 31, 26, 28, 33],
'C': [10, 15, 17, 21, 12]
}
df = pd.DataFrame(data)
corr_matrix = df.corr()
sn.heatmap(corr_matrix, annot=True)
plt.show()

Python を使って「Covariance Matrix」を作成する方法この短いガイドでは、Python を使用してCovariance Matrixを作成する方法を説明します。
Covariance Matrixを作成する手順
ステップ1: データを収集する
まず、Covariance Matrixに使用するデータを収集する必要があります。
デモンストレーションのために、3 つの変数に関する次のデータを使用しましょう。
A | B | C |
45 | 38 | 10 |
37 | 31 | 15 |
42 | 26 | 17 |
35 | 28 | 21 |
39 | 33 | 12 |
ステップ2: Pythonを使用して母Covariance Matrixを取得する
母Covariance Matrix (N に基づく) を取得するには、以下のコードでバイアスを True に設定する必要があります。
これは、Numpy パッケージを使用して母集団Covariance Matrixを導出する完全な Python コードです。
import numpy as np
A = [45, 37, 42, 35, 39]
B = [38, 31, 26, 28, 33]
C = [10, 15, 17, 21, 12]
data = np.array([A, B, C])
cov_matrix = np.cov(data, bias=True)
print(cov_matrix)
コードを実行すると、次の行列が得られます。

ステップ3: マトリックスの視覚的表現を取得する
Covariance Matrixを視覚的に表現するには、seaborn および matplotlib パッケージを使用できます。
Python で適用できる完全なコードは次のとおりです。
import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt
A = [45, 37, 42, 35, 39]
B = [38, 31, 26, 28, 33]
C = [10, 15, 17, 21, 12]
data = np.array([A, B, C])
cov_matrix = np.cov(data, bias=True)
sn.heatmap(cov_matrix, annot=True, fmt='g')
plt.show()
標本Covariance Matrixを導出する
サンプル共分散 (N-1 に基づく) を取得するには、以下のコードでバイアスを False に設定する必要があります。
以下は NumPy パッケージに基づくコードです。
import numpy as np
A = [45, 37, 42, 35, 39]
B = [38, 31, 26, 28, 33]
C = [10, 15, 17, 21, 12]
data = np.array([A, B, C])
cov_matrix = np.cov(data, bias=False)
print(cov_matrix)
そして、得られるマトリックスは次のようになります。

サンプルCovariance Matrixを取得するために、Pandas パッケージを使用することもできます。
次に、Pandas を使用して次のコードを適用します。
import pandas as pd
data = {'A': [45, 37, 42, 35, 39],
'B': [38, 31, 26, 28, 33],
'C': [10, 15, 17, 21, 12]
}
df = pd.DataFrame(data)
cov_matrix = pd.DataFrame.cov(df)
print(cov_matrix)
NumPy によって導出されたものと同じ行列が得られます。

最後に、seaborn および matplotlib パッケージを使用してCovariance Matrixを視覚的に表現できます。
import pandas as pd
import seaborn as sn
import matplotlib.pyplot as plt
data = {'A': [45, 37, 42, 35, 39],
'B': [38, 31, 26, 28, 33],
'C': [10, 15, 17, 21, 12]
}
df = pd.DataFrame(data)
cov_matrix = pd.DataFrame.cov(df)
sn.heatmap(cov_matrix, annot=True, fmt='g')
plt.show()
