Pandas を使用して相関行列を作成するには:

df.corr()


相関行列を作成する手順

ステップ1: データを収集する

まず、相関行列のデータを収集します。

たとえば、次の 3 つの変数を含むデータセットがあります。

ABC
453810
373115
422617
352821
393312

ステップ2: Pandasを使ってデータフレームを作成する

次に、上記のデータセットを Python でキャプチャするための DataFrame を作成します。

import pandas as pd

data = {'A': [45, 37, 42, 35, 39],
        'B': [38, 31, 26, 28, 33],
        'C': [10, 15, 17, 21, 12]
        }

df = pd.DataFrame(data)

print(df)

コードを実行すると、次の DataFrame が取得されます。

Pandasを使って相関行列を作成する方法 1

ステップ3: Pandasを使用して相関行列を作成する

次に、このテンプレートを使用して相関行列を作成します。

df.corr()

完全なコード:

import pandas as pd

data = {'A': [45, 37, 42, 35, 39],
        'B': [38, 31, 26, 28, 33],
        'C': [10, 15, 17, 21, 12]
        }

df = pd.DataFrame(data)

corr_matrix = df.corr()

print(corr_matrix)

Python でコードを実行すると、次の行列が得られます。

Pandasを使って相関行列を作成する方法 2

ステップ4(オプション):SeabornとMatplotlibを使用して相関行列の視覚的表現を取得する

相関行列を視覚的に表現するには、seaborn および matplotlib パッケージを使用できます。

まず、seaborn および matplotlib パッケージをインポートします。

import seaborn as sn

import matplotlib.pyplot as plt

次に、コードの末尾に次の構文を追加します。

sn.heatmap(corr_matrix, annot=True)
plt.show()

したがって、完全な Python コードは次のようになります。

import pandas as pd
import seaborn as sn
import matplotlib.pyplot as plt

data = {'A': [45, 37, 42, 35, 39],
        'B': [38, 31, 26, 28, 33],
        'C': [10, 15, 17, 21, 12]
        }

df = pd.DataFrame(data)

corr_matrix = df.corr()

sn.heatmap(corr_matrix, annot=True)
plt.show()
Pandasを使って相関行列を作成する方法 3

Python を使って「Covariance Matrix」を作成する方法この短いガイドでは、Python を使用してCovariance Matrixを作成する方法を説明します。

Covariance Matrixを作成する手順

ステップ1: データを収集する

まず、Covariance Matrixに使用するデータを収集する必要があります。

デモンストレーションのために、3 つの変数に関する次のデータを使用しましょう。

ABC
453810
373115
422617
352821
393312

ステップ2: Pythonを使用して母Covariance Matrixを取得する

Covariance Matrix (N に基づく) を取得するには、以下のコードでバイアスを True に設定する必要があります。

これは、Numpy パッケージを使用して母集団Covariance Matrixを導出する完全な Python コードです。

import numpy as np

A = [45, 37, 42, 35, 39]
B = [38, 31, 26, 28, 33]
C = [10, 15, 17, 21, 12]

data = np.array([A, B, C])

cov_matrix = np.cov(data, bias=True)

print(cov_matrix)

コードを実行すると、次の行列が得られます。

Pandasを使って相関行列を作成する方法 4

ステップ3: マトリックスの視覚的表現を取得する

Covariance Matrixを視覚的に表現するには、seaborn および matplotlib パッケージを使用できます。

Python で適用できる完全なコードは次のとおりです。

import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt

A = [45, 37, 42, 35, 39]
B = [38, 31, 26, 28, 33]
C = [10, 15, 17, 21, 12]

data = np.array([A, B, C])

cov_matrix = np.cov(data, bias=True)
sn.heatmap(cov_matrix, annot=True, fmt='g')
plt.show()

標本Covariance Matrixを導出する

サンプル共分散 (N-1 に基づく) を取得するには、以下のコードでバイアスを False に設定する必要があります。

以下は NumPy パッケージに基づくコードです。

import numpy as np

A = [45, 37, 42, 35, 39]
B = [38, 31, 26, 28, 33]
C = [10, 15, 17, 21, 12]

data = np.array([A, B, C])

cov_matrix = np.cov(data, bias=False)

print(cov_matrix)

そして、得られるマトリックスは次のようになります。

Pandasを使って相関行列を作成する方法 5

サンプルCovariance Matrixを取得するために、Pandas パッケージを使用することもできます。

次に、Pandas を使用して次のコードを適用します。

import pandas as pd

data = {'A': [45, 37, 42, 35, 39],
        'B': [38, 31, 26, 28, 33],
        'C': [10, 15, 17, 21, 12]
        }

df = pd.DataFrame(data)

cov_matrix = pd.DataFrame.cov(df)

print(cov_matrix)

NumPy によって導出されたものと同じ行列が得られます。

Pandasを使って相関行列を作成する方法 6

最後に、seaborn および matplotlib パッケージを使用してCovariance Matrixを視覚的に表現できます。

import pandas as pd
import seaborn as sn
import matplotlib.pyplot as plt

data = {'A': [45, 37, 42, 35, 39],
        'B': [38, 31, 26, 28, 33],
        'C': [10, 15, 17, 21, 12]
        }

df = pd.DataFrame(data)

cov_matrix = pd.DataFrame.cov(df)
sn.heatmap(cov_matrix, annot=True, fmt='g')
plt.show()
Pandasを使って相関行列を作成する方法 7