この短いガイドでは、Pandas DataFrame を作成する 2 つの異なる方法について説明します。

  • Python自体に値を入力してDataFrameを作成する
  • ファイル(CSVファイルなど)から値をインポートし、インポートした値に基づいてPythonでデータフレームを作成する

方法1: Pythonで値を入力してPandas DataFrameを作成する

Python で Pandas DataFrame を作成するには、次の汎用テンプレートに従います。

import pandas as pd

data = {'first_column':  ['first_value', 'second_value', ...],
        'second_column': ['first_value', 'second_value', ...],
         ....
        }

df = pd.DataFrame(data)

print(df)

数値を引用符で囲む必要はありません (それらの値を文字列として取得する場合を除く)。

次に、簡単な例を使用して上記のテンプレートを適用する方法を見てみましょう。

まず、製品に関する次のデータがあり、Pandas DataFrame を使用して Python でそのデータを取得するとします。

product_nameprice
laptop1200
printer150
tablet300
desk450
chair200

次に、以下のコードを使用して、例の DataFrame を作成します。

import pandas as pd

data = {'product_name': ['laptop', 'printer', 'tablet', 'desk', 'chair'],
        'price': [1200, 150, 300, 450, 200]
        }

df = pd.DataFrame(data)

print(df)

Python でコードを実行すると、次の DataFrame が得られます。

PythonでPandas DataFrameを作成する方法 1

各行は 0 から始まる番号 (インデックスとも呼ばれます) で表されることに注意してください。または、各行を表す別の値/名前を割り当てることもできます。

たとえば、以下のコードでは、index=[‘product_1’, ‘product_2’, ‘product_3’, ‘product_4’, ‘product_5’] が追加されました。

import pandas as pd

data = {'product_name': ['laptop', 'printer', 'tablet', 'desk', 'chair'],
        'price': [1200, 150, 300, 450, 200]
        }

df = pd.DataFrame(data, index=['product_1', 'product_2', 'product_3', 'product_4', 'product_5'])

print(df)

新しく割り当てられたインデックスが表示されます (黄色で強調表示されています)。

PythonでPandas DataFrameを作成する方法 2

次に、値を Python にインポートして DataFrame を作成する 2 番目の方法を確認しましょう。

方法2: CSVファイルから値をインポートしてPandas DataFrameを作成する

DataFrame を作成するには、次のテンプレートを使用して csv ファイルを Python にインポートできます。

import pandas as pd

data = pd.read_csv(r'Path where the CSV file is stored\File name.csv')
df = pd.DataFrame(data)

print(df)

次のデータが CSV ファイルに保存されているとします (CSV ファイル名は「products」です)。

product_nameprice
laptop1200
printer150
tablet300
desk450
chair200

以下の Python コードでは、CSV ファイルがコンピューター上に保存されている場所を反映するようにパス名を変更する必要があります。

たとえば、CSV ファイルが次のパスに保存されているとします。

‘C:\Users\Ron\Desktop\products.csv’

この例の完全な Python コードは次のとおりです。

import pandas as pd

data = pd.read_csv(r'C:\Users\Ron\Desktop\products.csv')
df = pd.DataFrame(data)

print(df)

前と同様に、Python でも同じ Pandas DataFrame を取得できます。

PythonでPandas DataFrameを作成する方法 3

Pandas を使用して Excel ファイルを Python にインポートして、同じ DataFrame を作成することもできます。

DataFrame内の最大値を見つける

DataFrame に値を取得したら、様々な操作を実行できます。例えば、Pandas を使って統計情報を計算するなどです。

たとえば、DataFrame 内のすべての製品の中で最高価格を見つけたいとします。

この例の最大価格を取得するには、Python コードに次の部分を追加する必要があります (そして結果を印刷します)。

max_price = df['price'].max()

完全な Python コードは次のとおりです。

import pandas as pd

data = {'product_name': ['laptop', 'printer', 'tablet', 'desk', 'chair'],
        'price': [1200, 150, 300, 450, 200]
        }

df = pd.DataFrame(data)

max_price = df['price'].max()
print(max_price)

コードを実行すると、1200 という値が得られます。これが実際に最高価格です。

PythonでPandas DataFrameを作成する方法 4