Dataframeを作る際には、既存のストレージからデータセットをロードして作成されます。
ストレージにはSQLデータベース、CSVファイル、Excelファイルなどがあります。
Pandas DataFrameは、リスト、辞書、辞書のリストから作成することができます。
データフレームは2次元のデータ構造であり、データは表形式で行と列に並べられます。
データフレームでは、データセットが行と列に並んでおり、1つのデータフレームに任意の数のデータセットを格納することができます。
これらのデータセットに対して、算術演算、列/行選択、列/行加算など多くの演算を行うことができます。
Pandasのデータフレームは様々な方法で作成することができます。
ここでは、データフレームを作成する様々な方法について一つずつ説明します。
空のデータフレーム作成
空のDataframeの作成について説明します。
空のDataframeは、DataFrameコンストラクタを呼び出すだけで作成することができます。
import pandas as pd
# DataFrameのコンストラクタを呼び出す
df = pd.DataFrame()
print(df)
"""
Empty DataFrame
Columns: []
Index: []
"""
リストを使ったデータフレーム作成
ここでは、リストを使ったデータフレームを作成する
DataFrameは、1つのリスト、または複数のリストを使って作成することができます。
import pandas as pd
# リストの一例
lst = ['I', 'like', 'sushi']
# リストからDataframeの作成
df = pd.DataFrame(lst)
print(df)
"""
0
0 I
1 like
2 sushi
"""
ndarray/listsのdictからDataFrame作成
ndarray/listのdictからDataFrameを作成するには、すべてのnarrayが同じ長さである必要があります。
インデックスが渡された場合、長さインデックスは配列の長さと同じでなければなりません。
インデックスが渡されない場合、デフォルトでは、インデックスは、nが配列の長さであるrange(n)になります。
import pandas as pd
# リストデータの初期化
data = {'Name': ['Alice', 'Brawn', 'Chris', 'Elan'], 'Age': [19, 25, 22, 31]}
# Dataframeの作成
df = pd.DataFrame(data)
print(df)
"""
Name Age
0 Alice 20
1 Brawn 21
2 Chris 19
3 Elan 18
"""
辞書を使ったリストからpandasのデータフレーム作成
辞書を使ったリストからの pandas データフレームの作成は、様々な方法で実現することができます。
pandas.DataFrameを使って、辞書を使ったリストからpandasのデータフレームを作成することができます。
リストの辞書をデータフレームに変換する方法を説明します。
import pandas as pd
# リストの辞書
dict = {'name': ["Alice", "Brawn", "Chris", "Elan"],
'degree': ["MBA", "Education", "Arts", "Social"],
'score': [80, 60, 90, 60]}
df = pd.DataFrame(dict)
print(df)
"""
name degree score
0 Alice MBA 80
1 Brawn Education 60
2 Chris Arts 90
3 Elan Social 60
"""