pandas.DataFrameの作り方です。
リストやNumpy配列などの既存のデータから作ることが多いとは思いますが、手打ちでサンプルデータを作って見たいと思います。
行単位で作成
行単位でデータを作成します。
列名「area」と列名「word」の2列にデータを入れていきます。
全体のリストの中に、行単位でリストを作成します。
import pandas as pd
df_city = pd.DataFrame([['Tokyo', 5], ['Nagoya', 6], ['Oosaka', 6]],
columns=['area', 'word'])
df_city
area word
0 Tokyo 5
1 Nagoya 6
2 Oosaka 6
列単位で作成
列単位でデータを作成します。
辞書表記で、’列名’: リスト。
import pandas as pd
pd.DataFrame({'area': ['Tokyo', 'Nagoya', 'Oosaka'],
'word': [5, 6, 6]})
area word
0 Tokyo 5
1 Nagoya 6
2 Oosaka 6
pandas.SeriesやNumpy配列からデータフレームを作成するときも同じです。
pandas.Seriesを作成します。
import pandas as pd
s_area = pd.Series(['Tokyo', 'Nagoya', 'Oosaka'])
s_area
0 Tokyo
1 Nagoya
2 Oosaka
dtype: object
numpy配列を作成します。
import numpy as np
n_word = np.array([5, 6, 6])
n_word
array([5, 6, 6])
pandas.SeriesとNumpy配列からデータフレームを作成します。
pd.DataFrame({'area': s_area,
'word': n_word})
area word
0 Tokyo 5
1 Nagoya 6
2 Oosaka 6
まとめ
- pandas.DataFrameを「行単位」と「列単位」で作成できた。
データに列名を付けて管理するには、pandas.DataFrameは強力なツールです。
pandas.DataFrameのデータ構造は、行と列がある2次元をしています。
縦に行を積み上げる感覚と、横に列を並べていく感覚をつかんでいきましょう。