【Python入門】pandas.DataFrameを作る2つの方法

sample data numpy

pandas.DataFrameの作り方です。
リストやNumpy配列などの既存のデータから作ることが多いとは思いますが、手打ちでサンプルデータを作って見たいと思います。

行単位で作成

行単位でデータを作成します。

列名「area」と列名「word」の2列にデータを入れていきます。
全体のリストの中に、行単位でリストを作成します。

import pandas as pd
df_city = pd.DataFrame([['Tokyo', 5], ['Nagoya', 6], ['Oosaka', 6]],
                        columns=['area', 'word'])
df_city
        area	word
0	Tokyo	5
1	Nagoya	6
2	Oosaka	6

列単位で作成

列単位でデータを作成します。

辞書表記で、’列名’: リスト。

import pandas as pd
pd.DataFrame({'area': ['Tokyo', 'Nagoya', 'Oosaka'],
              'word': [5, 6, 6]})
        area	word
0	Tokyo	5
1	Nagoya	6
2	Oosaka	6


pandas.SeriesやNumpy配列からデータフレームを作成するときも同じです。

pandas.Seriesを作成します。

import pandas as pd
s_area = pd.Series(['Tokyo', 'Nagoya', 'Oosaka'])
s_area
0     Tokyo
1    Nagoya
2    Oosaka
dtype: object


numpy配列を作成します。

import numpy as np
n_word = np.array([5, 6, 6])
n_word
array([5, 6, 6])


pandas.SeriesとNumpy配列からデータフレームを作成します。

pd.DataFrame({'area': s_area,
              'word': n_word})
        area	word
0	Tokyo	5
1	Nagoya	6
2	Oosaka	6

まとめ

  • pandas.DataFrameを「行単位」と「列単位」で作成できた。

データに列名を付けて管理するには、pandas.DataFrameは強力なツールです。
pandas.DataFrameのデータ構造は、行と列がある2次元をしています。
縦に行を積み上げる感覚と、横に列を並べていく感覚をつかんでいきましょう。

関連情報

タイトルとURLをコピーしました