【Pandas】 DataFrame と Series のデータ構造について【Python】
今回は、Python でデータ分析を行っていると必ず使う Pandas の DataFrame と Series について、データの構造や違いについて調べてみました。
Contents
DataFrame
DataFrame は、行とカラムから構成されているデータであり、
- インデックス(index)
- カラム(columns)
- データ(value)
の3つの要素から成り立っています。
read_csv 関数を使って、映画データの CSVファイル を読み込んで、3つの要素について確認します。
|
1 2 |
movie = pd.read_csv('data/movie.csv') movie.head() |

「0」「1」がインデックス(index)、「color」や「director_name」がカラム(columns)と呼ばれます。
インデックスやカラムは軸(axis)といいます。
read_csv 関数では、デフォルトで index が数値で割り振られ、columns がCSVファイルの1行目の値になります。
DataFrame は各カラムごとにデータ型が異なります。
dtypes 関数で確認できます。
|
1 |
movie.dtypes |
index は DataFrame のものがそのまま残ります。「Name:」部分で Series の名前、「Length:」部分でデータの個数、「dtype:」部分でデータ型(今回は文字列なので
object)を表しています。
こちらも type 関数で Series 型かを確認します。
|
1 2 |
director = movie['director_name'] type(director) |
|
1 |
pandas.core.series.Series |
Series 型を DataFrame 型に戻したいときは、to_frame 関数を使います。
|
1 |
director.to_frame() |
DataFrame に変換されました。このとき、カラム名には Series名が入ります。

参考書籍
関連記事
-
-
【Python】API を使って YouTube から動画情報を収集する方法。
API を使って YouTube から動画情報を収集してみたときのメモです。 OS は Lin
-
-
【Python】Windows で ライブラリ(NumPy) をインストールする方法。
Windows の Python(2.X系)で NumPy をインストールしようと思ったら、そもそも
-
-
【Python】Beautiful Soup を使ってスクレイピングする方法。
Beautiful Soup は、シンプルでわかりやすい API でデータを抜き出せる Python
-
-
【Pandas】 DataFrame で2行の列ごとの差を計算する方法【Python】
今回は、Pandas の DataFrame で、2行間の列ごとの値の差を計算し、その結果を Dat
-
-
【Google Colaboratory】クラウド上でPythonを使って機械学習を行う。
Python をブラウザ上で実行して、手軽に機械学習ができる環境「Google Colaborato
-
-
【Spyder】引数のあるスクリプトを実行する方法。
Python の統合開発環境(IDE)である Spyder では、簡単にスクリプトを実行できます。
-
-
【Python】漢字を分解するライブラリを使ってみた【部首分解】
Python で漢字を部首やさらに細かい部分に分解してくれるライブラリがあったので使ってみました。
-
-
【Python】時系列データ(為替データ)をグラフ表示してみた。
今回は、pandas・matplotlib ライブラリを使って、時系列データ(為替データ)をグラフ表
-
-
【Python】pip3 で「cannot import name ‘main’」エラーが出たときの対処法。
Python でライブラリをインストールする際に、pipを使います。 Python2 と Py
-
-
【Atom エディタ】Python で Matplotlib のグラフを Atom 上に表示させる方法。
Atom エディタで Python の Matplotlib ライブラリを使って、Atom 上にグラ



















