【Pandas】 DataFrame と Series のデータ構造について【Python】

公開日: : Python , , , , ,

今回は、Python でデータ分析を行っていると必ず使う Pandas の DataFrame と Series について、データの構造や違いについて調べてみました。

Contents

DataFrame

DataFrame は、行とカラムから構成されているデータであり、

  • インデックス(index)
  • カラム(columns)
  • データ(value)

の3つの要素から成り立っています。

read_csv 関数を使って、映画データの CSVファイル を読み込んで、3つの要素について確認します。

「0」「1」がインデックス(index)、「color」や「director_name」がカラム(columns)と呼ばれます。

インデックスやカラムは軸(axis)といいます。

read_csv 関数では、デフォルトで index が数値で割り振られ、columns がCSVファイルの1行目の値になります。

DataFrame は各カラムごとにデータ型が異なります。

dtypes 関数で確認できます。


object は文字列などが入り、int64 は 64ビットの int型、float64 は 64ビットの float型になります。

DataFrame 型かどうかを確認するには、type 関数を使います。

Series

DataFrame から1つのカラム(列)を抽出すると Series になります。

抽出方法はインデックス演算子によるものとドット表記によるものの2種類あります。

以下、どちらでも同じ結果になります。

index は DataFrame のものがそのまま残ります。「Name:」部分で Series の名前、「Length:」部分でデータの個数、「dtype:」部分でデータ型(今回は文字列なので

object)を表しています。

こちらも type 関数で Series 型かを確認します。

Series 型を DataFrame 型に戻したいときは、to_frame 関数を使います。

DataFrame に変換されました。このとき、カラム名には Series名が入ります。

参考書籍

関連記事

【Python】時系列データ(為替データ)をグラフ表示してみた。

今回は、pandas・matplotlib ライブラリを使って、時系列データ(為替データ)をグラフ表

記事を読む

【Pandas】 DataFrame のある列の最大値を含む行のインデックス値を取得する方法。

今回は、Pandas の DataFrame において、ある列で最大値を求めて、その最大値をもつ行に

記事を読む

【matplotlib】 Python でヒストグラムの横軸と棒(ビン)の数を調整する方法。

Python の matplotlib を使ってヒストグラムを描画し、横軸の目盛りと棒(ビン)がそろ

記事を読む

【Python】 複数の辞書型の同じ key を持つ value を計算に用いる方法。

Python で、複数の辞書型を読み込んで、同じキー(key)を持つ数値(value)を計算に使う方

記事を読む

【Python】Windows で ライブラリ(NumPy) をインストールする方法。

Windows の Python(2.X系)で NumPy をインストールしようと思ったら、そもそも

記事を読む

【Pandas】 loc・ilocで1行のみ Series ではなく DataFrame で抽出する方法。

Python の Pandas で DataFrame から loc や iloc を使って行を抽出

記事を読む

【Pandas】 DataFrame のインデックスを置き換える方法【Python】

今回は、Pandas の DataFrame型で、インデックス(index)を分かりやすいものに置き

記事を読む

【Python】pip3 で「cannot import name ‘main’」エラーが出たときの対処法。

Python でライブラリをインストールする際に、pipを使います。 Python2 と Py

記事を読む

【Python】プログレスバーを表示させる【tqdm】

Python でスクリプトの実行時間が長くなると、進捗状況が知りたくなったので、標準出力にどのくらい

記事を読む

【Python】機械学習のために SciPy・Matplotlib・scikit-learn をインストール。

Python で機械学習を行うために、Windows OS の python 2 系にライブラリ「S

記事を読む

無料動画編集ソフト AviUtl で mp4 形式の動画を読み込み・出力する方法【Windows】

今回は、無料動画編集ソフト AviUtl で mp4 形式の動画を読み

【Cubase】イヤホンから音がでないときの対処方法。

Cubase でイヤホンから音がでなくなったときの対処方法のメモです。

【Cubase】特定のトラックを無効にする方法。

今回は、Cubaseで特定のトラックのみを無効にする方法について紹介し

【転移学習】学習済みVGG16 による転移学習を行う方法【PyTorch】

今回は、PyTorch を使って、学習済みのモデル VGG16 を用い

【PyTorch】畳込みニューラルネットワークを構築する方法【CNN】

今回は、PyTorch を使って畳込みニューラルネットワーク(CNN)

→もっと見る

PAGE TOP ↑