【Pandas】 DataFrame と Series のデータ構造について【Python】

公開日: : Python , , , , ,

今回は、Python でデータ分析を行っていると必ず使う Pandas の DataFrame と Series について、データの構造や違いについて調べてみました。

Contents

DataFrame

DataFrame は、行とカラムから構成されているデータであり、

  • インデックス(index)
  • カラム(columns)
  • データ(value)

の3つの要素から成り立っています。

read_csv 関数を使って、映画データの CSVファイル を読み込んで、3つの要素について確認します。

「0」「1」がインデックス(index)、「color」や「director_name」がカラム(columns)と呼ばれます。

インデックスやカラムは軸(axis)といいます。

read_csv 関数では、デフォルトで index が数値で割り振られ、columns がCSVファイルの1行目の値になります。

DataFrame は各カラムごとにデータ型が異なります。

dtypes 関数で確認できます。


object は文字列などが入り、int64 は 64ビットの int型、float64 は 64ビットの float型になります。

DataFrame 型かどうかを確認するには、type 関数を使います。

Series

DataFrame から1つのカラム(列)を抽出すると Series になります。

抽出方法はインデックス演算子によるものとドット表記によるものの2種類あります。

以下、どちらでも同じ結果になります。

index は DataFrame のものがそのまま残ります。「Name:」部分で Series の名前、「Length:」部分でデータの個数、「dtype:」部分でデータ型(今回は文字列なので

object)を表しています。

こちらも type 関数で Series 型かを確認します。

Series 型を DataFrame 型に戻したいときは、to_frame 関数を使います。

DataFrame に変換されました。このとき、カラム名には Series名が入ります。

参考書籍

関連記事

【Atomエディタ】Python 開発用にインストールしてみた。

Python でプログラミングするときの エディタ を探していたのですが、とりあえず Atom とい

記事を読む

【Python】pip3 で「cannot import name ‘main’」エラーが出たときの対処法。

Python でライブラリをインストールする際に、pipを使います。 Python2 と Py

記事を読む

【Google Colaboratory】クラウド上でPythonを使って機械学習を行う。

Python をブラウザ上で実行して、手軽に機械学習ができる環境「Google Colaborato

記事を読む

【Python】 Series 型を dict(辞書型)に変換する方法。

Python で Series 型を dict(辞書型)に簡単に変換する方法を紹介します。 「

記事を読む

【Python】機械学習のために SciPy・Matplotlib・scikit-learn をインストール。

Python で機械学習を行うために、Windows OS の python 2 系にライブラリ「S

記事を読む

【matplotlib】 Python でヒストグラムの横軸と棒(ビン)の数を調整する方法。

Python の matplotlib を使ってヒストグラムを描画し、横軸の目盛りと棒(ビン)がそろ

記事を読む

【OpenCV】検出した顔画像部分を切り出す方法【Python】

OpenCV を使って、Python で画像の中から顔部分を切り出したときのメモです。 顔部分

記事を読む

【Linux】 ローカルに Python をインストールする方法。

今回は、Linux サーバに、root 権限なしで、ローカルに Python をインストールした方法

記事を読む

【Python】 複数の辞書型の同じ key を持つ value を計算に用いる方法。

Python で、複数の辞書型を読み込んで、同じキー(key)を持つ数値(value)を計算に使う方

記事を読む

【Python】時系列データ(為替データ)をグラフ表示してみた。

今回は、pandas・matplotlib ライブラリを使って、時系列データ(為替データ)をグラフ表

記事を読む

無料動画編集ソフト AviUtl で mp4 形式の動画を読み込み・出力する方法【Windows】

今回は、無料動画編集ソフト AviUtl で mp4 形式の動画を読み

【Cubase】イヤホンから音がでないときの対処方法。

Cubase でイヤホンから音がでなくなったときの対処方法のメモです。

【Cubase】特定のトラックを無効にする方法。

今回は、Cubaseで特定のトラックのみを無効にする方法について紹介し

【転移学習】学習済みVGG16 による転移学習を行う方法【PyTorch】

今回は、PyTorch を使って、学習済みのモデル VGG16 を用い

【PyTorch】畳込みニューラルネットワークを構築する方法【CNN】

今回は、PyTorch を使って畳込みニューラルネットワーク(CNN)

→もっと見る

PAGE TOP ↑