【Pandas】 DataFrame と Series のデータ構造について【Python】

公開日: : Python , , , , ,

今回は、Python でデータ分析を行っていると必ず使う Pandas の DataFrame と Series について、データの構造や違いについて調べてみました。

Contents

DataFrame

DataFrame は、行とカラムから構成されているデータであり、

  • インデックス(index)
  • カラム(columns)
  • データ(value)

の3つの要素から成り立っています。

read_csv 関数を使って、映画データの CSVファイル を読み込んで、3つの要素について確認します。

「0」「1」がインデックス(index)、「color」や「director_name」がカラム(columns)と呼ばれます。

インデックスやカラムは軸(axis)といいます。

read_csv 関数では、デフォルトで index が数値で割り振られ、columns がCSVファイルの1行目の値になります。

DataFrame は各カラムごとにデータ型が異なります。

dtypes 関数で確認できます。


object は文字列などが入り、int64 は 64ビットの int型、float64 は 64ビットの float型になります。

DataFrame 型かどうかを確認するには、type 関数を使います。

Series

DataFrame から1つのカラム(列)を抽出すると Series になります。

抽出方法はインデックス演算子によるものとドット表記によるものの2種類あります。

以下、どちらでも同じ結果になります。

index は DataFrame のものがそのまま残ります。「Name:」部分で Series の名前、「Length:」部分でデータの個数、「dtype:」部分でデータ型(今回は文字列なので

object)を表しています。

こちらも type 関数で Series 型かを確認します。

Series 型を DataFrame 型に戻したいときは、to_frame 関数を使います。

DataFrame に変換されました。このとき、カラム名には Series名が入ります。

参考書籍

関連記事

【Python】API を使って YouTube から動画情報を収集する方法。

API を使って YouTube から動画情報を収集してみたときのメモです。 OS は Lin

記事を読む

【Python】Windows で ライブラリ(NumPy) をインストールする方法。

Windows の Python(2.X系)で NumPy をインストールしようと思ったら、そもそも

記事を読む

【Python】Beautiful Soup を使ってスクレイピングする方法。

Beautiful Soup は、シンプルでわかりやすい API でデータを抜き出せる Python

記事を読む

【Pandas】 DataFrame で2行の列ごとの差を計算する方法【Python】

今回は、Pandas の DataFrame で、2行間の列ごとの値の差を計算し、その結果を Dat

記事を読む

【Google Colaboratory】クラウド上でPythonを使って機械学習を行う。

Python をブラウザ上で実行して、手軽に機械学習ができる環境「Google Colaborato

記事を読む

【Spyder】引数のあるスクリプトを実行する方法。

Python の統合開発環境(IDE)である Spyder では、簡単にスクリプトを実行できます。

記事を読む

【Python】漢字を分解するライブラリを使ってみた【部首分解】

Python で漢字を部首やさらに細かい部分に分解してくれるライブラリがあったので使ってみました。

記事を読む

【Python】時系列データ(為替データ)をグラフ表示してみた。

今回は、pandas・matplotlib ライブラリを使って、時系列データ(為替データ)をグラフ表

記事を読む

【Python】pip3 で「cannot import name ‘main’」エラーが出たときの対処法。

Python でライブラリをインストールする際に、pipを使います。 Python2 と Py

記事を読む

【Atom エディタ】Python で Matplotlib のグラフを Atom 上に表示させる方法。

Atom エディタで Python の Matplotlib ライブラリを使って、Atom 上にグラ

記事を読む

無料動画編集ソフト AviUtl で mp4 形式の動画を読み込み・出力する方法【Windows】

今回は、無料動画編集ソフト AviUtl で mp4 形式の動画を読み

【Cubase】イヤホンから音がでないときの対処方法。

Cubase でイヤホンから音がでなくなったときの対処方法のメモです。

【Cubase】特定のトラックを無効にする方法。

今回は、Cubaseで特定のトラックのみを無効にする方法について紹介し

【転移学習】学習済みVGG16 による転移学習を行う方法【PyTorch】

今回は、PyTorch を使って、学習済みのモデル VGG16 を用い

【PyTorch】畳込みニューラルネットワークを構築する方法【CNN】

今回は、PyTorch を使って畳込みニューラルネットワーク(CNN)

→もっと見る

PAGE TOP ↑