【Pandas】 DataFrame と Series のデータ構造について【Python】

公開日: : Python , , , , ,

今回は、Python でデータ分析を行っていると必ず使う Pandas の DataFrame と Series について、データの構造や違いについて調べてみました。

Contents

DataFrame

DataFrame は、行とカラムから構成されているデータであり、

  • インデックス(index)
  • カラム(columns)
  • データ(value)

の3つの要素から成り立っています。

read_csv 関数を使って、映画データの CSVファイル を読み込んで、3つの要素について確認します。

「0」「1」がインデックス(index)、「color」や「director_name」がカラム(columns)と呼ばれます。

インデックスやカラムは軸(axis)といいます。

read_csv 関数では、デフォルトで index が数値で割り振られ、columns がCSVファイルの1行目の値になります。

DataFrame は各カラムごとにデータ型が異なります。

dtypes 関数で確認できます。


object は文字列などが入り、int64 は 64ビットの int型、float64 は 64ビットの float型になります。

DataFrame 型かどうかを確認するには、type 関数を使います。

Series

DataFrame から1つのカラム(列)を抽出すると Series になります。

抽出方法はインデックス演算子によるものとドット表記によるものの2種類あります。

以下、どちらでも同じ結果になります。

index は DataFrame のものがそのまま残ります。「Name:」部分で Series の名前、「Length:」部分でデータの個数、「dtype:」部分でデータ型(今回は文字列なので

object)を表しています。

こちらも type 関数で Series 型かを確認します。

Series 型を DataFrame 型に戻したいときは、to_frame 関数を使います。

DataFrame に変換されました。このとき、カラム名には Series名が入ります。

参考書籍

関連記事

【Python】 複数の辞書型の同じ key を持つ value を計算に用いる方法。

Python で、複数の辞書型を読み込んで、同じキー(key)を持つ数値(value)を計算に使う方

記事を読む

【Python】Requests ライブラリを使って Web ページを取得してみた。

python の標準ライブラリ urllib を使っても Web ページの取得はできるのですが、Re

記事を読む

【Pandas】 DataFrame で2行の列ごとの差を計算する方法【Python】

今回は、Pandas の DataFrame で、2行間の列ごとの値の差を計算し、その結果を Dat

記事を読む

【Python】API を使って YouTube から動画情報を収集する方法。

API を使って YouTube から動画情報を収集してみたときのメモです。 OS は Lin

記事を読む

【Python】プログレスバーを表示させる【tqdm】

Python でスクリプトの実行時間が長くなると、進捗状況が知りたくなったので、標準出力にどのくらい

記事を読む

【Atom エディタ】Python で Matplotlib のグラフを Atom 上に表示させる方法。

Atom エディタで Python の Matplotlib ライブラリを使って、Atom 上にグラ

記事を読む

【Pandas】 DataFrame の行を抽出する方法【Python】

今回は、Python の Pandas で、DataFrame 型の行を抽出する方法を紹介します。

記事を読む

【Linux】 ローカルに Python をインストールする方法。

今回は、Linux サーバに、root 権限なしで、ローカルに Python をインストールした方法

記事を読む

【Python】pip3 で「cannot import name ‘main’」エラーが出たときの対処法。

Python でライブラリをインストールする際に、pipを使います。 Python2 と Py

記事を読む

【Python】Wikipedia のデータセットを取得し、文章を抽出する方法。

Wikipedia のデータセットを取得し、Python のライブラリを用いて文章を抽出する方法を紹

記事を読む

無料動画編集ソフト AviUtl で mp4 形式の動画を読み込み・出力する方法【Windows】

今回は、無料動画編集ソフト AviUtl で mp4 形式の動画を読み

【Cubase】イヤホンから音がでないときの対処方法。

Cubase でイヤホンから音がでなくなったときの対処方法のメモです。

【Cubase】特定のトラックを無効にする方法。

今回は、Cubaseで特定のトラックのみを無効にする方法について紹介し

【転移学習】学習済みVGG16 による転移学習を行う方法【PyTorch】

今回は、PyTorch を使って、学習済みのモデル VGG16 を用い

【PyTorch】畳込みニューラルネットワークを構築する方法【CNN】

今回は、PyTorch を使って畳込みニューラルネットワーク(CNN)

→もっと見る

PAGE TOP ↑