【Pandas】 DataFrame と Series のデータ構造について【Python】

公開日: : Python , , , , ,

今回は、Python でデータ分析を行っていると必ず使う Pandas の DataFrame と Series について、データの構造や違いについて調べてみました。

DataFrame

DataFrame は、行とカラムから構成されているデータであり、

  • インデックス(index)
  • カラム(columns)
  • データ(value)

の3つの要素から成り立っています。

read_csv 関数を使って、映画データの CSVファイル を読み込んで、3つの要素について確認します。

「0」「1」がインデックス(index)、「color」や「director_name」がカラム(columns)と呼ばれます。

インデックスやカラムは軸(axis)といいます。

read_csv 関数では、デフォルトで index が数値で割り振られ、columns がCSVファイルの1行目の値になります。

DataFrame は各カラムごとにデータ型が異なります。

dtypes 関数で確認できます。


object は文字列などが入り、int64 は 64ビットの int型、float64 は 64ビットの float型になります。

DataFrame 型かどうかを確認するには、type 関数を使います。

Series

DataFrame から1つのカラム(列)を抽出すると Series になります。

抽出方法はインデックス演算子によるものとドット表記によるものの2種類あります。

以下、どちらでも同じ結果になります。

index は DataFrame のものがそのまま残ります。「Name:」部分で Series の名前、「Length:」部分でデータの個数、「dtype:」部分でデータ型(今回は文字列なので

object)を表しています。

こちらも type 関数で Series 型かを確認します。

Series 型を DataFrame 型に戻したいときは、to_frame 関数を使います。

DataFrame に変換されました。このとき、カラム名には Series名が入ります。

参考書籍

関連記事

【Python】API を使って YouTube から動画情報を収集する方法。

API を使って YouTube から動画情報を収集してみたときのメモです。 OS は Lin

記事を読む

【OpenCV】画像の顔部分を検出する方法【Python】

OpenCV を使って、Python で画像から顔部分の検出を行ったときのメモです。 Anac

記事を読む

【Python】OpenCV を使って顔画像を検出してみた。

OpenCV のインストール Numpy のインストール [crayon-63dcb7352

記事を読む

【Pandas】 DataFrame のインデックスを置き換える方法【Python】

今回は、Pandas の DataFrame型で、インデックス(index)を分かりやすいものに置き

記事を読む

【Python】 Series 型を dict(辞書型)に変換する方法。

Python で Series 型を dict(辞書型)に簡単に変換する方法を紹介します。 「

記事を読む

【Google Colaboratory】クラウド上でPythonを使って機械学習を行う。

Python をブラウザ上で実行して、手軽に機械学習ができる環境「Google Colaborato

記事を読む

【Python】時系列データ(為替データ)をグラフ表示してみた。

今回は、pandas・matplotlib ライブラリを使って、時系列データ(為替データ)をグラフ表

記事を読む

【Python】漢字を分解するライブラリを使ってみた【部首分解】

Python で漢字を部首やさらに細かい部分に分解してくれるライブラリがあったので使ってみました。

記事を読む

【Python】Wikipedia のデータセットを取得し、文章を抽出する方法。

Wikipedia のデータセットを取得し、Python のライブラリを用いて文章を抽出する方法を紹

記事を読む

【Python】プログレスバーを表示させる【tqdm】

Python でスクリプトの実行時間が長くなると、進捗状況が知りたくなったので、標準出力にどのくらい

記事を読む

【Cubase】特定のトラックを無効にする方法。

今回は、Cubaseで特定のトラックのみを無効にする方法について紹介し

【転移学習】学習済みVGG16 による転移学習を行う方法【PyTorch】

今回は、PyTorch を使って、学習済みのモデル VGG16 を用い

【PyTorch】畳込みニューラルネットワークを構築する方法【CNN】

今回は、PyTorch を使って畳込みニューラルネットワーク(CNN)

【PyTorch】ニューラルネットワークを構築する方法【NN】

今回は、PyTorch を使って、ニューラルネットワーク(NN)を構築

【OpenCV】検出した顔画像部分を切り出す方法【Python】

OpenCV を使って、Python で画像の中から顔部分を切り出した

→もっと見る

PAGE TOP ↑