【Pandas】 DataFrame のインデックスを置き換える方法【Python】
今回は、Pandas の DataFrame型で、インデックス(index)を分かりやすいものに置き換える方法について紹介します。
index は、DataFrame 作成時に特に指定しないとデフォルトで整数 0 ~ 割り振られます。このインデックスを RangeIndex といいます。
例えば、映画データを read_csv で読み込むとインデックスは以下のようになります。
index は、
- DataFrame 作成後に変更する
- CSVファイル読み込み時に指定する
方法の2種類あります。
Contents
DataFrame 作成後に index を変更する方法
DataFrame型の set_index 関数を用いてインデックスを変更します。
1 2 3 |
movie = pd.read_csv('data/movie.csv') movie2 = movie.set_index('movie_title') movie2 |
index として使いたいカラム名を指定します。映画のタイトルが index になったことが確認できます。
なお、index として使用したカラムは削除されます。
CSV ファイル読み込み時に index を指定する方法
もう一つの方法は、read_csv で読み込む際に index_col でインデックスとして使うカラム名(CSVファイルの1行目の項目)を指定します。
1 2 |
movie = pd.read_csv('data/movie.csv', index_col='movie_title') movie.head() |
こちらも、index として使用したカラムは削除されます。
index をカラムに戻す方法
index をカラムに戻すには、reset_index 関数を使います。
index が整数値の RangeIndex に戻ります。ただし、注意しないといけないのは、戻したカラム(元はindexだったもの)は、先頭に戻るので、カラムの順番が変わってしまいます。
1 |
movie2.reset_index() |
参考書籍
関連記事
-
-
【matplotlib】 Python でヒストグラムの横軸と棒(ビン)の数を調整する方法。
Python の matplotlib を使ってヒストグラムを描画し、横軸の目盛りと棒(ビン)がそろ
-
-
【Pandas】 DetaFrame の列ごとに演算する方法【Python】
今回は、DetaFrame の列ごとに平均や加算・減算なのど演算をし、結果を DetaFrame 型
-
-
【Python】API を使って YouTube から動画情報を収集する方法。
API を使って YouTube から動画情報を収集してみたときのメモです。 OS は Lin
-
-
【Python】 Series 型を dict(辞書型)に変換する方法。
Python で Series 型を dict(辞書型)に簡単に変換する方法を紹介します。 「
-
-
【Spyder】引数のあるスクリプトを実行する方法。
Python の統合開発環境(IDE)である Spyder では、簡単にスクリプトを実行できます。
-
-
【Pandas】 loc・ilocで1行のみ Series ではなく DataFrame で抽出する方法。
Python の Pandas で DataFrame から loc や iloc を使って行を抽出
-
-
【Python】pip3 で「cannot import name ‘main’」エラーが出たときの対処法。
Python でライブラリをインストールする際に、pipを使います。 Python2 と Py
-
-
【Python】機械学習のために SciPy・Matplotlib・scikit-learn をインストール。
Python で機械学習を行うために、Windows OS の python 2 系にライブラリ「S
-
-
【Python】 複数の辞書型の同じ key を持つ value を計算に用いる方法。
Python で、複数の辞書型を読み込んで、同じキー(key)を持つ数値(value)を計算に使う方
-
-
【Atomエディタ】Python 開発用にインストールしてみた。
Python でプログラミングするときの エディタ を探していたのですが、とりあえず Atom とい