【Pandas】 DataFrame のある列の最大値を含む行のインデックス値を取得する方法。
今回は、Pandas の DataFrame において、ある列で最大値を求めて、その最大値をもつ行についてインデックスを取得する方法について紹介します。
文章だと少し分かりずらいので、実際のデータでみていきます。
以下のような DataFrame(df)があるとします。
インデックスが「0.01」「0.02」… と連続していて、実際には「1.00」まで続きます。
カラム名が「precision」「recall」「f-measure」の3つになります。
Contents
列ごとの最大値を求める
「precision」「recall」「f-measure」カラムのそれぞれの列ごとの最大値を求めるには、「max」関数を使います。
1 |
df.max() |
結果は Series で返ります。これだと、行はバラバラのデータになります。
1 2 3 4 |
precision 1.000000 recall 1.000000 f-measure 0.710526 dtype: float64 |
ある列の最大値を持つインデックスを求める
ある列で最大値を持っている行を抽出したいときがあると思います。
今回は、「f-measure」列の中で最大値をもつ行のインデックスの値を求めてみます。
「idxmax」関数を使います。
1 |
df['f-measure'].idxmax() |
1 |
0.6 |
ある列の最大値を持つ行を抽出する(Series型)
先ほどは、行のインデックス値のみを抽出しましたが、行全体を抽出してみます。
先ほど抽出したインデックス値を loc を使って渡してあげれば行の情報が抽出できます。
1 |
df.loc[df['f-measure'].idxmax()] |
Series 型で抽出されます。
1 2 3 4 |
precision 0.736364 recall 0.686441 f-measure 0.710526 Name: 0.6, dtype: float64 |
ある列の最大値を持つ行を抽出する(DataFrame型)
Series 型ではなく DataFrame 型で取得したいときは、loc に [ ] を1つ追加して、リストで渡します。
1 |
df.loc[[df['f-measure'].idxmax()]] |
無事 DataFrame 型で取得できました。
関連記事
-
【Python】Beautiful Soup を使ってスクレイピングする方法。
Beautiful Soup は、シンプルでわかりやすい API でデータを抜き出せる Python
-
【Pandas】 DataFrame と Series のデータ構造について【Python】
今回は、Python でデータ分析を行っていると必ず使う Pandas の DataFrame と
-
【Python】OpenCV を使って顔画像を検出してみた。
OpenCV のインストール Numpy のインストール [crayon-6730ee369
-
【Python】Requests ライブラリを使って Web ページを取得してみた。
python の標準ライブラリ urllib を使っても Web ページの取得はできるのですが、Re
-
【Python】機械学習のために SciPy・Matplotlib・scikit-learn をインストール。
Python で機械学習を行うために、Windows OS の python 2 系にライブラリ「S
-
【Google Colaboratory】クラウド上でPythonを使って機械学習を行う。
Python をブラウザ上で実行して、手軽に機械学習ができる環境「Google Colaborato
-
python 2.7 を Windows 64bit OS にインストールした。
python 2.7 を Windows にインストールしたときのメモです。 Python に
-
【Pandas】 DataFrame のインデックスを置き換える方法【Python】
今回は、Pandas の DataFrame型で、インデックス(index)を分かりやすいものに置き
-
【Python】漢字を分解するライブラリを使ってみた【部首分解】
Python で漢字を部首やさらに細かい部分に分解してくれるライブラリがあったので使ってみました。
-
【Python】 Series 型を dict(辞書型)に変換する方法。
Python で Series 型を dict(辞書型)に簡単に変換する方法を紹介します。 「