【Pandas】 DataFrame のある列の最大値を含む行のインデックス値を取得する方法。
今回は、Pandas の DataFrame において、ある列で最大値を求めて、その最大値をもつ行についてインデックスを取得する方法について紹介します。
文章だと少し分かりずらいので、実際のデータでみていきます。
以下のような DataFrame(df)があるとします。
インデックスが「0.01」「0.02」… と連続していて、実際には「1.00」まで続きます。
カラム名が「precision」「recall」「f-measure」の3つになります。
Contents
列ごとの最大値を求める
「precision」「recall」「f-measure」カラムのそれぞれの列ごとの最大値を求めるには、「max」関数を使います。
1 |
df.max() |
結果は Series で返ります。これだと、行はバラバラのデータになります。
1 2 3 4 |
precision 1.000000 recall 1.000000 f-measure 0.710526 dtype: float64 |
ある列の最大値を持つインデックスを求める
ある列で最大値を持っている行を抽出したいときがあると思います。
今回は、「f-measure」列の中で最大値をもつ行のインデックスの値を求めてみます。
「idxmax」関数を使います。
1 |
df['f-measure'].idxmax() |
1 |
0.6 |
ある列の最大値を持つ行を抽出する(Series型)
先ほどは、行のインデックス値のみを抽出しましたが、行全体を抽出してみます。
先ほど抽出したインデックス値を loc を使って渡してあげれば行の情報が抽出できます。
1 |
df.loc[df['f-measure'].idxmax()] |
Series 型で抽出されます。
1 2 3 4 |
precision 0.736364 recall 0.686441 f-measure 0.710526 Name: 0.6, dtype: float64 |
ある列の最大値を持つ行を抽出する(DataFrame型)
Series 型ではなく DataFrame 型で取得したいときは、loc に [ ] を1つ追加して、リストで渡します。
1 |
df.loc[[df['f-measure'].idxmax()]] |
無事 DataFrame 型で取得できました。
関連記事
-
-
【Python】pip3 で「cannot import name ‘main’」エラーが出たときの対処法。
Python でライブラリをインストールする際に、pipを使います。 Python2 と Py
-
-
【Pandas】 DataFrame と Series のデータ構造について【Python】
今回は、Python でデータ分析を行っていると必ず使う Pandas の DataFrame と
-
-
【Python】API を使って Amazon の商品情報を収集する方法。
AmazonAPI ライブラリをインストール 以下のコマンドで python-amazon-sim
-
-
【Python】 DataFrame の特定の列で出現回数をカウントして降順でソートする方法。
Python で DataFrame 型の特定の列を指定して、対象列の文字列の出現回数をカウントして
-
-
【OpenCV】検出した顔画像部分を切り出す方法【Python】
OpenCV を使って、Python で画像の中から顔部分を切り出したときのメモです。 顔部分
-
-
【Python】API を使って YouTube から動画情報を収集する方法。
API を使って YouTube から動画情報を収集してみたときのメモです。 OS は Lin
-
-
【Atom エディタ】Python で Matplotlib のグラフを Atom 上に表示させる方法。
Atom エディタで Python の Matplotlib ライブラリを使って、Atom 上にグラ
-
-
【Pandas】 DataFrame のインデックスを置き換える方法【Python】
今回は、Pandas の DataFrame型で、インデックス(index)を分かりやすいものに置き
-
-
【OpenCV】画像の顔部分を検出する方法【Python】
OpenCV を使って、Python で画像から顔部分の検出を行ったときのメモです。 Anac
-
-
【Python】プログレスバーを表示させる【tqdm】
Python でスクリプトの実行時間が長くなると、進捗状況が知りたくなったので、標準出力にどのくらい