【Pandas】 DataFrame のある列の最大値を含む行のインデックス値を取得する方法。
今回は、Pandas の DataFrame において、ある列で最大値を求めて、その最大値をもつ行についてインデックスを取得する方法について紹介します。
文章だと少し分かりずらいので、実際のデータでみていきます。
以下のような DataFrame(df)があるとします。
インデックスが「0.01」「0.02」… と連続していて、実際には「1.00」まで続きます。
カラム名が「precision」「recall」「f-measure」の3つになります。
Contents
列ごとの最大値を求める
「precision」「recall」「f-measure」カラムのそれぞれの列ごとの最大値を求めるには、「max」関数を使います。
1 |
df.max() |
結果は Series で返ります。これだと、行はバラバラのデータになります。
1 2 3 4 |
precision 1.000000 recall 1.000000 f-measure 0.710526 dtype: float64 |
ある列の最大値を持つインデックスを求める
ある列で最大値を持っている行を抽出したいときがあると思います。
今回は、「f-measure」列の中で最大値をもつ行のインデックスの値を求めてみます。
「idxmax」関数を使います。
1 |
df['f-measure'].idxmax() |
1 |
0.6 |
ある列の最大値を持つ行を抽出する(Series型)
先ほどは、行のインデックス値のみを抽出しましたが、行全体を抽出してみます。
先ほど抽出したインデックス値を loc を使って渡してあげれば行の情報が抽出できます。
1 |
df.loc[df['f-measure'].idxmax()] |
Series 型で抽出されます。
1 2 3 4 |
precision 0.736364 recall 0.686441 f-measure 0.710526 Name: 0.6, dtype: float64 |
ある列の最大値を持つ行を抽出する(DataFrame型)
Series 型ではなく DataFrame 型で取得したいときは、loc に [ ] を1つ追加して、リストで渡します。
1 |
df.loc[[df['f-measure'].idxmax()]] |
無事 DataFrame 型で取得できました。
関連記事
-
-
【Anaconda】Prompt 上で Git コマンドを実行する方法。
Anaconda のコマンドプロンプト(Anaconda Prompt)上で、Git Hub からダ
-
-
【Python】API を使って Amazon の商品情報を収集する方法。
AmazonAPI ライブラリをインストール 以下のコマンドで python-amazon-sim
-
-
python 2.7 を Windows 64bit OS にインストールした。
python 2.7 を Windows にインストールしたときのメモです。 Python に
-
-
【Python】プログレスバーを表示させる【tqdm】
Python でスクリプトの実行時間が長くなると、進捗状況が知りたくなったので、標準出力にどのくらい
-
-
【Pandas】 DataFrame で2行の列ごとの差を計算する方法【Python】
今回は、Pandas の DataFrame で、2行間の列ごとの値の差を計算し、その結果を Dat
-
-
【Pandas】 loc・ilocで1行のみ Series ではなく DataFrame で抽出する方法。
Python の Pandas で DataFrame から loc や iloc を使って行を抽出
-
-
【Python】Windows で ライブラリ(NumPy) をインストールする方法。
Windows の Python(2.X系)で NumPy をインストールしようと思ったら、そもそも
-
-
【Linux】 ローカルに Python をインストールする方法。
今回は、Linux サーバに、root 権限なしで、ローカルに Python をインストールした方法
-
-
【Python】時系列データ(為替データ)をグラフ表示してみた。
今回は、pandas・matplotlib ライブラリを使って、時系列データ(為替データ)をグラフ表
-
-
【matplotlib】 Python で折れ線グラフを描く方法。
今回は、Python の matplotlib というライブラリを使って簡単に折れ線グラフを描く方法