【Pandas】 DataFrame のある列の最大値を含む行のインデックス値を取得する方法。
今回は、Pandas の DataFrame において、ある列で最大値を求めて、その最大値をもつ行についてインデックスを取得する方法について紹介します。
文章だと少し分かりずらいので、実際のデータでみていきます。
以下のような DataFrame(df)があるとします。
インデックスが「0.01」「0.02」… と連続していて、実際には「1.00」まで続きます。
カラム名が「precision」「recall」「f-measure」の3つになります。
Contents
列ごとの最大値を求める
「precision」「recall」「f-measure」カラムのそれぞれの列ごとの最大値を求めるには、「max」関数を使います。
1 |
df.max() |
結果は Series で返ります。これだと、行はバラバラのデータになります。
1 2 3 4 |
precision 1.000000 recall 1.000000 f-measure 0.710526 dtype: float64 |
ある列の最大値を持つインデックスを求める
ある列で最大値を持っている行を抽出したいときがあると思います。
今回は、「f-measure」列の中で最大値をもつ行のインデックスの値を求めてみます。
「idxmax」関数を使います。
1 |
df['f-measure'].idxmax() |
1 |
0.6 |
ある列の最大値を持つ行を抽出する(Series型)
先ほどは、行のインデックス値のみを抽出しましたが、行全体を抽出してみます。
先ほど抽出したインデックス値を loc を使って渡してあげれば行の情報が抽出できます。
1 |
df.loc[df['f-measure'].idxmax()] |
Series 型で抽出されます。
1 2 3 4 |
precision 0.736364 recall 0.686441 f-measure 0.710526 Name: 0.6, dtype: float64 |
ある列の最大値を持つ行を抽出する(DataFrame型)
Series 型ではなく DataFrame 型で取得したいときは、loc に [ ] を1つ追加して、リストで渡します。
1 |
df.loc[[df['f-measure'].idxmax()]] |
無事 DataFrame 型で取得できました。
関連記事
-
【Python】機械学習のために SciPy・Matplotlib・scikit-learn をインストール。
Python で機械学習を行うために、Windows OS の python 2 系にライブラリ「S
-
【Pandas】 DataFrame の行を抽出する方法【Python】
今回は、Python の Pandas で、DataFrame 型の行を抽出する方法を紹介します。
-
【Linux】 ローカルに Python をインストールする方法。
今回は、Linux サーバに、root 権限なしで、ローカルに Python をインストールした方法
-
【Python】Beautiful Soup を使ってスクレイピングする方法。
Beautiful Soup は、シンプルでわかりやすい API でデータを抜き出せる Python
-
【Python】Requests ライブラリを使って Web ページを取得してみた。
python の標準ライブラリ urllib を使っても Web ページの取得はできるのですが、Re
-
【Pandas】 DataFrame のインデックスを置き換える方法【Python】
今回は、Pandas の DataFrame型で、インデックス(index)を分かりやすいものに置き
-
【matplotlib】 Python で折れ線グラフを描く方法。
今回は、Python の matplotlib というライブラリを使って簡単に折れ線グラフを描く方法
-
【Python】Wikipedia のデータセットを取得し、文章を抽出する方法。
Wikipedia のデータセットを取得し、Python のライブラリを用いて文章を抽出する方法を紹
-
【Google Colaboratory】クラウド上でPythonを使って機械学習を行う。
Python をブラウザ上で実行して、手軽に機械学習ができる環境「Google Colaborato
-
【Python】プログレスバーを表示させる【tqdm】
Python でスクリプトの実行時間が長くなると、進捗状況が知りたくなったので、標準出力にどのくらい