【Pandas】 DataFrame の行を抽出する方法【Python】
今回は、Python の Pandas で、DataFrame 型の行を抽出する方法を紹介します。
DataFrame の行抽出方法は、大まかに以下の2種類があります。
- インデックスを指定して行を抽出する方法( iloc、loc )
- 各行の論理値(True or False)で行を抽出する方法
この2つの方法についてそれぞれ説明していきます。
インデックスを指定して行を抽出する方法
DataFrame のインデックス(index)を指定して行を抽出することができます。
インデックスの値を指定するには「loc」を使い、インデックスの番号(整数値)を指定するには「iloc」を使います。
結果は DataFrame 型で返ります。
今回は、分かりやすい loc を使ってみます。
‘a6789012002’, ‘akikirara1122′ などの ユーザID をインデックスとした DataFrame から、’a6789012002’ の行だけ抽出するときは、以下のようにします。
1 |
df.loc['a6789012002'] |
出力結果は以下のようになります。
インデックスの ユーザ ID をリストで渡すと複数条件で指定することができます。
1 |
df.loc[['a6789012002', 'akikirara1122']] |
出力結果は以下のようになります。
各行の論理値(True or False)で行を抽出する方法
先ほどは、インデックスを指定して行の抽出を行いましたが、これは条件式でデータの値を比較して行の抽出を行う方法です。
先ほど抽出した以下のデータを使います。
「id」カラムの列の値が「0」の行を抽出したいとします。
DataFrame のカラムと比較演算子による条件式を指定すると、True もしくは False が入った Series が返ってきます。
1 |
df_user['id'] == 0 |
1番上の「0」の行だけ True になっていることがわかります。
これを DataFrame に与えると、True の行のみ抽出することができます。
1 |
df_user[df_user['id'] == 0] |
ちなみに、逆に id が「0」以外の行を取得する場合は、以下のように比較演算子を「!=0」とします。
1 |
df_user['id'] != 0 |
1行目以外が True になります。
1 |
df_user[df_user['id'] != 0] |
関連記事
-
-
【Pandas】 DataFrame のある列の最大値を含む行のインデックス値を取得する方法。
今回は、Pandas の DataFrame において、ある列で最大値を求めて、その最大値をもつ行に
-
-
【Python】Windows で ライブラリ(NumPy) をインストールする方法。
Windows の Python(2.X系)で NumPy をインストールしようと思ったら、そもそも
-
-
【Python】API を使って YouTube から動画情報を収集する方法。
API を使って YouTube から動画情報を収集してみたときのメモです。 OS は Lin
-
-
【Linux】 ローカルに Python をインストールする方法。
今回は、Linux サーバに、root 権限なしで、ローカルに Python をインストールした方法
-
-
【Pandas】 DataFrame で2行の列ごとの差を計算する方法【Python】
今回は、Pandas の DataFrame で、2行間の列ごとの値の差を計算し、その結果を Dat
-
-
python 2.7 を Windows 64bit OS にインストールした。
python 2.7 を Windows にインストールしたときのメモです。 Python に
-
-
【Python】機械学習のために SciPy・Matplotlib・scikit-learn をインストール。
Python で機械学習を行うために、Windows OS の python 2 系にライブラリ「S
-
-
【Python】漢字を分解するライブラリを使ってみた【部首分解】
Python で漢字を部首やさらに細かい部分に分解してくれるライブラリがあったので使ってみました。
-
-
【Python】 Series 型を dict(辞書型)に変換する方法。
Python で Series 型を dict(辞書型)に簡単に変換する方法を紹介します。 「
-
-
【Python】 複数の辞書型の同じ key を持つ value を計算に用いる方法。
Python で、複数の辞書型を読み込んで、同じキー(key)を持つ数値(value)を計算に使う方