【Python】 DataFrame の特定の列で出現回数をカウントして降順でソートする方法。
Python で DataFrame 型の特定の列を指定して、対象列の文字列の出現回数をカウントして出現回数の降順(多い順)に並べる方法を紹介します。
DataFrame の「value_counts()」関数を使うと簡単に実現できました。
以下のような df という名前の DataFrame 型のデータがあるとします。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
q_user_id r_user_id 0 akikirara1122 akikirara1122 1 akikirara1122 akikirara1122 2 asakaakie_blog2 asakaakie_blog2 3 a6789012002 casablanca117531 4 akikirara1122 amanjuli03 5 akikirara1122 asakaakie_blog2 6 akikirara1122 chanchankoiro 7 amanjuli03 ashino817 8 amanjuli03 casablanca117531 9 amanjuli03 chanchankoiro 10 asakaakie_blog2 ashino817 11 cotsplace cotsplace 12 ddogs38 ddogs38 13 fpdxw092 fpdxw092 14 fpdxw092 fpdxw092 15 ddogs38 fpdxw092 : |
「q_user_id」列の重複している各ユーザIDの出現回数をカウントします。
1 2 |
count = df['q_user_id'].value_counts() print(count) |
結果は、以下のようになります。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 |
tottokosa 6 akikirara1122 5 houzankai2006 3 amanjuli03 3 nama_k1 3 maruru39 2 ddogs38 2 sasaootako 2 nipponko2007 2 asakaakie_blog2 2 papakoa 2 umayado17 2 fpdxw092 2 cotsplace 1 juveneko 1 macyaken 1 a6789012002 1 saba2006201 1 tposato1 1 sanmamini91 1 wwide1225 1 Name: q_user_id, dtype: int64 |
結果は、Series 型で返り、index が 重複をカウントしたい要素(今回の場合は q_user_id 列)、data が 出現回数 となります。また、dtype は int64 となります。
Series 型は、インデックスとデータを持ちます。
なお、value_counts() はデフォルトで出現回数の降順(多い順)でソートしてくれます。
関連記事
-
-
【Python】OpenCV を使って顔画像を検出してみた。
OpenCV のインストール Numpy のインストール [crayon-603f1b464
-
-
【Google Colaboratory】クラウド上でPythonを使って機械学習を行う。
Python をブラウザ上で実行して、手軽に機械学習ができる環境「Google Colaborato
-
-
【Python】Wikipedia のデータセットを取得し、文章を抽出する方法。
Wikipedia のデータセットを取得し、Python のライブラリを用いて文章を抽出する方法を紹
-
-
【Python】機械学習のために SciPy・Matplotlib・scikit-learn をインストール。
Python で機械学習を行うために、Windows OS の python 2 系にライブラリ「S
-
-
【Pandas】 DetaFrame の列ごとに演算する方法【Python】
今回は、DetaFrame の列ごとに平均や加算・減算なのど演算をし、結果を DetaFrame 型
-
-
【Python】Windows で ライブラリ(NumPy) をインストールする方法。
Windows の Python(2.X系)で NumPy をインストールしようと思ったら、そもそも
-
-
【Pandas】 loc・ilocで1行のみ Series ではなく DataFrame で抽出する方法。
Python の Pandas で DataFrame から loc や iloc を使って行を抽出
-
-
【Pandas】 DataFrame のインデックスを置き換える方法【Python】
今回は、Pandas の DataFrame型で、インデックス(index)を分かりやすいものに置き
-
-
【Python】Requests ライブラリを使って Web ページを取得してみた。
python の標準ライブラリ urllib を使っても Web ページの取得はできるのですが、Re
-
-
【Pandas】 DataFrame と Series のデータ構造について【Python】
今回は、Python でデータ分析を行っていると必ず使う Pandas の DataFrame と